Cointime

扫码下载App
iOS & Android

GitHub首席执行官Thomas Dohmke谈生成性AI驱动的开发者体验

原文链接:GitHub CEO Thomas Dohmke on Generative AI-powered Developer Experiences

本文作者:Madrona;编译:Cointime Freya

今天,我们很荣幸地邀请到了GitHub的首席执行官Thomas Dohmke。他和Madrona合伙人Aseem Datar谈论了他是如何进入计算机与编程领域工作的,以及他自2021年11月成为GitHub首席执行官以来所做的工作,包括最近推出的Copilot X等。但他们讨论的内容更多的是围绕生成式AI的崛起进行的,从它如何成为开发者(实际上是每个人)表达创造力的新方式,到它如何将许多技能民主化,再到生成式AI驱动的开发者体验,以及开发者所处的不断发展的计算机领域,如何为他们建立了完善的安全网络,以充分发挥生成式AI的潜力。Thomas还为刚开始创业的人提供了建议。

本文内容是自动生成的,并经过再次编辑以使逻辑更加清晰。

Aseem:大家好!我是Madrona Ventures的合伙人Aseem Datar。今天,我邀请到了我的好友,GitHub的首席执行官Thomas Dohmke。很高兴能和他一起聊聊生成式AI这个精彩的话题。

欢迎Thomas!

Thomas:非常感谢你能够邀请我,Aseem。

Aseem:和这个行业的创新领军人物交谈总是很有趣的,也许你可以先和我们讲讲你的故事,首先,介绍一下自己吧。

Thomas:我是Thomas,我是一名开发者。早在80年代末90年代初,我大约12-13岁的时候,我就确定,我将成为一名开发者,我第一次接触计算机是在学校的地理实验室,后来我又购买了Commodore 64。我一直对构建软件很着迷,当然,作为一个孩子,我也会玩各种各样的电脑游戏。自从我开始构建自己的应用程序,我就一直在通过代码工作,并对代码充满热情。

我最初在柏林学习计算机工程,然后攻读博士学位。在格拉斯哥读完博士后,我在梅赛德斯工作,负责开发驾驶辅助系统。2008年,史蒂夫·乔布斯宣布了App Store,它把我拉进了应用程序行业。我有一家名为Hockey App的初创公司,2014年被微软收购,于是我从德国一路来到西海岸,进入微软并走上AI这条道路。通过收购,我首先进入GitHub,在GitHub运行特殊项目,从2021年11月开始,我一直在担任首席执行官。

Aseem:这真的是一段非常有趣的经历。显然,世界已经发生了很多变化。我们看到这种被称为生成式AI的新技术正在迅速创新。我们都会在谈论和听到更多关于生成式AI的话题时感到兴奋。那么,你的世界观是什么?我很想了解这一点。

Thomas:回顾过去6个月的经历,我们会发现有很多时刻都与我之前描述的“App Store时刻”相似。我认为其中最重要的时刻显然是去年年底的ChatGPT的诞生。我听说有人将发布ChatGPT和快速采用ChatGPT的那一刻,描述为2020年代的马赛克时刻。年龄较大的人可能还会记得第一个浏览器是Mosaic,紧随其后的是Netscape。实际上,昨晚吃饭的时候,我还和大家争论过——这到底是Netscape时刻还是Mosaic时刻?不过我认为这并不重要,重要的是,在很短的时间内,人们采用了ChatGPT,并且其工作方式也发生了转变。而在ChatGPT之前,我们已经通过Midjourney和Stable Diffusion等图像模型看到了转变。我认为,这些模型准确地描述了生成式AI的作用,其中一部分作用创造了一种人们表达创造力的新方式。

我们也听说过人们会在晚上渲染图像,而不是看Netflix。我认为这很有趣的。我的例子大多取决于我在哪个城市,我正在与什么样的客户交谈,让Stable Diffusion渲染特拉维夫的天际线,就像法国印象派画家莫奈的画一样。当然,莫奈并没有看到如今的特拉维夫天际线。然而,这些模型生成的图片就像莫奈绘制的特拉维夫、悉尼或旧金山的天际线一样。我认为这就是生成式AI新世界的力量所在。

它带来的另一种影响是,它使许多技能和获得这些技能的途径民主化了。你可以想象教室里的学生们,如果一个班级有30个学生,那么老师根本没有时间辅导每一个学生。它能够为学生们提供一个AI助教,他们可以问所有不敢在课堂上问的问题。我认为这也是AI时刻的真正力量所在,还是我们在这个行业中看到的最有发展潜力的地方。

Aseem:我认为生产力是一个巨大的领域,如今,生成性AI正在产生影响。在现实生活,无论是对学生、对商业工作者,还是对信息工作者来说,看到这些场景是非常棒的。但在这背后,所有的一切都是以软件开发者在某种程度上的创造力为基础的,对吗?而且我认为你不能回避这样一个事实,即开发者在创建这些智能应用程序,并将AI嵌入其中。那么,这一刻对于开发者来说到底意味着什么?你认为由AI驱动的开发者体验将会发生怎样的变化?

Thomas:开发者的角色一直在变化。我们可以回顾一下过去的40年,我们从punch card

、机器语言、mainframe和COBOL等等发展到现代编程语言。在互联网出现之前,也就是从21世纪初开始,我们从自己建立一切,发展到利用数以千计的开源组件。

Aseem:顺便说一下,我认为Visual Basic也是一个重要的时刻。

Thomas:你或许可以为许多编程语言本身提出这样的论点。我认为Ruby也是一个重要时刻。在过去十年左右的时间里,很多初创公司都是在Ruby on Rail上建立的,因为用Rail进行迭代实在是太容易了。而Python解锁了许多我们现在看到的机器学习。你所知道的关于软件开发的好处是,解决问题一直是软件开发实践的一部分,对吗?没有开发者是完美的,无论我们在punch card上出现了漏洞、在汇编程序中出现了漏洞、还是现在我们在代码中出现了漏洞。它总是围绕着解决问题,并修复你自己或你的团队的bug。而“bug”这个词甚至来自于punch card上的漏洞。因此,我们构建了所有这些工具、编译器和调试器,通过编写代码来发现问题。

我们发明了单元测试等实践,以确保我们正在构建的程序是我们想要构建的程序。在过去十年左右的时间里,我们引入了DevOps实践或敏捷实践、代码审查、拉取请求、结对编程、持续集成和部署、CI/CD、代码和秘密扫描。因此,如果你现在将其与 AI 联系起来,它实际上很吸引人的。我们已经在软件开发中构建了安全网络,以充分利用生成式AI的潜力。

我们都知道,那些模型,那些大型语言模型,并不总是正确的,它们有一些所谓的幻觉。它们认为自己有答案,并且对自己所说的内容很有信心,但它们是错的。通过软件开发者拥有的所有这些实践,我们已经建立了保障措施,以确保我们可以使用模型建议,并对其进行修改或接受,然后在代码审查中发现这并不是我们想做的。你可能会说,我们构建DevOps,是希望在未来能够出现像ChatGPT这样的时刻,我们可以在开发者中释放更多的生产力和创造力,并最终成为实现更大的想法。我认为,这才是最终的目标。

两年多前,也就是2020年,我们开始在GitHub研究Copilot,它是最早的AI辅助编程工具之一。它位于你的编辑器中,当你作为开发者输入时,它向你建议代码,并可以完成一行,但它也可以完成整个方法——多行代码、大量样板导入语句、Java以及测试用例,复杂的算法等等。而且它并不总是正确的,但开发者已经习惯了。他们在编辑器中输入,它就会显示建议。如果这不是我想要的,那么我可以继续输入,如果它足够接近我想要的答案,我就会按下Tab键,我可以使用并修改它。这与从Stack或GitHub复制代码然后进行修改没有什么区别。你能在互联网上找到你想要的片段。

生成式AI驱动的开发者体验给了他们一种更有创造力的方式。而且,我刚才提到了DevOps。我认为DevOps是伟大的,因为它创造了很多保障措施,它让很多经理人感到高兴,因为他们可以监控创意一直到云端的流程,并且可以跟踪周期时间。他们有一定的信心,相信开发者不会只是通过SSH进入生产服务器,因为他们有一些保障措施,但这实际上并没有让开发者更高兴。它没有给他们创造的空间。因此,通过将AI引入开发者的工作流程中,让开发者保持在工作流程中,们正在重新找回在过去20年中丢失的东西,那就是创造力,是快乐,它不会让开发者整天陷入调试和解决问题的困境,,而是让他们写出他们真正想写的东西。我认为这就是AI对软件开发者的真正力量。

Aseem:我记得我在Emacs编辑器中编写代码的日子,它只比记事本稍微好一点,因为它有一些配色方案等等。你提到的两件事让我很感兴趣。一是生产力,二是创造力。我认为这两点对开发者来说肯定是最重要的。开发者应该对哪些事情感到兴奋?你们已经加倍投入并将继续投入的领域有哪些?

Thomas:这就需要了解一下AI的历史了。2020年夏天,GPT-3问世,这差不多是三年前的事情了,当时我们的GitHub Next团队,也就是GitHub内部负责展望未来的团队,想知道能否利用GPT-3来编写代码。我们研究了这个模型,并提出了三种情况。现在再来看这三种情况真的很有趣,因为有文本可以编写代码。这正是Copilot现在所做的事情,即你输入文本,它就会为你提供代码建议。还有代码到文本,也就是你要求模型描述代码在做什么。我们刚刚宣布,作为Copilot X的一部分,你可以让Copilot向你描述一个pull request。

如果你是一名开发者,你就会知道那是什么感觉。你整天都在研究开发某个功能,然后你提交了一个pull request,现在你必须填写所有这些表格及其标题和正文,就像我知道我今天做了什么。我对此很有把握,因为我编写了所有这些代码。我不想花太多时间向他人描述这些东西。因此,通过Copilot为pull requests,我们正在帮助人们完成这些操作。它可以描述代码,但它不仅仅是关于pull request,它还可以帮助你描述你从同事和编辑器中阅读到的代码。它可能只是帮助你记住那是什么。它还可以帮助人们描述旧代码,一些银行仍在运行的旧COBOL代码,这些代码来自20世纪60年代,在mainframe上运行,编写这些代码的人早已退休。因此,专业知识已经消失了。最后一个是对话式编程。我们当时没有构建它,因为我们觉得这个模型还不够好,不适合进行这种对话。很明显,随着ChatGPT 3.5和GPT-4的推出,我们已经达到了这些聊天场景有用的程度。而且通常都是正确的。

早在2020年,我们就已经探索了这三种情况,我们验证了这对我们来说是足够好的,我们可以在其基础上构建一个产品。我们要求我们的员工和主要工程师提交编程练习,这些练习通常用于面试环节,包括描述、方法声明和方法主体。所以我们得到了大约230个这样的练习,我们剥离了主体,只留下声明和描述,我们给了模型150次机会来解决每个练习,并使其足够接近解决方案。我们从这个实验中得出的结论是,在2020年,92%的练习可以通过这个模型来解决。即使在当时,这个模型已经足以解决很多这样的编程练习。因此,我们以此为灵感,构建了Copilot,并将Copilot推向了世界。

3月22日,我们宣布了Copilot X。因此,下一代的Copilot,真正将这些AI模型的力量带入开发者体验的各个方面中,无论是在IDE中编程,还是在聊天场景中探索想法。我首先尝试的例子是我问它如何在Python中构建一个贪吃蛇游戏。它会开始显示你可以如何执行此操作,然后你可以要求它“告诉我更多关于第一步的信息”,它会给你一些代码,然后你就可以开始构建了。我认为这才是真正的力量,如果你失去了对编程的热爱,你还可以重新发现它。或者你可以探索一种新的编程语言,或者要求聊天代理修复代码中的bug或修复安全问题,比如删除你不小心放在那里的SQL注入。我们宣布了pull request,很快,我们还将拥有test generation。所以,pull request将检查你实际编写或应该编写的测试,然后为你生成这些测试。然后,我们宣布的另一件很酷的东西是Copilot for docs。因此,我们构建了了一个功能,基本上可以让你询问有关React、Azure和其他一些项目的文档的问题。

因此,模型在接受训练之前有一个截止日期。培训是一个非常昂贵的过程,需要使用超级计算机数周时间才能重新训练模型。目前的GPT-4的截止日期是2021年9月。如果你问2021年9月以后发生的事情,它就会告诉你。因此,它不知道在此期间发生的对开源项目文档的修改。从2021年9月到2023年3月,对于开源项目的API来说是一段很长的时间。我们正在做的事就是,从那些开源项目中收集数据,并将它们输入到提示中,使它们成为你作为提问者看不到的提示的一部分,因此它可以回答有关这些项目的最新问题。

Aseem:我对Docs感到非常兴奋,就让我回想起我做开发者的日子,我花了很多时间去阅读文档,并从不同的地方拉出来,这真的是一种效率低下的工作方式。我想指出的是,我认为GitHub创造了关于Copilot的概念,整个微软都注入了这个概念,现在有一个用于Office的Copilot和一个用于Teams的Copilot。我非常期待看到它的发展。让我们稍微转换一下话题,有一件事让我感到很兴奋,尤其是在风险投资领域,那就是初创公司创始人和团队现在可以非常快速地从零开始投入生产。那么,对于那些刚开始创业或创建团队的人,你有哪些建议?他们应该关注什么?又应该担心什么?

Thomas:我想你很清楚,创造力就是保持顺畅,不要被周围发生的事情分心。通常情况下,我们会被很多事物所吸引,无论是浏览器还是社交媒体等等。因此,我认为我对初创公司创始人的第一个建议是,保持专注,利用好一天中你真正有创造力的时间,因为这个时间是有限的。虽然我们的创造力是无限的,但我们在一天中真正能潜心构建很酷的东西的创造力是非常有限的。例如,对一些人来说,清晨是最适合发挥创造力的时刻。对我来说,通常在我喝完第一杯咖啡后,就是最有创造力的时候。我总是希望第二杯咖啡也能有同样的影响,但事实并非如此。夜深人静的时候,我也很有创造力。所以我认为,作为一个创始人,你必须在一天中找到这样的时刻,并始终保持那种能量的流动。

我们现在生活在这个世界上,无论你是否称之为经济衰退,我认为我们处于一个复杂的宏观经济环境中,但我认为这些时期总是具有挑战和机遇的。我们在2008年的经济衰退中看到了这一点——现在成为我们生活的一部分的许多初创企业,如Airbnb、Uber、Slack或Netflix,它们都是在同一时期成立的。而且它们现在是生活的一部分。例如Shopify,它在经济衰退期间成立,并构建了技术。当我们走出困境时,每个人都想拥有一个电子商务商店,或者从这些商店购买东西。我们现在、今天或今年所拥有的机会就是利用生成式AI作为基础层。许多初创公司将在此基础上简历发展,他们必须找到差异化和可防御性的想法。我认为,我们将看到很多基于ChatGPT或GPT-4的酷炫创意。但他们也可能不会作为一个公司独立生存,因为它们只是一个小想法,例如在Gmail中总结你的电子邮件。我认为谷歌会将它运用到产品中,然后你必须努力把它变成一个付费产品,如果客户已经把它内置到谷歌中,他们就会为它付费。

Aseem:我非常同意这一观点。我们一直在谈论用更少的资源做更多的事情,但我认为,我们所看到的AI或能力,都是关于用更少的资源做更多更好的事情。我认为,这正是我们所看到的创新步伐的美妙之处。Thomas,你已经深入到创业公司的生态系统当中,你会看到很多这样的开源项目的诞生。有什么项目或初创企业会让你感到非常兴奋吗?

Thomas:我一直很看好ChatGPT和OpenAI,在GitHub,我们对Copilot的未来感到非常兴奋。我之前提到过Stable Diffusion和Midjourney之类的东西,让我非常兴奋。我很看好一家名为Runway的初创公司,它可以让你从图像、视频剪辑以及文本提示中生成视频。

我认为,未来,你只需要在文本框中编写一个脚本,它就会为你生成一个完整的动画视频。

这将使我们能够把我们小时候从父母或甚至祖父母那里听到的故事,变成我们可以给孩子看的小视频片段。

我们都是Spice AI公司的董事会成员,该公司从不同的角度探索AI,而不是关注大型语言模型或图像模型。它关注时间序列AI,并在时间序列数据中发现异常。它允许你查询这些数据,他们从区块链和Web3开始,你可以编写自己的查询,并快速了解比特币的运行情况。但你也可以在此基础上运行AI,找到有趣的东西、警报,或发现价格变化。我认为这个领域有很大的发展空间,你可以将它应用于你的服务器数据、服务器监控,甚至Kubernetes集群。有各种各样的时间序列数据,每天都在影响着我们——天气也是基于时间序列的,比如晚上很冷,白天很暖和。

所以,我对此感到兴奋。总的来说,AI和机器学习领域对我来说非常令人兴奋。我可以在这里列出很多初创公司。如,Replicate,这是一家位于伯克利的初创公司,他们让你只用几行代码就可以运行机器学习模型。而你并不需要了解机器学习的工作原理。位于西雅图的OctoML使用机器学习将机器学习模型部署到云端,并找到最有效的版本、正确的GPU类型以及正确的云提供商。我相信我们还会看到很多人们认为不可能实现,或现在还没人想到的想法。就如同ChatGPT一样,但在它出现并征服世界之前,没有人构建过它。

Aseem:是的。我也赞同这种看法,看到未来以我们无法想象的方式加速总是很有趣的。

Thomas:如果我是一位初创公司创始人,我应该在遥远的未来期待什么?我们谈论了所有这些模式,但初创公司创始人现在面临的一个挑战是,很难找到优秀的开发者,顶尖人才更难找到。有这样一个概念,即正在构建的工具是为了解决低代码、无代码领域或民主化开发的问题。从GitHub的角度来看,你对此有什么看法?

Thomas:有这样一句口号,“假装你已经成功了”。这对许多创业者也同样适用。你不必从一开始就拥有完美的解决方案。你可以结合所有这些可用的AI工具,快速地拼凑出一些东西。无论是Copilot,还是Stable Diffusion,或是其他一些通过AI来帮助你编写营销文案的工具,尽可能地接受这些东西,并根据它们调整你的风格。我认为开发者将学会如何最大限度地利用AI。Andrej Karpathy最近在Twitter上说:“我改变了我的编程风格,通过写更多的评论和声明,我可以让Copilot或AI为我合成更多的代码。”

这就是我们要学习的东西,我看好在开放的环境中构建AI、拥有这些模型,并与它们一起构建,并在我们进入AGI之前尽可能早地学习如何使用它们。我们需要在公开中构建这些模型,需要学习它们在哪些方面表现良好,以及如何使用模型来帮助人类。我们还需要了解模型在哪些方面表现不佳,以及什么时候会出现bug或做出错误的预测。

Aseem:我相信我们的初创公司创始人,我们的听众,会从这场与GitHub首席执行官 Thomas Dohmke的讨论中受益匪浅。感谢你带来的这些精彩分享,很高兴我们能够成为合作伙伴,一起工作。

Thomas:也非常感谢你邀请我参加这个播客节目。

*本文由CoinTime整理编译,转载请注明来源。

评论

所有评论

推荐阅读

  • 美联储的新利率预测有可能影响市场

    LBBW 资深固定收益分析师 Elmar Voelker 在一份报告中说,在美联储下周的会议上,最大的市场波动潜力是新的关键利率预测。迄今为止,所谓的「点阵图」暗示美联储今年将降息两次,而货币市场定价几乎与美联储的预测完全一致。在我们看来,调整点阵图可能会让一些市场参与者措手不及。

  • 以色列的袭击未能突破伊朗核设施的保护层

    早期迹象表明,以色列的袭击没有穿透保护伊朗核储备设施的防护层。国际原子能机构(IAEA)说,没有迹象显示伊朗主要铀浓缩设施的辐射水平增加。伊朗当局告诉国际原子能机构,他们没有在位于德黑兰以南约300公里的纳坦兹设施观察到更高的辐射。以色列当局说,以色列没有对伊朗位于波斯湾沿岸的布什尔(Bushehr)核电站实施任何袭击。尽管如此,以色列总理内塔尼亚胡表示,袭击“将持续多少天,直到消除威胁”。只有最强大的常规弹药才能穿透伊朗的铀浓缩设施。纳坦兹核设施建在地下40多米处,有钢筋混凝土外壳保护,研究人员估计外壳厚约8米。而在福尔多核设施,浓缩大厅建在山里边。国际原子能机构总干事格罗西最近访问后估计,铀浓缩大厅位于地下半公里处。

  • 伊朗要求联合国安理会召开紧急会议

    伊朗常驻联合国代表团向安理会轮值主席致信,请求召开紧急会议,以应对以色列对伊朗的公然侵略。信中强烈谴责以色列在美国的支持下,对伊朗和平核设施和高级军事官员的侵略,呼吁安理会立即召开紧急会议,并对这些犯罪和挑衅行为采取果断行动。信中表示,以色列鲁莽、非法且有预谋地对伊朗的核设施和民用基础设施发动了一系列攻击。这些行动被认为明显违反了《联合国宪章》和国际法基本准则,其危险后果严重威胁着地区和国际和平与安全。

  • 伊朗方面称以色列总理专机已离开本-古里安机场

    当地时间13日,有消息称以色列总理内塔尼亚胡的专机已离开本-古里安机场。消息称,该专机由两架战斗机护航,正前往未知目的地。

  • 伊朗最高领导人将在以色列的袭击后发表声明

    伊朗国家电视台:伊朗最高领导人将在以色列的袭击后发表声明。

  • 以色列官员:以色列在伊朗问题上已与华盛顿完全协调

    以色列官员向以色列公共广播公司KAN表示,以色列在伊朗问题上已与华盛顿完全协调,在对伊朗发动袭击之前,以色列已通知华盛顿。

  • 伊朗:以色列和美国将付出沉重代价

    伊朗官方媒体传达了伊朗武装部队总参谋部的一份声明,称以色列和美国将“付出非常沉重的代价”。作为回应,美国和以色列将受到“严厉打击”

  • 哈梅内伊高级顾问或成下一个目标

    据外媒报道,一位消息人士透露称,伊朗最高领袖哈梅内伊的高级顾问阿里·沙姆哈尼(Ali Shamkhani)已成为袭击的目标,但目前尚不清楚最新情况,该报道尚未得到证实。

  • 发布1周年,一文理清ChatGPT时间线

    AI 元年,历史上的今天。

  • ChatGPT语音功能向所有用户免费开放

    OpenAI宣布,ChatGPT语音功能已向所有用户免费开放,用户可下载手机App使用该功能。