仍在持续进化的ChatGPT为何如此强大?-小程序制作开发-网站建设公司-分销商城小程序-网站制作公司-名联网络科技

仍在持续进化的ChatGPT为何如此强大?

2023-02-20 阅读：3725

ChatGPT的火，已经从AI圈烧到了全球。

自2022年11月推出后，这款强大的聊天机器人仅用60天月活过亿，被《财富》认为是划时代的产品，引微软、谷歌等巨头纷纷下场。

更重要的是，以ChatGPT为代表的AIGC（Artificial Intelligence Generated Content，生成式AI），正在人工智能领域掀起AI商业化的新一轮浪潮，打开了诸多行业变革的想象天窗。

如果要问谁是当下离 AI 技术革命最近的人，ChatGPT之父、OpenAI CEO 山姆·阿尔特曼（Sam Altman）一定位列其中。

2017 年，还在担任硅谷知名创业孵化器 Y Combinator总裁的他，和伊隆·马斯克、彼得・蒂尔、雷德・霍夫曼等人一起投资了 10 亿美元，共同成为 Open AI 的创始人。又过了两年，他将工作重心转移到了 AI，担任 OpenAI 的 CEO 直到今天。

在去年秋天，山姆·阿尔特曼与 Open AI 创始人之一、领英联合创始人雷德・霍夫曼（Reid Hoffman）展开了一场精彩对话。其中，山姆·阿尔特曼分享了他对于未来AI发展的预测：AI 大模型技术，将成为继移动互联网之后，未来最大的技术平台；而以聊天机器人为界面，加上图像、音乐、文本等多模态模型的发展，将诞生大型企业。

他是如何判断AI未来商业化发展的？大型AI企业将诞生于哪些领域？AI将取代人类的工作，还是更好地帮助人类工作？

▍最是一年春好处AI大模型——未来最大的技术平台

Q：很多AI大模型都通过API（application programming interface，应用接口）开放使用，它真正的商业机会是什么？

A：现在，语言模型已经可以很好地应用到文案写作和教育服务领域。我相信未来几年内，语言模型会更加强大，将能与Google这一价值万亿美元的搜索产品一较高下。语言模型的应用将会改变我们的日常生活。

以前，人们太早嘲笑许多趋势，比如聊天机器人，其实它很有价值，只是当时的技术还不能满足需求。现在的聊天机器人更加成熟，几乎可以达到人类水平。聊天机器人可以用于医疗服务行业，提供咨询和教育服务，这方面将能催生出大型企业。

我相信，不久之后会出现多模态模型，这将开辟新的事物。现在，人们可以直接用自然语言命令计算机为你完成你想做的工作。

例如DALL-E图像生成工具和Copilot编程工具，都是用户向它们输入自然语言描述，然后工具自动生成用户想要的东西，用户还可以不断迭代修改自己的描述，直至工具给出满意的输出。

类似的AI应用方式会成为大趋势，可以孕育出许多大型企业。强大的AI模型可以成为孵化各种AI应用的平台，就像智能手机的出现催生出众多APP一样，它们的共同点都是可以制造无数的商业机会。

Q：作为大型语言模型 API 的服务提供商，关键是什么？如何创建一个持久的差异化业务？

A：将来应该会出现几个大型的基础模型，开发人员都将基于这些基础模型研发AI应用。但目前的情况依然是某一家公司开发出一个大型语言模型，然后开放API供他人使用。

我认为，将来在基础模型和具体AI应用研发之间会有一个中间层：出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。能做好这一点的初创公司将会非常成功，但这取决于它们能在「数据飞轮」上走多远。

数据飞轮：使用更多数据可以训练出更好的模型，吸引更多用户，从而产生更多用户数据用于训练，形成良性循环。

我对初创企业训练模型的能力持怀疑态度，将来承担模型训练角色的应该不会是初创公司，但这些企业可以在上述的中间层角色中发挥巨大价值。我认为中间那一层会创造很多价值。

Q：一个大型语言模型初创企业，如何区别于另一个大型语言模型初创企业呢？

A：我觉得应该是中间层。

从某种意义而言，创业公司会训练自己的模型，只不过不是从头开始。

他们将采用基础模型，这些模型已经经过大量的计算和数据训练，然后在这些模型之上进行训练，为每个垂类创建模型。

他们所做的 1% 的训练，对于应用来说至关重要。我认为，这些创业公司将会非常成功，并且与众不同。可能包括一段时间内存在的 prompt engineering（提示工程）或基础核心模型（core base model）。

注：提示工程是指将任务的描述、或者提问放在输入中，让 AI 模型输出理想结果的调试过程；ChatGPT 走红之后，提示工程师这一岗位也被人所关注。

Q：五年内，大多数用户与基础模型交互的方式是什么？prompt engineering 将是许多组织的内部职能吗？

A：我不认为五年后我们还做 prompt engineering，这将被整合进所有地方。无论用文本还是语音，取决于上下文，只需要语言接口，让计算机做你想做的任何事情。

将来的AI系统不会因为增补了某个特定词就会产生截然不同的输出，而是可以较好地理解自然语言，用户只需以文本和语音形式输入指令，即可让计算机完成图像生成、资料研究、心理咨询等复杂任务。

总的来说，用户只需使用自然语言就可以与计算机交互，当然，如果艺术家能想出更有创造性的描述，也自然就可以生成更好的图像。

Q：当有一个伟大的视觉思考者，他们可以从 DALL-E 中获取更多，因为他们知道如何更深入思考，知道如何在测试中迭代循环。你认为这是大部分这类事的普遍真理吗？

A：百分百确定。重要的是思想的质量，和对你想要的东西的理解。所以艺术家仍然会在图像生成方面做得最好，不是因为他们在图像最后加上了这个神奇单词，而是因为他们能用我没有的创造性的眼光来表达。

Q：最令你惊讶的是什么？如果没有意识到事情已经发展到这一步，你认为会有什么样的惊喜呢？

A：人们现在所犯的最大的系统性错误，就是他们会说，「好吧，我也许持怀疑态度，但是这种语言模型真的会起作用，当然，图像和视频也会起作用。但它不会为人类产生新知。它只会做其他人已经做过的事情。这还是让智力的边际成本非常低，不能治愈癌症。它不会增加人类科学知识的总和。」我认为这将被证明是错误的，让目前该领域的专家最感到惊讶的地方。

▍当 AI 科学家可以自我迭代

Q：无论是建立在 API 之上，还是科学家使用 API，有哪些地方的科学会加速，以及如何加速？

A：现在科学界对AI的应用分为两种。

一种是将AI工具直接用于科学目的，如AlphaFold（用于蛋白质结构预测），它们可以创造巨大价值，相信未来会出现无数这样的工具。

另一种是将AI工具用于提升科研工作效率，如帮科学家和工程师找到新研究方向、写代码等。Copilot编程工具就是一个例子。但AI工具的能力远不止于此。上述两种AI应用将会大大推动科技前进。

此外，目前科学界也在探索对AI的第三种应用方式——让AI成为可以「自我改进」的科学家。这件事情既有好处也有风险。