去年年底,ChatGPT 席卷全球之后,令人耳目一新的是,上周宣布的聊天机器人下一代版本即将到来,但得到的报道相对较少,令人耳目一新。
德国出版物Heise 上周援引微软国内领导层高级成员的话说,GPT-4 将于本周发布。
微软德国首席技术官安德烈亚斯·布劳恩 (Andreas Braun) 表示:“我们将在下周推出 GPT-4,在那里我们将拥有多模式模型,将提供完全不同的可能性 - 例如视频,”布劳恩说。 ChatGPT(或 GPT-3.5)于 2022 年 12 月推出,而 GPT-3 于 2020 年推出。
布劳恩和微软德国首席执行官 Marianne Janik 都强调,虽然生成式人工智能改变了游戏规则,但它不会取代人类的工作。 GPT-4 公告的一大亮点是它将是“多模式”的,这意味着它将能够生成文本、音频、图像和视频。
这听起来可能是一件大事,但实际上它只是对现有人工智能技术的整合——包括 OpenAi 自己的 DALL-e 图像生成器。事实上,GPT-4 听起来像是会踩在一系列第三方软件的脚趾上,包括 MidJourney、ElevenLabels 和 D-ID,这些软件一起可以创建带有配音的 AI 动画头像。
小步骤
总而言之,这只是向前迈出的一小步,可能会让其他期待更深远的事情的人失望。然而,这证实了 OpenAI 首席执行官 Sam Altman 在 1 月份提出的观点,当时他警告说“人们对 GPT-4 感到失望” 。
Altman 在 StrictlyVC 上讲话时毫不拐弯抹角,将病毒般的预测(即 GPT-4 中的参数数量将从 GPT-3 中的 1750 亿个攀升至 100 万亿个)视为“完全是胡说八道”。
然而,Altman 承认,ChatGPT 的炒作让他措手不及。他表示,他只是将 GPT-3.5 视为 GPT-3 的迭代步骤,而 GPT-3 在推出时并没有引起太多兴奋。
奥特曼似乎低估了人类对自我的关注。看到自己的反思对我们很重要有很多原因,其中包括反思“帮助我们发展自我意识”这一事实。 ChatGPT 是最接近反映人类对话能力的人工智能程序,为文化意识创造了一个共享灯泡。
它之所以能做到这一点,得益于对较小数据集的集中训练和人类反馈。我什至不打算在这里尝试提炼这项工作的技术方面,但如果您想更深入地了解 GPT-3.5 的开发过程,请前往Jesus Rodriguez 对基于人类反馈的强化学习的探索(RLHF) 。
工具就是工具
归根结底,ChatGPT 只是一个工具,尽管它是一个令人兴奋且强大的工具。虽然它向我们展示了生成式人工智能的潜力,但我们仍然需要付出努力才能充分利用它。
周末,我读到了 Business Insider 的 Aaron Mok 关于利用人工智能工具提高生产力的。总而言之,这些工具让他的生活变得更加艰难,但有一个值得注意的例外。这让我思考了我们对软件学习曲线的期望。
最好的软件解决方案是使底层技术不可见的。无论出于何种意图和目的,谷歌都是最好的例子之一。在人工智能方面,ChatGPT 在隐形方面也走在前列。人们看到的世界是,通过聊天机器人进行低技术含量的对话输入即可完成纳税申报表。
这个世界即将到来,但我们距离目标还有很长的路要走。生成式人工智能产生幻觉信息时,我们都会不必要地感到愤怒。
锤子和钉子的名言不太适合这个主题的背景,但无论如何我都会把它敲进去。我们需要停止将人工智能视为解决生产力问题的万能解决方案。人工智能有多种形式,每种形式都需要用户投入大量时间才能获取真正的价值——换句话说,人类需要提高技能。
拿起锤子并不意味着你就能盖房子。您将需要一系列其他工具来完成工作,即使如此,如果您没有任何技能,您只是自找麻烦。