机器之心报道
机器之心编辑部
连今年的安卓 14 上都有生成式 AI,还不止一种。
一年一度的谷歌 I/O 总是吸引着全球开发者的眼球,今年 AI 技术有重大突破,大家的关注度更高了。
当地时间 5 月 10 日上午,加州山景城的海岸圆形剧场座无虚席,今年的大会正式开幕。

「AI 正在度过忙碌的一年,而谷歌作为人工智能优先公司的旅程已经七年了,我们正处于一个转折点,」谷歌首席执行官桑达尔皮查伊(Sundar Pichai)说道。「通过生成式 AI 技术,我们正在迈出下一步。」
在 ChatGPT 推出之后,人们都很关心谷歌的「反击策略」。在今天凌晨长达两个小时的演讲中,谷歌从算法、软件讲到硬件,又通篇都在讲人工智能,最新的大模型技术,已经应用在了谷歌产品体系的方方面面。
PaLM 二代模型
支持多语言、更强的数学、代码能力
首先,谷歌给出了自己对标 GPT-4 的大模型 PaLM 2。
要说这一波 AI 技术突破的源头,或许可以追溯到 2017 年谷歌提出的 transformer 架构,它已成为绝大多数现代大语言模型的基石。
在过去的几年里,谷歌除了在大模型上不断进步之外,也采用了许多创造性的新技术来构建功能更强大、用途更广的模型。这些技术是新一代语言模型 PaLM 2 的核心。PaLM 基于谷歌 Pathways 架构,其第一个版本的模型于 2022 年 4 月发布。
谷歌 I/O 大会上,皮查伊宣布推出 PaLM 2 预览版本,改进了数学、代码、推理、多语言翻译和自然语言生成能力,利用谷歌最新的 TPU 算力基础设施提升了训练速度。由于它的构建方式是将计算、优化扩展、改进的数据集混合以及模型架构改进结合在一起,因此服务效率更高,同时整体表现更好。





皮查伊现场演示了 PaLM 2 的代码调试功能,输入指令「你能修复这段代码的一个 bug,并添加一行一行的韩文注释吗?」,结果如下动图所示。




在皮查伊演讲的同时,谷歌放出了 PaLM 2 的论文,整整 91 页。但令人失望的是,PaLM 2 论文远没初代 PaLM 有诚意,和 GPT-4 一样,更像是技术报告。

另外,在 Google Brain 和 DeepMind 合并之后,新的大模型也在研制过程当中。皮查伊表示现在谷歌的研究重心正在转向 Gemini,这是一种多模态和高效的机器学习工具。

多模态版 Bard,能用 Adobe Firefly 画图
皮查伊表示,现在的谷歌 Bard 已经完全运行在了新一代模型 PaLM 2 上。在 I/O 大会上,ChatGPT 和新必应的竞争对手 Bard 经历了大幅更新,包括图像功能、编码功能和应用程序集成。
「PaLM 2 模型在逻辑和推理方面比以往的模型更加强大,这要归功于对逻辑和推理的广泛训练,」皮查伊表示。「它还接受了跨越 100 多种语言的多语言文本训练。」
Bard 将在回复和你给更复杂提示后给出更加直观的内容。你可以问它诸如「新奥尔良有哪些必看景点?」之类的问题,除了文本之外,你可以获得更有意义的回复,以及丰富的视觉内容。


其次是导出按钮。如果 AI 生成的内容接近于实用化,我们肯定会希望能够更快捷地使用这些结果。现在,人们能把内容快速导出到 Colab 和 Replit 上,进一步构建和迭代自己的想法。当然文字也是可以的,如果你让 Bard 写邮件,那么它也可以一键直接用 Gmail 发送,或新建一个 Docs 文件。
未来,谷歌还计划集成的应用还包括 Sheets、Slides、Calendar、Keep、Tasks、Maps、Photos、Messages、Flights、YouTube、YT Music、Google Images、Imagen、OpenTable、Replit,以及 Adobe 的 Firefly。
谷歌表示,Bard 很快就会支持各种第三方扩展,例如 AI 可以自动根据你输入的文本生成图像,使用的还是 Adobe 那个神奇的 Firefly:

下一代安卓,AI 可以帮你回短信
I/O 大会上,谷歌还展示了下一代移动操作系统 Android 14 的新能力。
Magic Compose 将于今年夏天在谷歌的默认短信应用 Message 中推出测试版,它是一种基于 AI 生成模型的工具,让你在回短信的时候根据聊天内容获得大量提示。它会学习你的说话方式,你也可以让自己的回复内容看起来有不同的语气,或者用莎士比亚的风格来写。


另外,谷歌也发布了 Pixel 7a、Pixel Tablet,还有自己的首款折叠屏手机 Pixel Fold,售价 1799 美元,新的硬件将于夏天正式开卖。

THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com