NLA:谷歌一雪前耻！全新PaLM 2反超GPT-4，办公全家桶炸裂升级，Bard史诗进化

来源&作者：新智元

导读：新版PaLM2超强进化，办公全家桶Workspace全面升级，Bard全面增强、所有人可用……可以看出，这届I/O大会，谷歌是真的憋出不少大招。

谷歌I/O2023大会，仿佛又给谷歌的支持者们打了一针强心剂。

此前，因为微软和OpenAI的优异表现，谷歌已经被唱衰了很久。

但是，毕竟是做出了众多奠基性工作的AI老牌公司，谷歌这一轮的发力，让我们精神一振——它只是慢了，并不是噶了。

对打GPT-4的PaLM2登台、DuetAI整进谷歌办公全家桶Workspace、Bard超强进化向所有人开放、谷歌搜索加入AI快照、AI新功能整合进Android14、AI魔术编辑器加入谷歌相册等等。

这届I/O大会，可谓眼花缭乱，精彩纷呈。

PALM2秀肌肉，手机也能跑

OpenAI的GPT-4，已经被全世界公认为最强大的语言模型。

怎么对打GPT-4？谷歌的答案，就是PaLM2。

恰在今天，谷歌一同发布了PaLM2技术报告。

论文地址：https://ai.google/static/documents/palm2techreport.pdf

显然，PaLM2被寄予了厚望，以缩小谷歌和微软之间在AI方面的差距。

劈柴介绍说，因为广泛的逻辑和推理训练，PaLM2模型在逻辑和推理方面更加强大。据说，PaLM2在超过100多种语言的多语言文本上进行了训练。

根据基准测试，对于具有思维链prompt或自洽性的MATH、GSM8K和MGSM基准评估，PaLM2的部分结果超越了GPT-4。

据谷歌高级研究主管SlavPetrov介绍，PaLM2在推理、编码和翻译上都表现更好，与2022年4月发布的第一代PaLM相比，PaLM2有了明显的改进。

可以看到，PaLM2的推理能力，得到了显著的改进

修改代码bug后，用韩语评论。

Voyager Token VGX短时涨超18%，现报价0.394美元:3月4日消息，据行情数据显示，Voyager Token VGX短时涨超18%，现报价0.394美元。

此前金色财经报道，听证会上美国法官驳回了SEC等监管机构对Binance.US收购Voyager的反对意见。这表明收购交易将在听证会结束后得到批准。[2023/3/4 12:42:24]

比如，PaLM2能够理解不同语言的成语。

比起PaLM，在最新专业语言熟练度考试中的表现，PaLM2的日语水平达到了A级，而PaLM达到了F级。PaLM2的法语水平达到了C1级。

德语「IchverstehenurBahnhof」如果直译，就是「我只理解火车站」，但如果你问它，你是不是理解错误了？

它马上就会告诉你，没错，这个德语的意思是「你说的啥？我什么都听不懂」。

再比如，和波斯谚语「Naborderanjganjmoyassarnemishavad」意思相近的中文谚语是什么？

在相关论文中，谷歌工程师声称PaLM2的语言能力已经「足以教授这门语言」，原因是其训练数据中的非英语文本更为普遍。

PaLM2包含了4个不同参数的模型，包括壁虎、水獭、野牛和独角兽，并在特定领域的数据上进行了微调，为企业客户执行某些任务。

这些微调就像给一个卡车底盘，加上一个新的发动机或前保险杠，以在某些特定任务上更好地工作。

这样的优势不言而喻，不用花费大量的时间和资源来创建，直接部署。

另外，PaLM2有一个基于健康数据训练的版本Med-PaLM2，可以轻松通过美国医学执照考试，达到「专家」水平。

一个基于网络安全数据训练的版本Sec-PaLM2，可以解释潜在恶意脚本的行为，检测到代码中的威胁。这两种模型都将通过谷歌云提供给特定客户。

目前，PaLM2已经应用在25种功能和产品中，包括办公全家桶、聊天机器人Bard、搜索等等。

值得称赞的是，PaLM2最轻量版本Gecko小到可以在手机上运行，每秒可以处理20个token，大约每秒16或17个单词。

推特出现自马斯克接管以来首次大范围宕机:12月29日消息，据监测网络状况的网站DownDetector数据显示，当地时间周三，推特公司有成千上万名用户宕机。截至美国东部时间晚上7点40分，超过1万名用户报告了在美国访问该社交媒体网站的问题。一些用户还抱怨他们的推特通知不起作用。(金十)[2022/12/29 22:13:59]

不过，谷歌没有提及具体用什么硬件来测试这个模型，只是说在「最新的手机上」运行。

显然，这次谷歌在大语言模型的小型化上，取得了非常重要的进步。在云端运行这种AI，往往是很昂贵的，如果能在本地运行，无疑有着许多显著优势，比如隐私保护。

英伟达科学家JimFan对此大加赞许——

下一波LLM将是移动原生的。一个离线的、永远在线的LLM不仅可以降低服务成本，而且还为用户体验开辟了全新的途径。例如，一个元应用程序可以从你的移动工作流程中学习，并为你实现自动化。在小屏幕上节省的生产力，将比在大屏幕上多得多。

此前，谷歌一直被嘲在AI研究上已经落后于微软，PaLM2，无疑是谷歌的一次重大回击。

但PaLM2同样也面临着一些争议，比如训练语言模型的数据是否合法？

谷歌只是提到训练语料库来自「网络文档、书籍、代码、数学和对话数据」，但并没有进一步的细节。

而大语言模型的幻觉问题，同样无法避免。谷歌研究副总裁ZoubinGhahramani表示，PaLM2是对早期模型的改进，谷歌「投入了大量精力，不断改进基础性和归因指标」。

但他承认，在打击AI产生的虚假信息方面，大家都还有很长的路要走。

除了PALM2，谷歌还宣布了正在训练的全新基础模型Gemini。这是第一个多模态模型，同样包含了参数大小不同的模型。

除了介绍模型，谷歌还特地介绍了开发AI技术的社会责任感，包括两个判别AI生成内容的工具：

-watermarking

-metadata

DuetAI：办公全家桶新升级

此前，微软Copilot把GPT-4整进了全系办公产品，掀起了震惊全世界的办公软件革命。

怎么破？谷歌这次祭出了DuetAI，给谷歌办公全家桶Workspace来了一个全新升级。

Auros Global已将总计47万枚QRDO转移至CEX:12月1日消息，据派盾PeckShield数据监测显示，标记为加密交易公司Auros Global的地址已将总计47万枚QRDO转移至几家中心化交易所，目前其地址上还持有约200万枚QRDO（约26.2万美元）。

此前报道，加密交易公司Auros Global已逾期支付2400WETH（约300万美元）的DeFi贷款本金。[2022/12/1 21:15:07]

其实呢，这也就是新瓶装旧酒，DuetAI就是Docs和Gmail等软件中AI工具的新名字。

谷歌希望，生成式AI能让Gmail、Docs、Sheets和Slides更有用，不过目前，大部分功能还在开发中。

DuetAI会涵盖谷歌的各种办公软件，包括在文档和Gmail中的写作辅助、幻灯片的图片生成、Meet的自动会议摘要等等。

在文档中，只要点「Helpmewrite」，DuetAI就能自动帮你生成招聘启事。

好玩的是，你还可以规定任意文风，比如让它古怪的调调写出一个工作描述。

在GoogleSlids中，DuetAI能直接从幻灯片中的文本生成图像。

简单描述一下，合意的图片立马生成。

想做一个遛狗业务的收费表？描述一下，它就给你自动生成。

而I/O大会上一个真正的新事儿是，写作辅助也会应用在移动端的Gmail上，这是对SmartCompose的升级。

现在，如果想试用这些新工具，需要注册WorkspaceLabs，加入候补名单。

好消息是，现在任何人都可以申请加入候补名单了，不过目前尚不清楚用户何时可以访问。谷歌的说法是，将在未来几周内将服务扩展到「更多的用户和国家」。

目前唯一可靠的消息是，Gmail的移动程序上会出现「Helpmewrite」AI助手，此前微软也曾推出类似产品，将必应集成到iOS和Android的SwiftKey键盘中。

罗永浩的AR创业公司“Thin Red Line”完成近4亿元天使轮融资:10月21日消息，罗永浩的AR创业公司“Thin Red Line”完成近4亿元天使轮融资，美团龙珠领投，参投方包括经纬创投、蓝驰创投等。美团龙珠创始合伙人朱拥华将出任该公司董事。36氪称，Thin Red Line计划于10月底开放新一轮融资，目前该公司估值约为10至15亿元。（36氪）[2022/10/21 16:34:39]

Bard又双叒叕便强了

发布会上，谷歌还宣布了一个重磅消息。

那就是，Bard未来也能像ChatGPT一样，接入网络，实时搜索网页。

这次，Bard上新了不少功能，比如支持了两种新的语言——日语和韩语，用户目前可以更简便地把生成的文本导出到谷歌文档和Gmail，可视化搜索，以及深色模式等等。

不过，最令用户开心的，想必是谷歌决定取消Bard的等候名单——将在180个国家或地区提供服务。

此外，和Adobe的AI图像生成功能，以及Instacart和OpenTable等第三方服务的功能整合也正在路上。

总的来看，这些上新是给老Bard注入的一针强心剂。

目前，谷歌正在使Bard变得更加可视化，让Bard能够分析图像，并且能在查询结果中提供图像信息等等。

关于这一方面，谷歌在发布会上展示了一个案例。

假如用户问Bard，美国的新奥尔良有哪些必看的景点，那么Bard就能图文并茂的解答这个问题。

就像用户在谷歌搜图中问同样的问题一样。

你还可以，用Bard起草邮件，并一键导入Gmail，还有文档中。

而另一个更好玩儿的功能是用图像提示系统。该功能由GoogleLens提供，它能够识别图片中的物体。

比方说，上传一张狗狗的照片，然后给一个prompt「为这两只狗写编一个有趣的标题」。GoogleLens就可以识别狗狗的品种，然后Bard就能写下与这两只狗狗特征相关的内容。

数据：通过Unstoppable Domains域名创建的网站总数已达3万:9月11日消息，Unstoppable Domains在社交媒体上发文表示，截止目前通过Unstoppable Domains域名创建的网站数量已达近3万个。另据其官方网站数据显示，当前已注册的Unstoppable Domains域名总量超过240万个。[2022/9/11 13:23:05]

该功能目前可能还不太完善，虽说潜力无限。未来如何取决于系统的整合程度。

虽说对Bard来讲，这是一个相当重大的更新，但和OpenAI的ChatGPT，以及微软的Bing之间的差距仍然是肉眼可见的。

要知道，微软在3月就给Bing增加了由OpenAI的DALL-E系统支持的AI图像生成功能。而OpenAI和微软一直在探索如何将聊天机器人与更多种的网络服务相结合。

不仅如此，OpenAI早些时候还宣布了ChatGPT将和OpenTable预订餐厅，以及Instacart订货配送的功能相结合。

谷歌表示，这些功能自己之后也会有的。

代码能力up

谷歌表示，升级后的Bard将会非常擅长处理有关代码的问题，包括调试和解释20多种语言的代码。

因此，今天发布会上的一些升级主要集中在这个方面上。

包括新的深色模式，改进的代码引用功能——不仅能提供来源，还能解释代码片段，以及一个新的导出功能。

用户可以把代码发送到谷歌的Colab平台，还能和另一个基于浏览器的IDE——Replit一起使用。

只要选中代码，就可以一键导出到Colab或者Replit。

还支持20+种编程语言。基本涵盖了码农们所需的所有编程需要。

甚至还能直接询问Bard怎么用某一种语言实现某种功能。只要prompt到位，生成一串代码也就是几秒钟的事。

写完以后，还能就着某一行代码进行解释，以及完善。

如此看来，结合了PaLM2的Bard应该会在生成质量上有明显的提升。当然，具体表现如何，还得再观察。

对战必应，谷歌AI搜索已来

此前，整合进GPT的必应势如破竹，真正威胁到了谷歌的搜索市场。

为了与微软必应竞争，谷歌同在今天推出了由PaLM2驱动的全新搜索引擎。

它能够提供问题回答的摘要，比如问「为什么酵母面包仍然如此受欢迎？」，谷歌搜索就给出几段详细描述酵母的味道、其益生元能力的优势等等。

另外，在生成内容旁，给出了3个链接，以证明摘要中的内容。这样以减少AI在生成内容上出现「幻觉」问题。

当你搜索蓝牙音箱，首先顶部有一个简短的摘要，详细说明了购买时应注意的事项：电池寿命、防水性、音质。

右边是三个购买指南的链接，下面是6个不错选择的购物链接，每个旁边都有一个AI生成的摘要。

可以看到，这是谷歌搜索结果页面的newlook。把AI生成内容放在最开始。

比起重新设计的微软必应，搜索结果顶部的AI框对谷歌来说更像是，一个小小的更新。

值得注意的是，要是想要访问这一功能，你必须选择SearchGenerativeExperience这一新功能。

并非所有搜索都会有AI生成的答案。只有当谷歌的算法认为它比标准答案更有用时，AI内容才会出现，而像健康、财务等敏感主题完全不会有AI生成。

谷歌表示，其改进后的搜索引擎能够以对话方式跟踪原始搜索查询的选项，无需重复已经提供的上下文或细节。

然而，谷歌搜索也不是无所不能，也存在从未完全解决过的问题——结构编排。

因为大部分数据储存在互联网上，甚至谷歌内部，但将所有这些数据放在一起形成一个连贯的答案真的很难。

目前，已经开放候补名单仅限美国，谷歌表示，未来几个月将考虑更广泛地推出这一功能。

一键退款，智能P图，沉浸导航

一键生成退款邮件？

谷歌行。

劈柴在发布会一开始就整了个小活。航班取消了得退款？不会写申请退款的邮件？

gmail会。

只要在prompt栏里输入要求，gmail分分钟生成了一篇有理有据有节的退款申请邮件。

另外，谷歌Map现在也有了沉浸式view，你想去哪，怼脸的实景导航来了。

你还能顺便问问空气质量、天气、交通状况，都能即时演示。

MagicEditor是谷歌最新公布的照片处理功能，使用生成性AI，可以让用户在没有专业工具的情况下对照片进行各种编辑。

不会p图星人的福音来了？

发布会上，谷歌分享了几个应用了这项新功能的案例，不得不说，效果酷炸了。

比如下面这张，MagicEditor一键把瀑布前的人像挪到了侧面，还把背景中别的游客p掉了。不仅如此，本来多云的天气硬是给p蓝了。

再比如下面这张，MagicEditor一键将长凳上的小孩连着凳子一起移到了中间，自动补齐了多出来的椅子，还把原画中缺失的气球补齐了。

而且天也p蓝了。

当然，这项功能还没到最完美的地步。就比方说，仔细看看上面这张图片，凳子挪动了，可是底下的影子没动。

但总归，这项功能对照片本身的理解是革命性的。

当然，咱现在还不用太担心是不是有的图片被MagicEditor处理过。因为谷歌说了，下半年才会推出这项功能。

AI笔记本ProjectTailwind

学生党福音来了。

不得不说，谷歌还真把学生们拿捏住了。

ProjectTailwind从本质上讲，就是个笔记本，但是加了AI的能力。

一下子就不一样了。

用户可以像问导师或者学习搭子一样进行在Tailwind里进行检索。

虽说谷歌把这个功能其定位为学生服务的工具，但是对于日常需要处理大量文本的打工人来说，也是重大利好。

谷歌产品管理高级总监表示，Tailwind就像一个真正的笔记本一样，你在里面记东西，而这些内容就是AI学习的对象。

用户可以简便地从谷歌云端硬盘中挑选文件，有效创建了一个兼具个性化和私人属性的AI模型。

目前，该功能在大学校园内进行了广泛的测试。

在示例演示中，Tailwind收集了一大堆学习笔记，然后，生成了包括主题词在内的很多内容，比如，用户可以为特定主题创建术语表。

Tailwind不仅仅能为学生服务，它对任何从不同来源获取信息的人都有帮助。

隐藏在Tailwind背后的理念是，为什么我们不能为每个用户定制不同的AI语言模型呢？

当然，这里存在两个问题。

一方面是成本问题。训练语言模型所需的计算需求和微调成本都很高，谁来负担这个成本？另一方面则是信息安全性。

毕竟，捏造信息这种事可一点都不稀奇，谁能保证个性化的笔记本不会出现同样的问题呢。

不过，是骡子是马还得拉出来遛遛。用户目前可以注册ProjectTailwind进行测试。该功能也是AILabs计划的一部分。

安卓开发小助手

此外，谷歌I/O大会上还推出了专为Android开发的AI编码机器人StudioBot。

不仅可以生成代码、修复BUG，甚至能够回答关于安卓应用开发的相关问题。

同时支持Kotlin和Java编程语言，并将直接嵌入到AndroidStudio开发工具的工具栏中。

参考资料：

https://io.google/2023/intl/zh/

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

链链资讯

NLA:谷歌一雪前耻！全新PaLM 2反超GPT-4，办公全家桶炸裂升级，Bard史诗进化

链链资讯