来自:google黑板报
大约在 24 年前,Google 由两名探讨生创立,那时 Google 具有一种产物,以及一种远大的使命:整合全世界消息,供大众运用,让人人受益。在那以后的几十年里,咱们一直在推行咱们的技艺来实现这一使命。
咱们所取得的进步由于咱们好几年来对领先进步技艺的投入,从人力智能到为此一切提供能源的技艺根基设备。每年一次,在咱一年中最喜爱的一天:) 咱们在 Google I/O 与大伙分享全新进展。
今日,咱谈到了咱们如何提升咱们使命的两个根本方面——常识和计算的进行——来缔造能够提供帮助的产物。开发这点产物是令人亢奋的;更令人亢奋的是见到这点产物能够帮助大伙做些甚么。
感谢全部帮助咱们达成这项事业的人,尤其是 Google 的同事们。咱们很感激有这一次机会。
- Sundar
之下是 Sundar Pichai 在今日的 Google I/O 开发者大会开幕式上发表的专题演讲全文。
大伙好,欢迎大伙!时隔三年,能再回到海岸线圆形剧场的感受真好!咱想对成千上万的开发者、合作伙伴和 Google的同事们说:“很高兴看到大伙”,也想对在全球各地收看这次大会的数百万观众友人们说,“很高兴大伙能来”。
昨年,咱们分享了在少许最具技艺性挑战的计算机科学范畴中的新突破,以及这点突破如何能让 Google 的产物在要害时候发挥很大效用。咱们做的这一切皆是为了实现 Google 永恒的使命:整合全世界消息,供大众运用,让人人受益。
咱也迫不及待地想给大伙展现 Google 是如何经过两种要害形式来推行这一使命的实现:其一,深化咱们对消息的了解,从而将消息转化为常识;其二,推进计算机技艺进行,不管大伙身在何处,全能方便快速便捷地获取消息和常识。
今日,大伙将见到咱们在上述两种形式上取得的进展,以及这点进展是怎么保证 Google 的产物能够惠及大众。咱先举几个容易的例子。在新冠疫情时期,Google 一直着力于提供明确的消息,帮助大伙维持健康。昨年,有近 20 亿次搜索是运用 Google Search 和 Google Maps 来寻觅疫苗接种点的。
昨年,Google 的洪水预测技艺向在印度及孟加拉国的 2300 万人发送了洪水提前警告
咱们还提高了 Google 的洪水预测技艺,能让面对当然灾害的大家安全没有恙。在昨年的季风季,咱们向在印度及孟加拉国的 2300 多万人发送了洪水提前警告。据咱们预计,这帮助了成千上万的人及时疏散。
Google 翻译新加了 24 种言语
在全球列国,Google翻译曾经成为了外来客与本地居民互相沟通的要紧用具。
经过机器学习技艺,咱们给 Google翻译新加了包括盖丘亚语在内的新语种
实时翻译的存留证实了常识和计算机技艺能够一同使人们的生活愈加美好。此刻,运用 Google翻译的人口之多,远超过去,但咱们不行止步于此,还应让 Google翻译愈加普遍。此刻另有好多言语在互联网上显露得无那末频繁,翻译这点言语是一种技艺困难,由于用以训练翻译模子的文本平常是双语文本,像是统一个短语的英语和西班牙语版本,但却非全部言语都有足量的公布双语文本。
因而,随着机器学习的进步,咱们开发了一个单语形式,能让翻译模子在从未瞧过某种新言语的直译版本的概况下,干脆去学习翻译此新言语。经过与母语人员及本地机构合作,咱们发觉用单语形式发展的翻译品质达标,咱们也将进一步提高翻译品质。
咱们为 Google翻译新加了24种新言语
今日,咱很激动地宣告,咱们为 Google翻译新加了 24 种新言语,包括第一批增添的美洲原住民言语。共计有 3 亿多人在运用这 24 种言语,这样的突破正好推进咱们获取常识和运用电脑的形式产生基本性转变。
Google Maps 新进级
众多对于咱们这种全球的可知消息都超过了言语的范围——他们存留于咱们四周的物理和地理体积中。超越 15 年来,Google Maps 一直着力于将这点消息以丰富且有效的方式表现出去,以帮助使用者导航。AI 的进步正好将这项事业推向新的高度,不论是将咱们的掩盖范畴扩大到偏远地域,仍是从新设想如何以更直观的形式探寻全球。
AI 的进步有助于绘制偏远和农村地域的地图
到日前为止,咱们已在全球各地绘制了大约 16 亿座建筑和超越 6000 万千米的公路。源于缺乏高品质的图像和清楚的建筑类别和地貌特征,从前一直难以绘制少许偏远地域和农村地域的建筑和公路消息。为理解决这种难题,咱们正好运用计算机视线和神经网站技艺,从卫星图像中探测建筑物。自 2020 年 7 月以来,Google Maps 上的非洲建筑物数量增添了 5 倍,从 6000 万幢增添到了近 3 亿幢。
本年,咱们在印度和印度尼西亚绘制的建筑物数量也增添了一倍。在全世界范畴内,Google Maps 上超越 20% 的建筑物都曾经运用这点新技艺发展了探测。在此根基上,咱们还向公众公布了非洲的建筑物数据集,结合国和全球银行等世界组织曾经在运用这点消息,以更好地理解本地人数密度,并提供扶持和紧急援助。
Google Maps 中的沉浸式视图将航拍和街景图像合一
咱们也为 Google Maps 带来了新的功效。应用 3D 绘图和机器学习技艺的进步,咱们正好合一数十亿张航拍和街景图像,以组建一种新的高保真的地图。咱们将这点突破性的技艺联合在一同,为使用者提供了一个沉浸式视图的新体会,运用户能够从前所未有的形式探寻一种位置。
让咱们去伦敦瞧瞧吧。假设使用者计划和家人一同游览威斯敏斯特。使用者此刻可行干脆从电话上的 Google Maps 得到这类身临其境的视野,还可行在风景区四周搬动......这便是威斯敏斯特大教堂。假如使用者想前往大本钟,那末可行在地图上见到去往大本钟的公路交通能否拥堵,甚而可行见到天气预报。假如还想在游览时期吃点东西,使用者可行察看周边的餐厅,而且到餐厅的内部瞧瞧。
令人惊奇的是,这其实不是有一架没有人机在餐厅里飞行拍摄——这是咱们运用神经渲染技艺,仅经过图像来缔造的体会。Google Cloud I毫米ersive Stream 让这类体会可行在差不多全部智能电话上运转。这项功效将至今年晚些时刻在 Google Maps 中针对全世界部分都市公布。
Google Maps 的另一种重要进级是咱们公布了环境保护路线。这项功效已于昨年落地,它能够为使用者显现最节约油耗的路线,提供愈加节约而且降低碳释放的抉择。环境保护路线曾经在美国和加拿大公布,使用者曾经依照这点路线行进了约 860 亿英里,降低了约 50 万公吨的碳释放,差不多于路上降低了 10 万辆正好行进的车子。
环境保护路线将至今年晚些时刻扩展到欧洲
咱很高兴与大伙分享,咱们正好将这项功效扩展到更多的位置,包括在本年晚些时刻将扩展到欧洲。在柏林地图的示例中,使用者可行抉择仅慢三分钟的路线,将油耗下降 18%。这点微小的打算将发生庞大的作用。随着这项功效扩展至欧洲及其它地域,咱们估计到本年年底可行节约的碳释放量将增添一倍。
咱们同样在 Google Flights 上增添了一种相似的功效。当使用者搜索两个都市之中的航班时,咱们也会向使用者显现碳释放估值以及价值和时间表等其它消息,让使用者轻松抉择愈加环境保护的航班。Google Maps 和 Google Flights 中的这点环境保护功效是咱们十分要紧的指标,即让 10 亿人经过咱们的产物做出更可持续的抉择,咱们十分高兴能够见到这点进展。
YouTube 新功效帮助使用者轻松访问视频内容
除了 Google Maps 之外,视频正好成为咱们分享消息、互相交流和学习必不可少的载体。好多时刻使用者在映入 YouTube 后,是期望在 YouTube 中寻到一种视频中的特定片段,咱们期望帮助使用者更快地获取所需消息。
昨年,咱们公布了自动生成的章节,让使用者可行更轻松地跳移到最感兴趣的部分。这对创作者来讲也是很棒的功效,由于它节省了创作者制作章节的时间。咱们此刻正好利用 DeepMind 的多形式技艺,这项技艺可行同一时间运用文本、音频和视频,并以更高的明确性和更快的速度自动生成章节。有了这种功效,咱们此刻的指标是将自动生成章节的视频数量增添 10 倍,从日前的 800 万到明年的 8000 万。
平常,理解视频内容的最快方法是阅读它的脚本,是以咱们也在运用语言声音辩别模子来转录视频。此刻全部 Android 和 iOS 的使用者都可行获取视频的脚本。
YouTube 上的自动生成章节
然后,咱们将把 YouTube 上的自动翻译字幕利用到搬动设施上。这意指着观众此刻可行获取 16 种自动翻译的视频字幕,创作者也可行借此迷惑全世界观众。
Google Workspace 帮助提高事业效能
正如咱们运用 AI 来改良 YouTube 的功效一样,咱们也正好将 AI 建立到 Workspace 系列产物中,以帮助大家提高事业效能。不论你是在小型公司仍是大型机构事业,可能都须要消费大批时间阅读文献。或许你此刻就记忆起了当你有一份 25 页的文献要阅读,而会议将在 5 分钟后最初的那种恐慌。
在 Google,每当咱收到一份长的文献或电子邮件时,咱都会在顶部寻觅“TL;DR”——“太长未读"的缩写。这让咱们料到,假如更多的事宜可行有“TL;DR”,生活非是会更好吗?
这便是为何咱们为 Google Docs 导入了自动总结功效。将咱们此中一种机器学习模子利用在文本总结功效种,Google Docs 将自动剖析单词并提取出重点。
这标记着当然言语料理的一种大飞跃。总结须要了解长段落、紧缩消息并生成言语,而这点曾经高于往日最佳的机器学习模子的能力。
而文档不过一种最初。咱们正努力将总结功效导入 Google Workspace 的其它产物。在然后的几个月里,Google Chat 将运用该功效,为聊天对话提供摘要,帮助使用者快速加入群聊,或回顾要点消息。
在未来几个月内,咱们将在 Google Chat 中加入总结功效
况且咱们正好努力将转录和总结功效导入 Google Meet。这样,使用者可行迅速补上要紧会议中错过的部分。
改良 Google Meet 视频
自然,好多时刻你真的十分期望有个虚拟房间,可行让你和别人待在一同。这便是为何咱们在 Project Starline 的启发下,接着提升音频和视频品质。咱们在昨年的 I/O 大会上推荐了 Project Starline。咱们一直在 Google 的各个办公室发展测试,寻求反馈并为未来改良技艺。在这种进程中,咱们发觉了少许可行立刻利用于 Google Meet 的技艺。
Project Starline 启发了机器学习驱动的图像料理,可行自动改进 Google Meet 的图像品质。况且这项技艺适用于全部类别的设施,因而不论你在哪里,全能展现你的最好造型。
机器学习驱动的图像料理,自动提升了 Google Meet 的图像品质
咱们还为 Google Meet 带来了摄影棚规格的虚拟灯光。你可行调度灯光的位子和光度,是以即便使用者身处黑暗的房间或坐在窗前依然可行被清楚见到。咱们正好测试这项功效,以保证人像愈加真正,这也是咱们在 Pixel 电话上的 Real Tone 和 Monk Scale 所做的事业的推行。
这点不过运用 AI 改良咱们产物的此中少许形式:使产物更有帮助,更简单得到,并为每私人提供创新的新功效。
今日在 I/O 大会上,Prabhakar Raghavan 分享了咱们如何帮助大家应用 Google Search 以更直观的形式寻到有效的消息
经过计算使常识更易得到
咱们曾经谈到了咱们如何推行常识的获取作为咱们使命的一部分:从更没有问题言语翻译到改良的跨图像和视频的搜索体会,到运用地图对全球发展更丰富的探寻。
此刻咱们着力于经过计算使这点常识更简单得到。咱们在计算方面所走过的旅程令人亢奋。从桌面到网站到搬动设施到可穿戴设施的每次转变,以及环境计算都使常识在咱们的平常生活中愈加有效。
虽然咱们的设施很有帮助,但咱们不得不差不多努力地去适应他们。咱一直以为应当由计算机来适应人,而非是人来适应计算机。咱们将接着追寻这方面的进展。
这边是咱们如何应用 Google Assistant 使计算愈加当然和直观地表现。
公布 LaMDA 2 和 AI Test Kitchen
咱们研发的用于对话应有的生成言语模子 LaMDA 的 Demo,以及 AI Test Kitchen
咱们在接着努力提高人力智能的对话能力。对话和当然言语料理全能使人们以更容易的形式运用计算机。大型言语模子是实现这一指标的要害。
昨年,咱们发表了 LaMDA,这是一种用于对话利用的生成言语模子,可就全部专题开展对话。今日,咱们很高兴能公布 LaMDA 2,Google 日前塑造的最领先进步的对话 AI。
日前,这点模子的实质利用还处于初始阶段,咱们有责任去不停改善他们。为了取得进展,咱们须要运用者体会技艺并提供反馈。咱们曾经向数千名乐意参加测试和理解其功效的 Google 同事们开放了 LaMDA,明显提高了它的对话品质,降低了不明确或冒犯性的回复。
这便是咱们要研发 AI Test Kitchen 的原因,这是一个与很大范畴的使用者一同探寻 AI 功效的新形式。AI Test Kitchen 有数种不同的体会形式,每种形式都旨在让使用者理解本人在现实生活中如何运用 LaMDA。
第一种 Demo 是“想象”,测试模子能否可行了解使用者提供的创意,生成富有想象力的相干描画。这点体会形式非是产物,不过让咱们和你能一同探寻 LaMDA 能做甚么。使用者界面十分容易。
假设你正好写一种故事,须要少许灵性。或许你的角色之一正好探寻深海,那末你可行问 LaMDA,在这类情境下会有甚么感受。在此,LaMDA 描绘了马里亚纳海沟里的一种情景,它甚而还可行即时生成延续难题。你可行让 LaMDA 想象一下那边可能生活着甚么样的生物。须要重申的是,咱们并未为少许特定话题,例如潜水艇或生物发光发展手动编程,却是 LaMDA 本人依据训练数据整合了这点概念。这便是为何你差不多可行询问全部话题:土星环,甚而是“由冰淇淋制成的星球”。
不跑题是言语模子的一大挑战。在塑造机器学习体会的进程中,咱们期望它既充足开放,使人们能够探寻好奇心会把它们带到哪里,又聚集于话题自身。咱们的第二个 Demo 展现了 LaMDA 如何做到这一丝。
在这种 Demo 中,咱们设计模子专注于与狗相干的专题。它起首生成了一种能打开对话的难题:“你有无有想过为何狗那么喜爱玩捡东西?”假如你问一种延续难题,你会获得更细化的谜底:狗感觉很有趣,这和狗的嗅觉和狩猎感相关。
使用者可行就全部方面开展延续对话。或许你对狗的嗅觉的事业原理感觉好奇,而且想更深入地探讨。那末,你也能获得专门的回复。不论你问甚么,LaMDA 都会努力将对话限定在与狗相干的这一话题范畴内。假如咱最初问板球相干的难题,那末模子可能会以一个有趣的形式将对话捎回狗身上。
维持不离题是个很棘手的挑战,要想运用运用言语模子塑造有效的利用程序,这是很要紧的一种探讨范畴。
AI Test Kitchen 的这点体会表达了言语模子有帮助咱们发展计划、理解全球和达成好多其余事宜的潜力。
自然,在这点模子真实有效此前,还须要解决少许重要挑战。尽管咱们提升了平安性,但该模子仍可能生成不明确、不适当或冒犯性的回应。这便是咱们踊跃邀请使用者提供反馈的原因,这样它们就能反馈难题。
咱们将依照 Google AI 的准则发展全部事业。咱们将不停迭代 LaMDA,在未来几个月一步步开放,并用心、广大地估价利益相干者的反馈——从 AI 探讨人士和社会科学家到人权行家。咱们将把这点反馈整合到 LaMDA 的未来版本中,并随时分享咱们的发觉。
将来,咱们计划在 AI Test Kitchen 中添加其余新兴 AI 范畴。你可行在 g.com/AI Test Kitchen 中理解更多。
让 AI 言语模子更强盛
LaMDA 2 具有不可思议的对话能力。另外,为了探寻当然言语料理和 AI 的其余方面,咱们最近还公布了新模子 Pathways Language Model(PaLM)。这是咱们迄今为止研发的第一大范围的模子,鉴于 5400 亿参数训练而成。
PaLM 在众多当然言语料理任务上都有着突破性的体现,比如从文本生成代码,回答数学难题,甚而解释一种笑话。
PaLM 经过扩大模子范围实现了这一丝。当咱们将这类大范围模子与一个名为“思维提醒链(chain-of- thought)”的新技艺联合起来时,结果是令人充满期望的。“思维提醒链”让模子可行将须要多步解决的难题转化为一系列的当中环节来料理。
让咱们以一种须要推理的数学难题为例。平常,咱们在运用模子前须要先以其余难题和谜底训练它,接下来再提问。在这种例子里,难题是:五月有多少个小时?可行见到,模子并未给出正确的谜底。
在“思维提醒链”中,咱们给模子输入一对“难题—谜底”,同一时间解释了谜底是如何得出的。这有点像你的老师一步一步地向你讲解如何解题。此刻,假如咱们再问模子“五月有多少个小时”或许其余相干难题,它能给出正确谜底和解答进程。
“思维提醒链”技艺让模子能更好地发展推理,给出更明确的谜底
“思维提醒链”大大提升了 PaLM 的明确性,让它在包括数学难题在内的若干推理基准测试(reasoning benchmarks)中达到了最高级水准。咱们在不改变模子训练形式的概况下达成了这一切。
另外,功效强盛的 PaLM 还能做到更多。比如,网站上此刻可能无充足多的以你所运用的言语提供的消息。更令人沮丧的是,你所搜寻的谜底可能就在某处,不过无以你看得懂的言语表现,而PaLM 提供了一个有望让每私人都更简单得到常识的新方法。
让咱展现一种示例,PaLM 可行用孟加拉语(一个有 2.5 亿人运用的言语)回答难题,就像咱们用孟加拉语的难题,以及孟加拉语和英语的谜底训练了它一样。
便是这样,此刻咱们可行最初用孟加拉语提问:“孟加拉国的国歌是甚么?” 顺便说一句,谜底是“Amar Sonar Bangla”——PaLM 也答对了。这其实不令人惊讶,由于在孟加拉语材料中很赫然能寻到相干谜底。
你还可行尝试少许不太可能以孟加拉语寻到相干消息的难题,例如:“纽约盛行的披萨配料是甚么?”该模子再一次以孟加拉语做出了正确回答。尽管它的回答到底有多“正确”,这一丝很可能在纽约人之中激发辩论。
令人感官深切的是,PaLM 从未瞧过孟加拉语和英语之中的对译。咱们也从未训练过它如何回答难题或翻译!该模子本人将全部功效联合在一同,可行用孟加拉语正确回答难题。咱们可行将这点技艺扩展到更多的言语和其它繁杂的任务。
咱们对言语模子的潜力十分乐天。有朝一日,咱们期望咱们能以使用者说的全部言语回答更多难题,让常识在 Google Search 和其余 Google 的用具中更简单被获取。
公布全球第一大的开放机器学习中心
咱们今日所分享的进步之是以能成为现实,离不开咱们在根基设备方面的持续创新。咱们最近还宣告了 Google 计划向美国各地的数据中心和办公室投资 95 亿美元。
咱们最领先进步的数据中心之一位于俄克拉荷马州的梅斯县。咱激动地宣告:咱们将为 Google Cloud 消费者公布全球第一大的开放机器学习中心。
咱们最领先进步的数据中心之一,位于美国俄克拉荷马州梅斯县
此机器学习中心具有 8 个 Cloud TPU v4 芯片,是 Google 定制,建在为 Google 第一大的神经模子提供扶持的网站根基设备之上,能提供挨近 9 x 1018 的算力,可行为 Google 的消费者提供前所未有的运转繁杂模子和事业负荷的能力。咱们期望这将推进许多范畴的创新,从医学、物流,到可持续性进行等等。
讲到可持续进行,该机器学习中心已达到 90% 的没有碳燃料运营。这能帮助咱们实现本人的指标,即到 2030 年时,麾下全部的数据中心和园区实现整天候没有碳运营,咱们要成为第一种做到这一丝的大企业。
在投资数据中心的同一时间,咱们也在努力创新 Google 的搬动平台,这样更多的数据料理就能在当地设施上发展。Google 定制的 Google Tensor 芯片是朝此方向迈进的要紧一步。Pixel 6 和 Pixel 6 Pro 旗舰电话已装载 Google Tensor 料理器,让你的电话干脆具有 AI 功效,包括咱们所利用的最佳的语言声音辩别技艺。这也是向“让设施更平安”这一指标迈出的一大步。与 Android 的 Private Compute Core 联合后,这项技艺可行干脆在设施上运转数据驱动的功效,庇护你的隐私。
不论是至关要紧仍是微不足道的时候,每天都有人向咱们的产物寻求帮助。让这一丝成为可能的要害便是在每一步都庇护使用者的隐私消息。虽然技艺正变得日渐繁杂,但咱们的产物是平安的,从设置上庇护隐私,让使用者具有操控权,因而,在让全球更多人能平安上网这一丝上,咱们比其它人走得更远。
咱们今日还分享了 Android 等平台的革新,这点革新正经过智能电话和其它可接连设施,像电视、车子、手表,向数十亿人提供访问、接连和消息。
咱们还分享了全新的 Pixel 系列产物,包括Pixel 6a, Pixel Buds Pro, Google Pixel Watch, Pixel 7 和 Pixel 平板电脑,全部产物均融入了环境计算的设置。咱们也很高兴能经过一系列设施更好地为使用者提供帮助。
计算技艺新前沿——加强现实技艺
今日,咱们讨论了全部正好改变咱们的技艺,他们改变了咱们运用计算机的形式和获取常识的形式。不论什么时候何地,只需有要求,咱们都可行寻到互联互通、紧密协作的设施。而对话界面的加持更为达成任务提供便捷。
展望未来,消息技艺范畴有了一种新战线,它具有推进现存技艺接着进行的潜质,它便是加强现实技艺(AR)。Google 在 AR 范畴投入颇多:咱们已将 AR 引用到众多产物中间,包括Google Lens、多重搜索(multisearch)、情景探寻(scene exploration)以及 Google Maps 的 Live Views 和沉浸式视图功效。
AR 各项功能已利用于电话末端,其神奇之处在于它可行在现实全球中为咱们带来最真正、当然的体会,似乎咱们却非在运用科技。
最令人振奋的是 AR 的潜力,也便是它能使咱们去关心真正的全球、真正的生活。要晓得,咱们所生活的这种全球本就精彩没有限!
咱们鉴于现实全球发展创作设置,绝不脱离现实,这一丝至关要紧。AR 恰好是能够帮助咱们实现这类设置理念的新方法。
以言语为例,言语是人与人之中沟通的根基。然则,假如对方讲着另一个言语,或许会话的一方有听觉阻碍时,沟通就变得难题重重。咱们来瞧瞧当咱们将全新技艺利用在翻译和言语转录中,并在早期测试原型中表现出去时,会显露甚么成果。
如果你所见,视频中的大家能够当然、通畅地与他人沟通,它们的脸上洋溢着喜悦。了解与被了解,那联通的一刻正是咱们在常识和计算机技艺方面所关心的,是咱们经过产物帮助大家实现的,也是咱们每日奋斗追逐的指标。
每一年,咱们全在向咱们的终极使命迈进,未来的路还很长。Google 真切地为这感觉振奋!咱们抱以乐天的态度,坚信咱们取得的突破将引领咱们达成使命。感谢全部与会开发者、合作伙伴和客户。咱们期待与各位一同共筑未来。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关心)













