这部分由谷歌 CEO Sundar Pichai “劈柴哥” 亲自讲

2019-05-17 05:16字体:
  

  今年的 Google I/O 大会结束了,硅谷洞察第一时间送上全程精华!

  如果说整场发布会要选出关键词的话,“安全与隐私” 是一个——几乎每个产品都强调了隐私和安全,“服务更多人” 是另一个 —— 从 35 美元手机上也能使用的服务、到帮助文盲人士读懂指示牌、再到帮助听障人士与人更好交流,谷歌强调了好几遍的 “服务更多人”。

  谷歌的CEO Sundar Pichai 甚至开头就说,谷歌的目标从始至终没有改变: 希望谷歌的产品对每个人的生活更有帮助。

  谷歌产品高级总监 Aparna Chennapragada 介绍道,谷歌搜索引入了 AR 相机功能,让你能把网上的东西 “放入” 你周围的环境里,给传统搜索增加了一个全新的维度。

  比如,你可以搜一双鞋子,用这个功能把 AR 图像直接放在你的房间里,看它和你的衣服裤子搭不搭配。

  如果你觉得 “看看这双鞋/某个新家具放在家里效果如何” 这种事过于日常,你也可以用这个功能做些奇怪的事情,比如把 AR 大白鲨 “邀请” 到谷歌今天大会的演讲台上...

  更牛的是,谷歌还把这个技术和 AI 结合在了一起,要 “给全世界建档” (indexing the physical world),这也诞生了很多逆天功能。

  举个例子:你在一家新餐厅不知道哪道菜好吃,打开摄像头对准菜单,自动高亮出菜单上的热门菜,还能从菜名搜索图片,让你直接看到菜长什么样子!对了,吃完饭后,在要付小费的国家,你用手机摄像头直接对着小票,手机就能直接给你算出要付多少小费。

  直接拿起手机摄像头对准烹饪杂志某张图,它会直接显示该道菜的烹饪视频!真是大写的服!(当然,谷歌和该杂志有合作关系,并不能运用到任意烹饪杂志上。)

  “看懂路标、指示牌” 这种对绝大多数人都很简单的事,有些人却很难 —— 比如全球 8 亿文盲,或是在陌生国度的旅行者。 谷歌不仅能把指示牌上的文字直接读出来,甚至还能直接、实时翻译,再把翻译后的文字读出来!这个功能已支持 14 种语言,而且即使在只有 35 美金的手机上也能运行,真正做到 “服务更多人”。

  去年发布会上,能订票、能做简单预约的谷歌助手 Duplex 首次亮相就引起了极大关注。今年,谷歌助手主要在两个方面取得新突破:一,速度极大提升;二,更贴心、更个人化。

  先来看速度极大提升。随着深度学习技术的进步,谷歌取得了一个里程碑式进展:现在,100GB 的语音学习模型已被缩减到仅有 0.5 GB,这也意味着它已经可以搭载到手机上了。

  那么,系统对人类语音控制的反应速度如何呢?现场真人演示环节,小姐姐全程对手机语音下达命令,无论是问天气、回复邮件、查询自己日程,都不含糊,系统响应非常迅速!展示了什么叫 “下一代谷歌助手(Next Gen Google Assistant)”。

  甚至小姐姐说要和朋友分享某次旅行带有动物的图片时,手机还自动筛选出带动物的照片;语音写邮件时,说了句 “邮件主题:黄石公园旅行”,手机自动把 “黄石公园旅行” 填写到邮件主题栏,而不是把这句话包含在邮件里。总之,非常智能,非常快速,全程语音输入,识别准确率惊人,演示几乎毫无卡顿。

  除了更快,新一代谷歌助手希望更好地理解你的心思,为你提供个性化服务。工程副总裁 Scott Huffman 就展示了自己搜 “今晚做点啥吃好”时,谷歌根据他的喜好,给他 “量身定制” 晚餐食谱。

  不仅是食谱,在你搜播客、“周末干点啥” 等有关个人喜好的东西时,谷歌的新功能 “Picks for you” 都能揣摩你的心思,给你建议。

  当然,这些 “个性化参考” 的服务是基于谷歌对用户数据的分析与理解,如果不想让谷歌获得这些信息,用户可以随时在设置中编辑或移除这些信息。

  此外,谷歌助手也来到车上了。用户只要说 “Hey Google, lets drive” 这句命令,就能启用驾驶模式下的谷歌助手。在此模式下,语音打电话、回短信都不离开谷歌地图,用户不再需要在应用之间来回倒,一切语音控制,更方便,也更安全。安卓手机有谷歌助手的用户,今年夏天就可以用驾驶模式了。

  这两年科技巨头没少在隐私上挨罚:上周 Facebook 发布会上 “隐私” 这个词被提了几十次,今天谷歌也不例外 ——在政府、媒体轮番轰炸后,谷歌展现出极为强烈的求生欲。

  这部分由谷歌 CEO Sundar Pichai “劈柴哥” 亲自讲,可见重视程度。

  劈柴哥首先说,谷歌正努力确保其 AI 模型不会强化世界上既有的偏见(比如,什么人更容易犯罪、什么人更容易不还银行贷款等)。为解决这个问题,谷歌正在研发一种叫 TCAV 新模型,新模型能让你知道机器选择了哪些变量,如果你认为这个变量无关紧要,就可以告诉模型忽略该变量,从而使结果更准确。

  举个例子,对于识别斑马来说,“有条纹” 就是个重要信号。但假设喂给机器大量医生图片,恰好男性居多的话,机器在识图时就有可能据此得出结论,认为 “男性” 是 “医生” 的一个信号,显然不对。人类此时可以纠正机器,“男性与否” 与 “是不是医生” 无关,而 “白大褂”、“听诊器” 之类的图像元素,与 “医生” 才有强相关性。

  谈完消除 AI 偏见后,劈柴哥谈的下一部分就是让用户充分掌握自己的隐私。

  Chrome 浏览器隐身模式相信大家都已不陌生了,现在谷歌地图和 YouTube 也迎来了全新的隐私模式。在谷歌地图上,用户将可以选择隐藏自己的搜索与位置信息;在 YouTube 上,用户也不用让每次搜索结果影响以后的内容推荐。

  除了让用户能控制何时、与谁分享数据之外,谷歌还想进一步打消用户对隐私的忧虑。比如不少人可能会担忧:为啥我发短信、写邮件时机器总能正确地预测出我要打的字?

  劈柴哥解释道,谷歌运用了一种叫做 “集合数据(Federated Learning)” 的全新机器学习算法,“我们无需收集你的具体数据—— 也就是你手机里打的具体的字句,而是将机器学习模型集成到了每一台设备上,并将后者发送到云端进行计算。”

  有了这项新技术,谷歌键盘输入法可以学习各种新单词,再把学习 “结果” (比如你打 “十动然”,机器学习后会自动推荐 “拒” 这个字)反馈给每台机器,而无需深入检索数据本身,从而保全用户隐私。

  说完了安全与隐私的 “求生欲部分”,谷歌接下来展现了其情怀一面:服务更多人。

  在服务听障人士方面,谷歌早有行动。之前已有 Live Transcribe 功能,今天又发布了以下几个新功能:Live Caption 及 Live Relay 给日常对话附上字幕,这样就能帮助聋哑人士以语音文字无缝转换的方式 “打” 电话。

  再比如 Project Euphonia,一款识别讲话与普通人有显著不同的语音识别系统,帮助由于患有中风、口吃、ASL 渐冻症等疾病而讲话有严重困难的人,也能说出被机器理解的话,与机器、与人交流,极大提高生活的便利性。

  正如众多媒体预测的,今年 I/O 大会一定有关于新一代安卓系统的更新。果不其然,Android10 —— Android Q 来了。

  安卓高级总监 Stephanie Cuthbertson 首先公布了一个数据:全球如今有 25 亿活跃安卓设备用户了。新一代安卓系统有三个关键词:创新(Innovation)、安全和隐私(Security&Privacy)、数字健康生活(Digital Wellbeing)。其中最后一条跟去年相同。

  谷歌表示,对于折叠屏而言,支持多重任务切换,半屏到全屏切换,都能实现无缝对接。另一个就是对 5G 网络的支持了。

  至于前面让我们最为震惊的实时字幕(Live Caption)功能,谷歌表示,这主要是针对耳聋或有听力障碍的人建立的,除了观看视频之外,这个功能也被添加到电话中,可以对当前对话进行实时转录,帮助那些听力困难的人清楚地理解所说的内容了。

  另一大震惊之处在于,该功能即使你是在飞行模式之下,也可以实现!还可以上下移动实时字幕的位置,非常方便。

  还有,广受期待的黑暗主题(Dark Theme)终于发布啦!为啥?当然是省电啊。全场听到这都鼓起了掌。这年头,手机没电估计最要命了……因为今天开放下载 Android Q 测试版,有体验过的用户表示,确实是真正的黑色,而不是灰色,从而有助于真正省电。

  在隐私安全方面,谷歌宣布,隐私功能可以说是 Android Q 的顶级设置,甚至 50% 的功能都专注于保护你的隐私。

  列举的一个明显用法是:用户对位置控制(New Location Controls)的选择。作为用户,你可以看到哪些 APP 在记录你的地理位置,你可以随手关上。你想要在不使用 APP 的时候把位置记录关上,也是可以的。

  按照谷歌的说法,如今,美国孩子使用手机的岁数是8岁。那么,在新的安卓系统设计上,父母可以查看孩子使用屏幕的时间,比如哪些 APP 是孩子使用时间最长;也可以设定屏幕的限定时长,比如 3 小时为限,过了之后,孩子就无法使用了;设置孩子的睡觉时间等。非常贴心的是,即使是针对某一个单独的 APP,也可以设置。此外,如果你的孩子遵守这些设定,甚至家长还可以提出“奖励时长”(bonus time)呢。

  如果说看完唯一疑惑的话,那就是到底众多隐私功能是在所有新安卓系统上都能实现,还是说限定在搭载了安卓系统的 Pixel 手机上呢?

  说完新安卓系统,谷歌硬件产品负责人 Rick Osterloh 上台了。果不其然,带来了新的家庭智能屏幕操控设备 Next Hub Max,以及新手机 Pixel3a 。

  其实此前就有猜测,本届大会谷歌会亮相“廉价版”的 Pixel 手机,以及带摄像头的智能家具设备,从而在亚马逊公布 Echo Show 和 Facebook 的Portal 两款带屏幕的智能音箱公布后,不落人后。

  对于 Next Hub Max 这款带 10 英寸屏幕的智能助理音箱,谷歌无疑想其成为一个智能家居设备的中控台。比如说,既可以控制温控器Nest,也可以控制你的智能门铃 Ring,又或者是你在厨房做饭时,让 Youtube 直播你最喜欢的体育节目,和调动你的 Gmail,让它提醒你,该提前出门去搭飞机了。

  有意思的一个细节是,如果你真的不想让它播放现有的节目,你只需要做一个举手、挥手的姿势,节目就自动暂停了。

  另外,Nest Hub Max 除了有声音识别模式之外,也开启了一个面部模式,即识别每一个用户不同的脸部,并做出个性化的主页。例如日历是你自己的,照片也是你的 Google Photos 上的。不过,为了强调隐私的谷歌称,该设备将会在本地处理面部数据,而不会将其上传到云端。

  说完智能家具,Pixel 3a 出场了,售价 399 美元(未含税,约人民币 2700 元)。

  如果说真的有什么功能让爱疯党羡慕(仇恨)的话,那估计是照相功能了吧。背面 1220 万像素传感器和f / 1.8镜头,这与 Pixel 3 相同,正面自拍则是 800 万像素。

  Pixel 3a 称,其夜间照相功能要比 Phone X 的好(请注意,可没说 iPhone X,但...你懂的),而且自带景深调节功能,还自带照片无限、免费储存的功能。(小探为了存照片,还苦苦挣扎在付费 iCloud 的服务中……)

  如果你想选 300— 500美元区间内的手机,还要拥有不错的照相功能的话,那你不妨考虑下它?更大的 Pixel 3a XL 拥有6英寸屏幕,起售价 479 美元。至于电量方面,Pixel 3a 称能做到单次充电用 30 小时,15分钟充电能撑 7小时。

  当然,这款手机的缺点也是比较明显的,比如没有无线充电、不防水,处理器较慢等。

  某小探说了,不到 400 美元,真是买了不吃亏,买了不上当啊……不过可惜的是,还是没有中国地区……

  近两年谷歌 I/O 大会上,谷歌已经以不同形式,大大小小的方式展示其AI肌肉。今天当然也不例外。但看完今年发布会,感觉谷歌最想要表达的是,AI 是向善的,而非作恶的。(可以查看此前硅谷洞察的报道:谷歌跟五角大楼合作)

  用谷歌 AI 技术部门负责人 Jeff Dean 的话说,人工智能作为一种技术,是从根本上解决其他问题,从而改善人们生活的。

  当然,真正偏技术的部分,就是谷歌宣布新发布的语言学习模型 BERT 了,Jeff Dean 展现如何在训练的时候,甚至可以故意隐匿部分单词,然后让 AI 去猜。

  随后上台的医学博士 Lily Peng 介绍,谷歌如今通过深度学习模型,对肺部的 CT 扫描图像进行分析,从而更早预测、判断肺癌的发生。这个早期预测的结果在 6 名训练有素的放射科医生中,有 5 名都没有发现。如今,这个模型正对泰国印度的数千名患者进行糖尿病并发症筛查,该模型也通过了欧盟监管机构的批准。

  另一大领域,是帮助解决社会问题,比如如何通过对卫星图片进行深度学习,从而预测洪水发生时的可能情况,帮助民众更好地预警、逃离。

  现在,谷歌正在将其检测和警报系统扩展到更广泛的覆盖范围,还推出了一个新版本的公共警报。

  为了社会福祉的人工智能(AI for Social Good)是谷歌去年推出的一项举措,而今年,Jeff Dean 也再度展现了谷歌是如何跟国际组织、大学研究机构等展开合作,并捐款 2500 万美元,支持这些机构研究。

  最后,Jeff Dean 再次重申了今年的主题:谷歌想要打造一个对所有人都有用的谷歌。就结束了一个半小时的大会主题演讲。

  虽然结束得有点奇怪,但硅谷洞察想说,跟前面看的一些其它大公司发布会相比,谷歌技术上的用心,谷歌的技术进步,着实让现场的欢呼声来得不那么尴尬,甚至不少是自发的。

  为了解决用户需求打造更好的技术,技术向善,不正是科技巨头公司们本来该提供的么。



产品分类CATEGORY

联系我们CONTACT

全国服务热线:
4006-026-000
地 址:江苏省南京市西善桥南路118号d88尊龙大厦
电 话:4006-026-000
传 真:+86-25-52415096
邮 箱:13254867@qq.com