AI语音助理来了,我们还需要手机吗?
时间:2023-08-10 来源:区块链网络 作者:王佳健
你是如何召唤苹果手机的语音助手Siri的? 已经12岁高龄的Siri,它主要提供了三个类型的“辅助功能”。 1、调动声音、闹钟、备忘录等系统基础应用的控制能力。比如:Hi Siri,明早两点我有个2亿美金的合同要签,记得提醒我。2、调用第三方软件。比如:Hi Siri,发微信给林志玲,我想约他一起看《热烈》。3、联网搜索:比如:Hi Siri,今天晚饭想简单点,帮我看看,澳洲香槟蟹怎么做好吃?Siri自诞生以来就被贴上了智能语音助理的标签,但它的定义更应该是自然语义处理工具,仅具有语音识别和语义理解能力,然后把理解的指令去调用手机应用。 说实话,Siri的功能挺鸡肋,会用,但频率不高。 chatGPT+Siri,会不会等于钢铁侠的贾维斯?或者士官长的科塔娜? 这个答案是肯定是,大语言模型的加持势必会让第一代AI助理,包括像苹果Siri、微软Cortana、亚马逊Alexa、GoogleAssistant等等,带来一次巨大的性能飞跃。 更好的自然语言的理解处理和推理反馈,加上语音识别,这才是人们梦寐以求的AI语音助理! 说道AI语音助理,第一想到的肯定是Siri,实际上,每个手机品牌都有自己的语音助理。小米的小爱同学,华为的小艾,三星的Bixby。 今天,我们就来看看,在这一次的AI浪潮里,这些手机厂商们会如何升级语音助手这个功能。 苹果:在考虑,别急Siri进入苹果生态是在iPhone4S的发布会上,那是2011年。在当时的介绍视频里,Siri的介绍时间占据了影片的20%,充分展示了Siri强大的助理能力以及在当时十分前卫的交互操作。 10年过去了,Iphone更换了好几部,Siri还是那个Siri…… Siri会拥抱大语言模型吗?过去一年,公众对苹果进军这一领域充满期待,但苹果的表现却极其谨慎,以至于被认为是落伍了。 最近,《华尔街日报》等媒体透露,苹果已经建立了自己的大语言模型框架“Ajax”,并已经将其应用在地图、Siri等功能上。苹果还基于Ajax创建了一个聊天机器人服务,一些工程师称之为“苹果GPT”,类似于chatGPT。 因而,完全有理由相信,Siri的大升级,肯定回来,但又不会太快。从苹果少之又少的介绍中就能看出一二。这也不难理解,相比于一些创业公司的激进做法,比如向公众开放Beta测试版之类,苹果要慎重得多,在面向市场阶段,他们会更希望提供一个可靠和稳定的版本。 三星:在研究了!我们考虑得相当充分三星的语音助手是Bixby,诞生于2017年。三星有没有想让它拥有chatGPT的能力?答案是肯定的。 7月,三星副总裁兼全球产品规划总监 Junho Park 提到了生成式 AI 技术的发展,他有暗示 Bixby 将获得生成式人工智能功能。但是,三星到底如何提升Bixby的功能,三星表现得非常谨慎,鲜有相关的计划和内容披露。 非常有意思的一点, 与手机相比,科幻电影里人类助理的交互方式或许更适合的硬件是耳机。Junho Park说,“无线耳机是一种很好的沟通方式。它不需要任何屏幕,因此是生成人工智能的好地方。” 可以确定的是,三星正在积极探索将生成式人工智能融入其 Galaxy 产品的方法。这不仅包括智能手机,还包括智能手表、耳机、平板电脑。 小米:瞧好了,大招在后面小米在AI方面的团队人数据说超过了1200人,而雷军在4月份更是发微博说,小米对大模型会全力以赴。小米集团总裁卢伟冰更直接:小爱同学就是小米大模型落地的代表。 小米集团AI实验室主任王斌在最近一次的采访中称,大模型最强的能力,简单来说就是它更理解人,它显然能优化人机交互的方式。小米的小爱同学、手机操作系统MIUI、汽车的座舱、IoT、机器人,都是应用大模型的典型场景。 绝对有理由相信,小爱同学一定会拥有类chatGPT的能力!不过,按照王斌的说法,天生带着产品属性,小米大模型会跟场景结合得更紧密,它会围绕产品的节奏去做相应的发布规划。 华为:搞完了,快来玩华为手机绝对是一众主流手机厂商里最激进的玩家,在8月份的华为开发者大会上,华为常务董事余承东明确表示,华为的盘古大模型将赋能全新的语音助理小艺。 从介绍看,主要是几方面的能力。 首先是交互,包括基于自然语言理解的设备控制,本机数字内容搜索,对话识别屏幕内容。这些其实与初代助理很相似,但语义理解能力是不是更强,还有待观察。 其次是生产力,小艺可以帮助用户快速摘要、文案内容辅助、图片二次创作等等。在今年 P60 系列的发布会上,对小艺说“找一下去年在公园看烟花的照片”,它就能在图库找到对应照片。而打开一张海报,通过对话就能让小艺直接识别海报中的活动地址,并启动导航到目的地。 另外,直接发送资讯链接、文档给小艺,对它说“这篇核心观点是什么”,它可以快速总结出要点,英文资讯也可以用中文进行摘要。 最后,chatGPT上最热门的玩法,这个小艺似乎也可以,对着她说:“请写一篇关于大模型技术研讨的会议邀请函”,她就可以生成邀请函。 不得不说,很强大。这几乎就是chatGPT了语音版本了,当然准确性是否能和chatGPT一较高下还未可知,但科技感是拉满了。 不过,这些都是发布会展示内容,真正的开放测试将会在8月底,再晚一些,搭载 HarmonyOS 4.0 及以上的部分机型都可以升级。 图片来源:由无界 AI生成 当我们迎来AI语音助理后,还需要手机吗?2021年,Siri横空出世,它被寄予了厚望。但很快,它就成了用户吐槽对象:确实能辅助用户使用手机,提供操作便利,但它与智能助理之间的差距实在太大了。 十年来,Siri们不尽如人意,但今天,情况很明显有变。语音助手毫无疑问是AI语言大模型的最佳切入口,借助大模型似乎可以把语音助手从“智障”的境地带出来,变成真正的AI语音助理。 它不仅幽默,还会和我们聊天,吐槽。 它甚至可以拥有自己的情感,自己的看法。 最好,它肯定会处理很多日常的事务,可以控制各种家用设备…… 今天,从苹果、三星、小米到华为,他们都对语音助手投入了很多关注,动作有快有慢,有的激进,有的谨慎。但无论如何,我们肯定就要迎来一个更智能的AI语音助理了。 就像人类一直想要飞一样,人类追求AI语音助理的梦也是天生的。它完全就是科技发展的必然品:完成人类言语和机械直接的“沟通”。 有趣的地方或许在于,手机虽然是最佳的场景,但最后成功的一定是手机品牌吗?AI智能助理可能压根就不需要手机。 |