科幻照进现实 人工智能距离我们有多远?
近期,北京车展火爆开幕,无论是各路大牌明星的到来、大量新能源汽车的集体亮相,还是众品牌主力车型的国产化都是人们津津乐道的话题。然而在人工智能时代,汽车智能化毫无疑问才是本次车展真正的主角!
人工智能距离我们还有多远?
据了解,在本届北京车展上,八成以上的车型都标配了智能交互系统,而此前刚刚惊艳大众的乐视,也携首台生态汽车LeSEE、搭载了乐乐语音交互系统的第二代乐视车联版阿斯顿·马丁Rapide S出席车展,成为车展上最具“智能科技范儿”的代表之一。
实际上,今年3月发布的“十三五”规划纲要中,就将培育人工智能纳入其中。而人工智能技术在生活消费领域的应用获得快速拓展有望创造巨大市场机会,2016年也被视为“人工智能商用元年”。
可以说,人工智能已经不再遥不可及,科幻大片中的“神奇”场景进入到寻常百姓家也不再是奢望。仅从现在人们的日常生活中就不难看出,服务类机器人,如:扫地机器人、医疗护理机器人、娱乐机器人等已经走入现实生活。而工业机器人更是现代工业化高速发展的中坚力量。对于普通消费者而言,智能手机、客服机器人、游戏中的电脑AI等等早已见怪不怪,更不必说前些日子引起全世界关注的谷歌AlphaGo了,只要你细心观察其实人工智能无处不在,它已经慢慢渗透到了我们生活的每一个地方。
然而,尽管人工智能已经不再是完全的“新人”,但是它现阶段依然不能完全颠覆人们的生活。究其原因就是技术发展初期的不成熟,造成部分人工智能并不那么“好用”,尤其是量产产品,这也是现阶段许多厂商研究的重点。如何能够让拥有“人脑”般思考的“电脑”进入普通人的生活是一件看似简单却极为艰难的事。不过大家也不必太过失望,毕竟人工智能的发展仅有数十年的基础就出现了如AlphaGo这样令全世界惊讶甚至产生恐慌的机器人,相信人工智能真正的成为人们生活中无处不在的帮手将不会遥远。
语音交互系统到底能帮助我们解决什么问题?
从发明电脑以来,人机交互技术一共经历了五个阶段:机器语言交互阶段、命令语言阶段、图形界面阶段、物理通道阶段和虚拟现实阶段。目前我们正处在第四个阶段,即“物理多通道交互阶段”,用户可以通过更加自然的手势动作、语音或表情控制机器,进一步接近人类自然的交流习惯。同时,上述交互手段的成熟对于虚拟现实阶段的发展也有着至关重要的意义。
相对于手势动作进行交互来说,语音和表情交互显然更加令人感到兴奋,这也与大量科幻大片中镜头的出现不无关系。在这其中,语音交互是最直接、最自然的方式,也是当下最为火爆的领域,甚至被不少人认为是人机交互的下一个风口。如此前苹果收购了VocalIQ以增强Siri的语音助手功能、谷歌入股了国内的语音助手出门问问、微软将语音助手微软小娜推广到IOS和Android平台等等动作,都显示出众多国际级科技类企业对于语音交互方面的看重。
众所周知,现阶段语音交互领域中以声纹识别最为热门,声纹识别的理论基础是每一个声音都具有独特的特征,通过该特征能将不同人的声音进行有效的区分,这对于人机交互来说至关重要,也是精准识别、安全等方面的保障基础。
近期乐视420“无破界,不生态”全球新品发布会上,乐视第四代超级电视就内置了拥有声纹识别功能的语音交互系统,并且拥有能够精准识别儿童声音的能力,这也是声纹识别功能实际应用的一个典范。当儿童在使用电视的时候,会自动跳转至儿童搜索,对孩子进行保护。这对于当前国内没有影视剧分级的现状下,儿童看电视如何更加健康的问题得到了完美的解决。
实际上,语音交互还能够解决更多问题,比如:将其应用于汽车中,将会彻底解放人的双手,就算是现阶段也能够让驾驶者无需手动去开启如收音机、后备箱、空调、车灯、导航等功能,不仅更加方便,而且更加安全。同时作为智能语音交互系统,当你驾车出行的时候,相当于多了一位能够帮你处理任何车内事物的小助手,可以尽享最佳的驾车体验!
人工智能现在是时尚还是实用?
许多人觉得通过一个简单的手势,一句话就可以达到控制某一个产品的目的非常的时尚。事实的确如此,正如苹果公司在iPhone上首次搭载Siri的时候,风靡全球,以至于随后智能手机如果无法实现语音交互就会显得十分落后,甚至很土。
而在时尚的背后,也存在不少的瑕疵,即便是Siri在实际应用中也并非完美,如何处理语音的地域化、方言、用户习惯等都是亟待解决的问题,只有真正完美解决了这些瑕疵,才能真正达到正确识别用户意图的程度。
而目前非常火爆的家居类机器人其实也遇到了同样的问题,即此类机器人基本都是完成单一功能,如清洁清扫、看护等,用户体验很不理想。专家认为,出现这种情况,主要是服务机器人缺少深度学习能力,未能识别用户的意图。
而上述这些情况也正是现阶段人工智能大众化所遇到的问题,如何才能让炫酷的人工智能除了时尚感以外更加实用,是摆在当下企业面前最大的问题。
乐乐语音到底是谁?
正如上文所述,说到人工智能就不得不提语音交互,而近期最火爆的语音交互类品牌既不是大家熟悉的苹果、谷歌,也不是国内最知名的科大讯飞,而是一个名为“乐乐语音”的品牌。乐乐语音隶属于乐乐创新智能科技(北京)有限公司,近期乐视420发布会上发布的第四代超级电视中的声纹识别功能、第二代乐视车联版阿斯顿·马丁Rapide S中的车载智能交互系统都是出自这家企业之手。而这其中,为阿斯顿·马丁Rapide S量身打造的全球首款全方位立体降噪语音识别交互系统更是引起了社会各界的关注,尤其是多路语音采集降噪模组更是全球首家应用于车载交互领域的个性化语音降噪产品,具有里程碑式的意义与极大的实际应用价值。
据了解,全方位立体降噪语音识别的交互系统是利用多个层面组合技术运用,以降低在语音控制中噪声对语料的干扰。如通过指向型麦克风阵列,只接受固定角度和范围内的声音,从硬件角度上降噪;采用盲源分离、回音消除,从算法上实现语音降噪。创新性开发了多路语音采集降噪模组,即前端通过麦克风阵列,精确地定位语音来源,经过降噪系统提取纯净的语音并对该路语音进行增强及回声消除,同时通过车内六路语音提取器,精确识别车内不同座驾位置人员发出的语音指令从而输入到语音识别模块,反馈出适合该人员的实际操作。
此外,据乐乐语音工作人员透露,他们已经研发完成一整套基于车载系统的整体解决方案,为车企及车载系统开发商提供开放性SDK云平台及创新性硬件操作系统,可以广泛适配各类型车载操作系统,实现热唤醒、打断、降噪等强大功能的语音识别技术,通过场景化语义解析,涵盖导航、电台、音乐、电话、应用操控、汽车操控、违章查询、指定地点查询、路况、今日限行等各领域内容。
移动互联网时代的到来让万物互联成为可能,而在经历了长时间探索阶段后,人工智能类产品已经拥有不俗的性能和广泛应用性。业界普遍认为,人工智能越来越深入地应用于衣食住行、教育、医疗等领域,不仅可令更多民众“走近”这一高新技术并享受其“红利”,也有望创造巨大的市场机会。相信伴随谷歌AlphaGo、乐乐语音全方位立体降噪语音识别交互系统等里程碑式的产品、技术更多的出现、应用,人类将会在不远的将来真正的迎来智能时代!