不只有AlphaGo:Facebook、百度们在干啥?
2016年03月16日 12:36:18
540 钛媒体

     谷歌人工智能AlphaGo围棋程序与围棋世界冠军李世石的“人机大战”落下帷幕,同时也掀起了一股人工智能(AI)热潮。尽管此前人类一直在进行AI的研究、开发和应用,我们发现业内在探讨AI的时候已经更多将其与谷歌联系在一起,至于应用,似乎也只有围棋才能体现出AI的实力。但事实远非如此。

人工智能新风向:Facebook,苹果,微软发力语音

实际上在谷歌AlphaGo与李世石博弈之前,Facebook曾经就挑战围棋的程序称自己也可以利用AI实现,后来又承认其与谷歌的AlphaGo存有一定的差距。但Facebook CEO扎克伯格已经明确表示,AI是Facebook未来发展的核心之一。

据了解,Facebook在人工智能领域的布局主要围绕着其用户的社交关系和社交信息展开,Facebook 在2015年7月开发代号为“Moneypenny”(简称M)的人工智能助理项目,该项目顺利的通过了内部测试并正式运行于 Facebook Messenger内,类似 Cortana、Google Now 和 Siri,但它更加优秀,可以对接人工客服,为客户提供商品查询和购买等服务。8月份,M助手被正式推出,目前M助手的功能和用户体验仍在持续更新优化中。

在这之前,Facebook人工智能研究中心(Facebook AI Research)在巴黎成立实验室,挖掘欧洲近百名人工智能人才,建造了能够理解海量数据的人工智能机器,而这已经是Facebook在美国门洛帕克和纽约之后开设的第三个专攻人工智能技术的研发中心。有意思的是,Facebook的人工智能布局似乎始终在对标谷歌

至于苹果,由于其是硬件厂商,所以未来它的业务还是以移动设备为核心,但仅仅依靠现有的交互方式是没有前途的。为此,去年10月,苹果收购了创业公司VocalIQ。VocalIQ是一家英国公司,该公司的技术可以理解自然语言,用户能以休闲会话的方式与设备进行交互,而不是一般设备所理解的冷冰冰的提示性语言。苹果通过该公司的技术来强化Siri功能。

对于传统IT大佬微软,Cortana与微软小冰是人工智能在当下的两种不同表现形态。前者让Windows Phone变的更加易用与人性化,而后者则是活跃在社交平台上,成为和用户沟通的人工智能机器人伙伴。比起其他初级的语音智能搜索,Cortana更像一个智能的私人语音助理。

需要说明的是,微软为Cortana进行了长时间的筹备,整个研发过程,微软在缔造Cortana的时候真正把她当作“人”来做。通过自然语言理解让Cortana能够听懂人类语言,而机器学习能够让Cortana像一个真的私人助理一样,更加了解它的主人。借由微软Bing提供的大数据支持,Cortana能够变得更加聪明。

不知业内从上述科技大佬的AI中看到了什么?我们看到的是,它们无一例外地将语音识别或语音搜索作为AI发力的主要方向。原因何在?

人工智能新风向:理解人类,服务人类

众所周知,随着以智能手机为代表的移动终端的崛起和普及,用户迫切需要更为智能和快捷的方式与自己的设备进行“交流”和“体验”,而语音无疑是最佳入口。

但语音搜索并不只是一种简单的AI技术,而是将多种人工智能技术整合起来的典型应用,包括语音识别、自然语言处理(对语言的理解)、对数据的挖掘和呈现。相比单一规则的计算,语音搜索的整个过程要复杂得多,因为思维、对话、情感等都具有极大的不确定性,通过多轮对话进行的语音搜索更是如此。那么什么是多轮对话?在此我们不妨以百度语音搜索为例来看看。

比如,打开手机百度,按住下方的麦克风向它询问一系列问题,百度语音搜索会根据语义和语境与用户进行多轮对话互动。

不只有AlphaGo:Facebook、百度们在干啥?

搜索引擎能够完成与用户多轮对话,需要像人与人之间的交流一样,要基于上下文理解用户的意图。要做到这一点,技术挑战非常大。毕竟,人类语言具有复杂性,机器识别单句自然语言的语义都不容易,而基于上下文等于要不断记录交互过程,就更是难上加难,也是Facebook、微软、苹果、百度等主要科技大佬主攻的方向和面临的挑战。

令业内感到欣慰的是,目前百度在基于深度学习的语音交互技术上实现了突破。在最近《麻省理工科技评论》公布的2016年十大突破技术中,百度凭借领先的语音交互技术登上榜单就是证明。该榜单指出,百度在世界语音交互技术领域做出了突出贡献,即将语音识别和自然语言理解相结合,为世界上最大的互联网市场创造切实可用的语音接口。百度所推出的Deep Speech2深度语音识别系统将人们从传统的利用触摸屏输入汉字发出指令中解放出来,通过语音完成搜索行为。

除了多轮交互,百度语音搜索引入注目的特性在于它并非简单的语音识别,而是包含着对需求的理解以及对数据资源的聚合。比如当用户向它询问“今天有雨吗”,文字输入会呈现6天详细的天气预报,而语音搜索结果不仅会呈现天气预报页面,更会语音回答用户“上海今天小雨”。再比如当用户询问“我要吃饭”时,百度语音搜索能给用户提供附近餐饮类相关的打折或团购等优惠,快速提供信息和服务满足用户需求。

而之所以存在这样的区别,究其原因是百度搜索引擎准确理解了语音背后的语义,从而给予用户真正需要的智能化服务。由此看,只有语义理解的突破,人工智能才能更接近人类语言背后的真实意图,才具有实际价值,才能最终为用户所用。

同济大学电信学院教授、中国人工智能学会理事,上海市人工智能学会秘书长汪镭认为,在五局人机围棋对抗中,谷歌AlphaGo取得了相对优势,但人类从第四盘能扳回一局,这本身就说明,人类是能够在不知对手风格的前提下,通过短期的经验总结,实时给出合理策略并反败为胜的。而AlphaGo出现的漏洞说明,谷歌人工智能处理的围棋人机智能对抗任务,还是有一定的对象单一及封闭式规则推演特征的。

而更成熟的人工智能模式,应该具备同时处理多项事务的综合能力,比如语音搜索,它融合了语音识别、自然语言理解及知识表达、大数据挖掘及知识匹配等多项人工智能,能够总体合理地适应用户在思维、对话、情感等方面特征的不确定性。比如,用户发出“今天有雾霾吗?”的网上搜索需求,语音搜索软件就会根据当前网络存储的实时大数据,进行快速的搜索反应,作出符合当前应用环境及用户特征的合理回答。这种需求的理解、答案的搜索和结果的交互模式,绝对不亚于人机智能围棋对决中的需求定义、策略搜索及结果输出方式

风物长宜放眼量。当谷歌将业内目光吸引到自己的AlphaGo与李世石的“人机大战”上时,其实AI的发展和应用远不止于此。除了科技大佬纷纷争夺贴近市场和用户需求、应用场景更广泛的语音技术、语音搜索外,像诸如人脸识别、无人驾驶等人工智能领域也是大佬们争夺的焦点,而这些领域的突破,因为其适用人群和场景的广泛性,而更具有实际价值。

最新评论(1

..

生活、科技、吐槽
总篇数
0
粉丝
0
+ 关注
精华文章
推荐文章