语音助手已经进驻到我们的手机里,只要你想,随时可以把它呼唤出来,聊聊天。
当然,也可以让它帮我们做点正事,比如设个闹钟,拨个电话什么的。但也有很多时候,我们得到的回答是“听不懂主人在说什么”或“主人,麻烦你换个说法好吗?”。问题是,我明明已经表达的很清楚了,机器为什么听不懂呢?
事实上,现在的语音助手还有聪明到可以“理解”人类的地步,我们看到的一些比较智能的反馈很多是开发人员设计出来的。总体来说,语音识别技术已经相对成熟,对一些常见句子识别的还是比较准确的。然而,从语音识别得到的句子来理解用户的意图并不容易。开发人员一般会收集某一任务的常见说法,利用这些说法来判断用户的意图。比如打电话这个意图,可能的说法包括:“我想打电话给...”,“请帮我拨给...”,“打...的电话”等等。这些说法收集上来以后,就可以用统计的办法或模板匹配的办法来测试用户“打电话”这个意图,并把打电话的对象提取出来。问题是,对同一件事,不同地区的说法可能不一样,开发人员不太可能把所有说法都收集上来,当遇到不熟悉的说法时,机器就可能识别不了了。当然,如果噪音比较大,用户的口音比较重,在语音识别阶段就出错了,那机器就更懵了。
遇到这种情况,最好的办法是换个说法试试,如果试通了,以后就用这种说法就行了。这不是说语音助手是“人工智障”,而是人类的语言实在太复杂了,到目前为止还需要使用者配合,越是着急,越是大喊大叫,机器越听不懂。
总而言之,不要被屏幕背后的甜美女声欺骗,现在的AI还只是个工具而不是人,把它想象成锤子斧子,按规定的方法使用就好了。
By:清华大学 王东