嘘,人工智能正在悄悄听懂你的话 - 行业资讯 - 肥雀云

　　小时候看特务电影时,特工们往往有一项必备的技能,就是隔着几百米远盯着正在说话的对象,从嘴型判断出对方在说什么。有了这种记忆,导致如今看什么语音识别技术都觉得相当一般,我都说出声儿了你才听的懂,算什么AI好汉。　　

　　不过最近一项专利申请表明,微软正在向特工学习,推出了无声语音识别技术。当AI也能像特工一样,无声之中辩人言,我们的世界究竟会有什么不同? 　　

　　说起无声语音识别,可能很多人第一反应就是复制人类的方式,利用图像识别进行辩读唇语。而利用唇语进行语音识别这种方式也由来已久,但是识别的准确率一直不算高.DeepMind曾在2016年做过测试,经过1万小时的新闻视频训练,AI唇语准确率达到46.8%了。国内有一家企业曾经提供过相关数据:在对中文新闻视频的识别中,准确率达到70%了。而搜狗所推出的驾驶场景下的唇语识别,因为涉及到的词汇量很少,准确率能够达到90%。　　

　　可以发现,相比现在主流语音识别动辄95%,97%的准确率,唇语识别准确程度实在是有些拿不上台面。对于中文这种一字一音节的语言来说还好,对于英文这种连音很多的语言来说,唇语识别要跨越的门槛确实不少。　　

嘘,人工智能正在悄悄听懂你的话