时间:2017-08-19 11:15:45 作者:琪琪 浏览量:93
语音识别令人满意
就在昨天老罗的锤子新机发布会上,科大讯飞的语音输入又被带起了一波节奏,出于对所谓各种发布会惯常性夸大其辞的质疑,我们特别亲身对这款输入法的识别效果进行了一个简单的测试,看看是不是真的得出和老罗一样的效果。
经过测试我们发现,在正常的语速环境下,讯飞输入法的识别效果还是让人满意的,这段文本是我们使用语音输入得出的结果。鉴于测试者的普通话水平还是比较靠谱的,所以具备一定的参考价值:
“北京时间10月19日消息,维基解密创始人阿桑奇早前承诺,将会在11月7日之前曝光一批新的美国总统大选文档。现在爆料来了,其中一批文档显示,希拉里团队拟定的副总统人选名单里,苹果CEO库克的名字赫然在列。”
慢语速下结果(左)和快语速下结果(右)
可以看到在前面较慢的语速下,讯飞输入法的识别是100%的还原了文档,而在较快的语速中则出现了部分错误。这部分错误经过我们的回溯,主要是由于发音的连读导致的,也就是说即使是在较快的语速中,讯飞输入法在单个音节的识别上仍然不会有什么问题,但是如果连音较严重的话,就会出现偏差。
所以结论就是,如果你在使用语音输入文本时,可以语速较快,但需要避免出现连音,尤其是北京话那种嘟嘟囔囔的发音方式,很容易出现偏差。
中英混输是硬伤
那么是否就是说通过语音就能完全解决的输入需求了呢?答案是否定的,因为我们在体验的过程中还是发现了一些“硬伤”。其中之一就是英语的穿插使用。
简单来说就是在我们当前的输入环境中,经常会遇到中文中夹杂英文的情况,比如下面这段文本,我们用讯飞语音输入得到的就是这样一个结果:
“苹果今年在秋季发布会上发布了一款非常小巧的无线蓝牙耳机,取名AirPods,不过有一个细节,让Beats粉丝非常失望,因为并没有取名BeatsPods。其实苹果早在2014年就收购了Beats这个品牌,近两年来似乎并没有大动作。但是通过苹果不断的扩充iTunes,我们似乎可以预测到之后苹果的大招。”
英文部分几乎全折
需要说明的是,我们特意在英文的部分进行了慢语速的着重拼读,但对比之后我们还是发现,所有的英文部分都出现了问题,没有一个是对得上号的。
我们在语言选项里只找到了普通话和英文这两个独立的选项,并没有能够实现中英文混合输入。这一点上我们想说微软做得非常好,如果你体验过Windows的Cortana就应该知道,比如同是用语音说“帮我打开Steam”,Cortana就真的是显示“帮我打开Steam”并完成启动程序,而讯飞这里显示的是“帮我打开视频”。
最后一点要说的其实并不是说是语音输入法单个的问题,只是这个问题在语音输入法中变得尤为明显,那就是词库的丰富度。我们知道平常打字时也会遇到一些名词或是短语,这些词在词库中并没有收录,所以需要我们一个字一个字的在候选栏中筛选出来。
但这个问题到了语音输入法中就变成比较严重的问题了,一旦遇到词库中不曾收录的词或短语,识别就必然出现问题,但是要知道语音输入可没有候选词让你选,这时候你就需要手动再打字去更正。这个问题同样出现在讯飞输入法上,比如我们说“肥伦的脱口秀今天你看了吗”“半血亚弥达拉有人来吗”“菲董新歌你听了吗”得到的就是下面的结果:
识别结果
当然我不是要故意刁难语音输入法,只是说这确实是一个比较突出的问题,尽管在测试的过程中讯飞还是给了我不少“这词都有”的惊讶(比如然并卵、艾吉奥艾迪托雷、骚当、瑞奇与叮当等等),但是仍然不适合在有生僻词时使用。
总的来说这次测试下来,讯飞的整体效果还是让人满意的,尤其是在语音的识别上,但是语义方面的识别仍然需要加强,尤其是中英文混合输入是一个亟待解决的痛点。总之就是,功能比较强大,但是放到具体的复杂的语言环境中,仍然难以替代打字输入,或是说难以完全脱离打字输入独立运转。