继林志玲、郭德纲之后,罗永浩语音包也于近日上线高德导航,以后飙车的时候可以听到:“我不是为了输赢,我就是认真”简直激动得不能自已!
那么问题来了,高德是如何把罗永浩、林志玲、郭德纲的声音装进导航里的呢?难不成真是一句一句录下来的?
ZEALER向我们进行了揭秘,原来,语音导航内容可以分为两部分:简单的和复杂的。
简单的,比如直行、左转、掉头……真的就是罗永浩、林志玲亲自录下来的。
而比较长的句子则要用到TTS(Text To Speech)技术了,也就是文本转语音技术,包括Siri、谷歌翻译用的就是这一技术。通过计算机语音合成,可以将任意文本转换成具有高自然度的语音。
原理上,只要让林志玲姐姐把汉语中的21个声母、37个韵母、5个声调组合的不超过3000个语音全部录一次,播放时,再把每个字的语音串起来就可以了。
这就好比活字印刷术,志玲姐姐每个字的发音都是一个单字,TTS会把这些单字重新排列组合成导航里的长句子。
虽然组字成句听起来略显生硬,但随着TTS语音技术的发展,自然度已经越来越高了。
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected])
近期热点