新聞中心

        EEPW首頁 > 智能計(jì)算 > 業(yè)界動態(tài) > 谷歌正在研究能夠讓計(jì)算機(jī)合成語音更加自然的技術(shù)

        谷歌正在研究能夠讓計(jì)算機(jī)合成語音更加自然的技術(shù)

        作者: 時(shí)間:2018-03-29 來源:鎂客網(wǎng) 收藏

          3月28日,據(jù)國外媒體報(bào)道,研究院正在探索讓機(jī)器合成語音更加自然的方法。大腦和機(jī)器感知團(tuán)隊(duì)的成員本周二在博客中公布了一些能讓語音更具有表現(xiàn)力的方法示例。

        本文引用地址:http://www.104case.com/article/201803/377599.htm

          同時(shí),發(fā)布了“云端文本轉(zhuǎn)語音”服務(wù)的測試版,提供了與谷歌助手同樣的語音合成服務(wù)。該服務(wù)采用了DeepMind的WaveNet技術(shù),這個技術(shù)可以被用于生成非常自然的聲音。

        谷歌正在研究能夠讓計(jì)算機(jī)合成語音更加自然的技術(shù)

         

          有報(bào)道顯示,谷歌研究員近期發(fā)表了兩篇論文,提出了新的發(fā)音方法,介紹了如何模仿語音中的重音或語調(diào)。這兩篇論文的技術(shù)都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系統(tǒng),使用神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,模仿人類語音。

          Tacotron在大部分情況下都可以模擬真人聲音,但是卻無法模仿說話中的重音和自然語調(diào)。Tacotron的聯(lián)合發(fā)明人Wang Yuxuan參與了其中一篇論文研究。研究通過將人類語音片段嵌入計(jì)算機(jī)語音風(fēng)格,使合成語音中實(shí)現(xiàn)了重音等效果。另一篇論文的研究則使用無監(jiān)督訓(xùn)練和識別語音模式,并模仿某些語音風(fēng)格。

          在語音技術(shù)研發(fā)上,去年蘋果Siri被眾多消費(fèi)者認(rèn)為是更加具有表現(xiàn)力的聲音。同時(shí)去年四月,亞馬遜Alexa面向語音應(yīng)用開發(fā)者提供了SSML標(biāo)簽,在語音助手中增加了更豐富的表達(dá),例如停頓、輕語,以及一些感嘆詞等。



        關(guān)鍵詞: 谷歌

        評論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 林周县| 屯留县| 若尔盖县| 彰化县| 依兰县| 侯马市| 花莲市| 临洮县| 武陟县| 沙坪坝区| 察雅县| 如皋市| 大冶市| 磐安县| 石城县| 岱山县| 长乐市| 侯马市| 门源| 小金县| 博罗县| 修武县| 常州市| 尼玛县| 池州市| 延吉市| 迁西县| 尉氏县| 旅游| 广州市| 敦化市| 洛扎县| 宝坻区| 太和县| 黄龙县| 济阳县| 谢通门县| 额济纳旗| 大余县| 胶州市| 奉新县|