新聞中心

        EEPW首頁 > 業界動態 > 谷歌開源Live Transcribe語音識別轉文字工具

        谷歌開源Live Transcribe語音識別轉文字工具

        作者:張金梁 時間:2019-08-19 來源:中關村在線 收藏

        在其開源博客中宣布開源 Android語音識別轉錄工具——Live Transcribe的語音引擎,它可以將語音或對話實時轉錄為文字,還能夠為聽障人士提供幫助。

        本文引用地址:http://www.104case.com/article/201908/403851.htm

        谷歌開源Live Transcribe語音識別轉文字工具
        開源Live Transcribe語音識別轉文字工具

        Live Transcribe 是于今年2月推出的一款Android應用程序,它的語音識別由谷歌最先進的Cloud Speech API提供。但是,依賴于云引入了一些復雜性,不斷變化的網絡連接、數據成本和延遲等等都帶來一些考驗。因此,谷歌把它開源出來,希望開發人員在已有的基礎上進一步構建和開發。

        Cloud Speech API目前無法支持無限的音頻流,團隊采取了一些措施來解決這一難題,例如在達到超時之前關閉并重新啟動流式傳輸請求,這將有效減少會話中丟失的文本量。

        值得一提的是,Live Transcribe支持超過70種語言,并能夠根據語音自動識別語種,其中也包括中文。

        另外,由于是提供實時語音轉錄,轉錄出來的文本會隨著語音的輸入不斷發生變化,降低延遲自然十分必要。該引擎能夠大大降低延遲率,這都要歸功于它的自定義Opus編碼器。

        (文中圖片來自互聯網)




        關鍵詞: 谷歌

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 济宁市| 阿拉善左旗| 宣威市| 靖远县| 封开县| 邵阳市| 建阳市| 南丰县| 梅河口市| 怀集县| 济阳县| 鄂州市| 兴宁市| 南华县| 会宁县| 武安市| 石河子市| 石嘴山市| 巴青县| 黄石市| 建宁县| 胶南市| 搜索| 布拖县| 南通市| 玉田县| 河南省| 深水埗区| 绵阳市| 土默特左旗| 汽车| 绥中县| 马山县| 乌恰县| 垦利县| 茌平县| 三穗县| 白河县| 左贡县| 敦煌市| 哈巴河县|