車上設備人機語音接口
隨著社會信息化的不斷深入,車上設備及其功能不斷增加,駕駛中使用這些設備的頻率很高。由于駕駛員的視覺和手直接控制駕駛操作,傳統的基于視覺和手操作的人機接口訪問方式,無法適應駕駛中對不斷增加的車上設備的訪問;不僅使用不方便,而且極大地影響安全性,并占用大量的車上空間。由于駕駛中使用類似于手機等設備引發的事故不斷增加,很多地方禁止駕駛中使用這些設備。在對車上設備訪問方式進行評估中,由于語言訪問方式不需要視覺和手的直接介入,安全性、使用方便性以及占用車上空間等指標遠高于其它方式,被認為是最有發展潛力的人機接口方式[1][2][3]。語言交流方式也是人類最自然的交互方式,隨著語音識別和語音合成等相關技術的不斷成熟,語言接口將不斷取代目前基于視覺和手操作的接口?;谡Z言的人機訪問接口將是車上設備人機接口的發展方向。
隨著車上電子設備與裝置不斷增多,傳統的連接方式已無法適應線束數量和連接復雜程度的增加,車上網絡技術越來越受到重視;普遍認為,所有車上電子裝置將通過車上網絡連接。車上網絡協議以及支撐器件的工業化和標準化也發展非???。在不久的將來,所有車上電子裝置都將通過車上網絡連接。所以本系統與被訪問的設備之間采用網絡連接方式。這有利于本系統與被訪問設備的硬件連接和推廣應用。它與車上網絡之間通過標準網絡協議進行通信。把語音接口納入到車上網絡體系中,也是連接語音接口與被訪問設備的最有效方式。
車上語音接口的支撐技術是小詞匯量語音識別、語音合成和車上網絡技術。小詞匯量語音識別技術(尤其是孤立詞小詞匯量識別)已經達到實用水平。采用隱馬爾可夫模型的小詞匯量識別可以在非特定人和高噪聲環境下可靠工作并達到很高的識別率[4]。對于大量的私人用轎車,可以采用特定人識別方式,不僅可以達到更高的識別率,而且可以適應個人說話口音等因素。車上網絡已經有較成熟的系統,如CAN 總線、MOST 總線等。而且越來越多的車上設備和總成支持網絡連接方式。這些對與本文介紹的系統將來在車上的推廣應用提供了有利的支持。
這方面的技術是國際上汽車電子技術研究的一個新領域,被認為是將來車上人機接口的必然發展方向,在我國尚未開展相關研究開發工作。對這項技術進行研究,并開發具有自主知識產權的技術產品,對提高我國汽車整體技術水平,提高我國汽車信息與電子技術產品的市場競爭力,具有重要意義。將來在車上使用語音人機接口方式,已經是一種共識,這項技術的市場潛力巨大。由于在車上應用語音接口方式的顯著優點,和語音識別與合成技術已經進入實用階段,也就是足以支持這類語音接口,國際上各大汽車公司和相應的配件廠家正展開車上語言人機訪問方式一系列相關技術的研究,并且取得了一些成果。BOSCH公司最近已經開發出了較為實用的車用語言操縱系統。SENSORY 等公司開發了適用于車輛環境的語音處理器件。這些工作目前還處于開發與完善階段,不久將進入市場;預計,首先在高檔車上使用,隨著技術不斷成熟成本將下降很快,然后在其它類型車上廣泛應用。
2 車上設備與裝置
這個語音接口訪問的車上設備和功能主要包括通信裝置(如電話)、車上計算機、車上媒體裝置(如音響設備、CD 播放機等)、車上輔助裝置(如空調、車門窗、后視鏡等)。語音接口訪問的設備不包括駕駛操作中影響安全性的裝置和設備(如轉向、信號、制動、加速踏板等)。這個接口與被訪問設備之間按標準車上網絡協議進行連接。
車上語音接口,一方面是一個駕駛員訪問其他設備的界面,另一方面它也是一個車用設備。設計中必須遵循汽車環境要求的指標。在汽車環境下應用的設備必須滿足一些特定的要求,包括:
(1) 高可靠性;
(2) 低成本;
(3) 工作溫度范圍-40~125℃;
(4) 應用方便;
(5) 體積小,安裝靈活;
(6) 滿足環保和電磁兼容要求;
(7) 駕駛中應用時,基本不分散駕駛員的視覺和手操縱的注意力;
(8) 在汽車可能出現的任何狀態下,它是安全的(不應引起有害后果)。
3 系統功能與操作方式
3.1 車上語音接口的功能
車上語音接口的主要功能包括:
(1) 上設備的語言命令控制;即通過這個接口,駕駛員可以用語言命令對這些設備進行操作。
(2) 表盤;即可以通過語音方式給出傳統儀表盤上的各種汽車狀態信息,如車速、燃料狀態、蓄電池狀態、故障狀態信息以及車上數據庫信息等。
(3) 語音形式的提示與報警功能。
3.2 基本操作方式
這個語音接口的基本操作為:
(1) 啟動:當汽車上電時,這個系統初始化,并進入接受語音命令狀態。初始化也可以通過初始化按鍵隨時重新進入。
(2) 初始化完成后,系統可以接受系統控制命令、設備控制命令和信息數據請求命令。
(3) 系統控制命令用于設置和檢查語音接口系統狀態。
(4) 設備控制命令完成設備訪問功能。
(5) 信息數據請求命令完成獲取汽車狀態或其他數據庫中信息的訪問。
4 車上語音接口硬件結構
由于這個接口是通過車上網絡與被訪問系統連接,這個接口本身就是網絡中的一個節點。它首先識別輸入的語音命令信息,識別后根據識別的結果發送訪問命令信息。在這個實驗系統中,語音接口通過CAN網絡與被訪問設備連接。系統硬件結構如圖1 所示。它由兩個信息通路構成,一個是由駕駛員到被訪問設備的控制命令通路,包括拾音器、語音識別、控制信號轉換以及與被控制設備的接口。另一個是由信息源或設備到駕駛員的反饋信息通路,包括信息獲取設備接口、數據到詞句的轉換以及語音合成和發音器。語音識別部分完成識別駕駛員命令并轉換為命令代碼的功能。信號轉換部分把命令代碼轉換為能控制對應設備的電信號形式。這個接口支持數字信號、模擬信號、串行接口信號和CAN 總線網絡連接方式。
評論