據廣州市公布的《2005年廣州市交通發展年度報告》統計,2005年廣州市機動車擁有量為177.4萬輛;據《法制晚報》報道2006年5月份北京機動車保有量可突破300萬輛。奧運時將突破330萬輛;而據2006年GSM協會公布的一組數據稱:GSM手機用戶數量超過20億,中國市場最大。以上三組不同的數據顯示:越來越多的人在駕駛著機動車并通過GSM終端與外界進行通訊。
現階段,許多機動車輛都安裝了車載終端。它主要用于車載導航、車輛調度、車載監控等。而許多終端設備是依靠手工操作顯示終端來完成的,如駕駛員查看車輛調度中心或朋友發來的重要短消息。查看導航終端的地圖等。這樣就導致司機開車時不能專心,其直接后果可能導致嚴重的交通事故。
語音交流是人類最自然的交流方式,如果車載終端的很多操作可由實時的語音來代替的話,將有利于減少交通事故的發生率。例如,GSM Modem收到短消息,司機不用手動查看。語音合成系統可以自動播報出來;可以實時地提示司機行駛的方向與路名;可以實時地將交通狀況播報出來。讓駕駛員了解當前交通狀況,通過了解道路交通擁堵的實時信息,從而避開擁堵路段,更快到達目的地等。語音合功能成的車載終端可提高車載終端的智能性、車輛駕駛的安全性和舒適性,使用戶使用起來更加方便,更具有人性化。
2 語音合成及GSM M0dem
2.1 語音合成技術
語音合成技術是利用計算機、智能系統等設備,按預定的程序和指令,人為產生音素、音節、詞和句子的技術。
目前,語音合成技術已發展到能實時地將任意文本轉換成連續可懂的自然語句輸出,相應技術通常稱為文語合成或文語轉換(Text To Speech,簡稱TTS),涉及到聲學、語言學、語音數字信號處理技術、多媒體技術等多個學科。文語合成的原理:根據韻律建模的結果,從原始語音庫中取出相應的語音基元,利用特定的語音合成技術對語音基元進行韻律特性的調整和修改,最終合成出符合實際的語音。
2.2 語音合成模塊
本設計采用安徽中科大訊飛信息科技有限公司研發的一款高端中文語音合成模塊XF-S4240。該模塊可通過UART、SPI和12C三種接口接收待合成的文本,直接合成為語音輸出(Line out)。
該模塊采用。InterSound4.0 KT系統作為模塊內核,一個是輕量級中文連續語音合成系統。
XF-S4240模塊的特點如下:支持任意中文文本的合成。支持英文字母的合成,遇到英文單詞時按字母方式發音;支持四種內碼格式:GB2312(簡體中文編碼)、GBK(國家標準擴展編碼)、Unicode(字符編碼)、Big5(繁體中文編碼);具有雙發音人:男聲、女聲;具有智能的文本分析處理算法,可正確識別和處理數值、號碼、時間日期及一些常用的度量衡符號,具備較強多音字處理和中文姓氏處理能力;支持軟件調節語速、語調、音量等。 2.3 GSM Modem