基于單片機語音識別的智能家居控制系統實現方案
來源:日期:2015-05-22 16:45:46點擊:11487次
在傳統的智能家居控制系統中,我們常采用不同次數的“滴滴”聲或不同的LED狀態作為操作提示信息,提示信息過于簡單,不夠直接,一般需要按照操作手冊一步一步進行,而且容易出錯。另外,它的身份驗證一般只有按鍵密碼,在電話遠程控制或門禁系統中容易被他人偷窺從而導致安全隱患。而本文提供的語音界面的智能家居控制系統在完全實現家庭安全監控與智能化控制的基礎上,增加了以語音提示作為操作向導的人機交互界面,極大的方便了系統設置與修改。同時,身份驗證時,可以要求以聲音和鍵盤密碼同時作為身份驗證信息,杜絕了密碼泄漏造成的安全隱患。
語音識別技術是一種多維識別系統,基本結構如圖一所示。語音識別系統與一般的模式識別系統類似,包括特征提取,語音模式庫,模式匹配3個基本單元。
對于語音辨識主要有以下2種:
(1)特定發音人識別SD (Speaker Dependent) :是指語音樣板由單個人訓練,也只能識別訓練人的語音命令,而他人的命令識別率較低或幾乎不能識別。
(2)非特定發音人識別SI (Speaker Independent):是指語音樣板由不同年齡、不同性別、不同口音的人進行訓練,可以識別一群人的命令。我們將標準模式的存儲空間稱之為“詞庫”,而把標準模式稱之為“詞條”或“樣板”。所謂建立詞庫,就是將待識別的命令進行頻譜分析,提取特征參數作為識別的標準模式。
識別過程首先要濾除輸人語音信號的噪音和進行預加重處理,提升高頻分量,然后用線性預測系數等方法進行頻譜分析,找出語音的特征參數作為未知模式,接著與預先存儲的標準模式進行比較,當輸人的未知模式與標準模式的特征相一致時,便被機器識別,產生識別結果輸出。如果輸人的語音與標準模式的特征完全一致固然好,但是語音含有不確定因素,完全一致的條件往往不存在,事實上沒有人能以絕對相同的語調把一個詞說兩遍,因此,預先制定好計算輸人語音的特征模式與各特征模式的類似程度,或距離度的算法規則固化在單片機中,把該距離最小,即最類似的模式作為識別相應語音的手段。當然,影響識別率的因素還有一些,如連續發音(如英語)與斷續發音(如漢語)的不同二者區別在于單詞間隔有200ms以上的空隙時間。本方案采用特定人識別方式,將W練的標準樣板存于FLASH中,第一次使用時要進行訓練,以后就可以不受掉電影響識別此人語音信息。