[發(fā)明專利]一種語音識(shí)別應(yīng)用系統(tǒng)的解決敏感詞未知性的方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410386511.1 | 申請(qǐng)日: | 2014-08-07 |
| 公開(公告)號(hào): | CN104166850A | 公開(公告)日: | 2014-11-26 |
| 發(fā)明(設(shè)計(jì))人: | 徐彬宸 | 申請(qǐng)(專利權(quán))人: | 和匯投資集團(tuán)股份有限公司;徐彬宸 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20 |
| 代理公司: | 上海三方專利事務(wù)所 31127 | 代理人: | 吳干權(quán);李美立 |
| 地址: | 201401 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 識(shí)別 應(yīng)用 系統(tǒng) 解決 敏感 知性 方法 | ||
1.一種語音識(shí)別應(yīng)用系統(tǒng)的解決敏感詞未知性的方法,其特征在于應(yīng)用程序給操作系統(tǒng)設(shè)置敏感詞表,語音識(shí)別模塊將敏感詞表引入識(shí)別算法,降低了每幀語音識(shí)別所需要的時(shí)間資源和空間資源,敏感詞表是以音素方式表達(dá)的敏感詞全體集合的一個(gè)子集,有了這個(gè)子集,就可以降低語音識(shí)別算法所需的時(shí)間資源和空間資源。
2.如權(quán)利要求1所述的一種語音識(shí)別應(yīng)用系統(tǒng)的解決敏感詞未知性的方法,其特征在于具體算法處理如下,將敏感詞表引入隱馬爾科夫聲學(xué)模型Viterbi算法,大幅降低算法的時(shí)間資源和空間資源:
Viterbi算法的原形:
a)初始化
δ1(i)=πibi(o1), 1≤i≤N
b)遞歸
c)終結(jié)
d)求S序列
隱馬爾科夫聲學(xué)模型中一個(gè)音素就是一個(gè)三至五狀態(tài),其中S為隱藏狀態(tài)集合,S={q},N是狀態(tài)數(shù)目,M為敏感詞表Q的狀態(tài)數(shù),O為觀察狀態(tài)集合,O={o},A為隱藏狀態(tài)間的轉(zhuǎn)移概率矩陣,A={a},B為輸出矩陣,即隱藏狀態(tài)到輸出狀態(tài)的概率,B=,PI為初始概率分布,隱藏狀態(tài)的初始概率分布,PI={π},A,B,PI稱為隱馬爾科夫的參數(shù),用λ表示,P*是在時(shí)刻T輸出狀態(tài)oT的最大概率,是在時(shí)刻T最大概率輸出狀態(tài)oT的隱藏狀態(tài),δt(i)是t時(shí)刻到達(dá)狀態(tài)i的所有序列概率中最大的概率,是在t-1時(shí)刻系統(tǒng)必須處于的狀態(tài),該狀態(tài)導(dǎo)致了系統(tǒng)在t時(shí)刻到達(dá)狀態(tài)i在所有屬于敏感詞表序列中是最大概率的;
在使用敏感詞表Q之后,五元組{S,O,A,B,PI}沒有改變,但敏感詞表Q含有的狀態(tài)集合是S的子集,原始隱含狀態(tài)集S的狀態(tài)數(shù)為N,敏感詞表Q的狀態(tài)數(shù)為M,相應(yīng)的,改變下列兩個(gè)函數(shù)定義:δt(i)是t時(shí)刻到達(dá)狀態(tài)i的所有屬于敏感詞表子集序列概率中最大的概率,是在t-1時(shí)刻系統(tǒng)必須處于的狀態(tài),δt(i)是t時(shí)刻到達(dá)狀態(tài)i的所有屬于敏感詞表序列概率中最大的概率,
在t-1時(shí)刻系統(tǒng)必須處于的狀態(tài),該狀態(tài)導(dǎo)致了系統(tǒng)在t時(shí)刻到達(dá)狀態(tài)i在所有屬于敏感詞表序列中是最大概率的;
經(jīng)證明,引入敏感詞表之后Viterbi算法下列公式仍然成立,而參數(shù)相應(yīng)的演變?yōu)椋?/p>
a)初始化
δ1(i)=πibi(o1), 1≤i≤M
b)遞歸
c)終結(jié)
d)求S序列
值得注意的是,P*的閾值必須仍然以原始模型為準(zhǔn),
可以看出,引入敏感詞表之后算法的參數(shù)由N變?yōu)镸,由于M遠(yuǎn)遠(yuǎn)小于N,可見新的算法所需時(shí)間和空間會(huì)大幅縮小。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于和匯投資集團(tuán)股份有限公司;徐彬宸,未經(jīng)和匯投資集團(tuán)股份有限公司;徐彬宸許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410386511.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 在線應(yīng)用平臺(tái)上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線應(yīng)用平臺(tái)
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場
- 使用應(yīng)用的方法和應(yīng)用平臺(tái)
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠(yuǎn)程應(yīng)用進(jìn)行應(yīng)用安裝
- 應(yīng)用檢測(cè)方法及應(yīng)用檢測(cè)裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)





