[發明專利]個性化語音采集與語義確定系統及其方法有效
| 申請號: | 201210276523.X | 申請日: | 2012-08-03 |
| 公開(公告)號: | CN102831195A | 公開(公告)日: | 2012-12-19 |
| 發明(設計)人: | 楊京廣;張永忠;李樹成;陳培基;劉軍 | 申請(專利權)人: | 河南省佰騰電子科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F3/16 |
| 代理公司: | 鄭州紅元帥專利代理事務所(普通合伙) 41117 | 代理人: | 王瑞麗 |
| 地址: | 450003 河南*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 個性化 語音 采集 語義 確定 系統 及其 方法 | ||
技術領域
本發明涉及一種語音系統,具體為一種個性化語音采集與語義確定系統及其方法。
背景技術
隨著時代的發展,各地區各民族人與人之間的交流越來越頻繁,隨著軟件系統的發展,人與機器的交流也越來越頻繁。在不同民族、不同地區之間的人相互交流時,由于語種或方言的不同,每個人都有他自己的個性化語音、個性化語法、個性化詞匯范疇,當他發出一個聲音或說出一句話時,可能只有他自己能準確無誤地明白所要表達的意義,他的親人、朋友、熟人因習慣了他的個性化語音,能較好地明白其語意,然而,陌生人就可能不能準確無誤地明白他的聲音所要表達的意義,非同一地方語系、非同一國家語言者就更不能明白他的聲音所表達的意思。
?近十多年來,國內外出現了多種語音轉化為文本文字的軟硬件。這些軟硬件是針對某種語言、某種語系設計的軟件和制造的硬件,通過建立本國家語言、本地方語系標準的語音數據庫,對應能準確表達意義的文本文字,建立語音與文本文字的轉化系統。但系統接收到的語音全部是個性化語音,當系統接收到個性化的語音時,系統對語音進行分析,提取參數,確定語意,轉化成文本文字。這個難度是相當大的,難度之一:數據庫龐大,但依然不能囊括本國語言、本地語系的所有個性化語音;難度之二:復雜的分析程序和過程,但依然不能準確無誤地分析出發音者的語音所要表達的意思。為了解決這些問題,這類軟硬件需要對使用者進行培訓,就是說要說出標準的本國語言、本地語系的語音,或者對軟硬件系統進行培訓,就是說要讓事先按本國本地標準語音設計好的軟硬件系統來適應使用者的個性化語音,本末倒置,同樣不能達到理想的效果。
譬如:IBM?ViaVoice語音識別系統(語音輸入語音控制)發明出來后,向全世界宣布這是一場解放雙手的革命,然而十多年過去了,人們普遍還在用雙手輸入信息和操控硬件。微軟的語音輸入系統,讀音要非常標準,電腦才能識別,即使在這種情況下,錯誤率還是很高。漢王手寫板的語音變文字功能,因發音者的普通話不標準,還是不如用手來書寫方便省事。當前日本發明的最新語音輸入技術,將聲波先轉化為電磁波,然后用電磁波和聲波原型相對照,并提出最合適的單詞,雖然加入了電磁波,準確性有所提高,但還是沒有解決根本性問題,他們自稱正確率在85%,而且只適合日語。蘋果新iPad語音輸入文字功能,目前只支持英、法、德、日四個語種,同樣需要發音者的發音要標準,Mac系列的產品需要搭配網絡才可使用。美國國防部高級研究計劃局(DARPA?)2012年投入大量資金對“泛用語言翻譯計劃”進行技術研發,如果本科技項目攻關成功,就可以實現讓美國士兵們聽懂外國民眾的語言,美國士兵的話實時翻譯成外語,在一些特殊情況下,國家與國家之間要員無需翻譯人員在場實時交流,從而減少知情人數,降低泄密機率,實現完全不了解彼此語言的人與之間的流暢交流。
????近十年來,與語音相關的軟硬件不斷地被設計和創造出來,應用范圍極其廣泛,但存在著對發音者的要求較高,轉化后的文本文字反映出語音所表達的語意的準確性不高,而普通大眾沒有經過特殊訓練的人,其發音幾乎都不標準,這就是這類軟硬件不能在社會上普及的主要原因,或者只能在一定語系范圍內才可正常使用。文本文字不能準確無誤地表達出發音者的真實意思,成為限制這一行業發展的瓶頸。數據顯示,在中國有159件與語音輸入相關的發明專利授權,從95年開始有專利授權,以后逐年上升,到2005年達到最高授權量,為25件,但由于語音轉化為文本文字的準確率問題無法解決,中國和國外一樣這類專利開始逐年下降,到2010年僅有1件。另有數據顯示,中國大陸在這方面的技術成果非常薄弱,授權的這類發明專利前8名分別是:國際商業機器公司9件,臺達電子工業股份有限公司8件,松下電器產業株式會社7件,微軟公司7件,株式會社建伍5件,索尼公司5件,日本電氣株式會社5件,三星電子株式會社4件,沒有一家中國大陸的公司。
為什么現有的這類系統不能準確無誤地表達發音者的真實意思呢?是因為全世界這類語音軟硬件的設計者都走進了一個誤區:認為人發出的聲波(語音)本身具有含義,是信息的載體,于是采取“分析語音提取參數”、“語音識別來確定語義”、“語言解碼”、“語音信息拾取”等等方法,來使音頻音波轉化為文本文字,其實聲波(語音)本身沒有含義,是人類賦予了它含義。為什么現有的這類系統也可以表達發音者的意思呢?是系統設計者采用了本國語言、本地語系所共認的語音所賦予的含義。所以這類系統總是要求發音者要發出標準的語音、訓練使用者來適應系統、訓練系統來適應發音者。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南省佰騰電子科技有限公司,未經河南省佰騰電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210276523.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:輪胎胎溝之防夾石結構
- 下一篇:聚酯材料自增韌、增強的方法





