[發明專利]基于半自動校正的語音關鍵信息記錄裝置及方法有效
| 申請號: | 201110243379.5 | 申請日: | 2011-08-23 |
| 公開(公告)號: | CN102956231A | 公開(公告)日: | 2013-03-06 |
| 發明(設計)人: | 葉英;孔吉;劉佩林 | 申請(專利權)人: | 上海交通大學;富士通株式會社 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G06F17/30 |
| 代理公司: | 上海交達專利事務所 31201 | 代理人: | 王錫麟;王毓理 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 半自動 校正 語音 關鍵 信息 記錄 裝置 方法 | ||
技術領域
本發明涉及的是一種語音識別技術領域的裝置及方法,具體是一種基于半自動校正的語音關鍵信息記錄裝置及方法,通過對語音信號進行識別,并以文本形式進行記錄,在用戶不便對語音信息進行文字記錄時,可替代用戶完成語音信息的文字記錄。
背景技術
受限于語音信號識別技術,已知的記錄裝置在對收到的語音信號進行自動識別后,通過操作員的人工校正,以確保所記錄信息的準確性。由此,使得記錄裝置的正常運作需要大量的人工校正工作;并且,語音信號中所提及的一些信息,可能由于操作員本身的知識量限制,無法做出有效地修正,比如一些地名或專業工具名稱等。
已知的記錄裝置,是對全部的語音信息進行識別記錄。但是,語音信息中會出現大量無意義的信息,比如通話過程中的問候語、助詞、語氣詞。真實有效的信息通常僅為全部語音信息的一部分。識別并記錄全部語音信息,一方面加大了文本信息校正的工作量;另一方面,用戶也不需要諸如問候語之類的信息記錄。語音信息記錄,應盡可能精簡,提供最多的有效信息量。
經過對現有技術的檢索發現,英國專利文獻GB2323693A,記載了一種“Speech?to?text?conversion”(語言文字轉換系統),該技術包括至少一個用戶終端用于錄制語音,至少一個自動語音識別處理器以將錄制的語音生成為文本,以及用于將文本反饋至終端的通訊裝置;該用戶終端與自動語音識別處理器之間通過服務器進行遠程且選擇性控制傳輸錄制的語音文件。該技術還包括一選擇糾正器,并由該技術的業務操作員對所識別出的文本信息進行糾錯,最后將更正后的文本信息儲存并反饋給用戶。
但是該現有技術需要業務操作員識別全部文本信息,且這些文本信息均為語音識別裝置直接識別結果。一方面,全部文本信息中包含大量無意義信息,如通話過程中的問候語、助詞、語氣詞,真實有效的信息僅占其中一部分,業務操作員識別全部文本信息加重了業務操作員的工作量。另一方面,語音識別裝置直接識別結果中,一類信息為特殊名詞、專有名詞,由業務操作員負責對此類信息進行糾錯,使得糾錯的準確率依賴于業務員的知識量,存在錯誤糾錯的風險;另一類信息,存在一定的格式上的要求,如時間信息,可通過算法進行自動糾錯,若此類信息的糾錯交由業務操作員,亦加重了業務操作員的糾錯工作量。
發明內容
本發明針對現有技術存在的上述不足,提供一種基于半自動校正的語音關鍵信息記錄裝置及方法,通過半自動的信息校正單元,降低了人工校正的工作量;利用數據庫對特殊名詞如地名、專業工具名稱進行校正,降低了人工校正中操作員的知識量限制所造成的影響;提取語音信息中的關鍵信息,從而提高所記錄信息的有效信息量。
本發明是通過以下技術方案實現的:
本發明涉及一種基于半自動校正的語音關鍵信息記錄裝置,包括:關鍵信息提取單元和與之相連的信息校正單元,其中:關鍵信息提取單元獲取未經校正的文本信息并提取出關鍵信息后輸出至信息校正單元,信息校正單元輸出用戶反饋確認后的文本信息。
所述的信息校正單元包括:冗余信息校正模塊、時間信息校正模塊、特殊名詞校正模塊和用戶反饋確認模塊,其中:冗余信息校正模塊的輸入端與關鍵信息提取單元相連,輸出端與時間信息校正模塊相連并將冗余信息校正后的關鍵信息傳輸給輸出端;時間信息校正模塊的輸入端與冗余信息校正模塊相連,輸出端與特殊名詞校正模塊相連并將冗余信息校正、時間信息校正后的關鍵信息傳遞給輸出端;特殊名詞校正模塊的輸入端與時間信息校正模塊相連,輸出端與用戶反饋確認模塊相連并將冗余信息校正、時間信息校正、特殊名詞校正后的關鍵信息傳遞給輸出端。用戶反饋確認模塊的輸入端與特殊名詞校正模塊相連并將冗余信息校正、時間信息校正、特殊名詞校正后的關鍵信息經用戶反饋確認后輸出。
所述的關鍵信息提取單元包括:句法分析器模塊和分類器模塊,其中:句法分析器模塊的輸入端與語音識別單元相連,輸出端與分類器模塊相連并將經句法分析后的詞語、短語傳輸給輸出端;分類器模塊的輸入端與句法分析器模塊相連,輸出端與信息校正單元相連并將分類后的信息中的關鍵信息傳輸給輸出端。
本發明涉及一種基于半自動校正的語音關鍵信息記錄方法,包括以下步驟:
第一步,由用戶處獲得的語音信息通過語音識別軟件獲得語音信號所表達的未經校正的文本信息。
所述的語音識別軟件采用卡耐基梅隆大學的開源語音識別軟件Sphinx進行自動語音識別。
第二步,關鍵信息提取單元依次對未經校正的文本信息進行句法分析和分類分析得到時間信息、關鍵信息詞類及特殊名詞信息,并將上述信息作為關鍵信息傳輸至輸出端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學;富士通株式會社,未經上海交通大學;富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110243379.5/2.html,轉載請聲明來源鉆瓜專利網。





