[發明專利]多輪交互并行語義理解方法和裝置在審
| 申請號: | 201610793380.8 | 申請日: | 2016-08-31 |
| 公開(公告)號: | CN107799116A | 公開(公告)日: | 2018-03-13 |
| 發明(設計)人: | 黃鑫;陳志剛;王智國 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G06F17/27 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙)11201 | 代理人: | 張大威 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 交互 并行 語義 理解 方法 裝置 | ||
技術領域
本申請涉及自然語言理解技術領域,尤其涉及一種多輪交互并行語義理解方法和裝置。
背景技術
隨著智能終端及網絡技術的迅速發展,人們越來越習慣地使用智能終端完成各種需求,如使用智能音箱作為人機交互的入口時,用戶可以與其進行語音交互以滿足用戶的不同需求,如查天氣、查股票、聽音樂等,或者用戶在開車時,使用智能車機作為人機交互的入口,用戶可以與智能車機進行語音交互以完成導航、電臺查詢、音樂查詢等應用需求。使用智能終端完成用戶的各種需求時,一般使用語音交互的方式,智能終端接收包含用戶需求的語音數據,對所述語音數據進行語音識別后得到對應識別文本,再對所述識別文本進行語義理解后,系統根據所述語義理解結果反饋給用戶交互結果,從而完成一次交互;當用戶有一個或多個需求時,往往可以與智能終端進行多輪交互,系統根據用戶每次的需求,不斷反饋給用戶交互結果,從而給用戶一種自然流暢的交互體驗,如用戶的需求為導航到科大,用戶可以與系統進行多輪交互后,滿足這個需求,具體交互時,用戶先與系統說:“去科大”,系統提問“是去科大南區、北區、中區還是東西區”,用戶說:“科大南區”,系統開始規劃路徑,將規劃好的多條侯選路徑反饋給用戶,用戶選定導航路徑后,系統開始導航。
相關技術中,用戶與智能終端進行多輪語音交互時,系統在語義理解時通常僅根據當前切分的文本進行語義理解。但是,如果用戶在一次請求過程中出現停頓、拖音等現象或其他人說話的干擾音時,系統通常會出現切分錯誤,相應的會造成語義理解錯誤,進而反饋給用戶錯誤的交互結果,嚴重降低用戶體驗。
發明內容
本申請旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本申請的一個目的在于提出一種多輪交互并行語義理解方法,該方法可以提高語義理解結果的準確度,從而可以反饋更準確的交互結果給用戶,提升用戶體驗。
本申請的另一個目的在于提出一種多輪交互并行語義理解裝置。
為達到上述目的,本申請第一方面實施例提出的多輪交互并行語義理解方法,包括:接收語音數據;對所述語音數據進行切分,得到語音數據片斷,以及,對所述語音數據片斷進行語音識別,得到當前切分文本數據;對當前切分文本數據進行獨立語義理解,得到第一語義理解結果,以及,根據用戶交互的歷史數據對當前切分文本數據進行語義理解,得到第二語義理解結果;選擇所述第一語義理解結果或者所述第二語義理解結果,作為最終的語義理解結果。
本申請第一方面實施例提出的多輪交互并行語義理解方法,通過根據歷史數據對切分文本數據進行語義理解,可以在語義理解時結合更多的信息,能夠得到更準確的語義理解結果,另外,在兩種語義理解結果中選擇一種,可以根據實際情況選擇更合適的語義理解結果,從而可以反饋更準確的交互結果給用戶,提升用戶體驗。
為達到上述目的,本申請第二方面實施例提出的多輪交互并行語義理解裝置,包括:接收模塊,用于接收語音數據;語音識別模塊,用于對所述語音數據進行切分,得到語音數據片斷,以及,對所述語音數據片斷進行語音識別,得到當前切分文本數據;語義理解模塊,用于對當前切分文本數據進行獨立語義理解,得到第一語義理解結果,以及,根據用戶交互的歷史數據對當前切分文本數據進行語義理解,得到第二語義理解結果;選擇模塊,用于選擇所述第一語義理解結果或者所述第二語義理解結果,作為最終的語義理解結果。
本申請第二方面實施例提出的多輪交互并行語義理解裝置,通過根據歷史數據對切分文本數據進行語義理解,可以在語義理解時結合更多的信息,能夠得到更準確的語義理解結果,另外,在兩種語義理解結果中選擇一種,可以根據實際情況選擇更合適的語義理解結果,從而可以反饋更準確的交互結果給用戶,提升用戶體驗。
本申請附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實踐了解到。
附圖說明
本申請上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1是本申請一個實施例提出的多輪交互并行語義理解方法的流程示意圖;
圖2是本申請實施例中對初始語義理解結果進行排序修正的方法的流程示意圖;
圖3是本申請實施例中選擇第一語義理解結果或第二語義理解結果的方法的流程示意圖;
圖4是本申請實施例中根據歷史數據對切分文本數據進行語義理解的方法的流程示意圖;
圖5是本申請實施例中對二次語義理解結果進行排序修正的方法的流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610793380.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語音識別方法及裝置
- 下一篇:語音方位識別方法和裝置及系統、家居控制器





