[發明專利]口語對話管理方法及系統有效
| 申請號: | 202010060660.4 | 申請日: | 2020-01-19 |
| 公開(公告)號: | CN111128175B | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 高懿;朱風云;范梓野 | 申請(專利權)人: | 大連即時智能科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G10L13/04;G06F40/30;G06N20/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 116000 遼寧省大連市高新*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 口語 對話 管理 方法 系統 | ||
本發明公開了一種口語對話管理系統,包括:語音識別器、語言理解單元、對話管理器、語言生成單元、語音合成器、語境指導信息生成器、策略學習單元。此外,本發明還公開了一種口語對話管理方法。采用本發明的技術方案,對話管理器維護對話過程中的對話狀態信息,系統根據當前的對話狀態信息生成語境指導信息,并動態地指導語音識別器更好地識別當前語境中用戶可能會使用的自然語言,大幅提高了語音識別的準確率;語音識別器不需要提前準備特定領域的訓練語料并訓練領域相關的語言模型,而是根據不同的語境動態調節語言模型,降低了提前訓練語言模型的工作量,提高了人機對話系統的生產效率。
技術領域
本發明涉及人機對話技術領域,特別涉及一種口語對話管理方法及系統。
背景技術
口語對話系統(Spoken Dialog System,簡稱SDS)以語音的形式與用戶進行交互,并為用戶提供特定的服務;口語對話系統通常由語音識別、語言理解、對話管理、語言生成、語音合成等模塊構成。在口語對話系統中,對話管理(Dialog Management,簡稱DM)和自動語音識別(Automatic Speech Recognition,簡稱ASR)是兩個相互獨立的模塊。其中,對話管理模塊是口語對話系統中的核心模塊,其前置模塊將用戶的輸入轉化為某種形式化語義表達,對話管理模塊在此基礎上決定下一步系統輸出的形式化語義表達;輸出的形式化語義表達在后續模塊中被轉化為某種輸出形式,如圖片、語音、文字、鏈接等。自動語音識別模塊將用戶語音轉化為文字,一般需要聲學模型和語言模型(Language Model,簡稱LM)等資源,其中語言模型負責從自然語言方面為自動語音識別解碼器提供線索。發明人經研究發現,現有技術中口語對話系統的自動語音識別的計算過程和對話管理的狀態無關。然而事實上,口語對話過程中的任意時刻,用戶使用的自然語言都與當前的對話語境密切相關,其中許多信息是在對話過程中才能夠動態獲取的。
現有技術中,口語對話系統通常包括五個模塊,如圖1所示:語音識別模塊;語言理解模塊;對話管理模塊;語言生成模塊;語音合成模塊。其中,語音識別模塊主要依賴聲學模型和語言模型兩種資源,其中聲學模型提供將聲波識別為語音學建模單元的概率,語言模型提供語音學建模單元組成自然語言句子的概率,語音識別算法根據這兩種概率,通過解碼得到與輸入的聲波最匹配的自然語言句子,即語音識別的結果。當前,口語對話系統中語音識別模塊的語言模型一般利用領域相關的自然語言數據,經過離線訓練過程訓練得到,并在執行語言識別任務之前提前加載到系統中。在執行語音識別時,指定使用和當前對話內容相近的特定領域的語言模型,可以有效地提高語音識別的準確率。
然而,經過發明人的研究發現,當前的口語對話系統中的自動語音識別模塊和對話管理模塊是相對獨立的。自動語音識別模塊中使用到的語言模型一般由提前收集的語料通過機器學習算法訓練獲得。從一方面來說,語料一般需要提前準備,并訓練定制化模型,導致系統的迭代周期長、生產效率低。另一方面來說,對話過程中,用戶使用的語言并非一成不變,而是會隨著對話發生的場景、對話的話題、對話題討論的深入程度、用戶的關注點的變化而動態調整。然而提前收集的語料統計規律固定,導致提前訓練的語言模型無法應對動態變化的對話語境。從對話管理的角度出發,語境信息也并不會反饋到語音識別模塊中幫助其進行更好的識別。目前,尚未有專門解決這一問題的口語對話系統。
發明內容
基于此,為解決現有技術中的技術問題,特提出了一種口語對話管理方法,包括:
語音識別器接收用戶輸入的語音,利用語言模型及聲學模型將用戶輸入的語音轉化生成文字形式的語音識別結果,將語音識別結果輸出至與其相連接的語言理解單元。
所述語言理解單元將其接收的語音識別結果轉化生成形式化語義表達的語言理解結果,并將語言理解結果輸出至與其相連接的對話管理器。
策略學習單元學習得到對話策略信息及語境指導模型,將所述對話策略信息輸出至與其相連接的所述對話管理器,將所述語境指導模型輸出至與其相連接的語境指導信息生成器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連即時智能科技有限公司,未經大連即時智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010060660.4/2.html,轉載請聲明來源鉆瓜專利網。





