[發明專利]基于對話的語音識別有效
| 申請號: | 202010153304.7 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111667833B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | J·諾吉馬;M·C·格拉維;C·S·平哈內茨 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 酆迅;彭夢曄 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 對話 語音 識別 | ||
實施例通過將包括對話樹的多個節點聚類成至少第一集群和第二集群來提供基于對話的語音識別。為第一集群創建自然語言句子的第一數據集并且為第二集群創建自然語言句子的第二數據集;基于第一數據集生成與第一集群相關聯的第一專用語言模型(LM);以及基于第二數據集生成與第二集群相關聯的第二專用LM,其中第一專用LM不同于第二專用LM。
背景技術
本發明涉及自然語言處理(NLP)系統,并且更具體地涉及會話和對話管理。最終用戶可以經由通常稱為聊天機器人的文本或口語代理與NLP系統交互。使用口語聊天機器人,語音識別組件將某人的口語話語轉錄為文本,該文本然后由NLP系統處理以確定話語的會話意圖。基于所確定的會話意圖,NLP系統用對查詢的回答、對附加信息的請求等來響應于該人。因此,一個人可以使用由人類使用的語言模式與聊天機器人進行會話,而不是將機器格式的查詢提交給數據庫,并且NLP系統可以在幾輪會話中以同樣方式進行響應,直到該人(或NLP系統)結束對話。
發明內容
根據本發明的一個實施例,提供了一種用于基于對話的語音識別的方法,該方法包括:將包括對話樹的多個節點聚類成至少第一集群和第二集群;為第一集群創建自然語言句子的第一數據集并且為第二集群創建自然語言句子的第二數據集;基于所述第一數據集生成與第一集群相關聯的第一專用語言模型(LM);以及基于第二數據集生成與第二集群相關聯的第二專用LM,其中第一專用LM不同于第二專用LM。
根據本發明的一個實施例,提供了一種用于基于對話的語音識別的系統,該系統包括:導航跟蹤器,被配置為在對話樹中標識當前節點并且選擇與當前節點相關聯的專用LM;語音到文本轉換器,被配置為接收自然語言語音的話語并且基于為當前節點選擇的專用LM將語音轉換為文本;以及對話服務,被配置為基于文本來在當前節點與對話樹中的后續節點之間導航,其中導航到后續節點發信號通知導航跟蹤器在對話樹中標識后續節點并且選擇與后續節點相關聯的新的專用LM以用于語音到文本轉換器在將后續話語轉換為文本時使用。
根據本發明的一個實施例,一種計算機可讀存儲介質,包括用于基于對話的語音識別的指令,這些指令在由處理器執行時使得處理器能夠執行包括以下各項的操作:將包括對話樹的多個節點聚類成至少第一集群和第二集群;為第一集群創建自然語言句子的第一數據集并且為第二集群創建自然語言句子的第二數據集;基于所述第一數據集生成與第一集群相關聯的第一專用語言模型(LM);以及基于第二數據集生成與第二集群相關聯的第二專用LM,其中第一專用LM不同于第二專用LM。
附圖說明
圖1示出了根據本公開的實施例的計算系統;
圖2示出了根據本公開的實施例的用于針對對話來定制語言模型的計算環境;
圖3示出了根據本公開的實施例的用于使用專用語言模型來導航對話的計算環境;
圖4A-4C示出了根據本公開的實施例的專用語言模型與對話樹的各部分之間的關聯;
圖5是根據本公開的實施例的用于針對對話來定制語言模型的方法的流程圖;以及
圖6是根據本公開的實施例的用于使用專用語言模型來導航對話的方法的流程圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010153304.7/2.html,轉載請聲明來源鉆瓜專利網。





