[發明專利]基于對話的語音識別有效
| 申請號: | 202010153304.7 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111667833B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | J·諾吉馬;M·C·格拉維;C·S·平哈內茨 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 酆迅;彭夢曄 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 對話 語音 識別 | ||
1.一種方法,包括:
將包括對話樹的多個節點聚類成至少第一集群和第二集群;
為所述第一集群創建自然語言句子的第一數據集并且為所述第二集群創建自然語言句子的第二數據集;
基于所述第一數據集生成與所述第一集群相關聯的第一專用語言模型LM;以及
基于第二數據集生成與所述第二集群相關聯的第二專用LM,其中所述第一專用LM不同于所述第二專用LM;
在所述對話樹的第一節點處接收第一話語,其中所述第一節點屬于所述第一集群;
基于所述第一節點屬于所述第一集群,選擇所述第一LM以用于將所述第一話語轉換為第一文本;
從根據所述第一LM從所述第一話語轉換得到的所述第一文本中確定第一意圖;
基于所述第一意圖導航到所述對話樹中的第二節點,其中所述第二節點屬于所述第二集群;
接收第二話語;
基于所述第二節點屬于所述第二集群,選擇所述第二LM以用于將所述第二話語轉換為第二文本;
從根據所述第二LM從所述第二話語轉換得到的所述第二文本中確定第二意圖;以及
基于所述第二意圖導航到所述對話樹中的第三節點。
2.根據權利要求1所述的方法,其中所述第一專用LM包括的詞匯量少于所述對話樹的領域特定LM,并且所述第二專用LM包括的詞匯量少于所述領域特定LM,其中所述第一專用LM包括從所述第二專用LM中排除的詞語并且所述第二專用LM包括從所述第一專用LM中排除的詞語。
3.根據權利要求1所述的方法,其中對所述多個節點進行聚類還包括:
接收所述多個節點中的每個節點的樣本句子;以及
基于所述樣本句子中包括的共享詞匯對所述多個節點中的節點進行分組。
4.根據權利要求1所述的方法,其中對所述多個節點進行聚類還包括:
觀察通過所述對話樹的先前會話流;以及
基于包括所述多個節點的子集的會話流的頻率對所述多個節點中的節點進行分組。
5.根據權利要求1所述的方法,
其中導航到所述對話的所述第二節點包括基于所述第二節點向用戶傳輸第一自然語言響應;以及
其中導航到所述對話的所述第三節點包括基于所述第三節點向所述用戶傳輸第二自然語言響應。
6.根據權利要求1所述的方法,還包括:
其中基于所述第一專用LM將所述第一話語轉換為文本包括從所述第一專用LM中選擇具有匹配所述第一話語的最高置信度得分的詞匯;
其中基于所述第二專用LM將所述第二話語轉換為文本包括從所述第二專用LM中選擇具有匹配所述第二話語的最高置信度得分的詞匯;
響應于匹配所述第一話語的所述最高置信度得分和匹配所述第二話語的所述最高置信度得分中的至少一個低于置信度閾值,請求所述對話的節點的重新聚類以及所述第一專用LM和所述第二專用LM的更新中的至少一項。
7.根據權利要求1所述的方法,還包括:響應于標識通過所述對話樹的導航頻率的變化,請求所述對話的節點的重新聚類以及所述第一專用LM和所述第二專用LM的更新中的至少一項。
8.根據權利要求1所述的方法,還包括:
接收第三話語;
基于所述第二專用LM將所述第三話語轉換為第三文本;以及
基于從所述第三文本確定的第三意圖,導航到所述對話的第四節點,其中所述第四節點屬于所述第一集群。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010153304.7/1.html,轉載請聲明來源鉆瓜專利網。





