[發明專利]用于檢測和校正對查詢的識別中的差錯的系統和方法在審
| 申請號: | 202010915560.5 | 申請日: | 2020-09-03 |
| 公開(公告)號: | CN112445931A | 公開(公告)日: | 2021-03-05 |
| 發明(設計)人: | 白羚;邢博納 | 申請(專利權)人: | 聲音獵手公司 |
| 主分類號: | G06F16/632 | 分類號: | G06F16/632;G06F16/635;G06F40/226;G10L15/22 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 楊佳婧 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 檢測 校正 查詢 識別 中的 差錯 系統 方法 | ||
1.一種用于檢測對查詢的不準確響應的方法,該方法包括:
接收來自用戶的第一查詢,所述第一查詢具有結束時間和第一轉錄;
提供對所述第一查詢的響應;
在接收所述第一查詢后的短時間段內接收來自用戶的第二查詢,所述第二查詢具有第二轉錄;
比較所述第二轉錄與所述第一轉錄以確定所述第一轉錄和所述第二轉錄之間的相似性;并且
基于對所述第一轉錄和所述第二轉錄之間的相似性的確定,當所述第一查詢與所述第二查詢相似時,確定所述響應是不準確的。
2.如權利要求1所述的方法,其中所述第二查詢中斷提供所述響應。
3.如權利要求1或2所述的方法,其中比較包括通過計算編輯距離來相對于所述第二轉錄分析所述第一轉錄。
4.如權利要求1至3的任何一項所述的方法,其中所述第二查詢是在所述第一查詢的結束時間后的三十秒內接收到的。
5.如權利要求1或2所述的方法,其中比較包括:
將所述第一轉錄變換成表示所述第一查詢的含義的第一嵌入向量;
將所述第二轉錄變換成表示所述第二查詢的含義的第二嵌入向量;并且
將查詢相似性計算為所述第一嵌入向量和所述第二嵌入向量之間的距離。
6.一種識別任何查詢的誤轉錄的方法,該方法包括:
在第一時間接收第一查詢,所述第一查詢具有結束時間;
為在所述第一時間接收的所述第一查詢得出第一轉錄;
提供對所述第一查詢的響應;
在第二時間接收第二查詢;
為在所述第二時間接收的所述第二查詢得出第二轉錄,所述第二轉錄不同于所述第一轉錄;
當所述第一時間和所述第二時間之間的時間流逝小于三十秒時,將所述第一轉錄與所述第二轉錄相比較以確定所述第一轉錄和所述第二轉錄之間的相似水平是否超過閾值;并且
當所述第一轉錄和所述第二轉錄之間的相似水平超過所述閾值時,確定存在誤轉錄。
7.如權利要求6所述的方法,其中確定存在誤轉錄取決于確定在所述第二時間接收的所述第二查詢中斷所述響應。
8.如權利要求6所述的方法,其中確定存在誤轉錄取決于基于語義嵌入向量之間的距離確定在所述第一時間接收的所述第一查詢的所述第一轉錄包括與在所述第二時間接收的所述第二查詢的所述第二轉錄的充分語義相似性。
9.如權利要求6所述的方法,其中確定存在誤轉錄取決于確定在所述第二時間接收的所述第二查詢包括指出所述第一轉錄錯誤的關鍵短語。
10.如權利要求6所述的方法,其中確定存在誤轉錄取決于確定所述第二轉錄是從文本查詢得出的。
11.如權利要求6至10的任何一項所述的方法,其中比較包括:
將所述第一轉錄變換成表示所述第一轉錄的第一嵌入向量;
將所述第二轉錄變換成表示所述第二轉錄的第二嵌入向量;并且
基于所述第一嵌入向量和所述第二嵌入向量之間的距離計算查詢相似性。
12.一種標記查詢數據的方法,包括:
對于第一時間處的第一查詢確定第一轉錄;
對于第二時間處的第二查詢確定第二轉錄,所述第二轉錄不與所述第一轉錄相同;
基于編輯距離計算所述第一轉錄和所述第二轉錄之間的查詢相似性;并且
響應于所計算的查詢相似性超過閾值而標記所述第一轉錄。
13.如權利要求12所述的方法,還包括生成響應,其中所述標記取決于確定所述第二時間處的所述第二查詢在所述響應期間插入。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聲音獵手公司,未經聲音獵手公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010915560.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電動機驅動裝置
- 下一篇:聚苯醚系樹脂組合物和車輛用燈具延長件





