[發明專利]用于自然語言處理的方法和設備在審
| 申請號: | 202010424480.X | 申請日: | 2020-05-19 |
| 公開(公告)號: | CN112905735A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 金美淑;柳尚賢;樸貞訓;全在勛;韓奎范 | 申請(專利權)人: | 三星電子株式會社 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 黃曉燕;張川緒 |
| 地址: | 韓國京畿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 自然語言 處理 方法 設備 | ||
1.一種用于自然語言處理的方法,所述方法包括:
確定用戶的輸入句子與選擇的第一數據庫查詢句子之間的第一相似度;和
基于確定第一相似度不滿足第一閾值,
確定比輸入句子的全部少的輸入句子的部分與選擇的第二數據庫查詢句子之間的第二相似度,和
響應于第二相似度滿足第二閾值,輸出與第二數據庫查詢句子相應的回復句子作為對輸入句子的回復。
2.根據權利要求1所述的方法,還包括:將輸入句子編碼為第一特征向量,
其中,確定第一相似度的步驟包括:確定第一特征向量與第一查詢句子特征向量之間的相似度,第一查詢句子特征向量是存儲在數據庫中的多個查詢句子特征向量之中的與第一數據庫查詢句子相應的特征向量。
3.根據權利要求2所述的方法,還包括:
基于確定第一相似度不滿足第一閾值,
將輸入句子的所述部分編碼為第二特征向量,
其中,確定第二相似度的步驟包括:確定第二特征向量與第二查詢句子特征向量之間的相似度,第二查詢句子特征向量與存儲在數據庫中的第二數據庫查詢句子相應。
4.根據權利要求3所述的方法,其中,輸出與第二數據庫查詢句子相應的回復句子的步驟包括:對第二查詢句子特征向量進行解碼以獲得回復句子。
5.根據權利要求1所述的方法,其中,輸入句子的所述部分是包括在輸入句子中的多個成分中的一個成分。
6.根據權利要求5所述的方法,其中,輸入句子的所述部分是包括在輸入句子中的作為所述一個成分的動詞。
7.根據權利要求1所述的方法,其中,輸入句子的所述部分是基于多種任務的類型中的與輸入句子相應的任務的類型而選擇的句子成分。
8.根據權利要求7所述的方法,其中,所述多種任務的類型包括:聊天機器人類型和檢索類型。
9.根據權利要求1所述的方法,其中,用于確定輸入句子的所述部分的輸入句子的劃分基于對輸入句子執行的詞素分析。
10.根據權利要求1所述的方法,還包括:
基于第一相似度滿足第一閾值,輸出與第一數據庫查詢句子相應的回復句子作為對輸入句子的回復。
11.根據權利要求1所述的方法,還包括:
當第二相似度不滿足第二閾值時,使用生成模型生成與輸入句子相應的回復句子,并且輸出生成的回復句子。
12.根據權利要求1所述的方法,其中,用戶的輸入句子從用戶說出的語音或用戶輸入的文本數據獲取。
13.一種用于自然語言處理的方法,所述方法包括:
從包括在用戶的輸入句子中的所有成分中選擇成分;
確定選擇的成分與選擇的數據庫存儲的查詢句子之間的相似度;和
基于相似度是否滿足閾值,選擇性地輸出與數據庫存儲的查詢句子相應的回復句子作為對輸入句子的回復。
14.根據權利要求13所述的方法,其中,選擇成分的步驟包括:
選擇與正在處理輸入句子的任務的類型相應的成分,以選擇性輸出回復句子作為對輸入句子的回復。
15.根據權利要求14所述的方法,其中,選擇與任務的類型相應的成分的步驟包括:從至少包括聊天機器人類型和檢索類型的多種任務類型中確定任務的類型,并且基于確定任務的類型的結果,在輸入句子的名詞與動詞之間進行選擇以作為選擇的成分。
16.根據權利要求13所述的方法,其中,選擇成分的步驟包括:
對輸入句子執行詞素分析;和
基于執行的詞素分析的結果選擇成分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子株式會社,未經三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010424480.X/1.html,轉載請聲明來源鉆瓜專利網。





