[發(fā)明專利]用于自然語(yǔ)言處理的方法和設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202010424480.X | 申請(qǐng)日: | 2020-05-19 |
| 公開(公告)號(hào): | CN112905735A | 公開(公告)日: | 2021-06-04 |
| 發(fā)明(設(shè)計(jì))人: | 金美淑;柳尚賢;樸貞訓(xùn);全在勛;韓奎范 | 申請(qǐng)(專利權(quán))人: | 三星電子株式會(huì)社 |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/332 |
| 代理公司: | 北京銘碩知識(shí)產(chǎn)權(quán)代理有限公司 11286 | 代理人: | 黃曉燕;張川緒 |
| 地址: | 韓國(guó)京畿*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 自然語(yǔ)言 處理 方法 設(shè)備 | ||
公開了一種用于自然語(yǔ)言處理的方法和設(shè)備。所述方法包括:確定用戶的輸入句子與選擇的第一數(shù)據(jù)庫(kù)查詢句子之間的第一相似度,基于確定第一相似度不滿足第一閾值,確定比輸入句子的全部少的輸入句子的部分與選擇的第二數(shù)據(jù)庫(kù)查詢句子之間的第二相似度,和響應(yīng)于第二相似度滿足第二閾值,輸出與第二數(shù)據(jù)庫(kù)查詢句子相應(yīng)的回復(fù)句子作為對(duì)輸入句子的回復(fù)。
本申請(qǐng)要求于2019年11月19日在韓國(guó)知識(shí)產(chǎn)權(quán)局提交的第10-2019-0148984號(hào)韓國(guó)專利申請(qǐng)的權(quán)益,所述韓國(guó)專利申請(qǐng)的全部公開出于所有目的通過(guò)引用包含于此。
技術(shù)領(lǐng)域
下面的描述涉及用于自然語(yǔ)言處理的方法和設(shè)備。
背景技術(shù)
聊天機(jī)器人系統(tǒng)是用于生成與用戶輸入的句子相應(yīng)的回復(fù)句子的系統(tǒng)。聊天機(jī)器人系統(tǒng)可包括基于檢索模型的聊天機(jī)器人系統(tǒng)和基于生成(生成式)模型的聊天機(jī)器人系統(tǒng)。由于基于檢索模型的聊天機(jī)器人系統(tǒng)基于存儲(chǔ)在數(shù)據(jù)庫(kù)中的數(shù)據(jù),因此難以輸出適合于數(shù)據(jù)庫(kù)中尚未包括的輸入句子或短語(yǔ)的回復(fù)句子。基于生成模型的聊天機(jī)器人系統(tǒng)生成各種回復(fù)。然而,因?yàn)榛谏赡P偷牧奶鞕C(jī)器人系統(tǒng)可能生成語(yǔ)法錯(cuò)誤的回復(fù)或在不同時(shí)間對(duì)相同的查詢輸入生成不同的回復(fù),所以基于生成模型的聊天機(jī)器人系統(tǒng)通常是不一致的。
發(fā)明內(nèi)容
提供本發(fā)明內(nèi)容以簡(jiǎn)化的形式介紹在以下具體實(shí)施方式中進(jìn)一步描述的構(gòu)思的選擇。本發(fā)明內(nèi)容不意在確定要求權(quán)利的主題的關(guān)鍵特征或必要特征,也不意在用于幫助確定要求權(quán)利的主題的范圍。
在一個(gè)總體方面,一種處理器實(shí)現(xiàn)的方法包括:確定用戶的輸入句子與選擇的第一數(shù)據(jù)庫(kù)查詢句子之間的第一相似度,和基于確定第一相似度不滿足第一閾值,確定比輸入句子的全部少的輸入句子的部分與選擇的第二數(shù)據(jù)庫(kù)查詢句子之間的第二相似度,和響應(yīng)于第二相似度滿足第二閾值,輸出與第二數(shù)據(jù)庫(kù)查詢句子相應(yīng)的回復(fù)句子作為對(duì)輸入句子的回復(fù)。
所述方法還可包括:將輸入句子編碼為第一特征向量,其中,確定第一相似度的步驟可包括:確定第一特征向量與第一數(shù)據(jù)庫(kù)查詢句子之間的相似度,第一數(shù)據(jù)庫(kù)查詢句子是存儲(chǔ)在數(shù)據(jù)庫(kù)中的多個(gè)查詢句子特征向量之中的存儲(chǔ)在數(shù)據(jù)庫(kù)中的第一查詢句子特征向量。
所述方法還可包括:基于確定第一相似度不滿足第一閾值,將輸入句子的所述部分編碼為第二特征向量,其中,確定第二相似度的步驟可包括:確定第二特征向量與第二數(shù)據(jù)庫(kù)查詢句子之間的相似度,第二數(shù)據(jù)庫(kù)查詢句子是存儲(chǔ)在數(shù)據(jù)庫(kù)中的第二查詢句子特征向量。
輸出與第二數(shù)據(jù)庫(kù)查詢句子相應(yīng)的回復(fù)句子的步驟可包括:對(duì)第二查詢句子特征向量進(jìn)行解碼以獲得回復(fù)句子。
輸入句子的所述部分可以是包括在輸入句子中的多個(gè)成分中的一個(gè)成分。
輸入句子的所述部分可以是包括在輸入句子中的作為所述一個(gè)成分的動(dòng)詞。
輸入句子的所述部分可以是基于多種任務(wù)的類型中的與輸入句子相應(yīng)的任務(wù)的類型而選擇的句子成分。
所述多種任務(wù)的類型可包括:聊天機(jī)器人類型和檢索類型。
用于確定輸入句子的所述部分的輸入句子的分配可基于對(duì)輸入句子執(zhí)行的詞素分析。
所述方法還包括:基于第一相似度滿足第一閾值,輸出與第一查詢句子相應(yīng)的回復(fù)句子作為對(duì)輸入句子的回復(fù)。
所述方法還包括:當(dāng)?shù)诙嗨贫炔粷M足第二閾值時(shí),使用生成模型生成與輸入句子相應(yīng)的回復(fù)句子,并且輸出生成的回復(fù)句子。
用戶的輸入句子可從用戶說(shuō)出的語(yǔ)音或用戶輸入的文本數(shù)據(jù)獲取。
在一個(gè)總體方面,非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)指令,所述指令在由一個(gè)或多個(gè)處理器執(zhí)行時(shí),使所述一個(gè)或多個(gè)處理器執(zhí)行在此描述的所有處理中的一個(gè)或多個(gè)或它們的任意組合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于三星電子株式會(huì)社,未經(jīng)三星電子株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010424480.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種自然語(yǔ)言的搜索方法及系統(tǒng)
- 基于交互上下文處理自然語(yǔ)言方法
- 計(jì)算機(jī)化的自然語(yǔ)言查詢意圖分派
- 自然語(yǔ)言描述信息的生成方法及裝置
- 風(fēng)格可定制的文本生成
- 多輪預(yù)制對(duì)話
- 改變應(yīng)答以提供表現(xiàn)豐富的自然語(yǔ)言對(duì)話的方法、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言查詢的轉(zhuǎn)換
- 一種自然語(yǔ)言處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言理解模型訓(xùn)練方法、自然語(yǔ)言理解方法及裝置
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





