[發(fā)明專利]一種基于自構(gòu)建多場景的對話追蹤方法在審

申請?zhí)枺?/td>	202111150461.3	申請日：	2021-09-29
公開（公告）號：	CN114003773A	公開（公告）日：	2022-02-01
發(fā)明（設(shè)計(jì)）人：	李青;胡萌;李立力	申請（專利權(quán)）人：	西北工業(yè)大學(xué)
主分類號：	G06F16/901	分類號：	G06F16/901;G06F16/9032;G06F40/211;G06F40/284;G06F40/35;B25J11/00
代理公司：	北京科億知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11350	代理人：	李越
地址：	710072 ***	國省代碼：	陜西;61
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于構(gòu)建場景對話追蹤方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種基于自構(gòu)建多場景的對話追蹤方法，該系統(tǒng)首先對用戶輸入的問句進(jìn)行特征工程處理，然后將處理過的問句送入多層級的線性過濾器中，使其先后通過模板匹配、圖譜檢索、問題檢索、模型預(yù)測、聯(lián)網(wǎng)搜索等多個(gè)模塊，最終得到答案返回給用戶。多個(gè)模塊負(fù)責(zé)不同類型的問答，最后如果都無法匹配答案則調(diào)用外部接口進(jìn)行聯(lián)網(wǎng)搜索，這種結(jié)構(gòu)設(shè)計(jì)能夠充分利用各個(gè)模塊的技術(shù)優(yōu)勢，從而有效提高了最后輸出的回答的可靠性，減少了聊天機(jī)器人常見的安全回答現(xiàn)象，同時(shí)也保證了程序能夠應(yīng)用于多數(shù)聊天場景之中，提高了泛用性。

技術(shù)領(lǐng)域

本發(fā)明涉及機(jī)器人技術(shù)領(lǐng)域，尤其涉及一種基于自構(gòu)建多場景的對話追蹤方法。

背景技術(shù)

聊天機(jī)器人也可被稱作自動問答系統(tǒng)，其是指利用計(jì)算機(jī)自動回答用戶所提出的問題以滿足用戶知識需求任務(wù)的系統(tǒng)，主要應(yīng)用于客戶服務(wù)等領(lǐng)域。與現(xiàn)有搜索引擎不同，自動問答系統(tǒng)不再是基于簡單的關(guān)鍵詞匹配排序得到一個(gè)網(wǎng)頁集合，而是能夠精準(zhǔn)的生成自然語言答案返回給用戶。聊天機(jī)器人的存在讓用戶無需逐個(gè)瀏覽和仔細(xì)閱讀搜索引擎返回的每個(gè)鏈接網(wǎng)址中的信息，再剔除冗余信息后才能得到期望的答案，這為用戶節(jié)約了大量的時(shí)間。近年來，隨著人工智能的飛速發(fā)展，自動問答系統(tǒng)作為自然語言處理的一個(gè)重要分支，已經(jīng)成為倍受關(guān)注且發(fā)展前景廣泛的研究方向。

目前，市面上現(xiàn)有的中文聊天機(jī)器人主要分為以下三種類型：

1.基于人工模板的聊天機(jī)器人。該方法是根據(jù)用戶輸入的句子，在模板庫中找到匹配的問句模板，然后按照對應(yīng)的應(yīng)答模板生成答案，返回給用戶。這種方法的優(yōu)點(diǎn)是精確，缺點(diǎn)是需要大量的人力，并且缺乏靈活性，可擴(kuò)展性差。

2.基于檢索的聊天機(jī)器人。基于檢索技術(shù)的聊天機(jī)器人根據(jù)用戶輸入的句子，在對話庫中以搜索匹配的方式進(jìn)行匹配，從中找到最合適的應(yīng)答內(nèi)容，將答案提取出來返回給用戶。這種方法對對話庫的要求很高，并且需要足夠大，但是它的優(yōu)點(diǎn)是回答質(zhì)量高，表達(dá)比較自然。

3.基于深度學(xué)習(xí)的聊天機(jī)器人。基于深度學(xué)習(xí)的聊天機(jī)器人根據(jù)用戶輸入的句子，利用模型逐詞或逐字生成答案，然后將答案回復(fù)給用戶。其中多數(shù)技術(shù)采用了Encoder-Decoder模型，即編碼-解碼模型。這種方法思路簡單，可擴(kuò)展，能夠更好地理解上下文，但是模型很難訓(xùn)練，回復(fù)時(shí)經(jīng)常存在一些語法錯(cuò)誤。

上文中提到的三種類型的聊天機(jī)器人都有其各自的優(yōu)缺點(diǎn)，但是目前的聊天機(jī)器人通常都只使用單一的技術(shù)思路去實(shí)現(xiàn)，這造成了最終產(chǎn)品的泛用性較低，無法適用于多種聊天場景，對于一些特定的使用場景甚至需要特別定制，這也使得成本大幅攀升。

發(fā)明內(nèi)容

本發(fā)明的目的就在于為了解決上述問題而提供一種基于自構(gòu)建多場景的對話追蹤方法。

本發(fā)明通過以下技術(shù)方案來實(shí)現(xiàn)上述目的：

本發(fā)明包括以下步驟：

S1：首先對用戶輸入的問句進(jìn)行特征工程處理以滿足后續(xù)模塊處理的需要；

S2：將經(jīng)過處理的問句送入多層級問答處理模塊；

S3：進(jìn)入圖譜檢索模塊；

S4：在問題檢索模塊會利用倒排索引，根據(jù)問題的余弦相似度在問答庫中查詢相似問題從而篩選出答案；

S5：在模型預(yù)測模塊啟動時(shí)，需要加載已經(jīng)預(yù)訓(xùn)練過的seq2seq模型；

S6：最后一個(gè)模塊為聯(lián)網(wǎng)搜索模塊，當(dāng)問題送入聯(lián)網(wǎng)搜索模塊即意味著本地語料庫沒有匹配到答案，因此將會調(diào)用搜狗問問提供的接口獲取相似問題的鏈接，再通過從搜索結(jié)果頁面中收集答案，并輸出給用戶。

本發(fā)明的有益效果在于：

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué)，未經(jīng)西北工業(yè)大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202111150461.3/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：面向橋梁振動監(jiān)測的加速度傳感器固定裝置及其方法
下一篇：一種廚余垃圾水熱轉(zhuǎn)換快速腐殖化方法

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】