[發(fā)明專利]一種基于自構(gòu)建多場景的對話追蹤方法在審
| 申請?zhí)枺?/td> | 202111150461.3 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN114003773A | 公開(公告)日: | 2022-02-01 |
| 發(fā)明(設(shè)計(jì))人: | 李青;胡萌;李立力 | 申請(專利權(quán))人: | 西北工業(yè)大學(xué) |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/9032;G06F40/211;G06F40/284;G06F40/35;B25J11/00 |
| 代理公司: | 北京科億知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11350 | 代理人: | 李越 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 構(gòu)建 場景 對話 追蹤 方法 | ||
本發(fā)明公開了一種基于自構(gòu)建多場景的對話追蹤方法,該系統(tǒng)首先對用戶輸入的問句進(jìn)行特征工程處理,然后將處理過的問句送入多層級的線性過濾器中,使其先后通過模板匹配、圖譜檢索、問題檢索、模型預(yù)測、聯(lián)網(wǎng)搜索等多個(gè)模塊,最終得到答案返回給用戶。多個(gè)模塊負(fù)責(zé)不同類型的問答,最后如果都無法匹配答案則調(diào)用外部接口進(jìn)行聯(lián)網(wǎng)搜索,這種結(jié)構(gòu)設(shè)計(jì)能夠充分利用各個(gè)模塊的技術(shù)優(yōu)勢,從而有效提高了最后輸出的回答的可靠性,減少了聊天機(jī)器人常見的安全回答現(xiàn)象,同時(shí)也保證了程序能夠應(yīng)用于多數(shù)聊天場景之中,提高了泛用性。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器人技術(shù)領(lǐng)域,尤其涉及一種基于自構(gòu)建多場景的對話追蹤方法。
背景技術(shù)
聊天機(jī)器人也可被稱作自動問答系統(tǒng),其是指利用計(jì)算機(jī)自動回答用戶所提出的問題以滿足用戶知識需求任務(wù)的系統(tǒng),主要應(yīng)用于客戶服務(wù)等領(lǐng)域。與現(xiàn)有搜索引擎不同,自動問答系統(tǒng)不再是基于簡單的關(guān)鍵詞匹配排序得到一個(gè)網(wǎng)頁集合,而是能夠精準(zhǔn)的生成自然語言答案返回給用戶。聊天機(jī)器人的存在讓用戶無需逐個(gè)瀏覽和仔細(xì)閱讀搜索引擎返回的每個(gè)鏈接網(wǎng)址中的信息,再剔除冗余信息后才能得到期望的答案,這為用戶節(jié)約了大量的時(shí)間。近年來,隨著人工智能的飛速發(fā)展,自動問答系統(tǒng)作為自然語言處理的一個(gè)重要分支,已經(jīng)成為倍受關(guān)注且發(fā)展前景廣泛的研究方向。
目前,市面上現(xiàn)有的中文聊天機(jī)器人主要分為以下三種類型:
1.基于人工模板的聊天機(jī)器人。該方法是根據(jù)用戶輸入的句子,在模板庫中找到匹配的問句模板,然后按照對應(yīng)的應(yīng)答模板生成答案,返回給用戶。這種方法的優(yōu)點(diǎn)是精確,缺點(diǎn)是需要大量的人力,并且缺乏靈活性,可擴(kuò)展性差。
2.基于檢索的聊天機(jī)器人。基于檢索技術(shù)的聊天機(jī)器人根據(jù)用戶輸入的句子,在對話庫中以搜索匹配的方式進(jìn)行匹配,從中找到最合適的應(yīng)答內(nèi)容,將答案提取出來返回給用戶。這種方法對對話庫的要求很高,并且需要足夠大,但是它的優(yōu)點(diǎn)是回答質(zhì)量高,表達(dá)比較自然。
3.基于深度學(xué)習(xí)的聊天機(jī)器人。基于深度學(xué)習(xí)的聊天機(jī)器人根據(jù)用戶輸入的句子,利用模型逐詞或逐字生成答案,然后將答案回復(fù)給用戶。其中多數(shù)技術(shù)采用了Encoder-Decoder模型,即編碼-解碼模型。這種方法思路簡單,可擴(kuò)展,能夠更好地理解上下文,但是模型很難訓(xùn)練,回復(fù)時(shí)經(jīng)常存在一些語法錯(cuò)誤。
上文中提到的三種類型的聊天機(jī)器人都有其各自的優(yōu)缺點(diǎn),但是目前的聊天機(jī)器人通常都只使用單一的技術(shù)思路去實(shí)現(xiàn),這造成了最終產(chǎn)品的泛用性較低,無法適用于多種聊天場景,對于一些特定的使用場景甚至需要特別定制,這也使得成本大幅攀升。
發(fā)明內(nèi)容
本發(fā)明的目的就在于為了解決上述問題而提供一種基于自構(gòu)建多場景的對話追蹤方法。
本發(fā)明通過以下技術(shù)方案來實(shí)現(xiàn)上述目的:
本發(fā)明包括以下步驟:
S1:首先對用戶輸入的問句進(jìn)行特征工程處理以滿足后續(xù)模塊處理的需要;
S2:將經(jīng)過處理的問句送入多層級問答處理模塊;
S3:進(jìn)入圖譜檢索模塊;
S4:在問題檢索模塊會利用倒排索引,根據(jù)問題的余弦相似度在問答庫中查詢相似問題從而篩選出答案;
S5:在模型預(yù)測模塊啟動時(shí),需要加載已經(jīng)預(yù)訓(xùn)練過的seq2seq模型;
S6:最后一個(gè)模塊為聯(lián)網(wǎng)搜索模塊,當(dāng)問題送入聯(lián)網(wǎng)搜索模塊即意味著本地語料庫沒有匹配到答案,因此將會調(diào)用搜狗問問提供的接口獲取相似問題的鏈接,再通過從搜索結(jié)果頁面中收集答案,并輸出給用戶。
本發(fā)明的有益效果在于:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué),未經(jīng)西北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111150461.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





