[發明專利]一種基于知識庫的領域性單獨對話的方法在審
| 申請號: | 201910719092.1 | 申請日: | 2019-08-06 |
| 公開(公告)號: | CN110413761A | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 李百成;馬馳 | 申請(專利權)人: | 浩鯨云計算科技股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F17/27;G06K9/62 |
| 代理公司: | 江蘇致邦律師事務所 32230 | 代理人: | 郭雪麗 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識庫 核心詞 算法流程 領域性 檢索 同義詞 對話 知識庫構建 答案 接收用戶 用戶語句 傳統的 粗檢索 相似度 構建 語句 匹配 發送 返回 運作 | ||
1.一種基于知識庫的領域性單獨對話的方法,其特征在于,包括以下步驟:
s1:知識庫構建;
s2:接收用戶發送的語句;
s3:根據算法流程將用戶語句與知識庫相關知識匹配;
s4:返回相似度最高的知識答案;
其中,s1中所述的知識庫在項目前期構建,知識庫包含五大元素:核心詞、核心詞同義詞、標準問句、相似問句、答案,s3中所述的算法流程包括核心詞檢索、粗檢索、精檢索三大步驟,各個步驟可單獨運作。
2.根據權利要求1所述的一種基于知識庫的領域性單獨對話的方法,其特征在于,所述的核心詞為一個知識標題中,最具有代表性的詞組,且一個知識標題有且只有一個核心詞,所述的核心詞同義詞為核心詞的同義詞,同義詞可以有多個,同義詞不能是已存在的核心詞,所述的標準問句又稱為知識標題,是一條知識的標準問法,所述的答案對應知識,每條知識只有一條答案。
3.根據權利要求1所述的一種基于知識庫的領域性單獨對話的方法,其特征在于,所述的核心詞檢索步驟包括以下子步驟:
S11:用戶輸入一句問句;
S12:系統需檢測問句中是否包含核心詞或者是某個核心詞對應的同義詞,如果存在,系統將從整個知識庫中篩選核心詞為該核心詞的知識到備選區。
4.根據權利要求1所述的一種基于知識庫的領域性單獨對話的方法,其特征在于,所述的粗檢索步驟包括以下子步驟:
S21:通過分詞算法對用戶問句以及備選區的知識進行分詞;
S22:結合word2vec模型得出各個詞組的詞向量;
S23:采用詞向量平均法得出句子的向量;
S24:句子相似度的度量采用余弦相似度,返回高于某閾值的知識進入到下一階段。
5.根據權利要求1所述的一種基于知識庫的領域性單獨對話的方法,其特征在于,所述的精檢索步驟包括以下子步驟:
s31:采用深度學習模型,對粗檢索返回的結果進行精排序;
s32:分值高于設置的直出閾值的知識數量大于等于一時,則直接返回分數最高的知識答案;
s33:分值高于設置的最低閾值且低于直出閾值的知識數量大于等于一,則返回分數最高的前三條知識作為推薦知識供用戶點選。
6.根據權利要求5所述的一種基于知識庫的領域性單獨對話的方法,其特征在于,所述的深度學習模型主模型任務的形式為給定一個前提文本,根據這個前提去推斷假說文本與前提的關系。
7.根據權利要求6所述的一種基于知識庫的領域性單獨對話的方法,其特征在于,所述的主模型分為計算注意力、比較和組合三個階段。
8.根據權利要求7所述的一種基于知識庫的領域性單獨對話的方法,其特征在于,所述的組合階段融入句子向量相似度計算,結合原模型的計算結果,結合方式如下:
其中,為最終得分為原DA模型的得分為句子相似度得分;為變量。
9.根據權利要求8所述的一種基于知識庫的領域性單獨對話的方法,其特征在于,所述的句子向量相似度計算采用word2vec詞向量,并添加領域性的無監督數據進行微調。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浩鯨云計算科技股份有限公司,未經浩鯨云計算科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910719092.1/1.html,轉載請聲明來源鉆瓜專利網。





