[發明專利]一種基于知識庫的領域性單獨對話的方法在審
| 申請號: | 201910719092.1 | 申請日: | 2019-08-06 |
| 公開(公告)號: | CN110413761A | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 李百成;馬馳 | 申請(專利權)人: | 浩鯨云計算科技股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F17/27;G06K9/62 |
| 代理公司: | 江蘇致邦律師事務所 32230 | 代理人: | 郭雪麗 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識庫 核心詞 算法流程 領域性 檢索 同義詞 對話 知識庫構建 答案 接收用戶 用戶語句 傳統的 粗檢索 相似度 構建 語句 匹配 發送 返回 運作 | ||
一種基于知識庫的領域性單獨對話的方法,包括以下步驟:知識庫構建;接收用戶發送的語句;根據算法流程將用戶語句與知識庫相關知識匹配;返回相似度最高的知識答案;知識庫在項目前期構建,知識庫包含五大元素:核心詞、核心詞同義詞、標準問句、相似問句、答案,算法流程包括核心詞檢索、粗檢索、精檢索三大步驟,各個步驟可單獨運作。本發明相對于傳統的基于知識庫的對話方法,具有精度高、速度快等優點。
技術領域
本發明屬于人機問答的數據處理方法,尤其涉及一種基于知識庫的領域性單獨對話的方法。
背景技術
隨著深度學習等AI技術的發展,越來越多的工作可以用AI來完成,從而降低人工的投入,例如智能客服、電話營銷、智能催繳等。而這些場景的應用都需要依賴文本技術來實現,自然語言理解能力為這些技術提供底層的支持,幫助使用者更好的利用AI技術來輔助企業運營。智能客服的本質是對話系統,它包含了許多從基礎科學到深度學習的方法與知識,是通過結合機器學習、人工智能自然語言理解方向的算法和系統調度處理等方法,實現讓機器人理解并生成對話的產物。隨著技術的發展,多種不同類型的對話機器人服務于各行各業。技術方需針對不用類型的用戶與場景選用合適的機器人類型。目前業內普遍有四種類型的對話機器人:檢索型單輪對話機器人、知識圖譜型機器人、任務型多輪對話機器人和閑聊型機器人。其中,檢索型對話機器人的應用最為廣泛,它的實現也相對簡單。
發明內容
本發明提出一種基于知識庫的領域性單獨對話的方法,具有匹配精度高、速度快等優點。
本發明的技術方案:一種基于知識庫的領域性單獨對話的方法,括以下步驟:
s1:知識庫構建;
s2:接收用戶發送的語句;
s3:根據算法流程將用戶語句與知識庫相關知識匹配;
s4:返回相似度最高的知識答案;
s1中所述的知識庫在項目前期構建,知識庫包含五大元素:核心詞、核心詞同義詞、標準問句、相似問句、答案,s3中所述的算法流程包括核心詞檢索、粗檢索、精檢索三大步驟,各個步驟可單獨運作。
進一步的改進在于,所述的核心詞為一個知識標題中,最具有代表性的詞組,且一個知識標題有且只有一個核心詞,所述的核心詞同義詞為核心詞的同義詞,同義詞可以有多個,同義詞不能是已存在的核心詞,所述的標準問句又稱為知識標題,是一條知識的標準問法,所述的答案對應知識,每條知識只有一條答案。
進一步的改進在于,所述的核心詞檢索步驟包括以下子步驟:
S11:用戶輸入一句問句;
S12:系統需檢測問句中是否包含核心詞或者是某個核心詞對應的同義詞,如果存在,系統將從整個知識庫中篩選核心詞為該核心詞的知識到備選區。
進一步的改進在于,所述的粗檢索步驟包括以下子步驟:
S21:通過分詞算法對用戶問句以及備選區的知識進行分詞;
S22:結合word2vec模型得出各個詞組的詞向量;
S23:采用詞向量平均法得出句子的向量;
S24:句子相似度的度量采用余弦相似度,返回高于某閾值的知識進入到下一階段。
進一步的改進在于,所述的精檢索步驟包括以下子步驟:
s31:采用深度學習模型,對粗檢索返回的結果進行精排序;
s32:分值高于設置的直出閾值的知識數量大于等于一時,則直接返回分數最高的知識答案;
s33:分值高于設置的最低閾值且低于直出閾值的知識數量大于等于一,則返回分數最高的前三條知識作為推薦知識供用戶點選。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浩鯨云計算科技股份有限公司,未經浩鯨云計算科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910719092.1/2.html,轉載請聲明來源鉆瓜專利網。





