[發明專利]一種聊天機器人知識庫自動構建裝置及其方法在審
| 申請號: | 201710292116.0 | 申請日: | 2017-04-28 |
| 公開(公告)號: | CN107133305A | 公開(公告)日: | 2017-09-05 |
| 發明(設計)人: | 袁浩 | 申請(專利權)人: | 上海斐訊數據通信技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 上海碩力知識產權代理事務所31251 | 代理人: | 郭桂峰 |
| 地址: | 201616 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聊天 機器人 知識庫 自動 構建 裝置 及其 方法 | ||
1.一種聊天機器人知識庫自動構建裝置,其特征在于,所述知識庫自動構建裝置中包括:
語料獲取模塊,用于獲取原始語料,所述原始語料中包括多個文本句;
語料分類模塊,用于根據預設規則對語料獲取模塊獲取的原始語料進行分類,得到各類別對應的子語料;
語料存儲模塊,用于根據語料分類模塊的分類結果將各類別對應的子語料存儲入知識庫中相應的存儲區域。
2.如權利要求1所述的知識庫自動構建裝置,其特征在于,
在所述語料獲取模塊中,獲取的原始語料為問答對式語料;
在所述語料分類模塊中,根據預設規則依次對原始語料問答對中的問題進行分類,所述子語料中包括各類別對應的問題及其應答內容。
3.如權利要求1或2所述的知識庫自動構建裝置,其特征在于,在語料分類模塊中包括:
拆分單元,用于將需要進行分類的文本句進行拆分得到若干分詞;
查找單元,根據各類別中預設的關鍵詞在拆分單元拆分得到的分詞中查找;
歸類單元,當查找單元查找到與某一類別中預設的關鍵詞相同的分詞,歸類單元將該文本句歸類至該類別。
4.如權利要求3所述的知識庫自動構建裝置,其特征在于,所述語料分類模塊中還包括:
相似度運算單元,當查找單元未查找到與各類別中預設的關鍵詞相同的分詞,相似度運算單元分別計算各分詞與各類別中預設的關鍵詞之間的相似度;
判斷單元,用于根據相似度運算單元的計算結果,判斷是否存在與某一類別中預設的關鍵詞之間相似度大于預設相似度的分詞;若存在,所述歸類單元將該文本句歸類至該類別。
5.如權利要求4所述的知識庫自動構建裝置,其特征在于,所述語料分類模塊中還包括類別獲取單元,
當判斷單元判斷該文本句中不存在與各類別中預設的關鍵詞之間相似度大于預設相似度的分詞,則類別獲取單元獲取上一文本句所屬類別,歸類單元將該文本句歸類之上一文本句所屬類別。
6.如權利要求1或2或4或5所述的知識庫自動構建裝置,其特征在于,所述知識庫自動構建裝置中還包括:
語料處理模塊,用于對語料分類模塊分類得到的各子語料進行自然語言處理得到標準子語料;
所述語料存儲模塊將語料處理模塊處理得到的標準子語料存儲入知識庫中相應的存儲區域。
7.一種聊天機器人知識庫自動構建方法,其特征在于,所述知識庫自動構建方法中包括:
S1獲取原始語料,所述原始語料中包括多個文本句;
S2根據預設規則對所述原始語料進行分類,得到各類別對應的子語料;
S3將各類別對應的子語料存儲入知識庫中相應的類別區域。
8.如權利要求7所述的知識庫自動構建方法,其特征在于,在步驟S2中具體包括:
S21將需要進行分類的文本句進行拆分得到若干分詞;
S22根據各類別中預設的關鍵詞在拆分得到的分詞中查找,若查找到與某一類別中預設的關鍵詞相同的分詞,跳轉至步驟S23;
S23該文本句歸類至該類別。
9.如權利要求8所述的知識庫自動構建方法,其特征在于,在步驟S22中,若未查找到與各類別中預設的關鍵詞相同的分詞,跳轉至步驟S24;
S24分別計算各分詞與各類別中預設的關鍵詞之間的相似度;
S25判斷是否存在與某一類別中預設的關鍵詞之間相似度大于預設相似度的分詞,若存在,跳轉至步驟S23。
10.如權利要求9所述的知識庫自動構建方法,其特征在于,在步驟S25中,若判斷該文本句中不存在與各類別中預設的關鍵詞之間相似度大于預設相似度的分詞,跳轉至步驟S26;
S26獲取上一文本句所屬類別,并跳轉至步驟S23。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海斐訊數據通信技術有限公司,未經上海斐訊數據通信技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710292116.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據操作方法、裝置及計算機可讀存儲介質
- 下一篇:信息流轉碼裝置及方法





