[發明專利]一種問答庫生成方法及相關設備在審
| 申請號: | 202110400261.2 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN113064982A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 張獻濤;暴筱;林小俊;支濤 | 申請(專利權)人: | 北京云跡科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/205;G06F40/279 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 劉杰 |
| 地址: | 100000 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 問答 生成 方法 相關 設備 | ||
本申請實施例提供了一種問答庫生成方法及相關設備,屬于機器人技術領域,解決了現有技術中智能設備的問答庫依靠已有的人工經驗和歷史的問答數據構建,效率較低的問題。所述方法包括:獲取所述基礎信息庫中的關鍵信息,其中,所述關鍵信息包括關鍵數據與屬性信息;基于所述關鍵數據確定對應所述關鍵數據的信息片段;基于所述屬性信息與預設問題列表獲取對應所述屬性信息的問題信息,其中,所述預設問題列表包括不同的屬性信息與對應所述不同屬性信息的問題信息;利用所述問題信息替換所述信息片段對應的所述關鍵信息,生成對應所述關鍵信息的問題;將對應所述關鍵信息的問題與所述關鍵信息組成問答對,對所述問答對進行存儲,得到所述問答庫。
技術領域
本申請實施例涉及機器人技術領域,尤其是涉及一種問答庫生成方法及相關設備。
背景技術
隨著數字化和智能化技術在各個領域的深入發展,更多的智能化設備在生活中發揮作用。各種智能的語音設備,如智能音箱、智能手機、智能機器人等設備都已經支持語音的對話。對話系統中最常用的功能模塊是自動問答功能,該功能主要是利用已有的問答庫,根據用戶的輸入進行回答。
當前,問答庫的整理和構建還主要是人工進行,根據已有的人工經驗和歷史的問答數據,進行整理,費時費力,效率較低。
發明內容
本申請實施例的目的在于提供一種問答庫生成方法,緩解了現有技術中創建問答庫根據已有的人工經驗和歷史的問答數據,進行整理,費時費力,效率較低的技術問題。
第一方面,本申請實施例提供一種問答庫生成方法,包括:
獲取上述基礎信息庫中的關鍵信息,其中,上述關鍵信息包括關鍵數據與屬性信息;
基于上述關鍵數據確定對應上述關鍵數據的信息片段;
基于上述屬性信息與預設問題列表獲取對應上述屬性信息的問題信息,其中,上述預設問題列表包括不同的屬性信息與對應上述不同屬性信息的問題信息;
利用上述問題信息替換上述信息片段對應的上述關鍵信息,生成對應上述關鍵信息的問題;
將對應上述關鍵信息的問題與上述關鍵信息組成問答對,對上述問答對進行存儲,得到上述問答庫。
可選的,上述獲取上述基礎信息庫中的關鍵信息的步驟,包括:
對上述基礎信息庫中的基礎信息進行分割,得到文本信息;
對上述文本信息進行詞性分析和命名體識別,得到初始關鍵信息;
基于預設篩選規則對上述初始關鍵信息進行篩選,得到上述關鍵信息,其中,上述預設篩選規則為能夠刪除至少一種詞性的初始關鍵信息的規則。
可選的,上述對上述基礎信息庫中的基礎信息進行分割的步驟,包括:
通過識別句號、分號、問號或者嘆號的方式對上述基礎信息庫中的基礎信息進行分割。
可選的,上述基于上述關鍵數據確定對應上述關鍵數據的信息片段的步驟,包括:
基于上述關鍵數據查找對應上述關鍵信息的上述文本信息;
通過識別逗號或者分號的方式對上述文本信息進行分割,得到對應上述關鍵數據的信息片段。
可選的,在上述將對應上述關鍵信息的問題與上述關鍵信息組成問答對的步驟之前,還包括:
基于語法和語義驗證上述對應上述關鍵信息的問題的合理性;
若上述對應上述關鍵信息的問題不合理,則刪除上述對應上述關鍵信息的問題;
若上述對應上述關鍵信息的問題合理,則將對應上述關鍵信息的問題與上述關鍵信息組成問答對。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京云跡科技有限公司,未經北京云跡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110400261.2/2.html,轉載請聲明來源鉆瓜專利網。





