[發明專利]一種信息處理方法及電子設備有效
| 申請號: | 201710855517.2 | 申請日: | 2017-09-20 |
| 公開(公告)號: | CN107633060B | 公開(公告)日: | 2020-05-26 |
| 發明(設計)人: | 胡長建;邱立坤 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/36 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 張穎玲;王花麗 |
| 地址: | 100085*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息處理 方法 電子設備 | ||
本發明公開了一種信息處理方法及電子設備,方法包括:基于預設的知識圖譜生成包括多個查詢串的查詢串集合;分別將每個所述查詢串輸入預設的問答系統,得到對應各所述查詢串的多個信息問答對;對由各所述查詢串對應的所述多個信息問答對組成的信息問答對集合進行聚類處理,得到對應所述知識圖譜的多個問題模板。
技術領域
本發明涉及信息處理技術領域,尤其涉及一種信息處理方法及電子設備。
背景技術
基于機器學習、深度學習的問答系統是人工智能的重要應用領域,以一問一答的形式,精確的定位用戶的提問所需要的答案,通過與用戶進行信息交互,為用戶提供個性化的信息服務。
目前的問答系統對用戶問題的響應通常是基于關鍵詞提取,將提取的關鍵詞與數據庫中的問題模板進行匹配,基于匹配結果確定用戶提問對應的答案。然而,當前問答系統中的問題模板的來源通常為人工撰寫,耗費大量的人力資源,且句式簡單、種類單一、通用性和精準度不高。
發明內容
本發明實施例提供一種信息處理方法及電子設備,能夠實現多個問題模板的自動獲取,覆蓋面廣、通用性強、準確性高。
本發明實施例的技術方案是這樣實現的:
本發明實施例提供了一種信息處理方法,所述方法包括:
基于預設的知識圖譜生成包括多個查詢串的查詢串集合;
分別將每個所述查詢串輸入預設的問答系統,得到對應各所述查詢串的多個信息問答對;
對由各所述查詢串對應的所述多個信息問答對組成的信息問答對集合進行聚類處理,得到對應所述知識圖譜的多個問題模板。
上述方案中,所述基于預設的知識圖譜生成包括多個查詢串的查詢串集合之前,所述方法還包括:
從預設的數據源中抽取指定類型的信息;
依據預設的構建策略對所述指定類型的信息進行結構化處理,形成所述知識圖譜。
上述方案中,所述基于預設的知識圖譜生成包括多個查詢串的查詢串集合,包括:
基于預設的第一提取策略對所述知識圖譜進行信息提取,得到多個信息三元組;每個所述信息三元組包括:第一實體信息、第二實體信息、實體關系信息;
基于預設的第二提取策略分別對每個所述信息三元組進行信息提取,得到對應各所述信息三元組的所述查詢串,形成所述包括多個查詢串的查詢串集合。
上述方案中,所述對由各所述查詢串對應的所述多個信息問答對組成的信息問答對集合進行聚類處理,得到對應所述知識圖譜的多個問題模板,包括:
分別提取各所述信息三元組中的所述第二實體信息;
基于所述第二實體信息,依據預設的篩選策略對所述信息問答對集合中的多個信息問答對進行篩選,得到符合預設條件的信息問答對;
依據預設的聚類策略,對所述符合預設條件的信息問答對中的問題信息進行聚類處理,得到對應所述知識圖譜的多個問題模板。
上述方案中,所述基于所述第二實體信息,依據預設的篩選策略對所述信息問答對集合中的多個信息問答對進行篩選,得到符合預設條件的信息問答對,包括:
將所述第二實體信息與所述信息問答對集合中每個所述信息問答對的答案信息進行相似度匹配;
確定與所述第二實體信息的相似度超過預設的相似度閾值的答案信息對應的信息問答對,為所述符合預設條件的信息問答對。
上述方案中,所述依據預設的聚類策略,對所述符合預設條件的信息問答對中的問題信息進行聚類處理,得到對應所述知識圖譜的多個問題模板,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710855517.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于分布式文件系統的數據處理方法和系統
- 下一篇:一種腕表識別系統





