[發明專利]主題挖掘方法和設備、以及查詢擴展方法和設備在審
| 申請號: | 201310301260.8 | 申請日: | 2013-07-18 |
| 公開(公告)號: | CN104298676A | 公開(公告)日: | 2015-01-21 |
| 發明(設計)人: | 黃耀海;張碧川;李榮軍;王釗 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 歐陽帆 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 主題 挖掘 方法 設備 以及 查詢 擴展 | ||
1.一種主題挖掘方法,包括:
獲取步驟,從至少一個知識庫中獲取多個句子;
轉換步驟,將所獲取的句子中的至少一個轉換為條件三元組形式的第一斷言聲明,其中所述第一斷言聲明的條件三元組由多模因素的一個模式、條件、以及多值屬性的一個值構成;
產生步驟,針對第一斷言聲明產生條件三元組形式的假設,其中所產生的假設的條件三元組中的多模因素和多值屬性分別與第一斷言聲明的條件三元組中的多模因素和多值屬性相同,所產生的假設中的多值屬性的值不同于第一斷言聲明中的多值屬性的值;
計算步驟,通過使用存儲在所述至少一個知識庫中的證據來計算每個假設的置信度,并且從所述假設中提取出一個或更多個假設作為第二斷言聲明,其中每個第二斷言聲明的置信度大于預定的第一閾值;
組合步驟,將第一斷言聲明和第二斷言聲明組合以獲得從所述多值屬性到所述多模因素的映射,并且驗證所述映射是否是滿射;以及
輸出步驟,在從所述多值屬性到所述多模因素的映射是滿射的情況下,輸出表示所述多值屬性是所述多模因素的前提的前提斷言對主題。
2.根據權利要求1所述的主題挖掘方法,其中,對于所獲取的句子中的至少一個,所述轉換步驟包括:
提取所獲取的句子中的特定實體,所述特定實體至少包括值和模式;
通過如下步驟來識別所述至少一個知識庫中的與所述模式對應的多模因素和與所述值對應的多值屬性:
從所述至少一個知識庫中提取與所述模式對應的因素、以及與所述值對應的屬性;以及
從所述至少一個知識庫中識別與所述因素對應的其它模式、以及與所述屬性對應的其它值,以確定多模因素和多值屬性;以及
將所獲取的句子轉換為所識別出的多模因素和所識別出的多值屬性的條件三元組。
3.根據權利要求1所述的主題挖掘方法,其中所述計算步驟包括:
從所述至少一個知識庫中提取所述假設的條件三元組的證據;
根據所提取的證據來計算與每個假設關聯的置信度。
4.根據權利要求1所述的主題挖掘方法,其中所述證據包括如下中的至少一個:
從無結構的文本片段中提取的語言模板以及指定的權重;
從無結構的文本片段中提取的共同出現的頻率以及指定的權重;
從本體中提取的多模因素與多值屬性之間的關系以及指定的權重;
多模因素與多值屬性的詞匯元素以及指定的權重。
5.根據權利要求1所述的主題挖掘方法,其中所述組合步驟還包括:
基于所產生的假設的個數及其置信度來計算驗證為是滿射的映射的關聯風險;或/和
基于所述第一斷言聲明中的多模因素的影響值來計算驗證為是滿射的映射的關聯風險。
6.根據權利要求1所述的主題挖掘方法,其中所述輸出步驟包括:
在所述至少一個知識庫中存儲作為滿射的從所述多值屬性到所述多模因素的映射;
以前提斷言對的形式產生對于作為滿射的從所述多值屬性到所述多模因素的映射的知識;
基于所產生的知識輸出前提斷言對主題,其中所述前提斷言對主題包括如下中的至少一個:
多值屬性是多模因素的前提;
改變多值屬性的值以滿足多模因素的一個模式,其中該多值屬性是二值屬性;
設置多值屬性的值以滿足多模因素的一個模式。
7.根據權利要求5所述的主題挖掘方法,其中所述輸出步驟包括:
在所述映射的關聯風險高于預定的第二閾值的情況下,將所述第一斷言聲明對應的原始句子輸出。
8.根據權利要求1所述的主題挖掘方法,其中所述獲取步驟包括:
接收自然語言形式的查詢作為輸入;
在所述至少一個知識庫中檢索與所述查詢匹配的句子。
9.根據權利要求1所述的主題挖掘方法,其中所述獲取步驟包括:
接收所述至少一個知識庫作為輸入;
遍歷所述至少一個知識庫,并且獲取所述至少一個知識庫中的至少一個文本片段;以及
在所述至少一個知識庫中檢索與所述至少一個文本片段匹配的句子。
10.根據權利要求1所述的主題挖掘方法,其中所述知識庫包括如下中的至少一個:
計算機可讀的文本文檔;以及
計算機可讀的領域本體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310301260.8/1.html,轉載請聲明來源鉆瓜專利網。





