[發明專利]一種事件特征的獲取方法和設備有效
| 申請號: | 201410828598.3 | 申請日: | 2014-12-26 |
| 公開(公告)號: | CN104572906B | 公開(公告)日: | 2018-05-18 |
| 發明(設計)人: | 賈江濤;顧翀 | 申請(專利權)人: | 華為軟件技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 馮艷蓮 |
| 地址: | 210012 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 事件 特征 獲取 方法 設備 | ||
本發明公開了一種事件特征的獲取方法和設備,包括:獲取用于描述目標事件的特征詞集合,特征詞集合中包含多個特征詞;從獲取的特征詞集合中,確定用于描述目標事件的屬性的至少一個特征詞;針對確定的每一個特征詞,從特征詞集合中除用于描述目標事件屬性的特征詞之外的剩余特征詞中,抽取出該特征詞所標識的屬性的具體內容的至少一個特征詞,并建立確定的該特征詞與抽取的至少一個特征詞之間的對應關系;根據得到至少一組對應關系,得到目標事件的特征,這樣,有助于全面了解該目標事件,提升了獲取目標事件個性化信息的精度,為后續快速定位該目標事件奠定基礎。
技術領域
本發明涉及計算機技術領域,尤其涉及一種事件特征的獲取方法和設備。
背景技術
在互聯網技術快速發展的今天,用戶在應用互聯網時產生大量的數據。面對互聯網上產生的海量數據,人們希望從海量數據中獲取自己感興趣的事件。
然而,每一個事件都具備個性化信息,可以通過事件的個性化信息來區分不同的事件。事件的個性化信息一般包括事件的屬性和事件的屬性對應的具體內容。
在對海量數據進行處理時,通過人工識別方式,確定用于描述事件的抽取模板,在利用確定的抽取模板對海量數據進行匹配,得到感興趣的事件的個性化信息。
其中,抽取模板是指能夠抽取描述事件的屬性和該屬性對應的具體內容的抽取規則。
但是,由于目前所使用的抽取模板是通過人工方式確定的,隨著事件的發展,對于事件出現的新特征,無法及時確定該新特征對應的抽取模板,導致在對海量數據進行處理時,得到感興趣的事件的個性化信息不夠精確,影響了人們對該事件的判斷。
發明內容
有鑒于此,本發明實施例提供了一種事件特征的獲取方法和設備,用于解決在對海量數據進行處理時,得到感興趣的事件的個性化信息不夠精確的問題。
第一方面,提供了一種事件特征的獲取方法,包括:
獲取用于描述目標事件的特征詞集合,其中,所述特征詞集合中包含多個特征詞;
從獲取的所述特征詞集合中,確定用于描述所述目標事件的屬性的至少一個特征詞;
針對確定的每一個特征詞,從所述特征詞集合中除用于描述所述目標事件的屬性的特征詞之外的剩余特征詞中,抽取出該特征詞所標識的屬性的具體內容的至少一個特征詞,并建立確定的該特征詞與抽取的至少一個特征詞之間的對應關系;
根據得到至少一組對應關系,得到所述目標事件的特征。
結合第一方面,在第一種可能的實現方式中,所述方法還包括:
建立所述目標事件的特征與得到的至少一組對應關系之間的映射關系。
結合第一方面,或者結合第一方面的第一種可能的實現方式,在第二種可能的實現方式中,從獲取的所述多個特征詞中,確定用于描述所述目標事件的屬性的至少一個特征詞,包括:
針對獲取的所述特征詞集合,執行以下操作,直至確定出所述特征詞集合中全部用于描述所述目標事件的屬性的特征詞:
選擇任意一個特征詞;
確定選擇的該特征詞在原始文檔中的上下文內容;并根據所述上下文內容,判斷該特征詞是否為用于描述所述目標事件的屬性的特征詞;
若判斷結果是選擇的該特征詞是用于描述所述目標事件的屬性的特征詞,則將該特征詞標記為用于描述所述目標事件的屬性的特征詞,并選擇下一個特征詞,繼續執行上述操作;
若判斷結果是選擇的該特征詞不是用于描述所述目標事件的屬性的特征詞,則選擇下一個特征詞,繼續執行上述操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為軟件技術有限公司,未經華為軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410828598.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種報文傳輸方法及報文處理系統
- 下一篇:資源預加載方法及裝置





