[發明專利]獲取評價單元、建立句法路徑詞典的方法、裝置及系統無效
| 申請號: | 200910082342.1 | 申請日: | 2009-04-14 |
| 公開(公告)號: | CN101866336A | 公開(公告)日: | 2010-10-20 |
| 發明(設計)人: | 王震;張翼;陳儒;高立琦;劉桂平 | 申請(專利權)人: | 華為技術有限公司;問天(北京)信息技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 何文彬 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 獲取 評價 單元 建立 句法 路徑 詞典 方法 裝置 系統 | ||
1.一種獲取評價單元的方法,其特征在于,所述方法包括:
識別情感句的極性詞和目標詞;
創建句法路徑,所述句法路徑用于連接所述極性詞與所述目標詞;
根據句法路徑詞典獲取所述句法路徑對應的目標詞,其中,所述句法路徑詞典用于存儲標準句法路徑;
將所述極性詞與所述獲取的目標詞組成評價單元。
2.根據權利要求1所述的方法,其特征在于,所述創建句法路徑,包括:
對所述情感句進行句法分析,得到所述情感句的句法樹;
根據所述句法樹獲取所述極性詞與所述目標詞在所述句法樹中的公共最小父節點,所述公共最小父節點用于鏈接所述極性詞與所述目標詞,其中,連接所述極性詞與所述目標詞之間的路徑為所述句法路徑。
3.根據權利要求1所述的方法,其特征在于,所述根據句法路徑詞典獲取所述句法路徑對應的目標詞,包括:
將所述句法路徑與所述句法路徑詞典中的標準句法路徑進行比較,得到與所述標準句法路徑相同的句法路徑;
當所述得到的句法路徑的個數為一個時,獲取所述得到的句法路徑對應的目標詞,或當所述得到的句法路徑的個數為兩個或兩個以上時,選取優先級最高的句法路徑,獲取所述選取的句法路徑對應的目標詞。
4.根據權利要求1所述的方法,其特征在于,當所述創建的句法路徑為一個時,所述根據句法路徑詞典獲取所述句法路徑對應的目標詞,包括:
將所述句法路徑轉換成所述句法路徑詞典中的標準句法路徑,將轉換操作作為所述句法路徑的編輯距離;
當所述句法路徑的編輯距離小于或等于預設的閾值時;
獲取所述句法路徑對應的目標詞。
5.根據權利要求1所述的方法,其特征在于,當所述創建的句法路徑為兩個或兩個以上時,所述根據句法路徑詞典獲取所述句法路徑對應的目標詞,包括:
將所述句法路徑轉換成所述句法路徑詞典中的標準句法路徑,將轉換操作作為所述句法路徑的編輯距離;
確定編輯距離小于或等于預設的閾值的句法路徑,從所述編輯距離小于或等于預設的閾值的句法路徑中,選擇編輯距離最小的句法路徑;
獲取所述選擇的句法路徑對應的目標詞。
6.根據權利要求5所述的方法,其特征在于,當所述選擇所述編輯距離最小的句法路徑為兩個或兩個以上時,選擇優先級最高的句法路徑;
其中,所述獲取所述選擇的句法路徑對應的目標詞,具體包括:
獲取所述選擇的優先級最高的句法路徑對應的目標詞。
7.根據權利要求1-6任意一項所述的方法,其特征在于,在所述創建句法路徑之后,在所述根據句法路徑詞典獲取所述句法路徑對應的目標詞之前,還包括:泛化所述句法路徑,其具體包括:
將所述句法路徑中連續且相同的句法標簽合并;
將合并得到的句法路徑中相近的句法成分用統一的符號代替。
8.根據權利要求7所述的方法,其特征在于,當泛化后得到兩個或兩個以的相同的句法路徑時,所述泛化所述句法路徑的步驟,還包括:
根據句法樹得到所述獲取的所有所述相同句法路徑對應的目標詞所共同存在的短語,獲取位置在所述短語最右的目標詞;
保留所述極性詞與所述獲取的位置在所述短語最右的目標詞之間的句法路徑。
9.根據權利要求1所述的方法,其特征在于,所述方法還包括:建立句法路徑詞典,所述建立句法路徑詞典具體包括:
識別情感句語料庫的情感句的極性詞和目標詞;
創建所述情感句的極性詞與目標詞之間的句法路徑;
對所述句法路徑進行泛化;
計算所述泛化后的句法路徑出現的次數,將所述計算得到的次數作為所述句法路徑的頻率;
選取頻率超過設定的閾值的句法路徑作為標準句法路徑,將所述標準句法路徑組成句法路徑詞典。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司;問天(北京)信息技術有限公司,未經華為技術有限公司;問天(北京)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910082342.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信息推送方法、裝置及系統
- 下一篇:移動終端及其與計算機連接后的通信方法





