[發明專利]語義消歧處理方法、裝置及其設備有效
| 申請號: | 201710585495.2 | 申請日: | 2017-07-18 |
| 公開(公告)號: | CN109271621B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 何鑫 | 申請(專利權)人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;賈允 |
| 地址: | 100080 北京市海淀區海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 處理 方法 裝置 及其 設備 | ||
1.一種語義消歧處理方法,其特征在于,包括:
確定篩選文本的基本匹配信息,其中,所述基本匹配信息具有多語義;
根據與所述基本匹配信息對應的目標語義和歧義語義,生成與所述基本匹配信息關聯的多個限定匹配信息;
建立用于篩選與所述基本匹配信息匹配的且符合目標語義文本的語義消歧數據結構,所述數據結構包括:與所述基本匹配信息對應的根節點,以及與所述多個限定匹配信息對應的多個子節點,并根據所述目標語義和歧義語義建立與所述根節點和所述多個子節點對應的父親節點和孩子節點的關系集合,其中,將待匹配的文本與當前的父親節點對應的匹配信息進行匹配,如果匹配成功,則根據與對應的孩子節點的匹配結果確定是否反轉與所述父親節點的匹配結果。
2.如權利要求1所述的方法,其特征在于,所述生成與所述基本匹配信息關聯的多個限定匹配信息,包括:
根據預設的匹配算法生成所述限定匹配信息;或者,
根據預設的停用詞生成所述限定匹配信息;或者,
根據預設的上下文范圍生成所述限定匹配信息。
3.如權利要求1或2所述的方法,其特征在于,還包括:
獲取待匹配的文本,從所述語義消歧數據結構的根節點對應的基本匹配信息開始對所述文本采取深度優先的遍歷策略,匹配所述語義消歧數據結構中的相關節點對應的限定匹配信息,其中,所述深度優先的遍歷策略包括:過濾邏輯與回溯邏輯,其中,
所述過濾邏輯包括:將所述文本與當前節點對應的匹配信息進行匹配,如果匹配失敗,則確定當前節點匹配失敗,如果匹配成功,則檢查當前節點是否包含未訪問過的孩子節點,如包括,則對所述未訪問過的孩子節點遞歸的執行所述過濾邏輯;
所述回溯邏輯包括:如果當前節點已經不包含未訪問過的孩子節點,判斷當前節點的全部孩子節點是否都匹配失敗,若是,則當前節點匹配成功,若至少一個孩子節點匹配成功,則當前節點匹配失敗;
根據所述相關節點的匹配結果確定所述根節點的全部孩子節點的匹配結果,并輸出所述文本與所述根節點的基本匹配信息對應的語義匹配結果。
4.如權利要求3所述的方法,其特征在于,在對所述未訪問過的孩子節點遞歸的執行所述過濾邏輯之前,還包括:
對所述未訪問過的孩子節點對應的限定匹配信息通過trie樹或datrie樹的數據結構進行表征。
5.如權利要求3所述的方法,其特征在于,所述根據所述相關節點的匹配結果確定所述根節點的全部孩子節點的匹配結果,并輸出所述文本與所述根節點的基本匹配信息對應的語義匹配結果,包括:
若根據所述相關節點的匹配結果確定所述根節點的全部孩子節點都匹配失敗,則輸出所述文本與所述根節點的基本匹配信息對應的語義匹配成功;
若根據所述相關節點的匹配結果確定所述根節點的至少一個孩子節點匹配成功,則輸出所述文本與所述根節點的基本匹配信息對應的語義匹配失敗。
6.一種語義消歧處理裝置,其特征在于,包括:
確定模塊,用于確定篩選文本的基本匹配信息,其中,所述基本匹配信息具有多語義;
生成模塊,用于根據與所述基本匹配信息對應的目標語義和歧義語義,生成與所述基本匹配信息關聯的多個限定匹配信息;
建立模塊,用于建立用于篩選與所述基本匹配信息匹配的且符合目標語義文本的語義消歧數據結構,所述數據結構包括:與所述基本匹配信息對應的根節點,以及與所述多個限定匹配信息對應的多個子節點,并根據所述目標語義和歧義語義建立與所述根節點和所述多個子節點對應的父親節點和孩子節點的關系集合,其中,若將待匹配的文本與當前的父親節點對應的匹配信息進行匹配,如果匹配成功,則根據與對應的孩子節點的匹配結果確定是否反轉與所述父親節點的匹配結果。
7.如權利要求6所述的裝置,其特征在于,所述生成模塊具體用于:
根據預設的匹配算法生成所述限定匹配信息;或者,
根據預設的停用詞生成所述限定匹配信息;或者,
根據預設的上下文范圍生成所述限定匹配信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710585495.2/1.html,轉載請聲明來源鉆瓜專利網。





