[發明專利]一種個股公告自然語言查詢處理的方法、系統及設備有效
| 申請號: | 201811615557.0 | 申請日: | 2018-12-27 |
| 公開(公告)號: | CN109710742B | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 趙岑;陳世敏;馮采;張小平;羅廣超 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/284 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 個股 公告 自然語言 查詢 處理 方法 系統 設備 | ||
1.一種個股公告自然語言查詢處理的方法,其特征在于,包括:
接收輸入的自然語言查詢語句;
對所述自然語言查詢語句進行分詞處理得到關鍵詞組;
根據所述關鍵詞組確定所述自然語言查詢語句的類型,并根據所述自然語言查詢語句的類型確定所述自然語言查詢語句的各個組成部分;
將各所述組成部分按照預設規則轉換為預設數據交換格式的文件;
獲取所述預設數據交換格式的文件中的查詢條件信息,并根據所述查詢條件信息對個股公告信息進行查詢;
其中,對所述自然語言查詢語句進行分詞處理得到關鍵詞組,包括:
對所述自然語言查詢語句進行初始匹配,得到初始組成部分;
根據所述初始組成部分對預設類型進行篩選,確定所述自然語言查詢語句的類型的初始范圍;
調用句法分析工具對所述自然語言查詢語句進行分詞處理得到關鍵詞組;
所述根據所述關鍵詞組確定所述自然語言查詢語句的類型,并確定所述自然語言查詢語句的各個組成部分對應包括:
根據所述關鍵詞組在所述初始范圍內確定所述自然語言查詢語句的類型;
根據所述自然語言查詢語句的類型確定所述自然語言查詢語句除所述初始組成部分之外的其它組成部分。
2.根據權利要求1所述的方法,其特征在于,所述自然語言查詢語句的組成部分包括事件時間、事件類型、標的物。
3.根據權利要求2所述的方法,其特征在于,當所述自然語言查詢語句的組成部分還包括事件屬性時,確定所述自然語言查詢語句的各個組成部分,包括:
獲取數據庫中記錄的各事件屬性組,并在所述自然語言查詢語句中對各所述事件屬性組進行匹配并評分;
確定評分最高的事件屬性組為所述事件屬性。
4.根據權利要求3所述的方法,其特征在于,當所述自然語言查詢語句的組成部分還包括事件過濾條件時,在確定評分最高的事件屬性組為所述事件屬性之后,還包括:
對所述自然語言查詢語句進行句法分析得到第一分析結果;
根據所述第一分析結果確定所述事件屬性的修飾詞或所述事件屬性的謂語及賓語為所述事件過濾條件。
5.根據權利要求2所述的方法,其特征在于,確定所述自然語言查詢語句的各個組成部分,包括:
獲取數據庫中記錄的各預設標的物,并在所述自然語言查詢語句中對各所述預設標的物進行匹配并評分;
確定評分最高的預設標的物為所述標的物。
6.根據權利要求5所述的方法,其特征在于,當所述自然語言查詢語句的組成部分還包括標的價格過濾條件及標的價格時間時,在確定評分最高的預設標的物為所述標的物之后,還包括:
對所述自然語言查詢語句進行句法分析得到第二分析結果;
根據所述第二分析結果確定所述標的物的修飾詞或所述標的物的謂語及賓語為所述標的價格過濾條件;
根據所述第二分析結果確定所述標的物的時間限制為所述標的價格時間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811615557.0/1.html,轉載請聲明來源鉆瓜專利網。





