[發明專利]一種股票行業的語義識別方法及系統裝置在審
| 申請號: | 201711248224.4 | 申請日: | 2017-12-01 |
| 公開(公告)號: | CN109871526A | 公開(公告)日: | 2019-06-11 |
| 發明(設計)人: | 陳斌;阮曙東;陳平;湯超 | 申請(專利權)人: | 武漢楚鼎信息技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430000 湖北省武漢市東湖新技術開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 匹配 歷史記錄 命名實體 系統裝置 語義識別 字模板 分詞 權重 引擎 數據庫 知識庫 系統穩定性 擴展性 場景模塊 調度引擎 檢索引擎 命令模板 人機交互 問題推薦 相關信息 引擎調用 語義分析 識別率 股票 伸縮 加載 調用 智能 挖掘 部署 | ||
1.一種股票行業的語義識別方法,包括:
輸入裝置獲取信息數據轉換為文本數據;
所述控制與調度引擎調用分詞引擎;
所述分詞引擎調用場景應用模塊中的多個場景模塊,加載所述各個場景模塊及對應的命名實體,對所述文本數據進行分詞,按照分詞順序生成關鍵詞及匹配的命名實體;
所述控制與調度引擎調用語義分析引擎;
所述語義分析引擎調用存儲于數據庫的歷史記錄,所述歷史記錄中包括多個文本數據及相應的命令字模板、參數,所述參數同所述命名實體相關聯;所述歷史記錄中命令字模板按照記錄時間的先后從小到大分配時間權重;所述匹配的命名實體同所述歷史記錄的匹配的命名實體進行匹配;
若匹配成功則提取所述歷史記錄中命令字模板,將所述關鍵詞同所述歷史記錄中命令字模板的相同參數關鍵詞進行替換,生成新命令字模板,并依據所述命令字模板的時間權重推送時間權重最大的命令字模板;
所述控制與調度引擎調用知識庫檢索引擎,所述知識庫檢索引擎根據所述時間權重最大的命令模板從數據庫中獲取所述命令模板關聯的信息。
2.根據權利要求1所述的一種股票行業的語義識別方法,其特征在于,所述對所述文本數據進行分詞,按照分詞順序生成關鍵詞及匹配的命名實體:
所述分詞引擎向場景應用模塊中的各個場景模塊發起調用;
所述場景模塊選取最大字節長度的命名實體的字節長度;
按照所述字節長度從所述文本數據的首字節選取相同字節長度的文本進行匹配;
若匹配不到相同字節長度的命名實體,則執行切分方法,所述切分方法為刪除所述選取相應字節長度的文本的末位字節進行匹配,循環上述切分方法進行匹配,直至匹配到命名實體或所述選取相應字節長度的文本字節為0;
若匹配到命名實體,提取所述命名實體,將所述選取相應字節長度的文本中刪除所述命名實體對應的文本數據,執行所述切分方法;
當所述選取相應字節長度的文本字節為0時,則執行移位方法,所述移位方法為按照最大字節長度命名實體的字節長度從所述文本數據后移一字節選取相應字節長度的文本,然后進行上述的切分方法循環匹配;循環上述移位方法,直至所述相應字節長度的文本字節為0,所述匹配結束;
按照分詞順序生成關鍵詞及匹配的命名實體。
3.根據權利要求1所述的一種股票行業的語義識別方法,其特征在于:所述場景應用模塊中的場景設置為金融行業,所述場景應用模塊中的多個場景分別為A股場景、港股場景、美股場景、創業板場景、基金場景、基本用語場景、客服場景、操作場景、QA場景、K線場景、行情場景。
4.根據權利要求1所述的一種股票行業的語義識別方法,其特征在于:所述知識庫檢索引擎根據所述時間權重最大的命令模板從數據庫中獲取所述命令模板關聯的信息后,將所述時間權重最大的命令字模板及相應的文本數據、參數存入所述數據庫中作為歷史記錄。
5.一種金融行業的分布式語義識別系統,包括:
控制與調度引擎:用于對所述分詞引擎、場景應用模塊、語義分析引擎、分析推薦引擎、知識庫檢索引擎進行控制和調度;
分詞引擎:用于對所述文本數據進行分詞,提取關鍵詞及關鍵詞屬性;
場景應用模塊:分配多個不同場景模塊,每個模塊存儲有多條命名實體及命令字模板供分詞引擎和語義分析引擎調用;
語義分析引擎:根據所述關鍵詞及關鍵詞屬性結合歷史記錄的時間權重匹配命令字模板;
知識庫檢索引擎:根據所述匹配度最高的命令字模板從數據庫提取相關信息呈現;
數據庫:用于存儲歷史記錄及相關信息。
6.根據權利要求5所述的一種金融行業的分布式語義識別系統,其特征在于,所述場景應用模塊包括:A股場景模塊、港股場景模塊、美股場景模塊、創業板場景模塊、基金場景模塊、基本用語場景模塊、客服場景模塊、操作場景模塊、QA場景模塊、K線場景模塊、行情場景模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢楚鼎信息技術有限公司,未經武漢楚鼎信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711248224.4/1.html,轉載請聲明來源鉆瓜專利網。





