[發明專利]一種基于自然語言理解的智能取數系統及其方法有效
| 申請號: | 201910292704.3 | 申請日: | 2019-04-12 |
| 公開(公告)號: | CN110119404B | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 王同和;凌立剛;孫銳 | 申請(專利權)人: | 杭州量之智能科技有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F16/2452 |
| 代理公司: | 杭州云睿專利代理事務所(普通合伙) 33254 | 代理人: | 張驍敏 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 理解 智能 系統 及其 方法 | ||
1.一種基于自然語言理解的智能取數方法,其特征是,包括如下步驟:
步驟1,用戶輸入搜索自然語言,外部分詞器進行外部分段來分隔中文查詢單詞、并輸送每個分隔單詞至標記解析器Tokenizer內識別含義;
步驟2,標記解析器Tokenizer嘗試識別每個分隔單詞的含義,必要時將分隔單詞組合成短語,最后將單詞和短語映射到含有語義信息的節點上,所有的單詞最初都會標記成UnknownNode節點類型;
步驟2.1,標記解析器Tokenizer首先解析與數據庫不相關的節點,并配備一個詞庫用于識別這些類型的節點,為了解決同一個詞在不同語境中有不同的含義,標記解析器Tokenizer允許編寫識別規則,識別規則匹配的是句子中的節點,根據上下文解釋單詞;
步驟2.2,標記解析器Tokenizer第二步解析與數據庫相關的節點,首先從詞本身出發,從所有匹配和組合方式中,通過打分的方式找到最佳的匹配和組合方式,接著將最佳匹配所有的節點的所有映射全排列,得到所有可能的組合,并將每個組合映射到數據模型Schema Graph的節點上,對這些節點生成Steiner Tree,在所有的Steiner Tree中,權重最小的組合即為最終標記解析器Tokenizer的結果,如果依舊有多個結果,則隨機選出一個,并將所有結果返回用戶,如有誤用戶可以訂正;
步驟3,將得到的節點序列轉化成查詢樹Query Tree,查詢樹Query Tree的構建方式采用先局部建成小的子樹,再合并的建樹方法;
步驟4,將查詢樹Query Tree轉化成結構化查詢語言SQL至數據庫DB內、并反饋至用戶自然語言交互模塊內供用戶參考。
2.根據權利要求1所述的一種基于自然語言理解的智能取數方法,其特征是,在步驟2.2中打分選擇最近匹配和組合方式過程中,得分的高低從以下四個方面考慮:被匹配項的字符應盡可能多的匹配、稀有被匹配項應具有更高的優先級、不要破壞原始分詞、匹配的字符要連續。
3.一種基于自然語言理解的智能取數系統,用于執行如權利要求1所述的智能取數方法,其特征是,包括用戶自然語言交互模塊、搜索引擎Search Engine、數據模型SchemaGraph、標記解析器Tokenizer、樹生成器Tree Builder、結構化查詢語言轉化模塊SQLGeneration,所述用戶自然語言交互模塊輸送用戶搜索的自然語言至外部分詞器進行外部分段將中文查詢分成單詞,所述標記解析器Tokenizer包含先后進行的數據庫不相關節點解析和數據庫相關節點解析、用于嘗試識別每個單詞含義以選擇最佳組合和解釋,樹生成器Tree Builder根據標記解析器Tokenizer內的節點序列構建查詢樹Query Tree,所述結構化查詢語言轉化模塊SQL Generation則將查詢樹Query Tree轉化成結構化查詢語言SQL至數據庫DB內、并最終反饋至用戶自然語言交互模塊內供用戶參考。
4.根據權利要求3所述的一種基于自然語言理解的智能取數系統,其特征是,所述標記解析器Tokenizer內數據庫相關節點解析同時會反饋得分前5的解釋至用戶自然語言交互模塊中供用戶選擇。
5.根據權利要求3所述的一種基于自然語言理解的智能取數系統,其特征是,所述標記解析器Tokenizer的映射節點類型主要包括AggregationNode、ConceptNode、PropertyNode、StringValNode、UnknownNode、GroupByNode。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州量之智能科技有限公司,未經杭州量之智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910292704.3/1.html,轉載請聲明來源鉆瓜專利網。





