[發明專利]一種提問式的分析節點生成方法、系統及存儲介質有效
| 申請號: | 202011259004.3 | 申請日: | 2020-11-12 |
| 公開(公告)號: | CN112270189B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 姜磊;鐘穎欣;辛巖;楊釗 | 申請(專利權)人: | 佰聆數據股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F16/33;G06F16/332;G06F18/2411;G06N3/0464;G06N3/049;G06N3/08 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 林梅繁 |
| 地址: | 510663 廣東省廣州市高新技術產業開*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提問 分析 節點 生成 方法 系統 存儲 介質 | ||
本發明涉及數據分析技術,為提問式的分析節點生成方法、系統及存儲介質,其方法包括:對所輸入自然語言問題進行預處理、分詞處理;對預處理后的輸入自然語言問題對應的文本數據進行特征表示、特征提取,轉化為數值形式;將自然語言問題中的關鍵信息抽取出來,對關鍵信息進行類型識別;構建意圖識別模型,判斷所輸入自然語言問題的分析意圖;結合特征提取、類型識別、意圖識別的結果,得到自然語言問題中所需要分析的數據源、分析維度、分析指標、分析任務以及其他附加數據分析信息,并自動生成分析節點。本發明使得用戶不需要了解復雜的數據結構以及分析方法就可以完成數據分析探索工作,從而快速探索數據發現業務中的問題。
技術領域
本發明涉及數據分析技術,尤其涉及一種提問式的分析節點生成方法、系統及存儲介質。
背景技術
現有的提問式數據分析系統,一般是用戶提出簡單的自然語言問題,系統經過解析后自動查詢數據庫,得到結果并呈現給用戶一個可視化的答案。這僅僅是針對一些特定的比較簡單的問題查詢,例如用戶提出“某地區這個月的用電量是多少”,現有的提問式數據分析系統會將數據庫中當月的用電量數據聚合成一個匯總值,并返回給用戶一個可視化的視圖或者一個具體的數值。
當用戶的提問比較復雜時,如“上半年廣州市不同用戶類型的用電趨勢如何?”,上述現有的提問式數據分析系統,由于僅有數據查詢功能,用戶所提問題對應的結果并不直接存在于數據庫中,因而將不能滿足用戶的復雜提問式分析需求。
此外,若用戶的問題與數據分析系統共享庫中的分析路徑沒有關系,則從提問式數據分析系統上,用戶也得不到有效的分析路徑推薦反饋。因此,有必要提出提問式的分析節點生成方法、系統等,用于解決上述分析路徑推薦式的數據分析系統所存在的問題。
發明內容
本發明提供提問式的分析節點生成方法、系統及存儲介質,可以基于用戶提出的自然語言問題進行解析,自動抽取數據,選擇分析功能并生成分析節點,使得用戶不需要了解復雜的數據結構以及分析方法就可以完成數據分析探索工作,從而快速探索數據發現業務中的問題。
根據本發明的提問式的分析節點生成方法,包括以下步驟:
S1、對所輸入自然語言問題進行預處理、分詞處理,得到分詞處理后的詞語;
S2、對預處理后的輸入自然語言問題對應的文本數據進行特征表示、特征提取,轉化為數值形式;
S3、將所輸入自然語言問題中的關鍵信息抽取出來,對關鍵信息進行類型識別,得到實體類別信息;
S4、構建意圖識別模型,判斷所輸入自然語言問題的分析意圖,完成意圖識別;
S5、結合上述步驟S2-S4中特征提取、類型識別、意圖識別的結果,得到自然語言問題中所需要分析的數據源、分析維度、分析指標、分析任務以及其他附加數據分析信息,并自動生成分析節點。
在優選的實施例中,步驟S5包括:
S51、分析節點任務數據接口制定,針對每個分析節點任務制定標準的數據接口;
S52、數據接口信息生成,基于實體類別信息,結合元數據信息,匹配索引得到數據源信息、指標信息、維度信息以及其他附加數據分析信息;基于分析意圖確定分析節點任務;將數據源信息、指標信息、維度信息以及其他附加數據分析信息經過處理后,傳遞給對應的分析節點任務,同時調用該分析節點任務完成分析結果的生成和展示。
根據本發明的提問式的分析節點生成系統,包括:
預處理模塊,用于對所輸入自然語言問題進行預處理、分詞處理,得到分詞處理后的詞語;
特征提取模塊,用于對預處理后的輸入自然語言問題對應的文本數據進行特征表示、特征提取,轉化為數值形式;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佰聆數據股份有限公司,未經佰聆數據股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011259004.3/2.html,轉載請聲明來源鉆瓜專利網。





