[發明專利]一種面向智能數據可視化的對話式問答實現方法有效
| 申請號: | 202110399195.1 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN113111158B | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 李齊良;李舒琴 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/242;G06F16/338;G06F16/34 |
| 代理公司: | 浙江千克知識產權代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 智能 數據 可視化 對話 問答 實現 方法 | ||
本發明公開了一種面向智能數據可視化的對話式問答實現方法,其按如下步驟進行:第一步:通過數據庫收集、分析方法的SQL函數集構建、問題創建與SQL、可視化方案標注、SQL語句審閱、問題文本審閱、整體審閱來構建數據集;第二步:在數據集的基礎上,通過具體問題的數學化來構造問題;第三步:建立將文本轉化為分析型SQL,文本可視化方案提取的模型框架;第四步:建立自動評估與人類評估的評估方案。本發明能夠構建一個更加支持分析的數據問答系統,相對于普通BI數據問答系統能夠支持更多的分析方法。
技術領域
本發明屬于人工智能技術領域,具體涉及一種面向商務智能數據可視化的對話式知識問答實現方法。
背景技術
隨著人工智能(AI)技術的進步,以及大數據的支撐,人工智能(AI)技術開始廣泛的應用于各個領域,比如圖像識別、物體檢測、圖像生成、機器翻譯、知識圖譜、對話問答等領域。AI技術在這些領域的運用可以幫助人們減少重復性勞動,提高工作效率并輔助人們進行創造。在商務智能領域,人們通過對原始數據進行轉換,應用分析算法來獲得見解,進而幫助決策。目前分析者得到一個分析結果通常需要經歷如下的步驟:了解數據結構,轉換原始數據,選擇分析方法或自行撰寫分析函數,制定可視化展示方案,得到結果。而現有技術存在的缺陷是,需要花費大量的時間,并且過程難以復制,造成了很多重復勞動。
發明內容
基于上述現狀,研發一種技術方案可以幫助簡化步驟,那么分析的復雜性可以被大大簡化,分析者可以更加聚焦于了解數據背后的見解,從數據中獲得更多的知識,因此,本發明提供了一種面向智能數據可視化的對話式問答實現方法,其包括基于自然語言的算法,進一步為系統問答式知識的圖譜可視化打下基礎。
本發明采取以下技術方案:
一種面向智能數據可視化的對話式問答實現方法,即實現商務智能分析、及自然語言轉化為SQL(結構化查詢語言)以及自動可視化。將通過商務智能分析方法來構建一個新的包含常見分析方法的NL2SQL數據集(NL2BISQL數據集),然后利用本發明中的模型,來實現面向商務智能可視化的問答過程,返回可視化結果作為回答。其按如下步驟進行:
第一步:數據集構建:通過數據庫收集、分析方法的SQL(結構化查詢語言)函數集構建、問題創建與SQL、可視化方案標注、SQL語句審閱、問題文本審閱、整體審閱來構建數據集;
第二步:問題構造:在數據集的基礎上,通過具體問題的數學化來構造問題;
第三步:模型框架:建立將文本轉化為分析型SQL,文本可視化方案提取的模型框架;
第四步:評估方案:自動評估與人類評估的評估方案建立。
進一步的,第一步具體如下:
本發明在Spider數據集的基礎上進行擴展。其中包含200個數據庫,其中每個數據庫平均含有5.1個表格。經過檢查,雖然該數據集可以泛化至不同的領域,再增加一些商業場景下的數據,能夠更直接的驗證商務智能場景中的應用效果。
本發明采用描述性分析(descriptive statistic)與推理統計(inferentialstatistics)來收集常用分析方法,并構建一種機制使使用者能夠根據需要擴展。確定了分析方法后,制定默認的可視化方案,最后形成分析方法的SQL函數集。
在擁有分析方法的SQL函數集后,則可開始生成文本及對應的SQL、及可視化。其過程為:首先針對每個數據集生成20-30個SQL,這些SQL的生成遵循如下規則:1)覆蓋50%的分析方法;2)涉及數據庫的每一個表格;3)自動根據表格屬性生成SQL;4)由于對于同一結果,用不同的SQL表示,規定SQL協議,生成時須符合協議。
對于具有多個可能的SQL翻譯的問題,審閱者應仔細檢查是否根據協議正確選擇了SQL標簽。然后,審閱者檢查當前數據庫中的所有SQL語句是否覆蓋50%分析方法,是否涉及數據庫中所有表格。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110399195.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





