[發明專利]一種基于NL2SQL技術的配電自動化圖表生成方法在審
| 申請號: | 202011392258.2 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112597273A | 公開(公告)日: | 2021-04-02 |
| 發明(設計)人: | 曾曉;陳蕾;楊堅;湯義勤;徐重酉;徐旭;韓威;黃俊;童力 | 申請(專利權)人: | 國網浙江省電力有限公司臺州供電公司;國網浙江省電力有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/31;G06F40/289;G06F40/211 |
| 代理公司: | 杭州華鼎知識產權代理事務所(普通合伙) 33217 | 代理人: | 項軍 |
| 地址: | 317000 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 nl2sql 技術 配電 自動化 圖表 生成 方法 | ||
本發明涉及語義識別領域,尤其涉及一種基于NL2SQL技術的配電自動化圖表生成方法,包括:獲取語言信息;根據語言信息從數據庫中匹配得到最佳匹配表;將語言信息通過數據預處理得到問題要素;將數據預處理得到的問題要素解析成數據結構;根據數據結構匹配最佳圖表類型并生成該類型的圖表。本發明能夠根據需要自動獲取數據并自動生成對應類型的圖表。
技術領域
本發明涉及語義識別領域,尤其涉及一種基于NL2SQL技術的配電自動化圖表生成方法。
背景技術
隨電網服務型系統的不斷完善,系統如浙江配電自動化Ⅳ區主站系統的數據規模和復雜度日益增大,數據分析人員從海量信息數據中找到合適有用的信息的難度日漸增加。重要信息或關鍵信息的獲取往往需要依賴對系統功能模塊熟悉的人員進行數據篩取和數據分析。因此,現有的數據篩取和數據分析需要大量的時間。
發明內容
為解決上述問題,本發明提出一種基于NL2SQL技術的配電自動化圖表生成方法。
一種基于NL2SQL技術的配電自動化圖表生成方法,包括:
獲取語言信息;
根據語言信息從數據庫中匹配得到最佳匹配表;
將語言信息通過數據預處理得到問題要素;
將數據預處理得到的問題要素解析成數據結構;
根據數據結構匹配最佳圖表類型并生成該類型的圖表。
優選的,所述根據語言信息從數據庫中匹配得到最佳匹配表包括:
將數據庫中表的字段名、枚舉值、實體標簽按字級別構建成倒排索引;
通過計算語言信息中問題與每個表的字段名、枚舉值和標簽的jaccard距離,當問題中包含與兩個及以上的表相關的字段時,采用position_diff計算方式將問題中匹配得到的字段按順序排列,并計算在倒排索引中記錄的距離的差分序列之和;
進行到排序得到最佳匹配表。
優選的,所述通過計算語言信息中問題與每個表的字段名、枚舉值和標簽的jaccard距離包括:
其中,question是問題中字和實體標簽的集合,table是表的字段名,invert_index是倒排索引。
優選的,所述采用position_diff計算方式將問題中匹配得到的字段按順序排列包括:
優選的,所述根據語言信息從數據庫中匹配得到最佳匹配表包括:
通過word2vec模型對詞進行向量化,對問題進行分詞;
在問題上使用長度為3的滑動窗口從左向右滑動,每滑動一次,計算窗口內的詞的向量和預先設定的表向量之間的相似度;
每個窗口相似度的最大值為表的分數,以最終得出數值最大的為最佳匹配表。
優選的,所述將語言信息通過數據預處理得到問題要素包括:
對問題進行分詞、詞性標注、實體識別和依存句法分析。
優選的,所述數據結構包含需要查詢的字段、查詢結果數量、排序和分組要求。
優選的,所述根據數據結構匹配最佳圖表類型并生成該類型的圖表包括:
以維度和指標為條件設定規則以描述不同類型圖表;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網浙江省電力有限公司臺州供電公司;國網浙江省電力有限公司,未經國網浙江省電力有限公司臺州供電公司;國網浙江省電力有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011392258.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鑰匙插拔機構
- 下一篇:一種硫醚催化氧化制備砜的方法





