[發(fā)明專利]結(jié)構(gòu)化查詢語言語句生成方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201911356000.4 | 申請(qǐng)日: | 2019-12-25 |
| 公開(公告)號(hào): | CN113032417A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 劉珮;項(xiàng)超;張超穎;何婷婷;王學(xué)敏;李明達(dá);王建秀 | 申請(qǐng)(專利權(quán))人: | 中國(guó)電信股份有限公司 |
| 主分類號(hào): | G06F16/242 | 分類號(hào): | G06F16/242 |
| 代理公司: | 中國(guó)貿(mào)促會(huì)專利商標(biāo)事務(wù)所有限公司 11038 | 代理人: | 曹蓓 |
| 地址: | 100033 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 結(jié)構(gòu) 查詢 語言 語句 生成 方法 裝置 | ||
本公開提出一種結(jié)構(gòu)化查詢語言語句生成方法和裝置,涉及人工智能技術(shù)領(lǐng)域。本公開的一種SQL語句生成方法,包括:獲取用戶在對(duì)話中的表達(dá)信息;基于增加動(dòng)態(tài)詞向量BERT模型的雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)Bi?LSTM和條件隨機(jī)場(chǎng)CRT模型,從表達(dá)信息中抽取有效信息,有效信息包括時(shí)間、實(shí)體或指標(biāo)中的一項(xiàng)或多項(xiàng);根據(jù)有效信息,基于SQL語句的語法生成結(jié)構(gòu)化查詢語言SQL語句。通過這樣的方法,能夠降低對(duì)用戶使用數(shù)據(jù)庫能力的要求,也提高了有效信息提取的效率和準(zhǔn)確度,無需預(yù)先生成固定查詢句式,提高了SQL語句生成的可擴(kuò)展性。
技術(shù)領(lǐng)域
本公開涉及人工智能技術(shù)領(lǐng)域,特別是一種SQL(Structured Query Language,結(jié)構(gòu)化查詢語言)語句生成方法和裝置。
背景技術(shù)
當(dāng)前,大量數(shù)據(jù)存儲(chǔ)于數(shù)據(jù)庫,進(jìn)行數(shù)據(jù)庫查詢時(shí)需要利用專業(yè)的查詢語言SQL語句進(jìn)行查詢,而非專業(yè)人員查詢數(shù)據(jù)庫比較困難。相關(guān)技術(shù)中基于用戶提供的信息,利用分詞技術(shù)提取關(guān)鍵字,進(jìn)而利用這些關(guān)鍵字從預(yù)設(shè)數(shù)據(jù)庫中的SQL語句中查詢最相似的SQL查詢語句。
發(fā)明內(nèi)容
發(fā)明人發(fā)現(xiàn),相關(guān)技術(shù)中的方法需要預(yù)先構(gòu)建SQL語句數(shù)據(jù)庫,會(huì)耗費(fèi)大量人力物力。并且該方法僅支持固定查詢句式,通用性差,擴(kuò)展性差。
本公開的一個(gè)目的在于提高SQL語言生成的可擴(kuò)展性。
根據(jù)本公開的一些實(shí)施例的一個(gè)方面,提出一種SQL語句生成方法,包括:獲取用戶在對(duì)話中的表達(dá)信息;基于增加BERT(動(dòng)態(tài)詞向量)模型的Bi-LSTM(雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò))和CRT(條件隨機(jī)場(chǎng))模型,從表達(dá)信息中抽取有效信息,有效信息包括時(shí)間、實(shí)體或指標(biāo)中的一項(xiàng)或多項(xiàng);根據(jù)有效信息,基于SQL語句的語法生成結(jié)構(gòu)化查詢語言SQL語句。
在一些實(shí)施例中,基于增加BERT的Bi-LSTM和CRT模型從表達(dá)信息中抽取有效信息包括:拼接動(dòng)態(tài)詞向量和預(yù)訓(xùn)練產(chǎn)生的詞向量,作為模型文本特征提取結(jié)果;將模型文本特征提取結(jié)果輸入Bi-LSTM+CRT模型,提取字和句子級(jí)別的有效信息。
在一些實(shí)施例中,SQL語句生成方法還包括:在從表達(dá)信息中抽取有效信息后,判斷有效信息中是否包含實(shí)體和指標(biāo);若有效信息中包含實(shí)體和指標(biāo),則判斷數(shù)據(jù)庫中是否存在實(shí)體和指標(biāo),在數(shù)據(jù)庫中存在實(shí)體和指標(biāo)的情況下,執(zhí)行生成SQL語句的操作。
在一些實(shí)施例中,SQL語句生成方法還包括:若數(shù)據(jù)庫中不存在有效信息中的實(shí)體和指標(biāo),則向用戶提供數(shù)據(jù)庫中存在的與有效信息的實(shí)體和指標(biāo)在預(yù)定相似度范圍內(nèi)的推薦實(shí)體和指標(biāo),以便用戶選擇;根據(jù)用戶選擇的實(shí)體和指標(biāo)執(zhí)行生成SQL語句的操作。
在一些實(shí)施例中,SQL語句生成方法還包括:若有效信息中包含實(shí)體或指標(biāo)中的一種,則基于預(yù)定腳本輸出引導(dǎo)信息,以便引導(dǎo)用戶輸入實(shí)體或指標(biāo)中缺失的一種。
在一些實(shí)施例中,SQL語句生成方法還包括:若有效信息中不包含實(shí)體,且不包含指標(biāo),則利用聊天機(jī)器人與用戶對(duì)話。
在一些實(shí)施例中,SQL語句生成方法還包括:在利用聊天機(jī)器人與用戶對(duì)話的過程中,執(zhí)行獲取用戶在對(duì)話中的表達(dá)信息的操作,以便生成SQL語句。
在一些實(shí)施例中,SQL語句生成方法還包括:將生成的SQL語句在數(shù)據(jù)庫中查詢,并反饋查詢結(jié)果。
通過這樣的方法,能夠基于BERT+Bi-LSTM+CRT的模型處理用戶在對(duì)話中提供的信息,根據(jù)提取到的信息,根據(jù)SQL語法生成SQL語句,從而降低了對(duì)用戶使用數(shù)據(jù)庫能力的要求,也提高了有效信息提取的效率和準(zhǔn)確度,無需預(yù)先生成固定查詢句式,提高了SQL語句生成的可擴(kuò)展性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)電信股份有限公司,未經(jīng)中國(guó)電信股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911356000.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 帶有前處理和后處理的數(shù)據(jù)庫復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語言的查詢方法及查詢系統(tǒng)
- 自動(dòng)檢測(cè)文件中搭配錯(cuò)誤的系統(tǒng)和方法
- 網(wǎng)絡(luò)連接裝置及網(wǎng)絡(luò)連接裝置的語言環(huán)境設(shè)定方法
- 一種口語評(píng)測(cè)方法及裝置
- 一種語言設(shè)置方法及移動(dòng)終端
- 一種語言文本加載方法和裝置
- 一種語言交流人工智能系統(tǒng)及其語言處理方法
- 語言序列標(biāo)注方法、裝置存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 一種基于語言包實(shí)現(xiàn)繼電保護(hù)裝置多語言版本方法及裝置
- 一種應(yīng)用軟件的多語言核對(duì)方法及系統(tǒng)
- 多語言字幕顯示方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 基于聊天大數(shù)據(jù)知識(shí)庫的機(jī)器人對(duì)話控制方法和系統(tǒng)
- 基于大數(shù)據(jù)搜索的幽默型機(jī)器人對(duì)話控制方法和系統(tǒng)
- 基于對(duì)話知識(shí)庫的機(jī)器人對(duì)話控制方法和系統(tǒng)
- 一種自然語言語句評(píng)價(jià)方法及裝置
- 句子級(jí)雙語對(duì)齊方法及系統(tǒng)
- 一種獲取相似語句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種翻譯模型結(jié)果重排序的方法及裝置
- 用于輸出信息的方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 搜索推薦方法和裝置、服務(wù)器、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本識(shí)別方法、裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)





