[發明專利]一種基于本體和受限自然語言處理的數據庫查詢方法有效
| 申請號: | 201310556508.5 | 申請日: | 2013-11-11 |
| 公開(公告)號: | CN103646032B | 公開(公告)日: | 2017-01-04 |
| 發明(設計)人: | 漆桂林;崔榮國;張慧;鄧波;陸彬;楊成彪 | 申請(專利權)人: | 漆桂林;崔榮國;張慧;鄧波 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 江蘇愛信律師事務所32241 | 代理人: | 劉琦 |
| 地址: | 211100 江蘇省南京市江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 本體 受限 自然語言 處理 數據庫 查詢 方法 | ||
1.一種基于本體和受限自然語言處理的數據庫查詢方法,其特征在于,該方法包括如下步驟:
1)將根據數據庫關系模式構建出的本體轉換成圖數據結構:本體中的類被轉換為類結點,數據類型屬性被轉換為屬性結點,所述屬性結點分別有一條連接到它指定的類結點的邊,對象屬性被轉換為連接兩個類的邊;
2)構建分詞專用詞典和關鍵詞索引:依次讀取數據庫中的每一條記錄,將讀取到的記錄值添加到詞典中作為用戶查詢時分詞的專用詞典,讀取出每一條記錄時同時將該記錄值作為鍵,將該記錄值在數據庫中對應的關系表名和列名作為值,組成鍵值對,存入到非關系型數據庫中,作為關鍵詞索引,用于快速定位給定的關鍵詞,提高查詢效率;
3)系統接收到用戶自然語言查詢后,利用所述步驟2)中構建出的專用詞典將自然語言分解為多個有意義的關鍵詞;
4)將所述步驟3)中分解出的關鍵詞逐個地作為鍵,在關鍵詞索引中查找所對應的值,即找出該關鍵詞所對應的關系表名和列名,然后在所述步驟1)中生成的圖數據結構中找到所有關系表名和列名對應的結點,最后將所有結點對應的連通分量從圖數據結構中提取出來,作為查詢空間;
5)遍歷所述步驟4)中構建出的查詢空間中的連通分量,找到查詢空間中能將所有關鍵詞連接起來的所有連通子圖,若不能找到任何一個滿足條件的連通子圖,則找出包含盡可能多的關鍵詞的連通子圖,然后將找出的連通子圖根據其包含的關鍵詞數從大到小進行排序,對于包含關鍵詞數相同的連通子圖,則再根據所包含的邊數從小到大進行排序,最后選擇排序最靠前的k個連通子圖,k的值根據數據庫的大小以及搜索得到的所有連通子圖個數來確定;
6)將所述步驟5)中選擇的k個連通圖按照排序,依次根據如下規則轉換成SQL語句:將SQL語句中的Select子句以*填充,用以表示將所有的列全部返回,將連通圖中的類結點寫入到SQL語句中的From子句中,將連接兩個類結點的邊轉換為外鍵關系寫入到SQL語句中的Where子句中,將用戶輸入的關鍵詞根據其對應的關系表名和列名寫入到SQL語句中的Where字句中;
所述SQL語句生成后,對數據庫進行查詢,然后將查詢結果返回給用戶。
2.根據權利要求1所述的基于本體和受限自然語言處理的數據庫查詢方法,其特征在于,所述步驟2)中的非關系型數據庫采用MongoDB數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漆桂林;崔榮國;張慧;鄧波,未經漆桂林;崔榮國;張慧;鄧波許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310556508.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光子型定位紫外探測器
- 下一篇:一種避雷器工頻電壓試驗裝置及試驗方法





