[發明專利]用于自然語言精準檢索的結構化查詢語句生成系統及方法有效
| 申請號: | 201510054594.9 | 申請日: | 2015-01-30 |
| 公開(公告)號: | CN104657439B | 公開(公告)日: | 2019-12-13 |
| 發明(設計)人: | 歐陽江 | 申請(專利權)人: | 歐陽江 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F17/27 |
| 代理公司: | 44232 深圳市隆天聯鼎知識產權代理有限公司 | 代理人: | 萬振雄;劉耿 |
| 地址: | 510630 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 自然語言 精準 檢索 結構 查詢 語句 生成 系統 方法 | ||
1.一種用于自然語言精準檢索的結構化查詢語句生成方法,應用于電子裝置,其特征在于,該方法包括:
獲取自然語言查詢語句;
利用預設的詞典及第一規則,對所述自然語言查詢語句進行切詞,并得到切詞方案;
利用預設的第二規則,在所述切詞方案上生成解析樹;
根據所述解析樹的根節點生成局部查詢參數,根據所述解析樹第一層子節點生成全局查詢參數,及代入所述解析樹第一層子節點的全局查詢參數并得到所述解析樹的根節點的全局查詢參數;及
根據所述解析樹的根節點的全局查詢參數生成結構化查詢語句,所述的結構化查詢語句是SQL語句或SPARQL語句;
所述的預設的第二規則包括領域規則、表達式規則及/或中心詞判定規則,其中:
所述領域規則以語義關系三元組為左部,以一組相應的屬性設置腳本為右部,并使用所述領域規則的左部為入口創建所述領域規則的索引;
所述表達式規則的左部用于定義表達式的形式化特征,右部包含一組相應的屬性設置腳本;及
所述中心詞判定規則左部為由關聯類型構成的有序二元組,右部則指出中心詞子節點應該具備的關聯類型,并使用所述中心詞判定規則的左部為入口創建所述中心詞判定規則的索引。
2.如權利要求1所述方法,其特征在于,所述的預設的詞典包括領域詞典、公共詞典及/或列名詞典,所述的第一規則包括命名實體識別規則。
3.如權利要求1所述方法,其特征在于,在生成解析樹時,且所述表達式規則的左部被切詞方案的一個片段滿足時,該片段是指所述切詞方案中一個或多個連續的切詞分量,該方法還包括:
以該片段為子節點新建一個解析節點,在原來的切詞方案中用該新建解析節點替換該片段以生成新的切詞方案,從而實現對切詞方案的消解,將切詞方案消解到只有一個切詞分量時,該切詞分量即為生成的解析樹;及
執行中心詞判定,并執行所述表達式規則的右部以初始化該新建解析節點的屬性。
4.如權利要求3所述方法,其特征在于,在表達式規則右部的屬性設置腳本中包含上下文函數時,該方法還包括:
計算屬性值中的上下文函數,并將上下文函數本身替換為上下文函數的計算結果。
5.如權利要求3所述方法,其特征在于,所述中心詞判定在根據領域規則或表達式規則創建新解析節點時,包括如下步驟:
若所述新建解析節點的第一層子節點激活領域規則,使用中心詞判定規則判定中心詞子節點;或
若所述新建解析節點的第一層子節點匹配表達式規則,則以擁有領域詞條的子節點作為中心詞子節點。
6.如權利要求5所述方法,其特征在于,在確定所述新建解析節點的中心詞子節點后,按以下原則設置所述新建解析節點的about屬性值和map屬性值,其中,所述about屬性值為所述新建解析節點所包括的about屬性的值,所述about屬性用于表示新建解析節點中的子節點中的中心詞,所述map屬性值為所述新建解析節點所包括的map屬性的值,所述map屬性用于描述所述新建解析節點關聯的數據庫中的表和字段:
若所述新建解析節點的中心詞子節點為嵌套子節點,將所述新建解析節點的about屬性值和map屬性值分別設置為中心詞子節點的about屬性值和map屬性值;或
若所述新建解析節點的中心詞子節點本身為非嵌套子節點,以該中心詞子節點的正文為所述新建解析節點的about屬性值,并且以所述領域詞條中的map屬性值為所述新建解析節點的map屬性值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于歐陽江,未經歐陽江許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510054594.9/1.html,轉載請聲明來源鉆瓜專利網。





