[發(fā)明專利]基于知識(shí)圖譜的開(kāi)放領(lǐng)域問(wèn)答方法及相關(guān)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202210964248.4 | 申請(qǐng)日: | 2022-08-11 |
| 公開(kāi)(公告)號(hào): | CN115470328A | 公開(kāi)(公告)日: | 2022-12-13 |
| 發(fā)明(設(shè)計(jì))人: | 賈勇哲;馬國(guó)寧;王林;徐大為 | 申請(qǐng)(專利權(quán))人: | 天津泰凡科技有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F16/33;G06F16/35;G06F16/36;G06K9/62 |
| 代理公司: | 北京風(fēng)雅頌專利代理有限公司 11403 | 代理人: | 金含 |
| 地址: | 300300 天津市濱海新區(qū)經(jīng)濟(jì)技術(shù)開(kāi)*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 知識(shí) 圖譜 開(kāi)放 領(lǐng)域 問(wèn)答 方法 相關(guān) 設(shè)備 | ||
本申請(qǐng)?zhí)峁┝艘环N基于知識(shí)圖譜的開(kāi)放領(lǐng)域問(wèn)答方法及相關(guān)設(shè)備,該方法通過(guò)多種匹配方法對(duì)問(wèn)題描述的實(shí)體和屬性進(jìn)行提取得到實(shí)體屬性候選集,能夠有效提升實(shí)體屬性抽取的召回率,避免漏掉問(wèn)題描述中的隱層信息。基于實(shí)體屬性候選集進(jìn)行路徑挖掘以得到初始路徑,再對(duì)初始路徑進(jìn)行組合和篩選以得到帶有限制條件的限制組合路徑,能夠有效降低無(wú)效路徑的召回,針對(duì)多限制問(wèn)題描述進(jìn)行精確路徑建模,進(jìn)而降低后續(xù)針對(duì)路徑的算力成本。通過(guò)分類模型輸出限制組合路徑和問(wèn)題描述的相似度得分,將相似度得分得分最高的限制組合路徑對(duì)應(yīng)的知識(shí)圖譜子圖作為推薦答案數(shù)據(jù),提升用戶的體驗(yàn)感。
技術(shù)領(lǐng)域
本申請(qǐng)涉及知識(shí)圖譜技術(shù)領(lǐng)域,尤其涉及一種基于知識(shí)圖譜的開(kāi)放領(lǐng)域問(wèn)答方法及相關(guān)設(shè)備。
背景技術(shù)
隨著互聯(lián)網(wǎng)的迅速發(fā)展,數(shù)據(jù)量呈爆炸性的增長(zhǎng)。網(wǎng)絡(luò)數(shù)據(jù)正在從只包含網(wǎng)頁(yè)之間文本數(shù)據(jù)的文檔萬(wàn)維網(wǎng)轉(zhuǎn)變?yōu)榘罅棵枋鰧?shí)體之間豐富關(guān)系的數(shù)據(jù)萬(wàn)維網(wǎng)。而知識(shí)圖譜能夠形式化地描述現(xiàn)實(shí)世界中的事物及其相互之間的關(guān)系,是以圖的形式存儲(chǔ)人類知識(shí)的大規(guī)模語(yǔ)義網(wǎng)絡(luò)。目前,基于知識(shí)圖譜的問(wèn)答技術(shù)側(cè)重于單次抽取的精度,抽取時(shí)盡可能減少實(shí)體和屬性值的數(shù)量,導(dǎo)致抽取結(jié)果難以覆蓋完全。此外,在路徑查詢時(shí),使用固定模板進(jìn)行查詢且缺乏限制條件,導(dǎo)致獲取路徑不完全且及包含較多的無(wú)效路徑,進(jìn)而影響問(wèn)答結(jié)果的準(zhǔn)確性。
發(fā)明內(nèi)容
有鑒于此,本申請(qǐng)的目的在于提出一種基于知識(shí)圖譜的開(kāi)放領(lǐng)域問(wèn)答方法及相關(guān)設(shè)備。
基于上述目的,本申請(qǐng)?zhí)峁┝艘环N基于知識(shí)圖譜的開(kāi)放領(lǐng)域問(wèn)答方法,包括:
獲取用戶輸入的問(wèn)題描述;
采用匹配方法對(duì)所述問(wèn)題描述中的實(shí)體和屬性進(jìn)行提取,以得到實(shí)體屬性候選集;
基于所述實(shí)體屬性候選集中的實(shí)體和屬性,在預(yù)先構(gòu)建的知識(shí)圖譜中進(jìn)行路徑挖掘,以得到多個(gè)初始路徑;
對(duì)全部所述初始路徑進(jìn)行組合,得到多個(gè)組合路徑;
對(duì)全部所述組合路徑進(jìn)行篩選,以得到多個(gè)限制組合路徑;
將每個(gè)所述限制組合路徑與所述問(wèn)題描述輸入至經(jīng)過(guò)預(yù)訓(xùn)練的分類模型中進(jìn)行分類預(yù)測(cè),得到所述限制組合路徑與所述問(wèn)題描述的相似度分?jǐn)?shù);
將最大所述相似度分?jǐn)?shù)對(duì)應(yīng)的所述限制組合路徑在所述知識(shí)圖譜中匹配的子圖作為所述問(wèn)題描述的推薦答案數(shù)據(jù)。
進(jìn)一步的,所述采用匹配方法對(duì)所述問(wèn)題描述中的實(shí)體和屬性進(jìn)行提取,以得到實(shí)體屬性候選集,包括:
通過(guò)精確匹配方法和模糊匹配方法分別對(duì)所述問(wèn)題描述中的實(shí)體和屬性進(jìn)行提取,以得到所述實(shí)體屬性候選集。
進(jìn)一步的,所述實(shí)體屬性候選集包括第一候選集和第二候選集,所述通過(guò)精確匹配方法和模糊匹配方法分別對(duì)所述問(wèn)題描述中的實(shí)體和屬性進(jìn)行提取,以得到所述實(shí)體屬性候選集,包括:
將所述問(wèn)題描述與預(yù)先構(gòu)建的字典樹(shù)進(jìn)行匹配,以得到所述第一候選集;
分別采用倒排索引方法和命名實(shí)體識(shí)別方法對(duì)所述問(wèn)題描述中的實(shí)體進(jìn)行提取,分別采用Duckling數(shù)值抽取方法和Lucene索引方法對(duì)所述問(wèn)題描述中的屬性進(jìn)行提取,以得到所述第二候選集。
進(jìn)一步的,所述對(duì)全部所述初始路徑進(jìn)行組合,得到多個(gè)組合路徑,包括:
將具有相同答案節(jié)點(diǎn)的所述初始路徑進(jìn)行組合,得到所述組合路徑。
進(jìn)一步的,所述對(duì)全部所述組合路徑進(jìn)行篩選,以得到多個(gè)限制組合路徑,包括:
基于所述問(wèn)題描述確定與其關(guān)聯(lián)的推理變量以及約束條件;
根據(jù)推理變量的數(shù)值大小對(duì)全部所述組合路徑進(jìn)行排序,將滿足所述約束條件的所述組合路徑作為所述限制組合路徑。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津泰凡科技有限公司,未經(jīng)天津泰凡科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210964248.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法





