[發(fā)明專利]一種面向人工智能領(lǐng)域知識的高效智能問答系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110392744.2 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113157885B | 公開(公告)日: | 2023-07-18 |
| 發(fā)明(設(shè)計(jì))人: | 曲晨帆;金連文;林上港;馬駿;譚濯;劉振鑫 | 申請(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/35;G06F40/30;G06F40/247 |
| 代理公司: | 廣州市華學(xué)知識產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 黃衛(wèi)萍 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 人工智能 領(lǐng)域 知識 高效 智能 問答 系統(tǒng) | ||
本發(fā)明涉及一種面向人工智能領(lǐng)域知識的高效智能問答系統(tǒng),包括準(zhǔn)備模塊和問答模塊;其中,準(zhǔn)備模塊包括數(shù)據(jù)收集模塊、模型訓(xùn)練模塊和問答系統(tǒng)知識結(jié)構(gòu)構(gòu)建模塊;問答模塊包括輸入預(yù)處理模塊、基于知識庫的問答模塊、基于文本庫的問答模塊和基于知識庫的問題推薦模塊。本發(fā)明通過準(zhǔn)備模塊與問答模塊,使得對于用戶問題以及知識庫問題、文本庫問題的分詞準(zhǔn)確性大大增強(qiáng),進(jìn)而大幅度提升全問答系統(tǒng)整體的準(zhǔn)確性,從而大幅度改善用戶體驗(yàn),實(shí)現(xiàn)低成本高效率高用戶體驗(yàn)的知識問答服務(wù)。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種面向人工智能領(lǐng)域知識的高效智能問答系統(tǒng)。
背景技術(shù)
近年來,人工智能技術(shù)發(fā)展迅速,在教育、醫(yī)療、農(nóng)業(yè)、交通等領(lǐng)域均具有十分廣泛的應(yīng)用前景。然而,獲取人工智能領(lǐng)域的知識需要具備一定的專業(yè)基礎(chǔ),各行各業(yè)的從業(yè)人員缺乏一種便捷準(zhǔn)確地獲取人工智能知識的途徑,使得人工智能技術(shù)在很多領(lǐng)域中難以普及,無形中阻礙了社會生產(chǎn)力的發(fā)展。人工智能領(lǐng)域的非結(jié)構(gòu)化文本承載了該領(lǐng)域大量的知識,若能完成一個該領(lǐng)域的基于文本理解的知識問答系統(tǒng),能夠?yàn)槿藗兲峁└咝П憬莸闹R獲取途徑,促進(jìn)人工智能技術(shù)的進(jìn)一步發(fā)展。
現(xiàn)有的知識問答系統(tǒng)存在下述問題:首先,信息抽取模型缺乏實(shí)體名稱和實(shí)體別稱的支持,前者使得相關(guān)專業(yè)術(shù)語被錯誤分詞,進(jìn)而影響搜索引擎的性能,后者缺乏對同義詞問題的理解,使得后續(xù)搜索結(jié)果片面。這兩者均會對問答系統(tǒng)的整體性能造成不利影響。其次,機(jī)器閱讀理解作為一項(xiàng)復(fù)雜的自然語言處理任務(wù),存在復(fù)雜度高、計(jì)算量大等問題,而且知識庫的構(gòu)建依賴于非結(jié)構(gòu)化文本,若采用人工方式構(gòu)建則耗時費(fèi)力,難以形成足夠規(guī)模的知識庫,兩者均制約了問答系統(tǒng)的實(shí)際部署。最后,現(xiàn)有的問答系統(tǒng)仍然缺乏高效地從跨段落、跨文檔、跨形式的不同類型文本得到準(zhǔn)確而全面的答案的能力,更缺少引導(dǎo)用戶進(jìn)一步探索領(lǐng)域內(nèi)相關(guān)知識的能力。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)所存在的技術(shù)問題,本發(fā)明提供一種面向人工智能領(lǐng)域知識的高效智能問答系統(tǒng),通過準(zhǔn)備模塊與問答模塊,使得對于用戶問題以及知識庫問題、文本庫問題的分詞準(zhǔn)確性大大增強(qiáng),進(jìn)而大幅度提升全問答系統(tǒng)整體的準(zhǔn)確性,從而大幅度改善用戶體驗(yàn),實(shí)現(xiàn)低成本高效率高用戶體驗(yàn)的知識問答服務(wù)。
本發(fā)明采用以下技術(shù)方案來實(shí)現(xiàn):一種面向人工智能領(lǐng)域知識的高效智能問答系統(tǒng),包括:準(zhǔn)備模塊和問答模塊;其中,準(zhǔn)備模塊包括數(shù)據(jù)收集模塊、模型訓(xùn)練模塊和問答系統(tǒng)知識結(jié)構(gòu)構(gòu)建模塊;問答模塊包括輸入預(yù)處理模塊、基于知識庫的問答模塊、基于文本庫的問答模塊和基于知識庫的問題推薦模塊;
準(zhǔn)備模塊通過數(shù)據(jù)收集模塊,將收集到的人工智能領(lǐng)域的無結(jié)構(gòu)化知識文本段落進(jìn)行標(biāo)注,并訓(xùn)練模型訓(xùn)練模塊的信息抽取模塊和機(jī)器閱讀理解模塊,同時收集或定義人工智能領(lǐng)域同義、不同義的問題來訓(xùn)練短文本匹配模型,利用問答系統(tǒng)知識結(jié)構(gòu)構(gòu)建模塊,將訓(xùn)練好的信息抽取模型抽取出知識三元組并形成問答對,同時利用抽取出的實(shí)體名稱、別稱進(jìn)行輔助搜索,再通過改進(jìn)知識庫、文本庫倒序索引的構(gòu)建方法來為搜索引擎提供語義,并構(gòu)建知識庫關(guān)鍵詞索引;
問答模塊通過輸入預(yù)處理模塊對用戶輸入的問題進(jìn)行預(yù)處理,利用基于知識庫的問答模塊進(jìn)行答案的尋找,若有答案則將答案準(zhǔn)備返回,否則將預(yù)處理后的用戶輸入問題送入基于文本庫的問答模塊尋找并準(zhǔn)備返回答案,并利用基于知識庫的問題推薦模塊向用戶推薦問題,最終將答案和推薦問題一起返回給用戶。
本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點(diǎn)和有益效果:
1、本發(fā)明通過信息抽取模型抽取出的實(shí)體名稱和其別稱來補(bǔ)充jieba分詞的詞典,使得對于用戶問題以及知識庫問題、文本庫問題的分詞準(zhǔn)確性大大增強(qiáng),進(jìn)而大幅度提升全問答系統(tǒng)整體的準(zhǔn)確性,從而大幅度改善用戶體驗(yàn)。
2、本發(fā)明通過信息抽取模型抽取出的實(shí)體名稱和別稱的對應(yīng)關(guān)系,以及從互聯(lián)網(wǎng)上獲取的近義詞典,利用改進(jìn)的BM25知識庫粗召回模塊,使得單次檢索幾乎不增加推理時間而同時排序所有同義不同關(guān)鍵詞的內(nèi)容,且使得文檔段落對主題詞詞頻和文檔長度差異變化帶來的影響更加魯棒,使得檢索效果得到提升。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110392744.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識防范方法和機(jī)器人





