[發(fā)明專利]一種面向人工智能領(lǐng)域知識(shí)的高效智能問(wèn)答系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110392744.2 | 申請(qǐng)日: | 2021-04-13 |
| 公開(公告)號(hào): | CN113157885B | 公開(公告)日: | 2023-07-18 |
| 發(fā)明(設(shè)計(jì))人: | 曲晨帆;金連文;林上港;馬駿;譚濯;劉振鑫 | 申請(qǐng)(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F16/35;G06F40/35;G06F40/30;G06F40/247 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 黃衛(wèi)萍 |
| 地址: | 510640 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 人工智能 領(lǐng)域 知識(shí) 高效 智能 問(wèn)答 系統(tǒng) | ||
1.一種面向人工智能領(lǐng)域知識(shí)的高效智能問(wèn)答系統(tǒng),其特征在于,包括準(zhǔn)備模塊和問(wèn)答模塊;其中,準(zhǔn)備模塊包括數(shù)據(jù)收集模塊、模型訓(xùn)練模塊和問(wèn)答系統(tǒng)知識(shí)結(jié)構(gòu)構(gòu)建模塊;問(wèn)答模塊包括輸入預(yù)處理模塊、基于知識(shí)庫(kù)的問(wèn)答模塊、基于文本庫(kù)的問(wèn)答模塊和基于知識(shí)庫(kù)的問(wèn)題推薦模塊;
準(zhǔn)備模塊通過(guò)數(shù)據(jù)收集模塊,將收集到的人工智能領(lǐng)域的無(wú)結(jié)構(gòu)化知識(shí)文本段落進(jìn)行標(biāo)注,并訓(xùn)練模型訓(xùn)練模塊的信息抽取模塊和機(jī)器閱讀理解模塊,同時(shí)收集或定義人工智能領(lǐng)域同義、不同義的問(wèn)題來(lái)訓(xùn)練短文本匹配模型,利用問(wèn)答系統(tǒng)知識(shí)結(jié)構(gòu)構(gòu)建模塊,將訓(xùn)練好的信息抽取模型抽取出知識(shí)三元組并形成問(wèn)答對(duì),同時(shí)利用抽取出的實(shí)體名稱、別稱進(jìn)行輔助搜索,再通過(guò)改進(jìn)知識(shí)庫(kù)、文本庫(kù)倒序索引的構(gòu)建方法來(lái)為搜索引擎提供語(yǔ)義,并構(gòu)建知識(shí)庫(kù)關(guān)鍵詞索引;
問(wèn)答模塊通過(guò)輸入預(yù)處理模塊對(duì)用戶輸入的問(wèn)題進(jìn)行預(yù)處理,利用基于知識(shí)庫(kù)的問(wèn)答模塊進(jìn)行答案的尋找,若有答案則將答案準(zhǔn)備返回,否則將預(yù)處理后的用戶輸入問(wèn)題送入基于文本庫(kù)的問(wèn)答模塊尋找并準(zhǔn)備返回答案,并利用基于知識(shí)庫(kù)的問(wèn)題推薦模塊向用戶推薦問(wèn)題,最終將答案和推薦問(wèn)題一起返回給用戶;
模型訓(xùn)練模塊的實(shí)現(xiàn)過(guò)程如下:
S31、利用HBT模型進(jìn)行信息抽取模型的搭建,再利用RoBERTa預(yù)訓(xùn)練模型進(jìn)行模型參數(shù)的初始化,并利用已標(biāo)注的三元組數(shù)據(jù)訓(xùn)練;
S32、搭建ESIM模型訓(xùn)練短文本匹配模型,利用中文維基百科的全語(yǔ)料使用word2vec方式訓(xùn)練中文字符向量,再利用Quora?Question?Pairs數(shù)據(jù)集的中文翻譯結(jié)果來(lái)預(yù)訓(xùn)練ESIM模型,在預(yù)訓(xùn)練得到的模型基礎(chǔ)上利用中文開放的大規(guī)模短文本匹配數(shù)據(jù)集LCMQC和已收集的人工智能領(lǐng)域短文本匹配數(shù)據(jù)集進(jìn)行ESIM模型參數(shù)微調(diào)訓(xùn)練;
S33、搭建RoBERTa-QA模型訓(xùn)練機(jī)器閱讀理解模型,再利用開放數(shù)據(jù)集DuReader在中文預(yù)訓(xùn)練模型RoBERTa的基礎(chǔ)上進(jìn)行進(jìn)一步的預(yù)訓(xùn)練,并利用收集到的人工智能領(lǐng)域的機(jī)器閱讀理解標(biāo)注數(shù)據(jù)進(jìn)行參數(shù)微調(diào)訓(xùn)練;
問(wèn)答系統(tǒng)知識(shí)結(jié)構(gòu)構(gòu)建模塊的實(shí)現(xiàn)過(guò)程如下:
S41、收集人工智能領(lǐng)域的無(wú)結(jié)構(gòu)化知識(shí)文本段落;
S42、利用步驟S31中訓(xùn)練的信息抽取模型在人工智能領(lǐng)域的無(wú)結(jié)構(gòu)化知識(shí)文本段落中進(jìn)行三元組抽??;
S43、將三元組中的實(shí)體名稱和實(shí)體別稱內(nèi)容單獨(dú)提出出來(lái),將抽取到的三元組結(jié)果形成問(wèn)題答案鍵值對(duì),再將百度百科和維基百科中的三元組知識(shí)進(jìn)行爬取并形成問(wèn)答對(duì)放入知識(shí)庫(kù)中,知識(shí)庫(kù)中的問(wèn)答對(duì)按照問(wèn)題作為鍵,答案作為值的鍵值對(duì)形式進(jìn)行存儲(chǔ);
S44、為知識(shí)庫(kù)中的所有問(wèn)題建立倒序索引和關(guān)鍵詞索引,建立倒序索引時(shí)利用jieba分詞工具分別對(duì)知識(shí)庫(kù)中的每個(gè)問(wèn)答對(duì)中的問(wèn)題文本段落進(jìn)行分詞和去除停用詞,得到一組詞語(yǔ),再統(tǒng)計(jì)知識(shí)庫(kù)中所有問(wèn)題經(jīng)過(guò)這樣處理之后得到的詞語(yǔ)的集合,即知識(shí)庫(kù)中的所有詞語(yǔ);構(gòu)建知識(shí)庫(kù)關(guān)鍵詞索引,遍歷知識(shí)庫(kù)中的每個(gè)問(wèn)題,若里面的詞語(yǔ)與信息抽取模型抽取出的實(shí)體名稱和別稱的集合有交集,則為知識(shí)庫(kù)關(guān)鍵詞索引中該實(shí)體名稱或別稱為鍵對(duì)應(yīng)的值加上這一條問(wèn)題;
S45、將人工智能領(lǐng)域的無(wú)結(jié)構(gòu)化知識(shí)文本段落直接保存作為文本庫(kù)并為其建立倒序索引,利用jieba分詞工具分別對(duì)文本庫(kù)中的每個(gè)文本段落進(jìn)行分詞和去除停用詞,得到一組詞語(yǔ);再統(tǒng)計(jì)文本庫(kù)中所有文本段落經(jīng)過(guò)這樣處理之后得到的詞語(yǔ)的集合,即文本庫(kù)中的所有詞語(yǔ)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110392744.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





