[發(fā)明專利]用于城市大腦的多模型融合問答方法及系統(tǒng)、介質(zhì)有效
| 申請?zhí)枺?/td> | 202010628531.0 | 申請日: | 2020-07-01 |
| 公開(公告)號: | CN111782786B | 公開(公告)日: | 2022-02-15 |
| 發(fā)明(設(shè)計)人: | 張宏志;李浩浩;馬亞中;何彬;梅一多;張聰聰 | 申請(專利權(quán))人: | 中關(guān)村科學(xué)城城市大腦股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06F16/35 |
| 代理公司: | 北京勁創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11589 | 代理人: | 張鐵蘭 |
| 地址: | 100081 北京市海淀區(qū)中關(guān)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 城市 大腦 模型 融合 問答 方法 系統(tǒng) 介質(zhì) | ||
本發(fā)明公開了一種用于城市大腦的多模型融合問答方法,包括:依據(jù)知識圖譜庫獲取用戶輸入問句的第一答案,確定第一置信度;依據(jù)問答庫對用戶輸入問題進行匹配,確定第二答案及第二置信度;依據(jù)生成式預(yù)訓(xùn)練獲取用戶輸入問句的預(yù)測答案;依據(jù)問答庫對預(yù)測答案進行匹配確定第三答案及第三置信度;對第一置信度、第二置信度、第三置信度進行融合分類,獲取目標(biāo)答案。本發(fā)明還公開了一種用于城市大腦的多模型融合問答系統(tǒng)、計算機存儲介質(zhì)。該用于城市大腦的多模型融合問答方法目的是解決問答方法因選擇具有很大經(jīng)驗性的人工設(shè)置閾值而導(dǎo)致的非最優(yōu)化的的問題。
技術(shù)領(lǐng)域
本發(fā)明屬于人工智能技術(shù)領(lǐng)域,具體涉及一種用于城市大腦的多模型融合問答方法及系統(tǒng)、介質(zhì)。
背景技術(shù)
目前專業(yè)領(lǐng)域問答系統(tǒng)算法大都是將用戶問題直接與問答庫中的問題進行匹配。問題-問題之間的匹配采用問題間的相似度排名計算。此類模型對問答庫中的答案沒有進行有效利用,導(dǎo)致答案中的有效信息未進行考慮,同時由于生成式回答的不易把控,導(dǎo)致專業(yè)領(lǐng)域問答系統(tǒng)都未采用該模型,盡管有的問答系統(tǒng)用到了生成模型,但也僅僅限于閑聊領(lǐng)域。
目前深度語義匹配度在問答系統(tǒng)中有較多應(yīng)用,但是深度語義一般需要將問答庫中的問題矢量預(yù)先全部加載到內(nèi)存中,在搜索時進行匹配,既消耗資源也不利于熱更新。
一般的問答系統(tǒng)都采用兩個以上模型,但在最后對模型的選取上大多選擇人工設(shè)置閾值,多個模型的選取上大多選擇人工設(shè)置閾值,具有很大的經(jīng)驗性,準(zhǔn)確率也存在一定不確定性。
有鑒于此,本領(lǐng)域技術(shù)人員亟待提供一種用于城市大腦的多模型融合問答方法及系統(tǒng)、存儲介質(zhì)用于解決問答系統(tǒng)單一和因選擇具有很大經(jīng)驗性的人工設(shè)置閾值而導(dǎo)致的非最優(yōu)化的問題。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問題
本發(fā)明要解決的技術(shù)問題是問答系統(tǒng)單一和因選擇具有很大經(jīng)驗性的人工設(shè)置閾值而導(dǎo)致的非最優(yōu)化。
(二)技術(shù)方案
本發(fā)明的第一方面提供了一種用于城市大腦的多模型融合問答方法,包括以下步驟:
依據(jù)知識圖譜庫獲取用戶輸入問句的第一答案,確定第一置信度;
依據(jù)問答庫對所述用戶輸入問句進行向量匹配,確定第二答案及第二置信度;
依據(jù)生成式預(yù)訓(xùn)練獲取所述用戶輸入問句的預(yù)測答案;
依據(jù)問答庫對預(yù)測答案進行匹配確定第三答案及第三置信度;
根據(jù)排序模型對所述第一置信度、所述第二置信度、所述第三置信度進行融合分類,獲取目標(biāo)答案。
可選的,所述依據(jù)問答庫對所述用戶輸入問句進行向量匹配,確定第二答案及第二置信度,具體包括如下步驟:
將所述問答庫中的問題通過向量表征離線存儲于搜索引擎;
通過所述搜索引擎檢索所述用戶輸入問句,匹配出所述第二答案,確定所述第二答案的第二置信度。
可選的,所述將所述問答庫中的問題通過向量表征離線存儲于搜索引擎,具體包括如下步驟:
通過Bert預(yù)訓(xùn)練獲取微調(diào)后的問答庫;
存儲所述微調(diào)后的問答庫中的問題至所述搜索引擎。
可選的,所述依據(jù)生成式預(yù)訓(xùn)練獲取所述用戶輸入問句的預(yù)測答案,具體包括如下步驟:
對每條訓(xùn)練數(shù)據(jù)進行順序拼接,并將拼接后的訓(xùn)練數(shù)據(jù)輸入到網(wǎng)絡(luò)中進行訓(xùn)練;
依據(jù)GPT-2神經(jīng)網(wǎng)絡(luò)訓(xùn)練,獲取所述預(yù)測答案。
可選的,根據(jù)排序模型對第一置信度、第二置信度、第三置信度進行融合分類,獲取目標(biāo)答案,具體為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中關(guān)村科學(xué)城城市大腦股份有限公司,未經(jīng)中關(guān)村科學(xué)城城市大腦股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010628531.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 三維大腦磁共振圖像的大腦皮層表面上腦溝區(qū)域分割方法
- 用于確定大腦狀態(tài)的方法和系統(tǒng)
- 融合圖像體素及先驗?zāi)X圖譜劃分的大腦網(wǎng)絡(luò)構(gòu)建方法
- 用于在大腦的實時圖像上重疊NBS功能數(shù)據(jù)的方法和系統(tǒng)
- 用于大腦的功能性成像的方法和裝置
- 一種采用人體克隆加大腦移植實現(xiàn)人“重生”的方法
- 一種基于深度循環(huán)自編碼器的大腦活動檢測方法
- 用于大腦的功能性成像的方法和裝置
- 數(shù)據(jù)中心冷源站控制系統(tǒng)及其控制方法
- 一種大腦功能網(wǎng)絡(luò)中時間穩(wěn)定社團檢測方法





