[發(fā)明專(zhuān)利]基于給定事實(shí)的問(wèn)句生成方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201911276552.4 | 申請(qǐng)日: | 2019-12-12 |
| 公開(kāi)(公告)號(hào): | CN111061851B | 公開(kāi)(公告)日: | 2023-08-08 |
| 發(fā)明(設(shè)計(jì))人: | 劉康;何世柱;趙軍;劉操 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)科學(xué)院自動(dòng)化研究所 |
| 主分類(lèi)號(hào): | G06F16/332 | 分類(lèi)號(hào): | G06F16/332;G06N5/022 |
| 代理公司: | 北京市恒有知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會(huì) |
| 地址: | 100190 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 給定 事實(shí) 問(wèn)句 生成 方法 系統(tǒng) | ||
本發(fā)明涉及一種基于給定事實(shí)的問(wèn)句生成方法及系統(tǒng)所述問(wèn)句生成方法包括:獲取歷史參考數(shù)據(jù),所述歷史參考數(shù)據(jù)包括多條不同用戶(hù)的歷史輸入信息;對(duì)各歷史輸入信息進(jìn)行擴(kuò)展,得到對(duì)應(yīng)的上下文表示;根據(jù)各所述輸入信息及對(duì)應(yīng)的上下文表示,建立問(wèn)句生成模型;基于所述問(wèn)句生成模型,根據(jù)當(dāng)前用戶(hù)的當(dāng)前輸入信息,確定所述當(dāng)前輸入信息對(duì)應(yīng)的問(wèn)句序列。本發(fā)明通過(guò)歷史參考數(shù)據(jù)建立問(wèn)句生成模型;能夠基于所述問(wèn)句生成模型,可根據(jù)當(dāng)前用戶(hù)給定的少量當(dāng)前輸入信息,即可準(zhǔn)確確定所述當(dāng)前輸入信息對(duì)應(yīng)的問(wèn)句序列。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,特別涉及一種基于給定事實(shí)的問(wèn)句生成方法及系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的蓬勃發(fā)展和網(wǎng)絡(luò)通訊終端的日益普及,人們每天都會(huì)接觸涉及各個(gè)領(lǐng)域的海量信息。知識(shí)庫(kù)問(wèn)答可以幫助人們快速地從海量信息中獲取知識(shí),從而減輕人類(lèi)的學(xué)習(xí)成本。然而,知識(shí)庫(kù)問(wèn)答嚴(yán)重依賴(lài)人工標(biāo)注數(shù)據(jù),問(wèn)答對(duì)(pair)的標(biāo)注數(shù)據(jù)成為制約問(wèn)句技術(shù)和問(wèn)答系統(tǒng)開(kāi)發(fā)的瓶頸資源,問(wèn)句生成可以有效解決這一問(wèn)題。
問(wèn)句生成這一任務(wù)主要從給定的答案及其輔助信息中自動(dòng)生成問(wèn)句。給定的答案及輔助信息可能是純文本形式,也可能是結(jié)構(gòu)化的知識(shí)庫(kù)。問(wèn)句生成有著如下用途:1.自動(dòng)構(gòu)建問(wèn)答的數(shù)據(jù)資源,或者減少人工標(biāo)注問(wèn)答對(duì)的工作量;2.用于數(shù)據(jù)增強(qiáng),提高問(wèn)答系統(tǒng)的性能;3.作為一個(gè)典型的文本生成任務(wù),可以促進(jìn)文本生成技術(shù)的發(fā)展和進(jìn)步。
然而,傳統(tǒng)問(wèn)句生成方法容易生成謂詞不匹配的問(wèn)句,如表1中的給定輸入自由女神像,位置,紐約市,可能會(huì)生成Q1(誰(shuí)創(chuàng)作了自由女神像?)這樣不能表達(dá)給定謂詞的問(wèn)句,此外,傳統(tǒng)方法生成的問(wèn)句容易對(duì)應(yīng)多個(gè)模棱兩可的答案,如Q2(自由女神像在哪?)有著多個(gè)正確答案(如,美國(guó)、紐約州、紐約市等等),這使得傳統(tǒng)方法生成的問(wèn)句難以實(shí)用化。
表1
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中的上述問(wèn)題,即為了解決基于少量給定事實(shí),準(zhǔn)確確定問(wèn)題,本發(fā)明提供一種基于給定事實(shí)的問(wèn)句生成方法及系統(tǒng)。
為解決上述技術(shù)問(wèn)題,本發(fā)明提供了如下方案:
一種基于給定事實(shí)的問(wèn)句生成方法,所述問(wèn)句生成方法包括:
獲取歷史參考數(shù)據(jù),所述歷史參考數(shù)據(jù)包括多條不同用戶(hù)的歷史輸入信息;
對(duì)各歷史輸入信息進(jìn)行擴(kuò)展,得到對(duì)應(yīng)的上下文表示;
根據(jù)各所述輸入信息及對(duì)應(yīng)的上下文表示,建立問(wèn)句生成模型;
基于所述問(wèn)句生成模型,根據(jù)當(dāng)前用戶(hù)的當(dāng)前輸入信息,確定所述當(dāng)前輸入信息對(duì)應(yīng)的問(wèn)句序列。
可選地,所述歷史參考數(shù)據(jù)還包括多條監(jiān)督信息,各所述監(jiān)督信息包括對(duì)應(yīng)歷史輸入信息的人工標(biāo)注問(wèn)句及參考答案;
所述問(wèn)句生成方法還包括:
根據(jù)所述監(jiān)督信息,對(duì)所述問(wèn)句生成模型進(jìn)行修正,得到修正后的問(wèn)句生成模型。
可選地,所述根據(jù)所述監(jiān)督信息,對(duì)所述問(wèn)句生成模型進(jìn)行修正,得到修正后的問(wèn)句生成模型,具體包括:
基于所述問(wèn)句生成模型,根據(jù)各歷史輸入信息,確定對(duì)應(yīng)的歷史問(wèn)句序列;
根據(jù)各所述歷史問(wèn)句序列及對(duì)應(yīng)的人工標(biāo)注問(wèn)句,計(jì)算生成問(wèn)句損失
根據(jù)各所述歷史問(wèn)句序列及對(duì)應(yīng)的參考答案,計(jì)算輔助答案損失
其中,各參考答案包括有對(duì)應(yīng)歷史輸入信息的答案類(lèi)型詞,所述歷史問(wèn)句序列包括有對(duì)應(yīng)歷史輸入信息的生成詞,是答案類(lèi)型詞的集合,|A|表示所述答案類(lèi)型詞的集合中答案類(lèi)型詞的數(shù)量,是一個(gè)問(wèn)句序列中生成詞yt與對(duì)應(yīng)答案類(lèi)型詞an的損失;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)科學(xué)院自動(dòng)化研究所,未經(jīng)中國(guó)科學(xué)院自動(dòng)化研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911276552.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 基于增強(qiáng)星型模型的立方體元數(shù)據(jù)及查詢(xún)語(yǔ)句生成
- 用于事實(shí)認(rèn)證的方法和裝置
- 一種基于雪花模型的多個(gè)HBase表關(guān)聯(lián)方法
- 一種基于時(shí)間知識(shí)抽取的文本摘要自動(dòng)生成方法及系統(tǒng)
- 一種使用LDA主題模型對(duì)法律判決文書(shū)進(jìn)行相似度匹配的方法
- 事實(shí)識(shí)別的校正方法及裝置
- 一種事實(shí)關(guān)系確定方法及裝置
- 案件裁判方法、裝置和系統(tǒng)
- 入侵調(diào)查
- 基于碎片化知識(shí)下的卷積嵌入表示推理方法
- 建立問(wèn)句生成模型的方法和裝置以及問(wèn)句生成方法和裝置
- 一種智能問(wèn)答方法及裝置
- 一種問(wèn)句模板的質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)
- 問(wèn)句文本的匹配方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 問(wèn)答匹配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種快速獲取FAQ模型訓(xùn)練語(yǔ)料的方法
- 擴(kuò)展問(wèn)句的召回方法和裝置
- 對(duì)問(wèn)句語(yǔ)料進(jìn)行處理的方法、裝置以及存儲(chǔ)介質(zhì)
- 文本處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 同義句匹配方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)





