[發(fā)明專利]一種針對基于提示符的探證的因果分析方法和系統(tǒng)在審

申請?zhí)枺?/td>	202210001713.4	申請日：	2022-01-04
公開（公告）號：	CN114492806A	公開（公告）日：	2022-05-13
發(fā)明（設(shè)計(jì)）人：	曹博希;林鴻宇;韓先培;孫樂	申請（專利權(quán)）人：	中國科學(xué)院軟件研究所
主分類號：	G06N5/04	分類號：	G06N5/04;G06N5/02
代理公司：	北京君尚知識產(chǎn)權(quán)代理有限公司 11200	代理人：	邱曉鋒
地址：	100190 ***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種針對基于提示符因果分析方法系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明涉及一種針對基于提示符的探證的因果分析方法和系統(tǒng)，屬于自然語言處理領(lǐng)域。該方法主要包含：(1)形式化基于提示符的探證過程中各個(gè)變量交互關(guān)系的結(jié)構(gòu)因果模型。該結(jié)構(gòu)因果模型共包含11個(gè)關(guān)鍵變量，描述了模型預(yù)訓(xùn)練、提示符選取、自然語言化的測試集生成、性能評估四個(gè)關(guān)鍵過程中的因果關(guān)系。(2)基于結(jié)構(gòu)因果模型，識別出期望評估的真正因果關(guān)系和三條混淆評估結(jié)果的后門路徑，分析三條后門路徑導(dǎo)致的三種偏差：提示符偏好偏差、實(shí)例自然語言化偏差、采樣差異偏差。(3)基于后門準(zhǔn)則的消除探證過程偏差的因果干預(yù)方法。本發(fā)明能有效地識別、理解和消除探證過程中存在的偏差，得到穩(wěn)定的、準(zhǔn)確的、可靠的評測結(jié)果。

技術(shù)領(lǐng)域

本發(fā)明涉及一種針對基于提示符的探證的因果分析方法和系統(tǒng)，屬于自然語言處理領(lǐng)域。

背景技術(shù)

隨著大規(guī)模預(yù)訓(xùn)練模型在自然語言處理領(lǐng)域取得的巨大成功，諸多研究著眼于探證現(xiàn)有預(yù)訓(xùn)練模型中蘊(yùn)含了哪些知識。其中基于提示符的探證是最為廣泛使用的探證方法之一：通過構(gòu)建任務(wù)特定的提示符對預(yù)訓(xùn)練模型進(jìn)行提問，從而評估模型在這一任務(wù)上具備的知識。例如，為了評估預(yù)訓(xùn)練模型是否知道“Michael Jordan”的生日，我們可以向預(yù)訓(xùn)練模型輸入“Michael Jordan was born in[MASK]”，其中“Michael Jordan”是被自然語言化的查詢輸入，“was born in”是被自然語言化的提示符，“[MASK]”是用于預(yù)訓(xùn)練模型輸出預(yù)測結(jié)果的占位符。近年來，研究者們已經(jīng)構(gòu)建多個(gè)利用提示符對預(yù)訓(xùn)練模型的知識進(jìn)行探證的評測數(shù)據(jù)集(例如LAMA，LM diagnostics，X-FACTE，BioLAMA等)，并把模型在這些數(shù)據(jù)集上的性能視作其在對應(yīng)任務(wù)上的能力。

然而，已有諸多研究發(fā)現(xiàn)當(dāng)前使用提示符進(jìn)行探證的范式存在不準(zhǔn)確，不穩(wěn)定以及不可靠的問題。這些探證過程中存在的偏差會使得預(yù)訓(xùn)練模型真正的能力無法得到準(zhǔn)確的評估，誤導(dǎo)我們對預(yù)訓(xùn)練模型的理解，甚至產(chǎn)生錯(cuò)誤的決定。因此，為了準(zhǔn)確評測預(yù)訓(xùn)練模型任務(wù)特定的能力，亟需回答三個(gè)核心問題：1)現(xiàn)有基于提示符的探證范式中存在哪些偏差？2)這些偏差來源于何處？3)如何消除這些偏差？

發(fā)明內(nèi)容

為了解決上述問題，本發(fā)明使用結(jié)構(gòu)因果模型形式化了基于提示符的探證過程，區(qū)分出期望評測的真實(shí)因果關(guān)系和導(dǎo)致評測結(jié)果偏差的后門路徑，并使用因果干預(yù)技術(shù)阻塞相應(yīng)的后門路徑，達(dá)到消除評測過程中偏差的目的。

本發(fā)明采用的技術(shù)方案如下：

一種針對基于提示符的探證的因果分析方法，包括以下步驟：

建立結(jié)構(gòu)因果模型，用于形式化基于提示符的探證過程中各個(gè)變量交互關(guān)系；

基于結(jié)構(gòu)因果模型，識別出探證過程中期望評估的真正因果關(guān)系和混淆評估結(jié)果的后門路徑，并分析后門路徑導(dǎo)致的偏差；

利用后門準(zhǔn)則阻塞導(dǎo)致偏差的后門路徑，得到無偏的因果關(guān)系評估結(jié)果。

進(jìn)一步地，所述結(jié)構(gòu)因果模型包含多個(gè)關(guān)鍵變量，描述基于提示符的探證中的模型預(yù)訓(xùn)練、提示符選取、自然語言化的測試集生成、性能評估四個(gè)關(guān)鍵過程中的因果關(guān)系。

進(jìn)一步地，所述結(jié)構(gòu)因果模型包含11個(gè)關(guān)鍵變量：預(yù)訓(xùn)練語料分布D_a；預(yù)訓(xùn)練語料C；預(yù)訓(xùn)練模型M；語言表達(dá)分布L；任務(wù)R；提示符P；任務(wù)特定的預(yù)測器I；測試數(shù)據(jù)分布D_b；采樣得到的測試數(shù)據(jù)T；自然語言化的測試數(shù)據(jù)X；評測性能E。

進(jìn)一步地，所述混淆評估結(jié)果的后門路徑為三條后門路徑，所述三條后門路徑體現(xiàn)預(yù)訓(xùn)練模型M和評測性能E之間的偽相關(guān)關(guān)系，從而導(dǎo)致三種偏差：提示符偏好偏差、實(shí)例自然語言化偏差、采樣差異偏差。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院軟件研究所，未經(jīng)中國科學(xué)院軟件研究所許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210001713.4/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06N 基于特定計(jì)算模型的計(jì)算機(jī)系統(tǒng)
G06N5-00 利用基于知識的模式的計(jì)算機(jī)系統(tǒng)
G06N5-02 .知識表達(dá)
G06N5-04 .推理方法或設(shè)備

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

公式密碼結(jié)合圖形提示的交互型動態(tài)密碼校驗(yàn)?zāi)Ｊ?/a>

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】