[發(fā)明專利]一種針對基于提示符的探證的因果分析方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210001713.4 | 申請日: | 2022-01-04 |
| 公開(公告)號: | CN114492806A | 公開(公告)日: | 2022-05-13 |
| 發(fā)明(設(shè)計(jì))人: | 曹博希;林鴻宇;韓先培;孫樂 | 申請(專利權(quán))人: | 中國科學(xué)院軟件研究所 |
| 主分類號: | G06N5/04 | 分類號: | G06N5/04;G06N5/02 |
| 代理公司: | 北京君尚知識產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 針對 基于 提示符 因果 分析 方法 系統(tǒng) | ||
本發(fā)明涉及一種針對基于提示符的探證的因果分析方法和系統(tǒng),屬于自然語言處理領(lǐng)域。該方法主要包含:(1)形式化基于提示符的探證過程中各個(gè)變量交互關(guān)系的結(jié)構(gòu)因果模型。該結(jié)構(gòu)因果模型共包含11個(gè)關(guān)鍵變量,描述了模型預(yù)訓(xùn)練、提示符選取、自然語言化的測試集生成、性能評估四個(gè)關(guān)鍵過程中的因果關(guān)系。(2)基于結(jié)構(gòu)因果模型,識別出期望評估的真正因果關(guān)系和三條混淆評估結(jié)果的后門路徑,分析三條后門路徑導(dǎo)致的三種偏差:提示符偏好偏差、實(shí)例自然語言化偏差、采樣差異偏差。(3)基于后門準(zhǔn)則的消除探證過程偏差的因果干預(yù)方法。本發(fā)明能有效地識別、理解和消除探證過程中存在的偏差,得到穩(wěn)定的、準(zhǔn)確的、可靠的評測結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及一種針對基于提示符的探證的因果分析方法和系統(tǒng),屬于自然語言處理領(lǐng)域。
背景技術(shù)
隨著大規(guī)模預(yù)訓(xùn)練模型在自然語言處理領(lǐng)域取得的巨大成功,諸多研究著眼于探證現(xiàn)有預(yù)訓(xùn)練模型中蘊(yùn)含了哪些知識。其中基于提示符的探證是最為廣泛使用的探證方法之一:通過構(gòu)建任務(wù)特定的提示符對預(yù)訓(xùn)練模型進(jìn)行提問,從而評估模型在這一任務(wù)上具備的知識。例如,為了評估預(yù)訓(xùn)練模型是否知道“Michael Jordan”的生日,我們可以向預(yù)訓(xùn)練模型輸入“Michael Jordan was born in[MASK]”,其中“Michael Jordan”是被自然語言化的查詢輸入,“was born in”是被自然語言化的提示符,“[MASK]”是用于預(yù)訓(xùn)練模型輸出預(yù)測結(jié)果的占位符。近年來,研究者們已經(jīng)構(gòu)建多個(gè)利用提示符對預(yù)訓(xùn)練模型的知識進(jìn)行探證的評測數(shù)據(jù)集(例如LAMA,LM diagnostics,X-FACTE,BioLAMA等),并把模型在這些數(shù)據(jù)集上的性能視作其在對應(yīng)任務(wù)上的能力。
然而,已有諸多研究發(fā)現(xiàn)當(dāng)前使用提示符進(jìn)行探證的范式存在不準(zhǔn)確,不穩(wěn)定以及不可靠的問題。這些探證過程中存在的偏差會使得預(yù)訓(xùn)練模型真正的能力無法得到準(zhǔn)確的評估,誤導(dǎo)我們對預(yù)訓(xùn)練模型的理解,甚至產(chǎn)生錯(cuò)誤的決定。因此,為了準(zhǔn)確評測預(yù)訓(xùn)練模型任務(wù)特定的能力,亟需回答三個(gè)核心問題:1)現(xiàn)有基于提示符的探證范式中存在哪些偏差?2)這些偏差來源于何處?3)如何消除這些偏差?
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明使用結(jié)構(gòu)因果模型形式化了基于提示符的探證過程,區(qū)分出期望評測的真實(shí)因果關(guān)系和導(dǎo)致評測結(jié)果偏差的后門路徑,并使用因果干預(yù)技術(shù)阻塞相應(yīng)的后門路徑,達(dá)到消除評測過程中偏差的目的。
本發(fā)明采用的技術(shù)方案如下:
一種針對基于提示符的探證的因果分析方法,包括以下步驟:
建立結(jié)構(gòu)因果模型,用于形式化基于提示符的探證過程中各個(gè)變量交互關(guān)系;
基于結(jié)構(gòu)因果模型,識別出探證過程中期望評估的真正因果關(guān)系和混淆評估結(jié)果的后門路徑,并分析后門路徑導(dǎo)致的偏差;
利用后門準(zhǔn)則阻塞導(dǎo)致偏差的后門路徑,得到無偏的因果關(guān)系評估結(jié)果。
進(jìn)一步地,所述結(jié)構(gòu)因果模型包含多個(gè)關(guān)鍵變量,描述基于提示符的探證中的模型預(yù)訓(xùn)練、提示符選取、自然語言化的測試集生成、性能評估四個(gè)關(guān)鍵過程中的因果關(guān)系。
進(jìn)一步地,所述結(jié)構(gòu)因果模型包含11個(gè)關(guān)鍵變量:預(yù)訓(xùn)練語料分布Da;預(yù)訓(xùn)練語料C;預(yù)訓(xùn)練模型M;語言表達(dá)分布L;任務(wù)R;提示符P;任務(wù)特定的預(yù)測器I;測試數(shù)據(jù)分布Db;采樣得到的測試數(shù)據(jù)T;自然語言化的測試數(shù)據(jù)X;評測性能E。
進(jìn)一步地,所述混淆評估結(jié)果的后門路徑為三條后門路徑,所述三條后門路徑體現(xiàn)預(yù)訓(xùn)練模型M和評測性能E之間的偽相關(guān)關(guān)系,從而導(dǎo)致三種偏差:提示符偏好偏差、實(shí)例自然語言化偏差、采樣差異偏差。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院軟件研究所,未經(jīng)中國科學(xué)院軟件研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210001713.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于行為時(shí)間序列的社交網(wǎng)絡(luò)因果關(guān)系發(fā)現(xiàn)算法
- 一種自底向上的高維數(shù)據(jù)因果網(wǎng)絡(luò)學(xué)習(xí)方法
- 情態(tài)生成裝置以及計(jì)算機(jī)可讀取記錄介質(zhì)
- 對短文本進(jìn)行常識性因果推理的方法
- 一種基于動量動力學(xué)模型的行人間因果關(guān)系識別方法
- 因果句解析裝置、因果句解析系統(tǒng)、程序以及因果句解析方法
- 訂單歸因方法及裝置
- 一種基于因果推理對玻璃熔爐環(huán)境控制的方法及系統(tǒng)
- 一種結(jié)合知識圖譜和自動變分編碼的因果發(fā)現(xiàn)方法
- 一種基于弱證據(jù)聚合的常識因果推理方法及系統(tǒng)





