[發(fā)明專利]基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法及框架在審
| 申請(qǐng)?zhí)枺?/td> | 202110549527.X | 申請(qǐng)日: | 2021-05-20 |
| 公開(公告)號(hào): | CN113139366A | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計(jì))人: | 許暢;劉疏觀;王慧妍 | 申請(qǐng)(專利權(quán))人: | 南京大學(xué) |
| 主分類號(hào): | G06F40/16 | 分類號(hào): | G06F40/16;G06F40/295;G06F40/18;G06F16/9535 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 蘇良 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 示例 編程 格式 豐富 文檔 實(shí)體 一致性 轉(zhuǎn)換 方法 框架 | ||
本發(fā)明涉及基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法及框架,其針對(duì)示例編程在被用于格式豐富的文檔時(shí)的局限性,通過分析用戶操作歷史,自動(dòng)識(shí)別操作歷史背后的用戶意圖,并據(jù)此為用戶提供有效、穩(wěn)定、高效的下一步操作推薦,以保持格式豐富的文檔中實(shí)體的一致性。
技術(shù)領(lǐng)域
本發(fā)明屬于信息技術(shù)領(lǐng)域,涉及基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法及框架。
背景技術(shù)
示例編程技術(shù)被廣泛應(yīng)用于諸多領(lǐng)域,如電子表格、文件管理、代碼轉(zhuǎn)換等,其可根據(jù)給定的輸入輸出示例自動(dòng)生成程序,從而替代重復(fù)的人工操作。
然而,當(dāng)示例編程技術(shù)被用于格式豐富的文檔時(shí),經(jīng)典的示例編程存在局限性:
首先,許多示例編程系統(tǒng)要求用戶進(jìn)入一種特殊的模式來提供示例,這可能會(huì)中斷用戶的正常工作流程,并增加額外的工作負(fù)載;
其次,雖然有時(shí)由多個(gè)實(shí)用的示例所組成的規(guī)范可以從用戶處獲取,但這仍然可能會(huì)導(dǎo)致歧義,因?yàn)樵谒阉骺臻g內(nèi)可能有多個(gè)滿足這些示例的程序。因此,為了更好地合成一個(gè)預(yù)期的程序,示例編程系統(tǒng)可能仍然需要一定數(shù)量的高質(zhì)量的示例。盡管有些示例編程工作看似只需要特定情況下的少量幾個(gè)示例,但它們可能局限于某些場(chǎng)景,例如,字符串操作。在這些場(chǎng)景下,搜索空間本身可能并不大,故而只需要幾個(gè)示例就可以滿足要求。然而,對(duì)于其他復(fù)雜的場(chǎng)景,這些工作的底層學(xué)習(xí)機(jī)制可能需要更多的例子以進(jìn)行健壯的訓(xùn)練。它們對(duì)示例數(shù)量要求較高,可能比格式豐富的文檔(如Power Point)所能提供的更多。由于格式豐富的文檔通常沒有足夠的示例進(jìn)行示例編程的程序合成,例如Power Point的一個(gè)頁面中可能只有幾個(gè)實(shí)體要進(jìn)行相同的任務(wù),而電子表格中可能有更多(如幾十個(gè)甚至幾百個(gè))單元格要進(jìn)行相同的計(jì)算任務(wù),傳統(tǒng)示例編程技術(shù)難以適用。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種具有有效性、穩(wěn)定性和高效性等特點(diǎn)的基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法及框架。有效性是指該方法和框架對(duì)保持實(shí)體一致性的推薦的準(zhǔn)確度較高。穩(wěn)定性是指該方法和框架對(duì)于各種因素的不同取值都能保持有效性。高效性是指該方法和框架給出推薦所需時(shí)間代價(jià)較小,能夠滿足實(shí)時(shí)推薦的要求,可部署于運(yùn)行中的格式豐富的文檔輔助實(shí)體一致性的保持。
為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法,包括如下步驟:
步驟S1、分析用戶操作歷史,并從為特定格式豐富的文檔類型預(yù)先設(shè)計(jì)好的用戶意圖目標(biāo)庫中,挑選出參數(shù)化表達(dá)的用戶意圖目標(biāo);
步驟S2、根據(jù)用戶操作歷史,對(duì)挑選出的參數(shù)化目標(biāo)進(jìn)行實(shí)例化,獲取描述細(xì)化的具體用戶意圖的實(shí)例化目標(biāo),并獲取與此目標(biāo)關(guān)聯(lián)的種子實(shí)體集合;
步驟S3、掃描整個(gè)格式豐富文檔中的剩余實(shí)體,根據(jù)獲取的實(shí)例化目標(biāo)和其種子實(shí)體集合,對(duì)各個(gè)實(shí)體進(jìn)行實(shí)體相關(guān)度計(jì)算,并根據(jù)計(jì)算結(jié)果確定與實(shí)例化目標(biāo)密切相關(guān)的候選實(shí)體;
步驟S4、根據(jù)實(shí)例化目標(biāo),為候選實(shí)體生成以達(dá)成此目標(biāo)需要的下一步操作,將其作為最終的輸出推薦給用戶。
進(jìn)一步地,步驟S1中,從用戶意圖目標(biāo)庫中挑選出參數(shù)化表達(dá)的用戶意圖目標(biāo)是指,
對(duì)用戶操作歷史進(jìn)行倒序分析,通過遍歷整個(gè)預(yù)先設(shè)計(jì)好的包含豐富用戶意圖的參數(shù)化目標(biāo)庫,從中匹配與此操作歷史相關(guān)聯(lián)的參數(shù)化目標(biāo),并標(biāo)記出與特定參數(shù)化目標(biāo)匹配成功的具體連續(xù)的操作序列。
進(jìn)一步地,對(duì)用戶操作歷史進(jìn)行倒序分析中,引入噪音容忍策略,允許在用戶操作歷史中存在特定數(shù)量個(gè)連續(xù)匹配失敗的意外操作,減弱實(shí)際用戶操作歷史中包含不受控噪聲操作所帶來的影響。
進(jìn)一步地,步驟S2中,對(duì)挑選出的參數(shù)化目標(biāo)進(jìn)行實(shí)例化是指,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110549527.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 從單個(gè)示例學(xué)習(xí)對(duì)象剪切
- 按示例格式化數(shù)據(jù)
- 輸入支持設(shè)備和方法
- 基于判別性示例選擇多示例學(xué)習(xí)的恐怖視頻識(shí)別方法
- 面向在線不確定圖像識(shí)別的多示例加權(quán)包學(xué)習(xí)方法
- 基于在線示例分類器精化的多示例檢測(cè)網(wǎng)絡(luò)及其訓(xùn)練方法
- 通過示例來學(xué)習(xí)ETL規(guī)則
- 示例演示方法及裝置
- 一種基于自動(dòng)示例選擇的端到端多示例學(xué)習(xí)方法
- 一種基于多示例深度學(xué)習(xí)的醫(yī)學(xué)圖像分類方法





