[發(fā)明專利]基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法及框架在審

申請(qǐng)?zhí)枺?/td>	202110549527.X	申請(qǐng)日：	2021-05-20
公開（公告）號(hào)：	CN113139366A	公開（公告）日：	2021-07-20
發(fā)明（設(shè)計(jì)）人：	許暢;劉疏觀;王慧妍	申請(qǐng)（專利權(quán)）人：	南京大學(xué)
主分類號(hào)：	G06F40/16	分類號(hào)：	G06F40/16;G06F40/295;G06F40/18;G06F16/9535
代理公司：	南京鐘山專利代理有限公司 32252	代理人：	蘇良
地址：	210093 江***	國省代碼：	江蘇;32
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于示例編程格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法框架
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明涉及基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法及框架，其針對(duì)示例編程在被用于格式豐富的文檔時(shí)的局限性，通過分析用戶操作歷史，自動(dòng)識(shí)別操作歷史背后的用戶意圖，并據(jù)此為用戶提供有效、穩(wěn)定、高效的下一步操作推薦，以保持格式豐富的文檔中實(shí)體的一致性。

技術(shù)領(lǐng)域

本發(fā)明屬于信息技術(shù)領(lǐng)域，涉及基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法及框架。

背景技術(shù)

示例編程技術(shù)被廣泛應(yīng)用于諸多領(lǐng)域，如電子表格、文件管理、代碼轉(zhuǎn)換等，其可根據(jù)給定的輸入輸出示例自動(dòng)生成程序，從而替代重復(fù)的人工操作。

然而，當(dāng)示例編程技術(shù)被用于格式豐富的文檔時(shí)，經(jīng)典的示例編程存在局限性：

首先，許多示例編程系統(tǒng)要求用戶進(jìn)入一種特殊的模式來提供示例，這可能會(huì)中斷用戶的正常工作流程，并增加額外的工作負(fù)載；

其次，雖然有時(shí)由多個(gè)實(shí)用的示例所組成的規(guī)范可以從用戶處獲取，但這仍然可能會(huì)導(dǎo)致歧義，因?yàn)樵谒阉骺臻g內(nèi)可能有多個(gè)滿足這些示例的程序。因此，為了更好地合成一個(gè)預(yù)期的程序，示例編程系統(tǒng)可能仍然需要一定數(shù)量的高質(zhì)量的示例。盡管有些示例編程工作看似只需要特定情況下的少量幾個(gè)示例，但它們可能局限于某些場(chǎng)景，例如，字符串操作。在這些場(chǎng)景下，搜索空間本身可能并不大，故而只需要幾個(gè)示例就可以滿足要求。然而，對(duì)于其他復(fù)雜的場(chǎng)景，這些工作的底層學(xué)習(xí)機(jī)制可能需要更多的例子以進(jìn)行健壯的訓(xùn)練。它們對(duì)示例數(shù)量要求較高，可能比格式豐富的文檔(如Power Point)所能提供的更多。由于格式豐富的文檔通常沒有足夠的示例進(jìn)行示例編程的程序合成，例如Power Point的一個(gè)頁面中可能只有幾個(gè)實(shí)體要進(jìn)行相同的任務(wù)，而電子表格中可能有更多(如幾十個(gè)甚至幾百個(gè))單元格要進(jìn)行相同的計(jì)算任務(wù)，傳統(tǒng)示例編程技術(shù)難以適用。

發(fā)明內(nèi)容

本發(fā)明的目的是提供一種具有有效性、穩(wěn)定性和高效性等特點(diǎn)的基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法及框架。有效性是指該方法和框架對(duì)保持實(shí)體一致性的推薦的準(zhǔn)確度較高。穩(wěn)定性是指該方法和框架對(duì)于各種因素的不同取值都能保持有效性。高效性是指該方法和框架給出推薦所需時(shí)間代價(jià)較小，能夠滿足實(shí)時(shí)推薦的要求，可部署于運(yùn)行中的格式豐富的文檔輔助實(shí)體一致性的保持。

為實(shí)現(xiàn)上述目的，本發(fā)明采用以下技術(shù)方案：

基于示例編程的格式豐富文檔實(shí)體一致性轉(zhuǎn)換方法，包括如下步驟：

步驟S1、分析用戶操作歷史，并從為特定格式豐富的文檔類型預(yù)先設(shè)計(jì)好的用戶意圖目標(biāo)庫中，挑選出參數(shù)化表達(dá)的用戶意圖目標(biāo)；

步驟S2、根據(jù)用戶操作歷史，對(duì)挑選出的參數(shù)化目標(biāo)進(jìn)行實(shí)例化，獲取描述細(xì)化的具體用戶意圖的實(shí)例化目標(biāo)，并獲取與此目標(biāo)關(guān)聯(lián)的種子實(shí)體集合；

步驟S3、掃描整個(gè)格式豐富文檔中的剩余實(shí)體，根據(jù)獲取的實(shí)例化目標(biāo)和其種子實(shí)體集合，對(duì)各個(gè)實(shí)體進(jìn)行實(shí)體相關(guān)度計(jì)算，并根據(jù)計(jì)算結(jié)果確定與實(shí)例化目標(biāo)密切相關(guān)的候選實(shí)體；

步驟S4、根據(jù)實(shí)例化目標(biāo)，為候選實(shí)體生成以達(dá)成此目標(biāo)需要的下一步操作，將其作為最終的輸出推薦給用戶。

進(jìn)一步地，步驟S1中，從用戶意圖目標(biāo)庫中挑選出參數(shù)化表達(dá)的用戶意圖目標(biāo)是指，

對(duì)用戶操作歷史進(jìn)行倒序分析，通過遍歷整個(gè)預(yù)先設(shè)計(jì)好的包含豐富用戶意圖的參數(shù)化目標(biāo)庫，從中匹配與此操作歷史相關(guān)聯(lián)的參數(shù)化目標(biāo)，并標(biāo)記出與特定參數(shù)化目標(biāo)匹配成功的具體連續(xù)的操作序列。

進(jìn)一步地，對(duì)用戶操作歷史進(jìn)行倒序分析中，引入噪音容忍策略，允許在用戶操作歷史中存在特定數(shù)量個(gè)連續(xù)匹配失敗的意外操作，減弱實(shí)際用戶操作歷史中包含不受控噪聲操作所帶來的影響。

進(jìn)一步地，步驟S2中，對(duì)挑選出的參數(shù)化目標(biāo)進(jìn)行實(shí)例化是指，

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué)，未經(jīng)南京大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110549527.X/2.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：基于區(qū)域生長的斷溶體識(shí)別方法
下一篇：掃地機(jī)器人自動(dòng)返回加水方法、掃地機(jī)器人和基座

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】