[發(fā)明專利]基于示例編程的格式豐富文檔實體一致性轉換方法及框架在審
| 申請?zhí)枺?/td> | 202110549527.X | 申請日: | 2021-05-20 |
| 公開(公告)號: | CN113139366A | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設計)人: | 許暢;劉疏觀;王慧妍 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F40/16 | 分類號: | G06F40/16;G06F40/295;G06F40/18;G06F16/9535 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 蘇良 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 示例 編程 格式 豐富 文檔 實體 一致性 轉換 方法 框架 | ||
1.基于示例編程的格式豐富文檔實體一致性轉換方法,其特征在于,包括如下步驟:
步驟S1、分析用戶操作歷史,并從為特定格式豐富的文檔類型預先設計好的用戶意圖目標庫中,挑選出參數化表達的用戶意圖目標;
步驟S2、根據用戶操作歷史,對挑選出的參數化目標進行實例化,獲取描述細化的具體用戶意圖的實例化目標,并獲取與此目標關聯(lián)的種子實體集合;
步驟S3、掃描整個格式豐富文檔中的剩余實體,根據獲取的實例化目標和其種子實體集合,對各個實體進行實體相關度計算,并根據計算結果確定與實例化目標密切相關的候選實體;
步驟S4、根據實例化目標,為候選實體生成以達成此目標需要的下一步操作,將其作為最終的輸出推薦給用戶。
2.根據權利要求1所述的基于示例編程的格式豐富文檔實體一致性轉換方法,其特征在于,步驟S1中,從用戶意圖目標庫中挑選出參數化表達的用戶意圖目標是指,
對用戶操作歷史進行倒序分析,通過遍歷整個預先設計好的包含豐富用戶意圖的參數化目標庫,從中匹配與此操作歷史相關聯(lián)的參數化目標,并標記出與特定參數化目標匹配成功的具體連續(xù)的操作序列。
3.根據權利要求2所述的基于示例編程的格式豐富文檔實體一致性轉換方法,其特征在于,對用戶操作歷史進行倒序分析中,引入噪音容忍策略,允許在用戶操作歷史中存在特定數量個連續(xù)匹配失敗的意外操作,減弱實際用戶操作歷史中包含不受控噪聲操作所帶來的影響。
4.根據權利要求2所述的基于示例編程的格式豐富文檔實體一致性轉換方法,其特征在于,步驟S2中,對挑選出的參數化目標進行實例化是指,
針對此參數化目標以及從操作歷史中抽取的與其匹配成功的操作序列,通過借助表達式求解方法,為參數化目標中包含的參數賦予具體值,從而實例化此目標;同時,根據實例化后的目標,從該操作序列中篩選密切相關的操作集合,并將其對應的實體作為該實例化目標對應的種子實體集合。
5.根據權利要求1所述的基于示例編程的格式豐富文檔實體一致性轉換方法,其特征在于,步驟S3中,掃描整個格式豐富文檔中除種子實體集合之外的剩余實體,利用步驟S2得到的實例化目標和對應的種子實體集合,對剩余實體進行實體相關度計算,計劃剩余實體與該實例化目標的滿足程度;將剩余實體根據下述相關度計算公式獲取計算結果并進行倒序排序,截取排名靠前的特定數量實體作為與此實例化目標關聯(lián)的候選實體集合;
某剩余實體eRk和某實例化目標gs的種子實體集合ESs在gs下的相關度計算公式為:
公式(1)中,G為實例化目標的目標屬性集合;I代表eRk和ESs的屬性交集;W(ai,aj)代表屬性權重,用來描述屬性ai和屬性aj的相關度,屬性間的相關度可由領域常見表達格式豐富的文檔中屬性的具體關聯(lián)程度的層次結構得到;Dis(eRk,ESs,aj)用來度量eRk和ESs在它們屬性交集I內某屬性aj上的屬性值的距離得到,公式(2)處理數值型屬性,公式(3)處理標簽型屬性;
公式(2)中,aj是一個數值型屬性,若eRk,在aj上的屬性值在ESs在aj上的屬性值區(qū)間范圍內,則認為eRk此屬性與種子集合描述的此數值型屬性區(qū)間相關聯(lián),Dis(eRk,ESs,aj)返回1,否則返回0;公式(3)中,aj是一個標簽型屬性,若eRk,在aj上的屬性值在ESs在aj上的屬性值集合范圍內,則認為eRk此屬性與種子集合描述的此標簽型屬性集合相關聯(lián),Dis(eRk,ESs,aj)返回1,否則返回0;在公式(2)和(3)中,value(·)和valueSet(·)分別返回針對在某特定屬性上某個實體的屬性值和某個實體集合上的一組屬性值;min(·)和max(·)分別表示取一個集合中的最小值和最大值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110549527.X/1.html,轉載請聲明來源鉆瓜專利網。





