[發(fā)明專利]一種智能Web表單自動填充方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201110107333.0 | 申請日: | 2011-04-28 |
| 公開(公告)號: | CN102184204A | 公開(公告)日: | 2011-09-14 |
| 發(fā)明(設(shè)計)人: | 葉施仁;楊長春;廖定安;周建龍;單延平;姚平安;周葉 | 申請(專利權(quán))人: | 常州大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 南京經(jīng)緯專利商標代理有限公司 32200 | 代理人: | 樓高潮 |
| 地址: | 213164 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 智能 web 表單 自動 填充 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種表單填充方法及系統(tǒng),特別涉及以前填寫過的內(nèi)容在新表單中不需再次錄入的自動填充方法及系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的普及,電子政務(wù)、電子商務(wù)和各種辦公自動化取得了蓬勃的發(fā)展,很多用戶都需要通過填寫大量表單來進行各類事務(wù)處理,如填報計劃、匯報業(yè)務(wù)、數(shù)據(jù)采集等。
表單的內(nèi)容通常由提示要輸入內(nèi)容的標簽和緊隨其后需要用戶輸入的表單域組成。如文本框、復(fù)選框、單選框、下拉選擇框等。用戶把數(shù)據(jù)輸入表單域以后,再提交服務(wù)器處理。而這些表單往往包含很多重復(fù)的內(nèi)容,用戶需要反復(fù)填寫自己的單位信息和個人信息等重復(fù)內(nèi)容。例如,求職人員盡管已經(jīng)有Word文檔等形式的簡歷,但招聘網(wǎng)站填寫個人信息時需要進行大量的復(fù)制、粘貼等手工操作,來填充姓名,性別,家庭住址,教育經(jīng)歷等數(shù)十項內(nèi)容。用戶需要在不同的招聘網(wǎng)站重復(fù)同樣的工作,費時費力,容易出錯。
有一些產(chǎn)品和技術(shù)可以減少互聯(lián)網(wǎng)上填報中重復(fù)的工作。例如,Autoformer能收集注冊、登錄簡單表單中用戶名、地址、電話等基本信息,用戶在下次遇到類似的表單時進行自動填充。其中新表單與歷史表單標簽相同時,同名標簽對應(yīng)的數(shù)據(jù)被記憶和重用。當(dāng)標簽不同時,例如,“郵編”和“郵政編碼”需要填充相同,這種情況無法自動填充。在基于互聯(lián)網(wǎng)的實際的事務(wù)處理系統(tǒng)中,表單非常普及,并且數(shù)據(jù)復(fù)雜,這些簡單的自動填充技術(shù)無法解決。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種能自動識別出語義相同的重復(fù)部分,解決填寫表單中重復(fù)內(nèi)容問題智能Web表單自動填充方法及系統(tǒng)。
本發(fā)明的技術(shù)方案是:
一種智能Web表單自動填充方法,包括語義庫和資源庫,該方法包括以下步驟:
1)?提取表單中的標簽名,歸一化為所述語義庫的標準名;
2)根據(jù)所述標準名查找所述資源庫,選擇所述候選值進行填表;
3)?選擇所述候選值進行填表。
進一步,所述語義庫存儲帶概率的所述標簽名到所述標準名的映射概率。
進一步,所述資源庫的建立步驟為:
21)從參考文檔或歷史表單填充數(shù)據(jù)中提取“標簽名-候選值”對;
22)根據(jù)所述語義庫將“標簽名-候選值”對歸一化為“標準名-候選值”對;
23)將所述“標準名-候選值”對存儲于所述資源庫。
更進一步,所述資源庫的建立步驟為:
201)從參考文檔或歷史表單填充數(shù)據(jù)中提取“標簽名-候選值”對;
202)根據(jù)所述語義庫將“標簽名-候選值”對歸一化為“標準名-候選值-可信度”對;
203)將所述“標準名-候選值-可信度”對存儲于所述資源庫。
進一步,所述步驟202)和步驟203)之間設(shè)有步驟204),用于刪除可信度小于過濾閾值的“標準名-候選值-可信度”對。
一種智能Web表單自動填充系統(tǒng),其特征在于,包括:
語義庫,用于存儲的標簽名到標準名的映射集合;
資源庫,用于存儲“標準名-候選值”對的集合;
歸一化模塊,用于提取表單中的標簽名,歸一化為所述語義庫的標準名;
檢索模塊,用于根據(jù)所述標準名查找資源庫,選取候選值;
填表模塊,用于根據(jù)選擇的所述候選值進行填表。
進一步,所述語義庫存儲所述標簽名到所述標準名的映射概率。
進一步,所述資源庫存儲“標準名-候選值-可信度”對的集合,設(shè)有可信度的過濾閾值。
本發(fā)明的有益效果是:通過語義庫的映射關(guān)系,對表格中的標簽名進行歸一化處理,并從資源庫中選取候選值進行自動填表,通過該系統(tǒng)和方法,使用戶的輸入最小化,減輕了用戶重復(fù)輸入的負擔(dān),增強了用戶體驗效果。資源庫的可信度的設(shè)置也使該系統(tǒng)能夠?qū)W習(xí)用戶的偏好,使自動填表的結(jié)果更符合用戶的需求。
附圖說明
圖1為本發(fā)明表單智能自動填充方法示意圖;
圖2為本發(fā)明實施例的實施流程圖;
圖3為本發(fā)明實施案例新表單樣圖;
圖4為本發(fā)明實施案例新表單自動填充效果圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明的具體實施方式進行詳細的說明。
如圖1所示,一種智能Web表單自動填充方法,包括語義庫和資源庫,該方法包括以下步驟:
1)?提取表單中的標簽名,歸一化為所述語義庫的標準名;
2)根據(jù)所述標準名查找所述資源庫,選擇所述候選值進行填表;
3)?選擇所述候選值進行填表。
一種智能Web表單自動填充系統(tǒng),其特征在于,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于常州大學(xué),未經(jīng)常州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110107333.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 提供共享Web模塊的系統(tǒng)和方法
- 管理環(huán)球網(wǎng)網(wǎng)頁中的環(huán)球網(wǎng)媒體的系統(tǒng)及其實現(xiàn)方法
- 一種WEB業(yè)務(wù)實現(xiàn)系統(tǒng)、裝置及方法
- 高速緩存廣播信息的方法和裝置
- 基于QoS指標和Web服務(wù)輸出參數(shù)的Web服務(wù)組合方法和裝置
- Web托管審查方法、裝置及Web托管系統(tǒng)
- 用于信息處理和Web瀏覽歷史導(dǎo)航的方法和設(shè)備及電子裝置
- 用于將web站點轉(zhuǎn)換為目標web app站點的方法和裝置
- 用于防護WEB漏洞的方法和設(shè)備
- 一種Web攻擊報告生成方法、裝置、設(shè)備及計算機介質(zhì)





