[發明專利]表單識別方法和裝置有效
| 申請號: | 201210529911.4 | 申請日: | 2012-12-10 |
| 公開(公告)號: | CN103034711A | 公開(公告)日: | 2013-04-10 |
| 發明(設計)人: | 蔡磊;張駿;萬振;傅盛;徐鳴;王昆 | 申請(專利權)人: | 北京金山安全軟件有限公司;北京金山網絡科技有限公司;貝殼網際(北京)安全技術有限公司;可牛網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F9/445 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 吳貴明;張永明 |
| 地址: | 100022 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表單 識別 方法 裝置 | ||
技術領域
本發明涉及數據處理領域,具體而言,涉及一種表單識別方法和裝置。
背景技術
雙核瀏覽器,即有兩個內核的瀏覽器,包括Trident內核與Webkit內核。Trident內核為網頁瀏覽器(Internet?Explorer,簡稱IE)所使用,IE瀏覽器在國內普及率非常高,很多網站只考慮兼容IE,而不符合萬維網聯盟(World?Wide?Web?Consortium,簡稱W3C)標準,例如網銀,在線支付類網站。Webkit內核對W3C標準支持的很完善,同時具有高速的特點。Trident內核的兼容性加Webkit內核的高速,雙核瀏覽器滿足了不同的用戶需求。現有技術中,Trident內核與Webkit內核的雙核表單識別采用了針對超文本標記語言(Hypertext?Markup?Language,簡稱HTML)網頁中form表單進行識別,具體識別方式是當用戶在頁面中填入表單信息,點擊提交按鈕,執行提交事件后,通過執行提交事件的結果來判斷表單是否提交成功。如果表單提交成功,則將表單數據存儲在數據庫中,數據庫中會存儲表單中的多個字段,視為一個成功的表單信息,通過上述描述可以看出,現有技術中在對表單進行識別時需要對提交成功后的表單中的多個字段進行判斷,在多個字段均滿足條件的情況下才能達到對表單的識別,此種需要對表單中多個字段進行識別的方式不僅會造成表單識別率降低,在后續用戶對表單進行填寫時,仍然需要對數據庫中的多個字段分別進行匹配才能判斷出用戶正在填寫的表單是否為當前網頁表單,只有在判斷出為當前表單時才可正常填寫,造成不方便用戶操作,用戶體驗度降低。
針對相關技術中表單識別率較低的問題,目前尚未提出有效的解決方案。
發明內容
本發明的主要目的在于提供一種表單識別方法和裝置,以解決現有技術中表單識別率較低的問題。
為了實現上述目的,根據本發明的一個方面,提供了一種表單識別方法,包括:接收訪問指令;加載與訪問指令相對應的網頁;對加載的網頁的網頁代碼進行掃描;判斷掃描到的網頁代碼中是否包括屬性為第一預設屬性的元素,其中,第一預設屬性對應的元素為密碼元素;判斷掃描到的網頁代碼中是否包括屬性為第二預設屬性的元素,其中,第二預設屬性對應的元素為用戶名元素;以及若判斷出掃描到的網頁代碼中包括屬性為第一預設屬性的元素,并且還包括屬性為第二預設屬性的元素,則確定加載的網頁為表單網頁。
進一步地,對加載的網頁的網頁代碼進行掃描包括:獲取產生訪問指令的內核類型;若獲取到的內核類型為Trident內核,則注入預設腳本代碼至網頁代碼中以對網頁代碼進行掃描;以及若獲取到的內核類型為Webkit內核,則對網頁代碼中的DOM樹中的input控件進行掃描。
進一步地,在確定加載的網頁為表單網頁之后,表單識別方法還包括:判斷是否接收到觸發指令,其中,觸發指令用于提交表單網頁;以及若判斷出接收到觸發指令,則確定表單網頁為有效表單。
進一步地,在產生訪問指令的內核類型為Trident內核時,判斷是否接收到觸發指令包括:獲取網頁代碼中屬性為第三預設屬性的元素,得到第一元素,其中,第三預設屬性對應的元素為提交事件;復制第一元素,得到第二元素;以第二元素覆蓋第一元素;以及判斷第二元素是否被執行,若判斷出第二元素被執行,則確定接收到觸發指令。
進一步地,在產生訪問指令的內核類型為Webkit內核時,判斷是否接收到觸發指令包括:獲取網頁代碼中屬性為第三預設屬性的元素,得到第一元素,其中,第三預設屬性對應的元素為提交事件;以及判斷第一元素是否被執行,若判斷出第一元素被執行,則確定接收到觸發指令。
進一步地,在確定加載的網頁為表單網頁之后,并且在判斷是否接收到觸發指令之前,表單識別方法還包括:獲取屬性為第一預設屬性的元素,得到密碼元素;獲取屬性為第二預設屬性的元素,得到用戶名元素;查詢預設數據庫以判斷密碼數據和用戶名數據是否均已保存在預設數據庫中,其中,密碼數據為密碼元素對應的數據,用戶名數據為用戶名元素對應的數據;以及若判斷出密碼數據和用戶名數據均已保存在預設數據庫中,則添加密碼數據至加載的網頁的密碼元素中,以及添加用戶名數據至加載的網頁的用戶名元素中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山安全軟件有限公司;北京金山網絡科技有限公司;貝殼網際(北京)安全技術有限公司;可牛網絡技術(北京)有限公司,未經北京金山安全軟件有限公司;北京金山網絡科技有限公司;貝殼網際(北京)安全技術有限公司;可牛網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210529911.4/2.html,轉載請聲明來源鉆瓜專利網。





