[發明專利]一種處理信息物料文件的方法和裝置有效
| 申請號: | 201410550772.2 | 申請日: | 2014-10-16 |
| 公開(公告)號: | CN104239586B | 公開(公告)日: | 2018-10-09 |
| 發明(設計)人: | 桂成林 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市中倫律師事務所 11410 | 代理人: | 張思悅 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 處理 信息 物料 文件 方法 裝置 | ||
本發明公開了一種處理信息物料文件的方法和裝置,所述方法包括以下步驟:接收信息物料文件;分析所述信息物料文件的編碼和結構;根據所述編碼和結構,按照預先定義的文件大小閾值,將所述信息物料文件拆分為不同歸類的多個子信息物料文件;以及將所述多個子信息物料文件按照其歸類分別處理到不同的數據庫表中。
技術領域
本發明涉及信息處理技術領域,尤其涉及一種處理信息物料文件的方法和裝置。
背景技術
在搜索引擎系統中,需要將所需數據按照固定的結構存儲在文件中,然后從準備好的文件中讀取數據,并且按照歸類來分別調用不同的業務存儲于相應的數據表中。在現有技術中,一般是從準備好的固定格式的文件中逐行讀取內容,進行分析,然后將結果分別存儲于相應的數據表中。
然而,由于搜索物料(例如搜索廣告)的投放需求非常大,搜索物料添加通過逐個新建,或者通過將數據存儲于文件中后逐行處理效率低下。例如,假設上傳文件總量為n,上傳文件的個數為g,拆分文件時間為s,處理時間為h,合并輸出時間為m,處理進程的個數為p,則上傳完用戶信息物料所花費的時間為:n*g*(h+m+s)*p,所花費時間過長,效率低下。
發明內容
鑒于上述問題,提出了本發明,以便提供一種克服上述問題或者至少部分地解決上述問題的處理信息物料文件的方法和裝置。
依據本發明的第一方面,提供了一種處理信息物料文件的方法,包括步驟:接收信息物料文件;分析所述信息物料文件的編碼和結構;根據所述編碼和結構,按照預先定義的文件大小閾值,將所述信息物料文件拆分為不同歸類的多個子信息物料文件;以及將所述多個子信息物料文件按照其歸類分別處理到不同的數據庫表中。
可選地,在根據本發明的實施例的處理信息物料文件的方法中,在所述將所述多個子信息物料文件按照其歸類分別處理到不同的數據庫表中的步驟之后,還包括步驟:搜集在所述方法各步驟操作中出現的錯誤;將所述錯誤合并為錯誤報告;以及將所述錯誤報告分發到前端服務器,以反饋給用戶。
可選地,在根據本發明的實施例的處理信息物料文件的方法中,在一個或多個前端服務器中接收信息物料文件;并且在一個或多個后端服務器中,分析所述信息物料文件的編碼和結構,根據所述編碼和結構、按照預先定義的文件大小閾值、將所述信息物料文件拆分為不同歸類的多個子信息物料文件,并將所述多個子信息物料文件按照其歸類分別處理到不同的數據庫表中。
可選地,在根據本發明的實施例的處理信息物料文件的方法中,所述信息物料文件包括搜索廣告物料文件和/或展示廣告物料文件,所述搜索廣告物料文件包括以下各項中的至少一項:搜索廣告的文本信息、鏈接地址、圖片、多媒體內容,所述展示廣告物料文件包括以下各項中的至少一項:展示廣告的文本信息、鏈接地址、圖片、多媒體內容。
可選地,在根據本發明的實施例的處理信息物料文件的方法中,所述歸類包括以下至少之一:所述信息的關鍵詞、否定關鍵詞、創意。
可選地,在根據本發明的實施例的處理信息物料文件的方法中,還包括步驟:在所述接收信息物料文件的步驟之后,將所述信息物料文件拉取到所述后端服務器的網絡文件系統中;以及在所述將所述信息物料文件拆分為不同歸類的多個子信息物料文件的步驟之后,將所述多個子信息物料文件拉取到所述后端服務器的網絡文件系統中。
依據本發明的第二方面,提供了一種處理信息物料文件的裝置,包括:接收模塊,用于接收信息物料文件;分析模塊,用于分析所述信息物料文件的編碼和結構;拆分模塊,用于根據所述編碼和結構,按照預先定義的文件大小閾值,將所述信息物料文件拆分為不同歸類的多個子信息物料文件;以及處理模塊,用于將所述多個子信息物料文件按照其歸類分別處理到不同的數據庫表中。
可選地,在根據本發明的實施例的處理信息物料文件的裝置中,還包括錯誤合并模塊,用于:搜集在所述各模塊操作中出現的錯誤;將所述錯誤合并為錯誤報告;以及將所述錯誤報告分發到前端服務器,以反饋給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410550772.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種黃芪養生米及其制備方法
- 下一篇:一種基于線路的檢索方法及裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





