[發明專利]一種模型更新方法和裝置有效
| 申請號: | 201610645496.7 | 申請日: | 2016-08-08 |
| 公開(公告)號: | CN107704929B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 譚銀燕;周鵬飛;汪芳山 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 更新 方法 裝置 | ||
本發明公開了一種模型更新方法和裝置,涉及計算機技術領域,用以至少解決因相鄰兩個更新觸發點之間的新增數據的數據特征與之前數據的數據特征之間變化不明顯,而導致的該相鄰兩個更新觸發點所觸發的兩次模型更新中在后的一次模型更新的意義不大,甚至毫無疑義,從而造成的資源浪費的問題。該方法包括:獲取在待測觸發點所在的窗口內接收到的第一在線業務數據;根據第一在線業務數據的數據特征,構建第一特征序列;確定第一特征序列與至少一個代表切片之間的關聯關系;代表切片是根據歷史業務數據的數據特征構建的特征序列的切片;若第一特征序列與至少一個代表切片之間的關聯關系滿足預設條件,則更新當前模型。
技術領域
本發明涉及計算機技術領域,尤其涉及一種模型更新方法和裝置。
背景技術
機器學習算法是通過對已知數據進行分析,獲得數據模型(下文中稱為模型),利用該模型對未知數據進行預測的算法;示例的,利用該模型和待接收的數據進行內容推薦服務等。傳統的機器學習算法需要在學習之前,準備好所有的已知數據,且模型一旦獲得,就不再更改。
隨著在線類業務(例如在線推薦類業務、在線營銷類業務等)的發展,數據規模不斷增大,數據變化速率越來越快,利用傳統的機器學習算法得到的模型不能很好地適應新增的數據的變化規律,使得利用該模型對未知數據的預測的準確率降低。基于此,增量建模技術應運而生。增量建模技術支持利用新增的數據漸進地對已得到的模型進行更新,使更新后的模型更能適應新增的數據的變化規律,從而提高對未知數據的預測的準確率。
目前,增量建模技術提供的模型更新方法如下:獲取新增的數據、歷史模型和更新觸發點;在更新觸發點所在的時刻,利用新增的數據更新歷史模型,從而訓練出新的模型。在增量建模技術中,何時觸發模型的更新是一個關鍵問題,這影響到模型的更新頻率及利用模型對未知數據進行預測的準確率。目前,一般將固定時長或固定數據量作為更新觸發點,即:若從上一更新觸發點所在的時刻至當前時刻之間的時間段達到固定時長,則觸發模型進行更新;或,若從上一更新觸發點所在的時刻開始新增的數據量達到固定數據量,則觸發模型進行更新。
在利用上述確定更新觸發點的方法進行模型更新的過程中,若相鄰兩個更新觸發點之間的新增數據的數據特征與之前數據的數據特征之間變化不明顯,則會導致該相鄰兩個更新觸發點所觸發的兩次模型更新中在后的一次模型更新的意義不大,甚至毫無疑義,從而造成資源的浪費。
發明內容
本發明的實施例提供一種模型更新方法和裝置,用以至少解決因相鄰兩個更新觸發點之間的新增數據的數據特征與之前數據的數據特征之間變化不明顯,而導致的該相鄰兩個更新觸發點所觸發的兩次模型更新中在后的一次模型更新的意義不大,甚至毫無疑義,從而造成的資源浪費的問題。
為達到上述目的,本發明的實施例采用如下技術方案:
一方面,提供一種模型更新方法,包括:獲取在待測觸發點所在的窗口內接收到的第一在線業務數據,其中,待測觸發點可以是任意一個待測觸發點;然后,根據第一在線業務數據的數據特征,構建第一特征序列;確定第一特征序列與至少一個代表切片之間的關聯關系,其中,代表切片是根據歷史業務數據的數據特征構建的特征序列的切片;若第一特征序列與至少一個代表切片之間的關聯關系滿足預設條件,則更新當前模型。可見,本發明實施例提供的技術方案中結合了在線業務數據的數據特征、歷史業務的數據特征、二者所構建的特征序列之間的關聯關系,以及預設條件這些特征,來確定待測觸發點是否為更新觸發點;與現有技術提供的將固定時長或固定數據量作為更新觸發點的技術方案相比,能夠減少因相鄰兩個更新觸發點之間的新增數據的數據特征與之前數據的數據特征之間變化不明顯,而導致的該相鄰兩個更新觸發點所觸發的兩次模型更新中在后的一次模型更新的意義不大,甚至毫無疑義的問題,從而節省資源。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610645496.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種服務器運行狀態視頻顯示設備
- 下一篇:一種資源周期信息展示方法和裝置





