[發明專利]用于更新模型參數的方法、裝置、設備和存儲介質有效
| 申請號: | 201810344086.8 | 申請日: | 2018-04-17 |
| 公開(公告)號: | CN110399547B | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 范淼;馮悅;孫明明;李平 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 李輝;羅利娜 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 更新 模型 參數 方法 裝置 設備 存儲 介質 | ||
根據本公開的示例實施例,提供了用于更新模型參數的方法、裝置、設備和計算機可讀存儲介質。用于更新模型參數的方法包括根據評論評估模型的第一參數集的當前值,利用評論評估模型提取第一評論的第一特征和第二評論的第二特征,評論評估模型用于評估評論的有用程度。該方法還包括基于第一特征和第二特征,確定第一評論與第二評論的至少一個相似度度量。該方法進一步包括響應于第一評論被標注有對應的真實有用程度并且第二評論為未被標注有對應的真實有用程度,至少基于至少一個相似度度量來更新第一參數集的當前值以獲得第一參數集的更新值。以此方式,未標注評論也可用于模型參數更新,從而有利地實現自動、有效且低成本的模型參數更新。
技術領域
本公開的實施例主要涉及計算機領域,并且更具體地,涉及用于更新模型參數的方法、裝置、設備和計算機可讀存儲介質。
背景技術
隨著網絡技術發展,越來越多互聯網平臺支持用戶原創內容(UGC)的生成。因此,用戶在許多互聯網平臺中都可以公開評論特定對象。這樣的評論不僅豐富了被評論對象(諸如產品,服務,諸如新聞、視頻、短文本等內容)的相關信息,而且也有助于其他用戶了解被評論對象的質量、特點等。
由于評論通常由用戶自主生成,并非所有評論內容都能夠向其他用戶提供與被評論對象有關的有用或有價值信息,甚至有些評論可能與被評論對象完全無關。如果被評論對象的評論數量過多,有用評論與無用評論混雜在一起,其他用戶難以從眾多評論中快速獲取有用信息,并且無用信息也不利于提供商或第三方對被評論對象的正確評價(例如是否值得推薦的判斷等)。因此,期望能夠對評論的價值或有用程度加以分辨。
已經提出可以通過機器學習的方法,利用訓練數據來訓練學習模型,以獲得能夠用于自動評估評論的有用程度的學習模型。這樣的模型訓練過程通常涉及多方面的成本,包括人力成本、計算成本等。期望能夠在確保良好模型學習的基礎上盡可能降低訓練成本。
發明內容
根據本公開的示例實施例,提供了一種用于更新模型參數的方案。
在本公開的第一方面中,提供了一種用于更新模型參數的方法。該方法包括根據評論評估模型的第一參數集的當前值,利用評論評估模型提取第一評論的第一特征和第二評論的第二特征,評論評估模型用于評估評論的有用程度。該方法還包括基于第一特征和第二特征,確定第一評論與第二評論的至少一個相似度度量。該方法進一步包括響應于第一評論被標注有對應的真實有用程度并且第二評論為未被標注有對應的真實有用程度,至少基于至少一個相似度度量來更新第一參數集的當前值以獲得第一參數集的更新值。
在本公開的第二方面中,提供了一種用于更新模型參數的裝置。該裝置包括特征提取模塊,被配置為根據評論評估模型的第一參數集的當前值,利用評論評估模型提取第一評論的第一特征和第二評論的第二特征,評論評估模型用于評估評論的有用程度。該裝置還包括度量確定模塊,被配置為基于第一特征和第二特征,確定第一評論與第二評論的至少一個相似度度量。該裝置進一步包括參數更新模塊,被配置為響應于第一評論被標注有對應的真實有用程度并且第二評論為未被標注有對應的真實有用程度,至少基于至少一個相似度度量來更新第一參數集的當前值以獲得第一參數集的更新值。
在本公開的第三方面中,提供了一種設備,包括一個或多個處理器;以及存儲裝置,用于存儲一個或多個程序,當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現根據本公開的第一方面的方法。
在本公開的第四方面中,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現根據本公開的第一方面的方法。
應當理解,發明內容部分中所描述的內容并非旨在限定本公開的實施例的關鍵或重要特征,亦非用于限制本公開的范圍。本公開的其它特征將通過以下的描述變得容易理解。
附圖說明
結合附圖并參考以下詳細說明,本公開各實施例的上述和其他特征、優點及方面將變得更加明顯。在附圖中,相同或相似的附圖標注表示相同或相似的元素,其中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810344086.8/2.html,轉載請聲明來源鉆瓜專利網。





