[發明專利]地圖興趣點的訓練模型確定方法、裝置及電子設備在審
| 申請號: | 202011561079.7 | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112559885A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 王昆 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9537;G06F16/29;G06F40/295;G06K9/62;G06N20/20 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地圖 興趣 訓練 模型 確定 方法 裝置 電子設備 | ||
本申請公開了一種地圖興趣點的訓練模型確定方法、裝置及電子設備,涉及深度學習領域的自然語言處理和大數據技術領域,所述方法包括:獲取與興趣點POI相關的至少一類預訓練任務;根據預訓練任務,確定第一階段的訓練模型;根據第一階段的訓練模型的參數以及至少一類與POI相關的專有任務,確定第二階段的訓練模型。本申請可以提高在地圖POI名稱領域的所有下游自然語言處理任務的性能,并且可以作為通用的一個模型參數進行發布,極大提高地圖POI的處理效率。
技術領域
本申請公開了一種地圖興趣點的訓練模型確定方法、裝置、設備、介質及程序產品,尤其涉及深度學習技術領域,具體涉及自然語言處理和大數據。
背景技術
地圖類應用利用互聯網技術連接真實世界,隨著5G和AI的發展,地圖行業的數據越來越龐大和豐富,其中除了招牌圖像等影像數據,還包括了招牌圖像上的POI(Point ofInteresting,興趣點)名稱等文本數據,智能情報中的文本數據等,這一類文本數據都直接或者間接的和POI的名稱相關。
POI領域中使用的模型各異,這導致了很多模型無法共享一部分的領域知識,例如LSTM這一類模型都需要從頭開始訓練相關任務,無法從與之相關的一類任務中汲取領域知識。
現有的預訓練模型的參數是在通用語料庫上進行反復訓練獲取的,還不具備POI領域的知識,POI領域中很多語義關系和特征都與通用文本具有很大的差距。雖然可以使用其提供的預訓練參數來進行微調,但是在實際工程上效果不好,無法共享進行遷移訓練。
發明內容
本申請提供了一種地圖興趣點的訓練模型確定方法、裝置、設備、介質及程序產品。
根據本申請的一方面,提供了一種地圖興趣點的訓練模型確定方法,所述方法包括:
獲取與興趣點POI相關的至少一類預訓練任務;
根據所述預訓練任務,確定第一階段的訓練模型;
根據所述第一階段的訓練模型的參數以及至少一類與所述POI相關的專有任務,確定第二階段的訓練模型。
根據本申請的另一方面,提供了一種地圖興趣點的訓練模型確定裝置,包括:
獲取模塊,用于獲取與興趣點POI相關的至少一類預訓練任務;
第一處理模塊,用于根據所述預訓練任務,確定第一階段的訓練模型;
第二處理模塊,用于根據所述第一階段的訓練模型的參數以及至少一類與所述POI相關的專有任務,確定第二階段的訓練模型。
根據本申請的另一方面,提供了一種電子設備,包括:
至少一個處理器;
以及與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本申請提供的地圖興趣點的訓練模型確定方法。
根據本申請的另一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,所述計算機指令用于使所述計算機執行本申請提供的地圖興趣點的訓練模型確定方法。
根據本申請的另一方面,提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現本申請提供的地圖興趣點的訓練模型確定方法。
應當理解,本部分所描述的內容并非旨在標識本申請的實施例的關鍵或重要特征,也不用于限制本申請的范圍。本申請的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本申請的限定。其中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011561079.7/2.html,轉載請聲明來源鉆瓜專利網。





