[發明專利]地址文本的召回方法及裝置在審
| 申請號: | 202210192994.6 | 申請日: | 2022-03-01 |
| 公開(公告)號: | CN114564940A | 公開(公告)日: | 2022-05-31 |
| 發明(設計)人: | 丁瑞雪;劉楚;黃申;王瀟斌;龍定坤;高瓊;陳博理;謝朋峻;黃非 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/151;G06N20/00 |
| 代理公司: | 北京同鈞律師事務所 16037 | 代理人: | 許懷遠 |
| 地址: | 310056 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址 文本 召回 方法 裝置 | ||
本申請實施例提供的地址文本的召回方法及裝置,通過利用具有第二風格的地址文本對已有的第一地址向量表示模型進行風格遷移訓練,以使得到可用于處理具有第二風格的地址的第二地址向量表示模型;另一方面,本實施方式的文本召喚處理是基于正交空間而實現的,通過這樣的方式能夠保證第二地址向量表示模型所輸出的第二風格地址向量庫和待處理地址文本的向量處于相同的正交空間,避免向量的空間偏移,提升方案的召回效果。
技術領域
本申請實施例涉及計算機技術領域,尤其涉及一種地址文本的召回方法及裝置。
背景技術
隨著大數據時代的快速發展,對于地址的文本召回處理廣泛應用各類產品中。
在現有技術中,地址的文本召回處理是基于地址向量表示模型來實現的,通過利用地址向量表示模型可將用戶輸入的地址文本進行向量轉換,以得到相應的地址召回文本。
但是,受限于地址向量表示模型在訓練時所使用的地址文本的文本風格,當地址向量表示模型應用在對特定風格地址的文本召回處理時,其容易出現生成的地址召回文本與特定風格地址的風格不對應,召回效果不佳等問題。
發明內容
本申請實施例提供一種地址文本的召回方法及裝置,通過對已有的地址向量表示模型進行風格遷移訓練,并利用風格化的地址向量表示模型進行基于正交空間的文本召回處理,從而有效提升模型對于地址文本的向量表示的準確性,進而提升地址文本的召回效果。
第一方面,本申請實施例提供一種地址文本的召回方法,包括:
獲取第一地址向量表示模型,第一地址向量表示模型是利用第一風格地址庫中的地址文本進行訓練所得到的;
利用第二風格地址庫中的各地址文本,對第一地址向量表示模型進行基于自監督的風格遷移訓練,得到第二地址向量表示模型;
利用第二地址向量表示模型對第二風格地址庫中的各地址文本進行向量轉換處理,得到第二風格地址向量庫,其中,第二風格地址向量庫中包括有第二風格地址庫中的各地址文本所對應的地址向量;
利用第二地址向量表示模型和第二風格地址向量庫對具有第二風格的待處理地址文本進行基于正交空間的文本召回處理,得到召回文本。
可知的是,一方面,本實施方式通過利用具有第二風格的地址文本對已有的第一地址向量表示模型進行風格遷移訓練,以使得到可用于處理具有第二風格的地址的第二地址向量表示模型;另一方面,本實施方式的文本召喚處理是基于正交空間而實現的,通過這樣的方式能夠保證第二地址向量表示模型所輸出的第二風格地址向量庫和待處理地址文本的向量處于相同的正交空間,避免向量的空間偏移,提升方案的召回效果。
可選的,利用第二風格地址庫中的地址文本,對第一地址向量表示模型進行基于自監督的風格遷移訓練,得到第二地址向量表示模型,包括:利用第一地址向量表示模型對第二風格地址庫中的每一地址文本進行向量處理,得到第二風格地址庫中的每一地址文本對應的地址向量對;基于對比學習損失函數,利用第二風格地址庫中的每一地址文本對應的地址向量對,對第一地址向量表示模型進行自對比學習訓練,得到第二地址向量表示模型。
可知的是,本實施方式通過利用對比學習損失函數和第二風格地址庫中的每一地址文本對應的地址向量對,對第一地址向量表示模型進行自對比學習訓練,從而將地址向量表示模型從第一風格遷移至第二風格,而遷移后的第二地址向量表示模型能夠對具有第二風格的地址文本進行處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210192994.6/2.html,轉載請聲明來源鉆瓜專利網。





