日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種跨領域知識遷移的標簽嵌入方法和裝置有效

專利信息
申請號: 201610804200.1 申請日: 2016-09-06
公開(公告)號: CN106649434B 公開(公告)日: 2020-10-13
發明(設計)人: 李攀登;孟慶婷;孫超;王煉 申請(專利權)人: 北京藍色光標品牌管理顧問股份有限公司
主分類號: G06F16/35 分類號: G06F16/35;G06F40/151
代理公司: 北京市安倫律師事務所 11339 代理人: 楊永波
地址: 100015 北京市朝*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 領域 知識 遷移 標簽 嵌入 方法 裝置
【權利要求書】:

1.一種跨領域知識遷移的標簽嵌入方法,其特征在于,包括以下步驟:

獲取源域和目標域的文本數據,對源域和目標域的文本數據進行分詞處理和模型表征,求解源域和目標域中關鍵詞的詞向量參數,并進行從源域到目標域的關鍵詞標簽的遷移;

以源域和目標域中的關鍵詞的詞向量參數為基礎構建隨機抽取向量組,根據隨機抽取的關鍵詞的詞向量參數間的余弦值作為分支依據,構建隨機森林;

采用隨機森林最近鄰方法獲取源域與目標域中已標注的關鍵詞的最近鄰,將已標注的關鍵詞的關鍵詞標簽賦權給最近鄰的關鍵詞,得到擴展后的關鍵詞標簽;

根據抽取的用戶級的文本數據,進行用戶級關鍵詞標簽的標注;

以關鍵詞的詞向量參數和用戶級關鍵詞標簽為基礎,根據用戶的點擊和/或訪問數據信息,動態優化用戶級關鍵詞標簽部分的參數;

從目標域中獲取新的用戶級文本數據,進行用戶級關鍵詞標簽的標注預測和排序,并輸出結果。

2.根據權利要求1所述的跨領域知識遷移的標簽嵌入方法,其特征在于,所述對源域和目標域的文本數據進行模型表征,求解源域和目標域中關鍵詞的詞向量參數,包括:

建立連接源域和目標域數據特征的綜合似然損失函數,其中,所述綜合似然損失函數由極大似然損失函數和共享正則函數構成;

采用kernel-based高斯核算法模型度量共享正則函數;

對極大似然損失函數進行轉化;

采用異步隨機梯度下降算法對綜合似然損失函數進行迭代優化求解,得到源域和目標域中關鍵詞的詞向量參數。

3.根據權利要求2所述的跨領域知識遷移的標簽嵌入方法,其特征在于,所述對極大似然損失函數進行轉化,事先需要對源域和目標域中的關鍵詞采用Huffman編碼,編碼后產生的路徑節點的分支采用Logistic分類預測。

4.根據權利要求1所述的跨領域知識遷移的標簽嵌入方法,其特征在于,所述采用隨機森林最近鄰方法獲取源域與目標域中已標注的關鍵詞的最近鄰,將已標注的關鍵詞的關鍵詞標簽賦權給最近鄰的關鍵詞,得到擴展后的關鍵詞標簽,包括:

搜索每棵樹上具有關鍵詞標簽的關鍵詞的最近鄰關鍵詞,并將已標注的關鍵詞的關鍵詞標簽賦權給最近鄰的關鍵詞;

對所有樹上具有相同關鍵詞標簽的關鍵詞進行匯總和緊鄰排序,得到擴展后的關鍵詞標簽及關鍵詞標簽所包含的關鍵詞集合。

5.根據權利要求1所述的跨領域知識遷移的標簽嵌入方法,其特征在于,所述以關鍵詞的詞向量參數和用戶級關鍵詞標簽為基礎,根據用戶點擊和/或訪問的數據信息,動態優化用戶級關鍵詞標簽部分的參數,包括:

以用戶級關鍵詞標簽作為本步驟的一個輸入源,以用戶在線廣告投放的點擊反饋和廣告或訪問渠道的數據信息作為另一個輸入源,將二者的概率分布進行聯合,構建聯合似然損失函數;

采用隨機梯度下降算法對所述聯合似然損失函數進行迭代優化求解,獲得用戶級關鍵詞標簽部分的參數。

6.根據權利要求5所述的跨領域知識遷移的標簽嵌入方法,其特征在于,所述用戶級關鍵詞標簽的標注服從多項分布,對應的關鍵詞的詞向量參數為其特征,所述用戶在線廣告投放的點擊反饋服從二項分布,廣告或訪問渠道的數據信息為其對應的擴展特征。

7.一種應用權利要求1-6中任一項所述方法的跨領域知識遷移的標簽嵌入裝置,包括:

獲取模塊,用于獲取源域和目標域的文本數據;

分詞模塊,用于對獲取的源域和目標域的文本數據進行分詞處理;

模型表征模塊,用于求解源域和目標域中關鍵詞的詞向量參數;

遷移模塊,用于根據得到的源域和目標域中關鍵詞的詞向量參數,將源域中的關鍵詞標簽遷移至目標域;

擴展模塊,用于采用隨機森林最近鄰方法獲取源域與目標域中已標注的關鍵詞的最近鄰,將已標注的關鍵詞的關鍵詞標簽賦權給最近鄰的關鍵詞,得到擴展后的關鍵詞標簽;

標注模塊,用于根據抽取的用戶級的文本數據,進行用戶級關鍵詞標簽的標注;

動態優化模塊,用于以上述模塊得到的關鍵詞的詞向量參數和用戶級關鍵詞標簽為基礎,根據用戶的點擊和/或訪問數據信息,進行動態優化,調整用戶級關鍵詞標簽的標注;

標注預測模塊,用于從目標域中獲取新的用戶級文本數據,進行用戶級關鍵詞標簽的標注預測和排序,并輸出結果。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京藍色光標品牌管理顧問股份有限公司,未經北京藍色光標品牌管理顧問股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610804200.1/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: **毛片免费| 99精品区| 免费观看又色又爽又刺激的视频| 中文字幕理伦片免费看| 欧美精品免费看| 国产精品乱码久久久久久久久| 国产视频一区二区视频| 狠狠色噜噜狠狠狠狠2021天天| 亚洲国产欧美一区二区三区丁香婷| 69久久夜色精品国产69–| 欧美一区二区三区在线视频观看| 99精品国产一区二区三区麻豆 | av中文字幕一区二区| 久久国产精品-国产精品| 猛男大粗猛爽h男人味| 香蕉视频一区二区三区| 久99久精品| 国产精品视频久久| 精品国产一区二区三区高潮视| 国产高清不卡一区| 日韩av在线中文| 狠狠色狠狠色合久久伊人| 97人人模人人爽人人喊小说| 97精品国产aⅴ7777| 年轻bbwbbw高潮| 99精品黄色| 欧美国产一区二区三区激情无套 | 91精品国产高清一二三四区| 久99精品| 视频一区欧美| 国产中文字幕91| 91一区二区三区久久国产乱 | 97久久精品人人做人人爽50路| 91精品福利观看| 满春阁精品av在线导航| 99国产精品免费观看视频re| 久久婷婷国产综合一区二区| 国产欧美视频一区二区三区| 国产欧美精品va在线观看| 电影午夜精品一区二区三区| 一区二区三区在线观看国产| 久久免费视频99| 久久二区视频| 国产农村妇女精品一二区| 99国精视频一区一区一三| 一区二区午夜| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 欧美日韩九区| 久久久久亚洲| 久久久精品欧美一区二区| 日韩av在线网| 91精品久久久久久综合五月天| 欧美日韩精品在线播放| 中文字幕一二三四五区| 国产精品久久久久免费a∨大胸| 91久久国产露脸精品国产护士| 午夜影院啊啊啊| 亚洲午夜国产一区99re久久| 一区二区三区中文字幕| 麻豆精品久久久| 欧美色综合天天久久| 亚洲精品国产精品国自产网站按摩| 精品国产乱码久久久久久图片| 精品国产免费一区二区三区| 免费午夜在线视频| 欧美一区二三区人人喊爽| 99国产精品久久久久99打野战| 欧美精品日韩| 国产三级国产精品国产专区50| 国产精品一区一区三区| 久久99精品久久久秒播| 夜夜嗨av色一区二区不卡| 91午夜精品一区二区三区| 国产精品视频久久| 福利片午夜| 午夜免费av电影| 日韩亚洲欧美一区| 国产一区二区综合| 91精品国产综合久久国产大片| 国产精品视频二区不卡| 国产精品乱码久久久久久久久| 丰满岳妇伦4在线观看|