日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種詞語詞向量的生成方法以及相似詞的確定方法在審

專利信息
申請號: 202110057200.0 申請日: 2021-01-15
公開(公告)號: CN112686033A 公開(公告)日: 2021-04-20
發明(設計)人: 林曉明;江金陵 申請(專利權)人: 上海明略人工智能(集團)有限公司
主分類號: G06F40/284 分類號: G06F40/284;G06F40/289;G06F40/216;G06K9/62
代理公司: 北京超成律師事務所 11646 代理人: 裴素英
地址: 200030 上海市徐匯區*** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 詞語 向量 生成 方法 以及 相似 確定
【權利要求書】:

1.一種詞語詞向量的生成方法,其特征在于,所述生成方法包括:

獲取樣本訓練語料以及詞間關系集,構建所述樣本訓練語料對應的樣本語料庫;

確定所述樣本語料庫中各個樣本詞語的初始詞向量,得到所述樣本語料庫的初始語料向量集;

按照所述詞間關系集中各個詞語相關關系的預設訓練順序,依次更新所述初始語料向量集中對應樣本詞語的初始詞向量,并迭代訓練所述初始語料向量集,得到所述各個樣本詞語的目標詞向量,其中,所述詞語相關關系包括弱關系,強關系以及相等關系;

基于所述各個樣本詞語的目標詞向量,構建所述樣本語料庫的目標語料向量集。

2.根據權利要求1所述的生成方法,其特征在于,通過以下步驟構建樣本語料庫:

對所述樣本訓練語料進行分詞處理,將所述樣本訓練語料拆分為多個樣本詞語;

基于所述多個樣本詞語構建所述樣本語料庫。

3.根據權利要求1所述的生成方法,其特征在于,所述確定所述樣本語料庫中各個樣本詞語的初始詞向量,得到所述樣本語料庫的初始語料向量集,包括:

將所述樣本語料庫中各個樣本詞語進行向量化處理,得到所述樣本語料庫中各個樣本詞語的原始向量;

使用Word2vec模型,對所述樣本語料庫中各個樣本詞語的原始向量進行訓練,得到所述樣本語料庫中各個樣本詞語的初始詞向量;

基于所述各個樣本詞語的初始詞向量,構建所述樣本語料庫的初始語料向量集。

4.根據權利要求1所述的生成方法,其特征在于,所述按照所述詞間關系集中各個詞語相關關系的預設訓練順序,依次更新所述初始語料向量集中對應樣本詞語的初始詞向量,并迭代訓練所述初始語料向量集,得到所述各個樣本詞語的目標詞向量,其中,所述詞語相關關系包括弱關系,強關系以及相等關系,包括:

根據所述詞間關系集的指示,從所述初始語料向量集中確定出互為弱關系的多組弱關系詞組中的每個樣本詞語的初始詞向量;

針對于每組弱關系詞語,使用所述弱關系詞組對應的均值詞向量替換該詞組中每個詞語的初始詞向量,得到更新后的初始語料向量集;

使用Word2vec模型,對所述更新后的初始語料向量集進行訓練,當訓練次數達到第一預設閾值時,得到所述更新后的初始語料向量集中各個樣本詞語的第一詞向量,并基于所述樣本詞語的第一詞向量構建第一詞向量集;

根據所述詞間關系集的指示,從所述第一詞向量集中確定出互為強關系的多組強關系詞組中的每個樣本詞語的第一詞向量;

針對于每組強關系詞語,使用所述強關系詞組對應的均值詞向量替換該詞組中每個詞語的第一詞向量,得到更新后的第一詞向量集;

使用Word2vec模型,對所述更新后的第一詞向量集進行訓練,當訓練次數達到第二預設閾值時,得到所述更新后的第一詞向量集中各個樣本詞語的第二詞向量,并基于所述樣本詞語的第二詞向量構建第二詞向量集;

根據所述詞間關系集的指示,從所述第二詞向量集中確定出互為相等關系的多組相等關系詞組中的每個樣本詞語的第二詞向量;

針對于每組相等關系詞語,使用所述相等關系詞組對應的均值詞向量替換該詞組中每個詞語的第二詞向量,得到更新后的第二詞向量集;

使用Word2vec模型,對所述更新后的第二詞向量集進行訓練,當訓練次數達到第三預設閾值時,停止訓練,得到所述更新后的第二詞向量集中各個樣本詞語的目標詞向量。

5.根據權利要求4所述的生成方法,其特征在于,通過以下步驟確定詞組對應的均值向量:

針對于每種詞語相關關系下的每組詞語,統計該詞組中每個詞語對應的詞向量;

將所述詞組中每個詞語的詞向量相加求均值,得到所述詞組的均值詞向量。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110057200.0/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产69精品久久99的直播节目| 91偷自产一区二区三区精品 | 久久精品国产精品亚洲红杏| 91精品婷婷国产综合久久竹菊 | 久久中文一区| 91丝袜国产在线观看| 狠狠色噜噜狠狠狠狠88| 日韩偷拍精品| 日本精品三区| 欧美高清性xxxx| 欧美一区二区三区免费播放视频了| 国产一区二区国产| 美女张开腿黄网站免费| 国产一区日韩一区| 国产精品高潮呻吟三区四区| 日韩国产精品一区二区| 亚洲精品日韩激情欧美| 91午夜在线观看| 四虎影视亚洲精品国产原创优播| 91精品国产高清一区二区三区 | 91精品国产高清一二三四区| 午夜影院伦理片| 538国产精品| 中文字幕在线乱码不卡二区区| 国产精品精品国内自产拍下载| 亚洲欧美一卡| 国产精品v一区二区三区| 日韩av在线播放网址| 日本一区二区三区在线看| 午夜欧美a级理论片915影院| 最新国产精品久久精品| 日韩欧美多p乱免费视频| 91亚洲精品国偷拍| 国产乱人伦精品一区二区| 久久夜靖品2区| 久久久人成影片免费观看| 97视频一区| 欧美色图视频一区| 美女啪啪网站又黄又免费| 国产欧美一区二区三区沐欲| 国产精自产拍久久久久久蜜| 欧美大片一区二区三区| 国产精品久久91| 精品999久久久| 91福利视频免费观看| 国产欧美一区二区三区在线播放| 狠狠色丁香久久综合频道| 国产日韩欧美一区二区在线观看 | 亚洲乱码av一区二区三区中文在线: | 99精品欧美一区二区三区美图| av国产精品毛片一区二区小说| 久久人91精品久久久久久不卡| 456亚洲精品| 国产欧美三区| 国产无遮挡又黄又爽又色视频 | 色乱码一区二区三区网站| 国产一区二区三区在线电影| 日本美女视频一区二区三区| 精品少妇一区二区三区| 国产一卡在线| 国产足控福利视频一区| 欧美国产亚洲精品| 日本一二区视频| 精品91av| 91婷婷精品国产综合久久| 国产电影精品一区二区三区| 制服丝袜视频一区| 中文字幕一区二区三区乱码| 亚洲欧美日韩综合在线| 国产精品亚洲第一区| 久久精品爱爱视频| 国产一区二区在| 乱淫免费视频| 欧美精品免费视频| 国产精品久久久久久久四虎电影| 午夜影院试看五分钟| 国产一区二区免费在线| 欧美精品亚洲一区| 亚洲欧美日韩国产综合精品二区 | 国产一区二区在线观看免费| 97国产婷婷综合在线视频,| 综合久久一区二区三区|