日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于多義詞和同義詞的聚類矯正方法在審

專利信息
申請號: 202310248724.7 申請日: 2023-03-15
公開(公告)號: CN116384378A 公開(公告)日: 2023-07-04
發明(設計)人: 鄭志松;林鋒;吳運昌;丁仙峰 申請(專利權)人: 江蘇數兌科技有限公司
主分類號: G06F40/247 分類號: G06F40/247;G06F40/289;G06F40/216;G06F18/23;G06F40/211;G06F40/30;G06F18/22
代理公司: 南京知識律師事務所 32207 代理人: 李湘群
地址: 210001 江蘇省南京市秦淮區永智路*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 多義詞 同義詞 矯正 方法
【說明書】:

發明公開了一種基于多義詞和同義詞的聚類矯正方法,包括以下步驟:構建文本語料庫并統計文本的詞頻信息;在文本的上下文中找出含有多義詞或同義詞的句子;對于多義詞,提取原始句子的特征向量,進行多義矯正,計算詞向量的余弦相似度;對于同義詞,使用word2vec模型訓練文本的上下文重建文本語料庫,將單詞表示成一個長向量,輸入到機器學習模型當中作為語料庫,進行同義矯正,將數字存儲在哈希表中;進行迭代優化,計算梯度,并在非葉節點處提取向量;本方案通過關注聚類過程中的多義詞和同義詞問題,使用詞袋模型來區分相同詞語的語境以及通過word2vec模型來重新聚類具有相似含義的詞,達到聚類過程糾正的目的。

技術領域

本發明涉及文本聚類領域,特別涉及一種基于多義詞和同義詞的聚類矯正方法。

背景技術

在機器學習中,一個重要的任務就是需要定量化描述數據中的集聚現象。聚類分析也是模式識別和數據挖掘領域一個極富有挑戰性的研究方向,它是在無監督學習下探索數據對象的合適的簇的過程,在探索過程中,簇與簇之間的數據對象差異越來越明顯,簇內的數據對象之間差異越來越小。最終在已知無標簽的數據集上找到合適的簇,將這些無標簽的數據合理的劃分到合適的簇中。其中,文本聚類是聚類分析在文本中的應用,它主要應用于自動化文檔管理、主題抽取和快速信息檢索過濾等方面。一般來說,文檔聚類有兩種常見的算法。第一種是基于層次的算法,這種算法并不能有效地處理所有的問題;另一種算法是使用K-means算法及其變體的開發;一方面,分層算法可以詳細分析并生成更深入的信息,另一方面,基于K-means算法及其變體的算法對深入信息挖掘更為有效,并為大多數模型提供足夠的樣本信息。

然而,近年來,隨著互聯網技術日新月異,信息規模指數級增長,每一天都能夠帶來海量信息,這些信息大部分來自一些主流平臺,這些信息往往具有短文本、口語化、富含噪聲、網絡迭代快等特點,因此傳統的聚類算法并不適合,要想及時的挖掘出文本中潛在的語義關聯并不容易。要對海量文本進行聚類分析不僅需要有強大的數據分析與處理能力,更需要對語義信息進行修正,從而能夠更好的契合現實發展的需要。

現有的聚類方法包括凝聚聚類、具有噪聲的基于密度的空間聚類應用density-based?spatial?clustering?of?applications?with?noise、高斯混合聚類等。它們具有一些相同的缺陷:在文檔聚類過程中,文本和語句通常表示為向量,在這種情況下,許多多義詞不能被很好的描述。一方面,某些名詞或者縮寫有時會干擾特定區域的聚類過程;另一方面,許多相似的詞或短句不能很好的收集在一起,在某種程度上造成語義信息的丟失,這使得聚類算法在特定場景中的應用變得不夠準確。它們也有一些不同的缺陷:凝聚聚類在聚類的過程中,由于每次只能合并兩個簇,導致這一過程的計算復雜度高,因此這種聚類方法不適用于大數據量的聚類;具有噪聲的基于密度的空間聚類應用在遇到簇之間的密度不均勻的場景下,聚類效果將會非常差,并且它跟凝聚聚類一樣,無法對新的數據進行預測;高斯混合聚類的缺點是計算量大,導致該方法的性能存在局限。

在聚類過程,有時會將含義相似的詞語分配在同一類中,這降低了聚類的準確性,有時這個問題存在于一個單詞和一個短語之間,盡管他們的意思是相近的,但它們的形式卻不同,這需要從實際的語境來考察這些詞句之間的異同。

發明內容

為此,需要提供一種通過關注聚類過程中的多義詞和同義詞問題,使用詞袋模型來區分相同詞語的語境以及通過word2vec模型來重新聚類具有相似含義的詞,提高聚類算法、達到聚類過程糾正的作用。

為實現上述目的,發明人提供了一種基于多義詞和同義詞的聚類矯正方法,包括以下步驟:

S101、構建文本語料庫并統計文本的詞頻信息;

S102、在文本的上下文中找出含有多義詞或同義詞的句子;

S103、對于多義詞,使用詞袋模型提取原始句子的特征向量;

S104、對于多義詞,在詞袋模型中,保留多義詞的上下文作為特征向量;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇數兌科技有限公司,未經江蘇數兌科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202310248724.7/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 在线电影一区二区| 北条麻妃久久99精品| 午夜色大片| 6080日韩午夜伦伦午夜伦| 国产精品白浆一区二区| 毛片大全免费看| 美女被羞羞网站视频软件| 久久99精品久久久大学生| 亚洲国产精品97久久无色| 欧美精品中文字幕亚洲专区| 99久久婷婷国产亚洲终合精品| 久久97国产| 麻豆精品国产入口| 国产88av| 国产日韩欧美亚洲综合| 在线观看v国产乱人精品一区二区| 久久久久久亚洲精品中文字幕| 午夜影院h| 国产资源一区二区| 欧美一级特黄乱妇高清视频| 久久精品视频一区二区| 少妇厨房与子伦免费观看| 国产精品9区| 欧美极品少妇| 午夜影院黄色片| 一区二区精品久久| 91亚洲欧美强伦三区麻豆| 手机看片国产一区| 2023国产精品久久久精品双| 久久久一区二区精品| 国产乱码精品一区二区三区中文| 精品国产乱码久久久久久虫虫 | 亚洲福利视频二区| 欧美乱妇在线视频播放| 午夜情所理论片| 岛国精品一区二区| 午夜无遮挡| 一区二区三区日韩精品| 日本午夜无人区毛片私人影院| 激情久久一区| 欧美在线一级va免费观看| 欧美精品免费视频| 日韩av不卡一区二区| 99视频一区| 欧美亚洲精品suv一区| 久久两性视频| 国产男女乱淫视频高清免费| 国产69精品久久久久久| 国产一级片自拍| 午夜剧场伦理| 午夜免费av电影| 91精品美女| 午夜色大片| 综合色婷婷一区二区亚洲欧美国产| 精品国产乱码一区二区三区在线| 在线精品视频一区| www.成| 欧美久久一区二区三区| 热久久国产| 亚洲精品日韩色噜噜久久五月| 国产91精品高清一区二区三区| 农村妇女精品一二区| 欧美日韩一区二区三区在线播放| 久久九精品| 亚洲欧美日韩国产综合精品二区| 亚洲精品久久久久一区二区| 国产精品视频1区| 羞羞免费视频网站| 精品特级毛片| 综合久久色| 99国产精品99久久久久久粉嫩| 狠狠色狠狠色综合系列| 国产日韩欧美在线影视| 国产伦精品一区二| 国产99久久久久久免费看| 亚洲午夜天堂吃瓜在线| 激情欧美一区二区三区| 欧美一级片一区| 国产麻豆91视频| 99久久夜色精品| 亚洲欧美日韩在线看| 国产免费一区二区三区四区五区 | 亚洲精华国产欧美| 亚洲精品日本久久一区二区三区| 精品免费久久久久久久苍| 91av中文字幕| 97人人模人人爽视频一区二区| 国产91丝袜在线熟| 亚洲四区在线| 国产一区免费播放| 国产88av| 欧美精选一区二区三区| 日韩精品一区二区三区中文字幕| 国产高清在线一区| 99热久久精品免费精品| 欧美午夜一区二区三区精美视频| 日韩欧美一区二区久久婷婷| 一区二区三区国产精品| 日韩精品久久一区二区三区| 91午夜在线观看| 国产91九色在线播放| 国产精品久久久麻豆| 夜夜嗨av色一区二区不卡| 久久艹亚洲| 国产麻豆精品一区二区| 久爱视频精品| 538国产精品一区二区在线| 色乱码一区二区三在线看| 亚洲欧美另类久久久精品2019| 国产黄一区二区毛片免下载| 国产男女乱淫真高清视频免费| 国产精品日韩高清伦字幕搜索| 理论片午午伦夜理片在线播放| 91免费看国产| 欧美精品日韩精品| 私人影院av| 欧美一区二区综合| 日本看片一区二区三区高清| 男女视频一区二区三区| 日韩欧美中文字幕精品| 久久久久久久久亚洲精品| 偷拍精品一区二区三区| 欧美一区二粉嫩精品国产一线天| 国产精品99久久久久久宅男| 国产91热爆ts人妖在线| 首页亚洲欧美制服丝腿 | 国产精品偷乱一区二区三区| 99精品国产99久久久久久97 | 国产午夜精品一区二区三区视频| 91精品一区二区在线观看| 久久99精品久久久大学生| 免费xxxx18美国| 偷拍区另类欧美激情日韩91| 久久久久久中文字幕| 国内精品99| 久久久精品久久日韩一区综合| 一区二区国产精品| 欧美高清极品videossex| 国产乱子一区二区| 国产一二三区免费| 亚洲欧美国产精品一区二区| 国产韩国精品一区二区三区| 日韩精品一区三区| 精品国产一区二区三区国产馆杂枝| 狠狠插影院| 亚洲精品久久久久中文字幕欢迎你 | 日韩偷拍精品| 国产日韩欧美亚洲综合| 欧美日韩一区二区三区在线观看视频| 99精品黄色| 国产精品伦一区二区三区级视频频 | 欧美一级免费在线视频| 国产精品麻豆自拍| 精品美女一区二区三区| 夜夜爽av福利精品导航| 国产日韩欧美网站| 精品久久不卡| 狠狠色噜噜狠狠狠狠777| 日韩不卡毛片| 国产综合久久精品| 性视频一区二区三区| 国产盗摄91精品一区二区三区| 欧美日韩国产免费观看| 国产69精品福利视频| 狠狠躁夜夜躁2020| 国产精品一区二区6| 国产.高清,露脸,对白| 午夜天堂在线| 国产精品国产三级国产专区55 | 亚洲国产视频一区二区三区| 欧美激情精品久久久久久免费| 久久久精品a| 中日韩欧美一级毛片| 欧美日韩一区二区三区在线播放| 日韩一区二区福利视频| 九一国产精品| 日韩午夜电影在线| 日本一区二区三区中文字幕| 在线观看黄色91| 国产精品久久久av久久久| 国产精品一级片在线观看| 一区二区国产盗摄色噜噜| 国产在线精品一区| 91看片片| 一区二区三区欧美视频| 欧美日韩中文国产一区发布| 国产欧美日韩在线观看| 国产一区二区在线精品| 日韩国产不卡| 中文字幕天天躁日日躁狠狠躁免费 | 一区二区久久久久| 国产精品视频免费看人鲁| 97国产精品久久| 国产伦精品一区二区三区四区| 精品99在线视频| 国久久久久久| 91久久国产露脸精品国产| 久久综合国产精品| 国产精品99久久久久久宅男| 日韩欧美亚洲视频| 狠狠色很很在鲁视频| а√天堂8资源中文在线| 狠狠色噜噜狠狠狠狠2021天天| 国产精品日韩电影| 欧美一区二区三区激情在线视频| 91亚洲欧美强伦三区麻豆| 国产高清在线精品一区二区三区| 99国产精品永久免费视频 | 亚洲精品国产精品国自| 国偷自产中文字幕亚洲手机在线| 高清国产一区二区三区| 国产欧美精品久久| 亚洲精品国产一区| 亚洲国产欧美一区二区三区丁香婷| 国产99网站| 国产一区日韩欧美| 国产九九九精品视频| 韩日av一区二区| 国产午夜一级片| 亚洲码在线| 91精品婷婷国产综合久久竹菊 | 日本高清一二三区| 亚洲欧美v国产一区二区| 狠狠色狠狠色综合日日2019 | 国产精品99999999| 国产精品自产拍在线观看桃花| 国产精品视频1区| 国产片91| 日本xxxx护士高潮hd| 思思久久96热在精品国产| 狠狠色噜噜狠狠狠狠米奇7777| 91精品第一页| 91久久国产露脸精品国产护士| 国产精品不卡一区二区三区| 午夜电影毛片| 欧美极品少妇xxxxⅹ| 午夜免费片| 国产精品久久久久久久综合| 亚洲一二区在线观看| 国产精品一二三四五区| 日本一区欧美| 一区二区久久久久| 国产精选一区二区| 91视频国产九色| 亚洲国产一区二| 蜜臀久久久久久999|