日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專(zhuān)利]一種基于成詞率的領(lǐng)域詞識(shí)別方法及裝置有效

專(zhuān)利信息
申請(qǐng)?zhí)枺?/td> 202110377911.6 申請(qǐng)日: 2021-04-08
公開(kāi)(公告)號(hào): CN113051912B 公開(kāi)(公告)日: 2023-01-20
發(fā)明(設(shè)計(jì))人: 方正云;楊政;李萍;尹春林;劉柱揆 申請(qǐng)(專(zhuān)利權(quán))人: 云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院
主分類(lèi)號(hào): G06F40/289 分類(lèi)號(hào): G06F40/289;G06F40/216;G06F16/335;G06F16/35
代理公司: 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 11363 代理人: 逯長(zhǎng)明;許偉群
地址: 650217 云南省昆*** 國(guó)省代碼: 云南;53
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 成詞率 領(lǐng)域 識(shí)別 方法 裝置
【說(shuō)明書(shū)】:

本申請(qǐng)涉及文本處理技術(shù)領(lǐng)域,提供一種基于成詞率的領(lǐng)域詞識(shí)別方法及裝置,所述一種基于成詞率的領(lǐng)域詞識(shí)別方法包括:獲取某一領(lǐng)域的文本數(shù)據(jù),對(duì)文本數(shù)據(jù)進(jìn)行文本預(yù)處理得到第一文本;對(duì)第一文本中的字符串進(jìn)行成詞率計(jì)算及閾值篩選,獲得第一候選詞集;利用第一候選詞集對(duì)第一文本進(jìn)行切分,獲得第二候選詞集;根據(jù)第一候選詞集,采用回溯算法,對(duì)第二候選詞集進(jìn)行篩選,獲得第三候選詞集;對(duì)第三候選詞集進(jìn)行常用詞過(guò)濾,獲得第四候選詞集;對(duì)第四候選詞集進(jìn)行向量化及聚類(lèi)處理,獲得領(lǐng)域詞詞集。上述基于成詞率的領(lǐng)域詞識(shí)別方法有效提高了領(lǐng)域詞識(shí)別的準(zhǔn)確性,并具有更高的領(lǐng)域詞識(shí)別效率。

技術(shù)領(lǐng)域

本申請(qǐng)屬于文本處理技術(shù)領(lǐng)域,具體涉及一種基于成詞率的領(lǐng)域詞識(shí)別方法及裝置。

背景技術(shù)

領(lǐng)域詞是指通過(guò)語(yǔ)言或文字來(lái)表達(dá)或限定專(zhuān)業(yè)概念的約定性語(yǔ)言符號(hào),常出現(xiàn)在某些特定領(lǐng)域,而很少在與特定領(lǐng)域不相關(guān)的領(lǐng)域出現(xiàn)。比如繼電器是電力領(lǐng)域詞,低碳是環(huán)保領(lǐng)域詞,人工智能是計(jì)算機(jī)領(lǐng)域詞。在當(dāng)前這個(gè)各行各業(yè)都處于信息爆炸的時(shí)代,時(shí)刻都會(huì)有海量語(yǔ)料涌入數(shù)據(jù)庫(kù)。對(duì)這些語(yǔ)料進(jìn)行自然語(yǔ)言處理技術(shù)的量化分析首先需要的就是分詞,其主要依賴(lài)基于詞典的匹配。由此可見(jiàn),領(lǐng)域詞詞庫(kù)可以對(duì)其領(lǐng)域文檔進(jìn)行有效的分詞,從而進(jìn)一步量化分析。

領(lǐng)域詞識(shí)別是指從現(xiàn)有相關(guān)文本數(shù)據(jù)中抽取出候選詞集,并對(duì)候選詞集進(jìn)行加工處理得到某一領(lǐng)域的領(lǐng)域詞集合的過(guò)程。某一領(lǐng)域的文本數(shù)據(jù),包括科技項(xiàng)目文本、期刊和論文等,是具有較高研究?jī)r(jià)值的專(zhuān)業(yè)領(lǐng)域資源,有較為規(guī)范的格式。領(lǐng)域詞是其領(lǐng)域文本數(shù)據(jù)的重要構(gòu)成單元,與文本主題及研究領(lǐng)域高度相關(guān)。因此,從某一領(lǐng)域的文本數(shù)據(jù)中識(shí)別領(lǐng)域詞是構(gòu)建領(lǐng)域詞詞庫(kù)的基礎(chǔ),也對(duì)了解和把握該領(lǐng)域發(fā)展現(xiàn)狀以及未來(lái)趨勢(shì)具有重要的理論和現(xiàn)實(shí)意義。

傳統(tǒng)的領(lǐng)域詞識(shí)別方法主要有基于詞語(yǔ)統(tǒng)計(jì)特性的方法、基于規(guī)則的方法以及基于序列模式機(jī)器學(xué)習(xí)的方法。基于詞語(yǔ)統(tǒng)計(jì)特性的方法,即通過(guò)統(tǒng)計(jì)字符串的相關(guān)統(tǒng)計(jì)特征來(lái)判斷該字符串是否可以構(gòu)成一個(gè)詞語(yǔ),主要用到的參數(shù)有頻率、似然比和互信息等。利用統(tǒng)計(jì)的方法雖然方便簡(jiǎn)單,但由于缺少詞性的規(guī)則會(huì)遺留較多垃圾字串和非領(lǐng)域詞,仍然需要進(jìn)行人工的篩選。基于規(guī)則的方法通常將漢語(yǔ)成詞規(guī)則與一些領(lǐng)域先驗(yàn)知識(shí)結(jié)合,這種方法雖然準(zhǔn)確性相對(duì)較高,但是泛化能力差,需要大量相關(guān)領(lǐng)域知識(shí)和人工構(gòu)建規(guī)則。基于序列模式機(jī)器學(xué)習(xí)方法譬如通過(guò)條件隨機(jī)場(chǎng)模型訓(xùn)練,也需要大量人工標(biāo)注語(yǔ)料,耗時(shí)耗力。

為了節(jié)省人力成本,近些年來(lái),人們致力于研究不需要人力干預(yù)的領(lǐng)域詞識(shí)別無(wú)監(jiān)督方法。現(xiàn)有技術(shù)公開(kāi)了一種基于聚類(lèi)算法的電力文本詞典構(gòu)造方法,包括利用通用的詞典對(duì)文本進(jìn)行分詞,再通過(guò)word2vec模型進(jìn)行詞向量構(gòu)造,最后進(jìn)行k-means聚類(lèi)。現(xiàn)有技術(shù)還提出了依賴(lài)互信息或鄰接熵得到候選詞集,進(jìn)而利用word2vec進(jìn)行詞向量轉(zhuǎn)化和k-means聚類(lèi),最終得到行業(yè)領(lǐng)域詞。然而,此類(lèi)方法在篩選候選詞集時(shí)對(duì)詞語(yǔ)組合規(guī)律運(yùn)用的不夠全面,篩選的候選詞集存在諸多不合理的詞語(yǔ),導(dǎo)致后期聚類(lèi)時(shí)工作量驟增,影響效率和準(zhǔn)確性。

發(fā)明內(nèi)容

本申請(qǐng)?zhí)峁┮环N基于成詞率的領(lǐng)域詞識(shí)別方法及裝置,以提供一種準(zhǔn)確性和識(shí)別效率更高的領(lǐng)域詞識(shí)別方法及裝置。

本申請(qǐng)第一方面提供一種基于成詞率的領(lǐng)域詞識(shí)別方法,所述一種基于成詞率的領(lǐng)域詞識(shí)別方法包括:

獲取某一領(lǐng)域的文本數(shù)據(jù),對(duì)所述文本數(shù)據(jù)進(jìn)行文本預(yù)處理得到第一文本,所述文本預(yù)處理包括去除掉停用詞和標(biāo)點(diǎn)符號(hào);

根據(jù)所述第一文本中字符串的互信息、左右熵、構(gòu)詞規(guī)律以及預(yù)設(shè)的最長(zhǎng)詞語(yǔ)長(zhǎng)度,利用成詞率模型,獲得所述字符串的成詞率,所述成詞率模型為:

Suc=1/m(Mut+k1×Adjl+k2×Adjr)-Reg(a,b)

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,未經(jīng)云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110377911.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

×

專(zhuān)利文獻(xiàn)下載

說(shuō)明:

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū);

2、支持發(fā)明專(zhuān)利 、實(shí)用新型專(zhuān)利、外觀(guān)設(shè)計(jì)專(zhuān)利(升級(jí)中);

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專(zhuān)利網(wǎng)在線(xiàn)咨詢(xún)

周一至周五 9:00-18:00

咨詢(xún)?cè)诰€(xiàn)客服咨詢(xún)?cè)诰€(xiàn)客服
tel code back_top
主站蜘蛛池模板: 亚洲欧美日韩三区| 久久一级精品| 亚洲一区欧美| 国产一级片一区| 一区二区精品在线| 国产精品久久国产精品99 | 国产91在| 天摸夜夜添久久精品亚洲人成| xoxoxo亚洲国产精品| 狠狠躁天天躁又黄又爽| 日本高清不卡二区| 国产中文字幕一区二区三区| 97人人模人人爽人人喊小说| 国产剧情在线观看一区二区| 影音先锋久久久| 久久艹国产精品| 日韩欧美高清一区二区| 亚洲欧美一卡二卡| 国产精品你懂的在线| 国产精品高潮在线| 久久99精品国产麻豆婷婷洗澡 | 亚州精品国产| 中文字幕av一区二区三区高| 精品国产区一区二| 欧美三区视频| 久草精品一区| 欧美精品国产一区| 欧美精品一区二区久久| 国产精品中文字幕一区| 精品国精品国产自在久不卡| 热re99久久精品国99热蜜月| 亚洲码在线| 狠狠躁天天躁又黄又爽| 国产日韩欧美综合在线| 国产视频精品一区二区三区| 国产日韩欧美91| 国产无套精品久久久久久| 精品国产乱码久久久久久老虎| 国产一区不卡视频| 久久国产欧美视频| 九九视频69精品视频秋欲浓| 日韩不卡毛片| 在线精品国产一区二区三区88 | 97国产婷婷综合在线视频,| 国产69精品久久久久777糖心| 久久激情综合网| 国产一区二区三区伦理| 国产精品二区一区| 99精品小视频| 午夜亚洲影院| 国产二区免费| 国产二区免费视频| 国产精品日韩三级| 激情久久久| 久久久一区二区精品| 国产精品综合在线观看| 中文字幕国内精品| av午夜在线观看| 中文字幕日韩精品在线| 国产不卡三区| 国产日韩一区二区三免费| 91麻豆精品国产91久久久更新资源速度超快 | 国产精品久久久久99| 99爱精品视频| 精品一区二区三区自拍图片区| 高清欧美xxxx| www.午夜av| 精品国产伦一区二区三区| 精品婷婷伊人一区三区三| 狠狠躁日日躁狂躁夜夜躁av| 销魂美女一区二区| 色一情一交一乱一区二区三区| 日本午夜精品一区二区三区| 国产69精品久久| 国产精品一区不卡| 国产精品v欧美精品v日韩| 国产一级二级在线| 国产性猛交| 精品国产亚洲一区二区三区| 日韩中文字幕一区二区在线视频 | 久久久综合亚洲91久久98| 国产欧美www| 精品视频久| 日本一区二区三区中文字幕| 精品一区电影国产| 91精品国产一区二区三区| 国产免费观看一区| 好吊妞国产欧美日韩软件大全| 91亚洲精品国偷拍自产| 激情aⅴ欧美一区二区三区| 亚洲欧美一二三| 日韩一级在线视频| 日韩无遮挡免费视频| 久久国产精品免费视频| 欧美色图视频一区| 亚洲国产精品日韩av不卡在线| 日韩av在线网| 狠狠色噜噜狠狠狠四色米奇| 欧美老肥婆性猛交视频| 特高潮videossexhd| 一本色道久久综合亚洲精品图片| 97久久精品人人做人人爽50路| 国产精品欧美日韩在线| 亚洲欧美日韩另类精品一区二区三区 | 国产一区二区免费在线| 亚洲精品久久久中文| 亚洲精品久久久久久动漫| 日本一区免费视频| 国产亚洲精品精品国产亚洲综合| 91久久免费| 国产精品视频久久久久| 欧美激情在线观看一区| 国产视频在线一区二区| 性刺激久久久久久久久九色| 国产精品麻豆自拍| 午夜三级大片| 久久综合国产精品| 国产91免费观看| 国产日产精品一区二区| 国产乱码精品一区二区三区中文| 国产伦精品一区二区三区免费观看| 日本三级不卡视频| 国产欧美日韩二区| 午夜一级电影| 国产综合久久精品| 高清欧美精品xxxxx在线看| 亚洲国产精品肉丝袜久久| 亚洲一区二区福利视频| 91精品视频一区二区| 夜夜躁狠狠躁日日躁2024| 国产精品高潮呻吟88av| 欧美在线播放一区| 麻豆精品一区二区三区在线观看| 日韩欧美精品一区二区三区经典| 欧美hdfree性xxxx| 国产伦高清一区二区三区 | 一区精品二区国产| 黄色国产一区二区| 国产日韩欧美另类| 国产aⅴ一区二区| 蜜臀久久久久久999| 99久久久久久国产精品| 久久国产激情视频| 国产淫片免费看| 91看片淫黄大片91| 亚洲综合日韩精品欧美综合区| 国产一区二区三区的电影| 日韩精品久久久久久久酒店| 日韩欧美一区精品| 欧美精品国产一区| 91久久香蕉国产日韩欧美9色| 久久精品视频一区二区| 久久久久久国产精品免费| 欧美一区二区三区四区五区六区| 狠狠躁天天躁又黄又爽| 91亚洲欧美强伦三区麻豆| 日韩精品少妇一区二区在线看| 狠狠躁夜夜躁人人爽天天天天97 | 一区二区三区四区中文字幕| 午夜国产一区二区三区四区| 欧美日韩久久一区二区| 亚洲欧美日韩在线看| 一区二区中文字幕在线| 少妇性色午夜淫片aaa播放5| а√天堂8资源中文在线| 免费精品一区二区三区第35| 欧美日韩激情在线| 狠狠色狠狠色很很综合很久久| 亚洲欧美一卡二卡| 久久精品麻豆| 色婷婷综合久久久久中文| 日本精品视频一区二区三区| 中文字幕一区二区三区免费视频| 欧美乱码精品一区二区三| 亚洲精品乱码久久久久久国产主播| 91一区二区三区在线| 午夜社区在线观看| 97欧美精品| 欧美视屏一区| 狠狠躁天天躁又黄又爽| 久久久久亚洲| 亚洲国产精品精品| 国产精品一卡二卡在线观看| 亚洲第一天堂无码专区| 丰满少妇在线播放bd日韩电影| 日本99精品| 国内精品久久久久久久星辰影视 | 国产.高清,露脸,对白| 免费在线观看国产精品| 麻豆精品久久久| 99久久精品一区| 日韩欧美国产中文字幕| 久久久久国产精品www| 91亚洲欧美强伦三区麻豆 | 欧美一级日韩一级| 制服.丝袜.亚洲.另类.中文| 欧美精品一区二区性色| 日韩欧美一区二区久久婷婷| 国产麻豆91视频| 亚洲va欧美va国产综合先锋| 亚洲va欧美va国产综合先锋| 亚洲国产偷| 亚洲色欲色欲www| 国产另类一区| 国产精品视频久久久久久| 久久精品综合视频| 一区二区三区日韩精品| 日韩精品一区二区不卡| 91精品一区在线观看| 国产一区二区精品在线| 91麻豆精品国产91久久| 欧美在线免费观看一区| 国产一区二区三区国产| 国产一区二区在线观| 亚洲精品www久久久| 午夜肉伦伦| 欧美一区二区三区三州| 97人人模人人爽人人喊小说| 亚洲欧洲一二三区| 久久精品国产亚| 日韩欧美多p乱免费视频| 日韩精品乱码久久久久久| 26uuu亚洲国产精品| 国产午夜精品一区二区三区四区| 久久综合伊人77777麻豆| 国产99小视频| 国产精品一区二区麻豆| 国产在线拍揄自揄拍| 精品国产一区二区三| 国产欧美一区二区精品久久| 91精品国产影片一区二区三区| 国产区一二| 欧美精品第一区| 国产欧美亚洲精品第一区软件| 国产不卡三区| 热99re久久免费视精品频软件 | 日韩av在线中文| 欧美激情视频一区二区三区| 午夜黄色网址| 国产亚洲精品久久久久动| 99国产精品免费| 国产日韩欧美网站| 国产不卡三区| 欧美一区二区三区四区五区六区| 国产精选一区二区| 国产在线视频二区|