日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于預分類的短文本關鍵詞提取方法及系統(tǒng)有效

專利信息
申請?zhí)枺?/td> 201710053710.4 申請日: 2017-01-22
公開(公告)號: CN106886576B 公開(公告)日: 2018-04-03
發(fā)明(設計)人: 蔡禹;紀曉陽;孔祥明;張一帆;林成創(chuàng) 申請(專利權)人: 廣東廣業(yè)開元科技有限公司
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 廣州嘉權專利商標事務所有限公司44205 代理人: 譚英強
地址: 510623 廣東省廣州市天*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 分類 文本 關鍵詞 提取 方法 系統(tǒng)
【權利要求書】:

1.一種基于預分類的短文本關鍵詞提取方法,其特征在于:該方法包括的步驟有:

將短文本全量數(shù)據(jù)集劃分為多個短文本子數(shù)據(jù)集;

采用短文本預分類方式以及通用條數(shù)最優(yōu)值,對多個短文本子數(shù)據(jù)集分別進行關鍵詞特征詞典的生成處理,從而生成得到每一個短文本子數(shù)據(jù)集所對應的關鍵詞特征詞典;

利用每一個關鍵詞特征詞典分別相對應對每一個短文本子數(shù)據(jù)集進行關鍵詞權重系數(shù)的累計計算;

根據(jù)每一個短文本子數(shù)據(jù)集的關鍵詞權重系數(shù)累計計算結果,對短文本全量數(shù)據(jù)集進行關鍵詞提取處理;

所述短文本子數(shù)據(jù)集所對應的關鍵詞特征詞典,其生成步驟包括有:

從短文本子數(shù)據(jù)集中選取出一個包含有s條短文本的短文本微數(shù)據(jù)集,其中,s的數(shù)值為通用條數(shù)最優(yōu)值;

對短文本微數(shù)據(jù)集中所包含的短文本進行分類,然后將屬于同一類別的短文本拼接成相對應的長文本;

采用TF-IDF算法對每一條長文本中的詞語進行TF-IDF值計算,計算出每一條長文本中詞語的TF-IDF值;

根據(jù)預設的第一閾值,對每一條長文本的詞語的TF-IDF值進行閾值判斷,然后將每一條長文本中TF-IDF值大于第一閾值的詞語提取出來;

將提取出來的詞語及其對應的TF-IDF值存儲至關鍵詞特征詞典中時,判斷關鍵詞特征詞典中是否已存儲有該詞語,若否,則將該詞語及其對應的TF-IDF值存儲至關鍵詞特征詞典中;反之,則判斷待存儲的詞語所對應的TF-IDF值是否大于已存儲在關鍵詞特征詞典中的該詞語所對應的TF-IDF值,若是,則采用待存儲的詞語所對應的TF-IDF值替換已存儲在關鍵詞特征詞典中的該詞語所對應的TF-IDF值,反之,則不改變已存儲在關鍵詞特征詞典中的該詞語所對應的TF-IDF值。

2.根據(jù)權利要求1所述一種基于預分類的短文本關鍵詞提取方法,其特征在于:所述通用條數(shù)最優(yōu)值,其確定獲取步驟包括有:

計算每一個短文本子數(shù)據(jù)集所對應的條數(shù)最優(yōu)值,然后從計算得出的所有條數(shù)最優(yōu)值中選取數(shù)值最大的條數(shù)最優(yōu)值作為通用條數(shù)最優(yōu)值。

3.根據(jù)權利要求2所述一種基于預分類的短文本關鍵詞提取方法,其特征在于:所述短文本子數(shù)據(jù)集所對應的條數(shù)最優(yōu)值,其計算步驟包括有:

從短文本子數(shù)據(jù)集中選取出一個包含有n條短文本的短文本微數(shù)據(jù)集,其中,n值小于等于s0,s0表示為短文本子數(shù)據(jù)集所包含的短文本的總條數(shù);

根據(jù)選取出的短文本微數(shù)據(jù)集,生成該短文本子數(shù)據(jù)集所對應的關鍵詞特征詞典;

判斷當前生成的關鍵詞特征詞典與前一次生成的關鍵詞特征詞典之間的差異是否滿足預設的判定標準,若是,則將前一次的n值作為該短文本子數(shù)據(jù)集所對應的條數(shù)最優(yōu)值;反之,則對當前n值進行減小處理后得到新的n值,利用新的n值返回重新執(zhí)行上述從短文本子數(shù)據(jù)集中選取出一個包含有n條短文本的短文本微數(shù)據(jù)集這一步驟。

4.根據(jù)權利要求3所述一種基于預分類的短文本關鍵詞提取方法,其特征在于:所述對當前n值進行減小處理后得到新的n值這一步驟,其具體為:將當前n值與10的相除結果作為新的n值。

5.根據(jù)權利要求1-4任一項所述一種基于預分類的短文本關鍵詞提取方法,其特征在于:所述對短文本子數(shù)據(jù)集進行關鍵詞權重系數(shù)的累計計算,其所采用的計算公式為:

Wi=ai*wi,i=1、2、……、m

其中,m表示為關鍵詞特征詞典中所包含的詞語的總個數(shù),Wi表示第i個關鍵詞的權重系數(shù)累計計算結果,ai表示在關鍵詞特征詞典中所存儲的第i個詞語在短文本子數(shù)據(jù)集所包含的所有短文本中所出現(xiàn)的次數(shù),wi表示為在關鍵詞特征詞典中所存儲的第i個詞語所對應的TF-IDF值。

6.根據(jù)權利要求1-4任一項所述一種基于預分類的短文本關鍵詞提取方法,其特征在于:所述根據(jù)每一個短文本子數(shù)據(jù)集的關鍵詞權重系數(shù)累計計算結果,對短文本全量數(shù)據(jù)集進行關鍵詞提取處理這一步驟,其具體為:

對每一個短文本子數(shù)據(jù)集的關鍵詞權重系數(shù)累計計算結果進行降序,從而獲得每一個短文本子數(shù)據(jù)集的關鍵詞排序結果,然后對所有短文本子數(shù)據(jù)集的關鍵詞排序結果進行匯總計算,接著對匯總計算結果進行排序和閾值過濾操作,從而得到短文本全量數(shù)據(jù)集的關鍵詞提取結果。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東廣業(yè)開元科技有限公司,未經(jīng)廣東廣業(yè)開元科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710053710.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产性猛交| 久久精品国产一区二区三区不卡| 久久午夜精品福利一区二区| 亚洲视频精品一区 | xxxx18hd护士hd护士| 国产欧美一区二区三区沐欲| 国产91麻豆视频| 91精品国产91热久久久做人人| 亚洲自拍偷拍一区二区三区| 91在线一区二区| 精品一区欧美| 婷婷嫩草国产精品一区二区三区| 精品少妇一区二区三区 | 国产一区二区二| 大bbw大bbw巨大bbb| 国产精品96久久久| 综合欧美一区二区三区| 精品国产1区2区3区| 欧美激情视频一区二区三区免费| 99国产精品| 岛国黄色av| 国产二区视频在线播放 | 国产精品视频1区2区3区| 久久久久久亚洲精品| 欧美极品少妇| 欧美色图视频一区| 欧美日韩一区视频| 91九色精品| 午夜一二区| 九九视频69精品视频秋欲浓| 国产999精品视频| 久久夜色精品国产噜噜麻豆| 久久精品一| 夜夜躁日日躁狠狠久久av| 午夜免费av电影| 国产麻豆一区二区三区精品| 久久久中精品2020中文| 午夜激情影院| 韩国女主播一区二区| 国产精品美女一区二区视频| 农村妇女毛片精品久久| 国产三级精品在线观看| 国产精品欧美久久| 91精品综合| 美女销魂免费一区二区| 亚洲国产精品综合| 国产aⅴ精品久久久久久| 一区二区免费在线观看| 国产一区二区免费在线| 91精品美女| 亚洲欧美日韩三区| 狠狠色丁香久久婷婷综合_中| 国产91在线拍偷自揄拍| 日韩女女同一区二区三区| 国产日韩欧美在线影视| 亚洲网站久久| 国产男女乱淫真高清视频免费| 狠狠躁天天躁又黄又爽| xxxx在线视频| 91丝袜国产在线观看| 91社区国产高清| 国产91刺激对白在线播放| _97夜夜澡人人爽人人| 欧美髙清性xxxxhdvid| 国产91久| 91精品第一页| 99精品黄色| freexxxxxxx| 日韩av在线播放网址| 精品一区二区三区影院| 亚洲一区二区三区加勒比| 91热精品| 国产韩国精品一区二区三区| 中文文精品字幕一区二区| 26uuu亚洲国产精品| 国产亚洲久久| 国产专区一区二区| 国产91久| 国产韩国精品一区二区三区| 激情久久综合网| 国产在线卡一卡二| 91久久精品国产亚洲a∨麻豆 | 色婷婷精品久久二区二区蜜臂av| 亚洲伊人久久影院| 精品a在线| 午夜激情看片| 国产在线一二区| 秋霞av电影网| 国产精品二区在线| 午夜av影视| 久久免费精品国产| 一区二区免费播放| 九色国产精品入口| 狠狠色噜噜狠狠狠狠2021免费| 国产一区在线免费观看| 国产视频二区| 国产一区二区三区精品在线| 国产99视频精品免费视频7 | 国产乱色国产精品播放视频| 97人人模人人爽人人喊38tv| 日本一二三四区视频| 国产v亚洲v日韩v欧美v片| 2023国产精品久久久精品双| 欧美精品日韩| 午夜片在线| 久久一区欧美| 99久久www免费| 免费午夜在线视频| 中文字幕国内精品| 狠狠色噜噜狠狠狠狠黑人| 女人被爽到高潮呻吟免费看| 欧美日韩一区二区三区精品| 免费超级乱淫视频播放| 国产一区二区在线免费| 国产农村妇女精品一区二区| 午夜亚洲影院| 狠狠色综合久久婷婷色天使| 狠狠躁日日躁狂躁夜夜躁| 国产1区在线观看| xxxx18hd护士hd护士| 欧美日韩一区二区三区四区五区| 一区二区免费播放| 精品国产二区三区| 欧美日韩激情一区| 日韩午夜一区| 精品国产一区二区三区高潮视| 狠狠色噜噜狠狠狠狠| 欧美在线视频三区| 伊人久久婷婷色综合98网| 国产精品一二三区免费| 久久99精品一区二区三区| www.成| 日韩精品在线一区二区三区| 国产一区二区三区国产| 久久99久久99精品蜜柚传媒| 一区二区欧美精品| 久久国产精品波多野结衣| 国产一区二区a| 国产呻吟久久久久久久92| 少妇av一区二区三区| 日本一二三区视频| 亚洲欧美日本一区二区三区 | 国产精品6699| 人人要人人澡人人爽人人dvd| 狠狠躁天天躁又黄又爽| 91久久国产露脸精品国产护士| 国产精品视频一二区| 日韩一区高清| 国产视频精品久久| 久久久精品中文| 国产91久久久久久久免费| xxxx国产一二三区xxxx| 精品国产一区二区三区久久久久久| 性old老妇做受| 午夜精品一区二区三区在线播放| 国产色婷婷精品综合在线播放 | 久久国产精品久久| 国产亚洲精品久久19p| 7777久久久国产精品| 麻豆91在线| 91精品久久久久久综合五月天 | 亚洲欧洲精品一区二区三区不卡| 欧美性xxxxx极品少妇| 99国产精品丝袜久久久久久| 国产有码aaaae毛片视频| 一色桃子av| 国产日韩欧美二区| 国产91丝袜在线| 香蕉av一区| 国内少妇自拍视频一区| 国产va亚洲va在线va| 国产精品二区一区二区aⅴ| 国产二区免费| 国产一区二三| 中文字幕一区二区三区又粗| 亚洲精品少妇久久久久| 欧美一区二区久久| 少妇太爽了在线观看免费| 欧美日韩精品在线一区| 亚洲欧美一卡二卡| 国产在线视频二区| 久久99久久99精品蜜柚传媒| 亚洲神马久久| 亚洲国产aⅴ精品一区二区16| 日韩精品一区二区三区不卡 | 美女被羞羞网站视频软件| 亚洲精品国产精品国产| 日韩精品中文字幕一区二区| 国产精品一区二区人人爽| 午夜影院伦理片| 国产一区日韩精品| 国产伦精品一区二区三区免| 国产足控福利视频一区| 欧洲另类类一二三四区| 久久人人精品| 国产精华一区二区精华| 美国三级日本三级久久99| 国产午夜精品一区二区理论影院 | 88国产精品欧美一区二区三区三| 日韩欧美国产另类| 久草精品一区| 香蕉av一区| 亚洲精品久久久久999中文字幕| 久久夜色精品亚洲噜噜国产mv| 99久久国产综合| 在线精品一区二区| 99日本精品| 亚洲视频h| 国产一区二区电影在线观看| 国产高潮国产高潮久久久91| 鲁一鲁一鲁一鲁一鲁一av| 国产高清精品一区二区| 久久亚洲精品国产一区最新章节| 51区亚洲精品一区二区三区| 欧美激情片一区二区| 色噜噜狠狠一区二区| 精品国产91久久久| 国产精品乱战久久久| 亚洲精品日日夜夜| 国产一级片一区| 国产呻吟高潮| 午夜电影三级| 日韩精品免费一区二区中文字幕| 国产欧美亚洲一区二区| 特级免费黄色片| 久久久久亚洲精品视频| 国产品久久久久久噜噜噜狼狼| 国产一区二区在| 91麻豆精品国产91久久久资源速度| 国产精品色婷婷99久久精品| 国产经典一区二区| 91午夜精品一区二区三区| 婷婷午夜影院| 国产人澡人澡澡澡人碰视 | 91波多野结衣| 91精品www| 亚洲欧美国产日韩综合| 国产一区亚洲一区| 国产清纯白嫩初高生视频在线观看| 国产资源一区二区| 国产伦精品一区二区三区免费下载| 亚洲欧美另类综合| 久久99精品久久久久国产越南| 欧美在线视频一区二区三区| 99久久99精品| 国产麻豆一区二区|