日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于數值-字符串混合編碼的中文文檔基因量化與表征方法有效

專利信息
申請號: 201610407743.X 申請日: 2016-06-12
公開(公告)號: CN107491423B 公開(公告)日: 2021-03-30
發明(設計)人: 李巖 申請(專利權)人: 北京云量數盟科技有限公司
主分類號: G06F40/126 分類號: G06F40/126
代理公司: 北京方安思達知識產權代理有限公司 11472 代理人: 陳琳琳;楊青
地址: 100012 北京*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 數值 字符串 混合 編碼 中文 文檔 基因 量化 表征 方法
【權利要求書】:

1.一種基于數值-字符串混合編碼的中文文檔基因量化與表征方法,其步驟包括:

步驟1)提取待處理文檔的28種混合特征并生成文檔基因向量;

步驟2)獲取文檔基因向量中的一個文檔特征;

步驟3)提取該文檔特征的一個特征要素;

步驟4)判斷這個特征要素是否為數值型,如果為是,則對這個文檔特征要素按照數值型編碼方式編碼,進入步驟5);否則,對這個文檔特征要素按照字符串向量型編碼方式編碼,進入步驟5);

步驟5)判斷這個特征要素是否為該文檔特征最后的特征要素,如果為否,則加入文檔特征要素之間的分隔符編碼并且跳轉到步驟3),否則,進入步驟6);特征要素之間的分隔符的ASCII表示“,”,十六進制編碼為2C;

步驟6)將該文檔特征的所有特征要素的編碼和特征要素之間的分隔符編碼組合形成這個文檔特征的編碼;

步驟7)判斷該文檔特征是否為文檔基因向量最后的文檔特征,如果為否,則加入文檔特征之間的分隔符編碼并且跳轉到步驟2),否則,進入步驟8);文檔特征間的分隔符的ASCII表示為“%”,十六進制編碼為25;

步驟8)將該文檔特征的所有特征的編碼和文檔特征之間的分隔符編碼組合形成這個文檔基因的編碼;

文檔基因的28種混合特征分為數值型特征和字符串向量型特征,其中數值型類型的文檔特征包括文件大小、文件創建時間、文件修改時間、文檔字數、文檔句數和文檔段數;字符串向量類型的文檔特征包括文件名稱,MD5,SHA1,SHA256,SHA512,文檔類型,文檔標題,文檔類別,文檔備注,文檔作者,文檔修訂號,文檔最后一次保存者,摘要,分詞,關鍵詞,短語,命名實體,依存句法,MinHash,SimHash,段間順序和句間順序;

所述步驟1)具體包括:

(1)接收需要處理的文檔文件;

(2)獲取文檔文件的類型,判斷是否可以處理,如果不可以處理,跳轉到步驟(20);

(3)對文檔文件進行預處理,解決文檔字符編碼問題;

(4)獲取文件名稱、文件大小、文件創建時間、文件修改時間這些文件基本的特征屬性;

(5)使用MD5、SHA1、SHA256和SHA512哈希算法計算文檔文件的哈希值;

(6)匯總文件名稱、文件大小、文件創建時間、文件修改時間和文件哈希值,綜合形成文檔載體特征;

(7)讀取文檔獲取文檔的附加信息,包括文檔類型、文檔標題、文檔類別、文檔備注、文檔作者、文檔修訂號和文檔最后一次保存者這些文檔固有屬性信息;

(8)讀取文檔統計文檔內容的信息,包括統計文檔字數、文檔句數和文檔段數;

(9)匯總固有屬性和統計屬性,綜合形成文檔屬性特征;

(10)使用N-最短路徑算法來進行獲取分詞,得到文檔的分詞結果;

(11)使用步驟(10)的分詞結果,通過TextRank算法獲取摘要;

(12)使用步驟(10)的分詞結果,通過TextRank算法獲取關鍵詞;

(13)使用步驟(10)的分詞結果,通過基于互信息和左右信息熵提取識別短語;

(14)使用步驟(10)的分詞結果,使用基于層疊隱馬爾可夫模型的方法,提取命名實體;

(15)對文檔進行基于CRF序列標注的中文依存句法分析;

(16)使用MinHash和SimHash算法分別計算文檔MinHash值和SimHash值,組合形成局部敏感哈希;

(17)使用步驟(13)的短語結果,使用短語順序組來標識一個段落或者一個句子,按照出現順序為每個段落短語順序組和句子短語順序組賦予一個順序值;使用段落短語順序組和順序值來表示段間順序;使用句子短語順序組和順序值來表示句間順序;

(18)匯總文檔語義要素和順序關系形成文檔內容特征;文檔語義要素包括分詞、摘要、關鍵詞、短語、命名實體、依存句法和局部敏感哈希值;順序關系包括段間順序和句間順序;

(19)將獲取到的文檔載體特征、文檔屬性特征和文檔內容特征進行組合,形成文檔基因向量;

(20)流程結束。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京云量數盟科技有限公司,未經北京云量數盟科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610407743.X/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美在线一级va免费观看| 香港三日三级少妇三级99| 男女视频一区二区三区| 秋霞av电影网| 91麻豆精品国产91久久久资源速度| 欧美一区二区久久| 色乱码一区二区三在线看| 精品国产乱码久久久久久影片| 亚洲精品国产一区二| 国产一卡二卡在线播放| 国产精品电影一区二区三区| 波多野结衣女教师电影| 国产在线精品一区二区| 日本一二区视频| 国产一区二区在| 亚洲精品中文字幕乱码三区91| 亚洲国产精品激情综合图片| 亚洲精品国产setv| 精品国产乱码久久久久久免费| 97视频一区| 国产一区网址| 狠狠色噜噜狠狠狠狠米奇777| 久久婷婷国产综合一区二区| 国产伦精品一区二区三区免费下载| 精品久久一区| 国产亚洲精品久久yy50| 国产毛片精品一区二区| 午夜wwwww| 日韩精品中文字幕一区二区三区| 亚洲五码在线| 在线观看欧美一区二区三区| 久久夜色精品国产噜噜麻豆| 国产91清纯白嫩初高中在线观看| 日韩精品一区在线视频| 欧美一区二区三区免费看| 丰满岳乱妇bd在线观看k8| 精品国产一二区| 国产欧美日韩另类| 日韩a一级欧美一级在线播放| 国产精品三级久久久久久电影| 亚洲精品日韩激情欧美| 91精品国产高清一区二区三区| 亚洲第一天堂无码专区 | 亚洲在线久久| 猛男大粗猛爽h男人味| 农村妇女精品一区二区| 一本大道久久a久久精品| 在线精品国产一区二区三区 | 久久久久久国产一区二区三区| 夜夜躁人人爽天天天天大学生| 91超碰caoporm国产香蕉| 国产精品一区二区久久乐夜夜嗨 | 国产精一区二区| 午夜影院一区二区| 精品国产乱码久久久久久久久| 国产97久久| 在线国产一区二区| 国产香蕉97碰碰久久人人| 欧美日韩久久一区| 亚洲精品国产久| 日本一二三区电影| 97久久超碰国产精品| 狠狠色噜噜狠狠狠狠88| 亚洲精品日本无v一区| 日韩av一区不卡| 狠狠色丁香久久婷婷综| 男人的天堂一区二区| 久久久精品欧美一区二区免费| 午夜伦全在线观看| 欧美日韩综合一区| 91亚洲欧美日韩精品久久奇米色| 日韩av中文字幕第一页| 国产一区二区伦理| 日韩av电影手机在线观看| 香港三日三级少妇三级99| 国产精品自拍不卡| 曰韩av在线| 欧美一级久久精品| 亚洲精品无吗| 少妇高潮大叫喷水| 色噜噜狠狠色综合久| 久久密av| 天堂av一区二区| 久久不卡精品| 国产女人与拘做受免费视频| 欧美精品粉嫩高潮一区二区 | 国产精品乱码一区| 欧美日韩一级在线观看| 久久中文一区| 国产欧美一区二区三区不卡高清| 午夜电影天堂| 精品一区欧美| 性欧美一区二区三区| 久久精品男人的天堂| 国产一卡二卡在线播放| 91麻豆精品国产91久久久久| 欧美精品国产精品| 国产精品99久久久久久宅男| 日本少妇高潮xxxxⅹ| 久久99国产精品视频| 男人的天堂一区二区| 国产精品亚洲一区二区三区| 国产在线一卡二卡| 国产精品欧美久久| 电影午夜精品一区二区三区| 国产精品久久久久久久久久久久久久久久 | 亚洲一区二区福利视频| 国产一区二区在线观| 欧美性xxxxx极品少妇| 精品视频在线一区二区三区| 国产日本一区二区三区| 精品久久久久久亚洲综合网 | 久久精品国产色蜜蜜麻豆| 91精品系列| 日本精品99| 91黄色免费看| 国产真实乱偷精品视频免| 国产91刺激对白在线播放| 亚洲精品suv精品一区二区| 特高潮videossexhd| 久久影院国产精品| 日本精品99| 精品无人国产偷自产在线| 91精品丝袜国产高跟在线| 日本一区二区三区在线看| 欧美69精品久久久久久不卡| 国产www亚洲а∨天堂| 91麻豆国产自产在线观看hd| 国产亚洲久久| 日韩精品免费一区二区夜夜嗨| 欧美老肥婆性猛交视频| 亚洲高清乱码午夜电影网| 国产日韩欧美不卡| 大桥未久黑人强制中出| 日韩欧美国产中文字幕| 日韩精品一区二区三区四区在线观看 | 国产99网站| 国内精品久久久久久久星辰影视 | 午夜看片网| 国产亚洲精品久久777777 | 一区二区三区欧美日韩| 国产高潮国产高潮久久久91| 一区二区三区在线影院| 欧美高清性xxxx| 国产偷国产偷亚洲清高| 久久综合国产伦精品免费| 扒丝袜网www午夜一区二区三区| 国产麻豆91欧美一区二区| 国产一区激情| 国产品久精国精产拍| 欧美一区二区三区久久综合| 久久aⅴ国产欧美74aaa| 精品国产1区2区| 蜜臀久久99精品久久久| 国产99小视频| 国产精品无码永久免费888| 中文字幕亚洲欧美日韩在线不卡| 久久久综合亚洲91久久98| 日韩欧美国产第一页| 片毛片免费看| 欧美777精品久久久久网| 日韩亚洲精品在线| 97国产精品久久久| 91看片app| 久久精品入口九色| 北条麻妃久久99精品| 玖玖玖国产精品| 久久精品国产色蜜蜜麻豆| 国产在线不卡一| 国产精品欧美久久久久一区二区 | 香港日本韩国三级少妇在线观看| 久久午夜无玛鲁丝片午夜精品| 色一情一乱一乱一区免费网站| 浪潮av网站| 久久综合伊人77777麻豆最新章节| 国产免费一区二区三区四区| 国产精品国精产品一二三区| 91精品婷婷国产综合久久竹菊| 一区二区久久精品| 亚洲欧美日韩一级| 激情欧美一区二区三区| 午夜影院黄色片| 久久精品国产精品亚洲红杏| 久久99国产视频| 夜夜嗨av一区二区三区中文字幕| 久久久中精品2020中文| 日本少妇高潮xxxxⅹ| 日本99精品| 国语对白一区二区| 国产欧美一区二区精品久久久| 久久久精品a| 一区二区三区精品国产| 91精品系列| 国产一区二区中文字幕| 欧美亚洲国产日韩| 精品国产乱码久久久久久图片| 午夜无遮挡| 国产99久久九九精品免费| 欧美精品中文字幕在线观看| 欧美一区二区三区片| 午夜影院试看五分钟| 午夜av影视| 高清国产一区二区三区| 国产精品无码专区在线观看| 国产麻豆精品久久| 国产欧美一区二区在线观看| 91av精品| 丰满少妇在线播放bd日韩电影| 国产欧美一二三区| 91九色精品| 久久国产精品-国产精品| 国产乱对白刺激视频在线观看| 91高清一区| 精品免费久久久久久久苍| 精品国产乱码久久久久久图片| 2020国产精品自拍| 国产91九色视频| 91日韩一区二区三区| 国产亚洲久久| 欧美一区二区激情三区| 欧美精品久久一区二区| 二区三区免费视频| 亚洲乱在线| 午夜av电影院| 99热久久精品免费精品| 国产在线一二区| 久久99精品国产麻豆婷婷| 久久久久久久久久国产精品| 日本三级香港三级| 97精品国产aⅴ7777| 久久人人爽爽| 欧美视屏一区| 国产精品免费一视频区二区三区| 人人玩人人添人人澡97| 国产精品久久久爽爽爽麻豆色哟哟 | 日韩精品久久一区二区三区| 好吊妞国产欧美日韩软件大全| 在线观看黄色91| 护士xxxx18一19| 黑人巨大精品欧美黑寡妇| 久久天天躁狠狠躁亚洲综合公司| 91理论片午午伦夜理片久久| 91精品一二区| 午夜爽爽爽男女免费观看| 欧美乱大交xxxxx胶衣| 国产一区二区黄|