日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]文本模式識別方法有效

專利信息
申請號: 201110367595.0 申請日: 2011-11-18
公開(公告)號: CN103123685A 公開(公告)日: 2013-05-29
發明(設計)人: 吳秦;張存銓;艾迪·福勒 申請(專利權)人: 江南大學
主分類號: G06K9/00 分類號: G06K9/00;G06K9/20
代理公司: 無錫互維知識產權代理有限公司 32236 代理人: 王愛偉
地址: 214122 江*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文本 模式識別 方法
【說明書】:

【技術領域】

發明涉及文本識別領域,尤其涉及文本模式識別方法。

【背景技術】

隨著網絡的發展和數字圖書館的出現,如何從海量的文本中快速獲取有效信息成為信息處理領域和模式識別領域的重要研究課題之一。如果我們能夠根據文本的內容對文本按照一定的分類體系進行自動分類標記,對不同的文本文件進行相似性分析,則可以更好地幫助人們組織及挖掘文本信息。

現有技術的實現方案:文本中的關鍵詞長期以來一直被用作文本文件的一個特征項。基于關鍵詞的重復頻率,我們通常用決策樹、網絡神經元、貝葉斯方法或者支撐向量機等方法對文本進行自動分類。對于不同文本之間的相似性比較,通常也是基于關鍵詞的重復頻率進行比較。

僅基于關鍵詞的重復頻率可以在一定程度上對文本進行比較粗略的大類劃分,但是當我們將該方法用于細分不同文本文件的相似性時,結果卻不是很好。這主要是因為:(1)僅利用關鍵詞的重復頻率這一方法忽略了關鍵詞與關鍵詞之間可能存在的相互依賴性。(2)傳統的方法也沒有利用文本文件的結構信息。這些都將直接影響文本文件分類結果和文本文件相似性比較結果。

因此,有必要開發出一種可以改進的文本模式識別方法來克服上述問題。

【發明內容】

本發明要解決的技術問題之一在于提供一種文本模式識別方法,其可以更多、更有效的保存了原始文本文件的特征信息,使得在進行文本分類及文本相似性計算時能得到更好的結果。

為了解決上述問題,根據本發明的一個方面,本發明提供了一種文本模式識別方法,其包括:逐行掃描原始文本文件,記錄每個關鍵詞在所述文本文件中出現的次數和位置;根據記錄的關鍵詞在所述文本文件中出現的次數和位置將所述文本文件映射為帶有多重邊的有向加權圖,其中所述帶有多重邊的有向加權圖中每個節點代表一個關鍵詞;將帶有多重邊的有向加權圖簡化為簡單有向加權圖;將所述簡單有向加權圖用矩陣來表示;和根據所獲得的矩陣及記錄的關鍵詞出現次數,將所述文本文件映射為文本特征向量。

進一步的,假設關鍵詞集為K={k1,k2,...,kn},關鍵字ki在所述文本文件中出現次數為fi,用F=[f1,f2,…,fn]表示所有關鍵詞的出現次數信息,i大于等于1小于等于n,n為大于等于1的自然數。

進一步的,帶有多重邊的有向加權圖中每個節點代表一個關鍵詞ki,若關鍵詞ki在所述文本文件中位置pi出現,關鍵詞kj在所述文本文件中位置pj出現,且位置pj在位置pi之后,則在帶有多重邊的有向加權圖中加一條有向邊kikj,有向邊kikj的權重為pi和pj之間的距離,若關鍵詞ki和關鍵詞kj在所述文本文件中出現多次,則在帶有多重邊的有向加權圖中用同樣的方法將這些在所述文本文件中不同位置出現的關鍵詞ki和kj映射為多重邊,j大于等于1小于等于n。

更進一步的,將帶有多重邊的有向加權圖簡化為簡單有向加權圖包括:

將帶有多重邊的有向加權圖的節點集合作為簡單有向加權圖的節點集合;

簡單有向加權圖中從節點ki到節點kj之間的有向邊表示為kikj,kikj的權值w(kikj)為:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江南大學,未經江南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201110367595.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 韩国女主播一区二区| 国产九九九精品视频| 欧美精品免费看| 久久精品男人的天堂| 国产在线卡一卡二| 欧美一区二区三区在线视频观看| 国产日韩欧美在线一区| 国产97在线看| 精品日韩久久久| xxxxx色| 国产jizz18女人高潮| 性欧美激情日韩精品七区| 国产精品亚洲第一区| 午夜爽爽视频| 亚洲精品欧美精品日韩精品| 国产欧美日韩另类| 亚洲va久久久噜噜噜久久0| 久久精品爱爱视频| 国产午夜精品一区二区三区视频 | 国产精品久久久久久久妇女| 亚洲国产精品91| 亚洲国产欧美一区二区丝袜黑人| 亚洲免费精品一区二区| 中文字幕日本一区二区| 亚洲欧美日韩精品suv| 久久不卡一区| ass美女的沟沟pics| 欧美色图视频一区| 日韩精品一区在线观看| 国产一区二区三区的电影| 国产二区三区视频| 久爱视频精品| 国产精品中文字幕一区| 亚洲精品www久久久久久广东| 浪潮av色| 免费欧美一级视频| 国产精品视频久久久久| 欧美髙清性xxxxhdvid| 岛国黄色网址| 91嫩草入口| 91免费视频国产| 久久精品手机视频| 国产一区二区三区午夜| 欧美一区二区三区免费电影| 国产伦精品一区二区三区电影 | 午夜影皖精品av在线播放| 欧美激情在线观看一区| 日本午夜一区二区| 躁躁躁日日躁网站| 久久九精品| 国产乱子伦农村xxxx| 国产欧美日韩在线观看| 日本一区二区三区免费视频| 99re热精品视频国产免费| 国产69精品福利视频| 69久久夜色精品国产69–| 亚洲自拍偷拍中文字幕| 欧美日韩一区二区电影| 97国产精品久久久| 午夜性电影| 国产精品乱综合在线| 国产午夜一级一片免费播放| 亚洲色欲色欲www| 亚洲无人区码一码二码三码 | 少妇特黄v一区二区三区图片| 日韩精品一区二区三区免费观看视频| 亚洲欧美日韩另类精品一区二区三区| 久久久久亚洲最大xxxx| 久久久久国产精品一区二区三区| 亚洲精品卡一卡二| 日韩欧美亚洲视频| 午夜肉伦伦| 欧美久久一区二区三区| 国产日韩欧美另类| 欧美精品在线视频观看| 中文字幕国内精品| 亚洲少妇中文字幕| 99久久久国产精品免费无卡顿| 一区二区三区精品国产| 久久er精品视频| 精品国产乱码久久久久久久| 国产精品久久久不卡|