日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于維基語義匹配的文檔分類方法及系統有效

專利信息
申請號: 201610712106.3 申請日: 2016-08-23
公開(公告)號: CN106372122B 公開(公告)日: 2018-04-10
發明(設計)人: 吳宗大;徐湖鵬 申請(專利權)人: 溫州大學甌江學院
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 武漢臻誠專利代理事務所(普通合伙)42233 代理人: 仲暉
地址: 325035 浙江省溫州市甌海經濟*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 語義 匹配 文檔 分類 方法 系統
【說明書】:

技術領域

發明屬于互聯網技術領域,更具體地,涉及一種基于維基語義匹配的文檔分類方法及系統。

背景技術

隨著萬維網技術的發展,在線文本文檔數量的爆炸式增長急需高效文本分類算法,以方便用戶實現對在線文本文檔的快速導航和瀏覽。傳統的文本文檔分類方法采用的通常是“關鍵詞文本匹配技術”,其基本思想是:首先,將文本文檔表示成關鍵詞的加權出現頻度向量,然后,以關鍵詞向量相關度作為文本文檔之間的相似性度量;即文本文檔之間的相似度通過分析文本文檔之間的共同關鍵字進行度量。然而,關鍵詞文本匹配技術由于僅僅考慮了文本文檔關鍵詞的表面文本信息,而沒有考慮關鍵詞的背后語義信息,導致了諸多問題,如多義詞引發語義混淆、同義詞引發的內容失配等,從而嚴重制約了該項技術的有效性。為此,學者們提出了“維基語義匹配技術”,其基本思想是:利用維基百科豐富的語義概念作為中間參考空間,將文本文檔從關鍵字空間中的一個關鍵詞向量映射為維基參考空間中的一個概念向量(每個元素對應一個維基概念),以獲取文本文檔背后所隱藏的語義信息。維基百科相比于其它知識本體具有以下優點:(1)寬廣的知識概念覆蓋范圍,易于為文本文檔確定相關的參考概念;(2)維基概念能夠及時有效更新,使得知識始終保持最新;(3)包含許多其它知識庫所沒有的最新詞匯。正是這些優點使得維基語義匹配技術能有效地解決關鍵字文本匹配技術所遇到的語義失配問題,從而提高了文本文檔相似度量的準確性。以下,我們通過一個具體例子來展示維基語義匹配相比于關鍵詞匹配的優越性。給定三個短文本文檔:

文本文檔一:“Puma,an American Feline Resembling a Lion(美洲豹,一種類似獅子的美洲貓科動物)”

文本文檔二:“Puma,a Famous Sports Brand from German(彪馬,來自于德國的一個著名運動品牌)”

文本文檔三:“Zoo,the Animal World(動物園,動物世界)”

由于多義詞引發的語義混淆問題,關鍵字匹配技術會認為文本文檔一和文本文檔二間的相似性要高于文本文檔一和文本文檔三間的相似性,因為文本文檔一和文本文檔三均蘊含同一關鍵詞Puma。在維基匹配技術中,利用關鍵詞匹配技術,三個文本文檔首先會被映射為維基參考空間中三個概念向量。由于文本文檔一中存在Feline和Lion等關鍵詞,因此與動物相關的維基概念將在文本文檔一的概念向量中擁有較高的相應元素值。而這些維基概念在文本文檔三的概念向量中也將同樣擁有較高的元素值,但在文本文檔二向量中卻擁有較低的元素值,因為文本文檔二不包含動物相關詞。所以,基于概念向量進行文本文檔相似性度量的維基語義匹配技術得出結論:相比于文本文檔二,文本文檔三與文本文檔一擁有更高的相似性。可以看出,維基匹配技術利用維基語義知識來分析文本文檔文本背后所蘊含的語義信息,較好地解決了關鍵字匹配技術所遇到的語義失配問題,從而提高了文本文檔相似性度量的準確性,進而提高了文本文檔分類性能。此外,許多研究成果也驗證了維基語義匹配的有效性。

然而,由于維基百科包含非常多概念文章,數量在千萬級別,因而在文本文檔的概念向量映射時,需要進行大量的全文關鍵詞匹配操作,極大地影響了維基語義匹配技術的執行性能,從而嚴重制約了它在在線文本文檔分類應用環境中的實際效用。為了提高計算效率,一種直接的做法是從維基百科中挑選出一小部分概念組建一個小規模的維基參考空間,以減少全文關鍵詞匹配操作的次數。例如,文獻提出使用1000個覆蓋各種主題的“特征概念”組建維基參考空間。然而,這種策略會極大地制約參考空間的知識語義覆蓋范圍,使得許多待分類文本文檔難以在參考空間里找到相關參考概念,導致文本文檔概念向量的元素值均為零,從而降低了文本文檔相似度量的準確性。實際上,如果僅使用維基百科的部分知識概念,那么維基百科的許多優點尤其是擁有寬廣的知識覆蓋范圍,也將不復存在。總而言之,維基語義匹配技術存在以下矛盾:一方面,若為了提高計算效率,而如果挑選較少的維基概念組建參考空間,則又難以保證語義知識覆蓋范圍,從而影響文本文檔相似性度量的準確性;另一方面,若為了確保知識覆蓋范圍,以提高相似度量性能,而挑選較多的維基概念組建參考空間,則又將嚴重降低文本文檔分類的執行效率。

發明內容

為了克服維基語義匹配方法所面臨的有效性和高效性之間的矛盾,本發明提供了一種基于維基語義匹配的文檔分類方法及系統,其目的在于通過結合關鍵詞和維基語義匹配,高效地計算文檔之間的相似性從而對文檔進行分類,由此解決現有文檔分類技術效率低或者不準確的技術問題。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于溫州大學甌江學院,未經溫州大學甌江學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610712106.3/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 午夜激情在线| 福利片91| 久久精品爱爱视频| 99精品一级欧美片免费播放| 激情久久一区二区三区| 国产精品亚洲第一区| 亚洲二区在线播放视频| 欧美高清性xxxx| av国产精品毛片一区二区小说| 少妇又紧又色又爽又刺激视频网站| 欧美精品六区| 精品少妇一区二区三区| 国产不卡一区在线| 秋霞av电影网| 午夜裸体性播放免费观看| 国产老妇av| 91精品国产91热久久久做人人| 亚洲欧洲日本在线观看| 国产伦理久久精品久久久久| 久久午夜精品福利一区二区| 日本午夜精品一区二区三区| 亚洲五码在线| 国产精品久久久麻豆| 国产aⅴ精品久久久久久| 综合久久激情| 欧美精品一区二区性色| 亚洲精品国产一区二区三区| 996久久国产精品线观看| 欧美一区二区三区免费视频| 99久久夜色精品| 国产伦精品一区二区三区免费下载| 国产一区2区3区| 欧美一区二三区人人喊爽| 亚洲精品国产setv| 91精品国产综合久久国产大片| 艳妇荡乳欲伦2| 国产在线干| 伊人欧美一区| 欧美日韩国产精品一区二区| 亚洲乱在线| 一区二区三区日韩精品| 国产精品不卡一区二区三区| 国产欧美精品一区二区三区小说| 午夜av在线电影| 99久久婷婷国产综合精品草原| 国产九九九精品视频| 欧美一区二区三区白人| 97视频久久久| 在线精品国产一区二区三区 | 久久精品入口九色| 免费在线观看国产精品| 91精品福利观看| 亚洲理论影院| 综合久久激情| 日韩av不卡一区| 免费午夜片| 欧美日韩国产精品综合| 国产88在线观看入口| 视频二区一区国产精品天天| 色噜噜狠狠色综合中文字幕| 欧美精品免费一区二区 | 国产三级欧美三级日产三级99| 波多野结衣巨乳女教师| 中文字幕日韩一区二区| 国产精品久久久久久亚洲调教| 综合国产一区| 午夜精品一区二区三区在线播放| 国产一区二区片| 国产全肉乱妇杂乱视频在线观看| **毛片在线免费观看| 国产伦精品一区二区三区免| 欧美乱妇高清无乱码一级特黄| 少妇在线看www| 大bbw大bbw巨大bbw看看| 91久久香蕉| 国产高清精品一区| 激情欧美一区二区三区| 久久一级精品视频| 国产欧美一区二区三区免费| 国产精品你懂的在线| 亚洲精品乱码久久久久久国产主播| 国产午夜精品av一区二区麻豆 | 狠狠色噜噜狠狠狠888奇米| 精品一区欧美| 国产精品6699| 狠狠色噜噜狠狠狠狠米奇777| 国产精品一区二区免费| bbbbb女女女女女bbbbb国产| 26uuu亚洲国产精品| 97国产婷婷综合在线视频,| 91精品黄色| 少妇bbwbbwbbw高潮| 99久久婷婷国产精品综合| 欧洲激情一区二区| 午夜一级免费电影| 国产99小视频| 狠狠色噜噜狠狠狠狠88| 91国偷自产中文字幕婷婷| 日韩精品一二区| 国产又黄又硬又湿又黄 | 少妇久久精品一区二区夜夜嗨| 91一区二区三区在线| 国产一区免费在线观看| 亚洲乱码av一区二区三区中文在线:| 久久精品视频中文字幕| 欧美极品少妇videossex| 中文无码热在线视频| 99久精品视频| 国产精品一区在线播放| 午夜免费av电影| 国产伦精品一区二区三区四区| 中文av一区| 日韩精品中文字幕一区| 免费看片一区二区三区| 99精品国产免费久久| 欧美精品在线观看视频| 日韩精品一区二区三区在线| 亚洲精品欧美精品日韩精品| 国产精品日韩一区二区| 日本一二三区电影| 国产乱老一区视频| 日韩毛片一区| 四虎精品寂寞少妇在线观看| 中文字幕在线一二三区| 99爱精品视频| 日韩区欧美久久久无人区| 婷婷嫩草国产精品一区二区三区| 99精品区| 亚洲国产欧美一区二区三区丁香婷| 午夜伦理片在线观看| 久久久人成影片免费观看| 欧美一区二区三区性| 亚洲一区欧美| 一区二区久久精品66国产精品| 国产精品对白刺激在线观看| 午夜精品一区二区三区三上悠亚 | 国产欧美一区二区精品婷| 久久国产欧美日韩精品| 一区二区在线国产| 中文乱码字幕永久永久电影| 一二三区欧美| 精品香蕉一区二区三区| 欧美精品国产精品| 午夜叫声理论片人人影院| 91精品福利观看| 日韩中文字幕区一区有砖一区| 国产精品v欧美精品v日韩| 午夜爽爽视频| 午夜天堂电影| 午夜激情免费电影| 国产极品美女高潮无套久久久| 99精品小视频| 国产一区二区免费在线| 狠狠色噜噜狠狠狠狠69| 色一情一乱一乱一区99av白浆| 欧美日韩精品中文字幕| www.久久精品视频| 久99久精品| 亚洲精品久久久久一区二区| 香蕉av一区| 精品一区中文字幕| 狠狠色狠狠色综合日日2019| 欧美激情视频一区二区三区免费| 国产日韩欧美精品一区二区| 欧美一级久久久| 波多野结衣女教师30分钟| 久久国产精品欧美| 国产一区二区精品在线| 国产二区不卡| 欧美一区二区三区白人| 丰满岳乱妇bd在线观看k8| 免费**毛片| 精品少妇一区二区三区| 国产一区=区| 欧美乱妇在线观看| 亚洲神马久久| 久久天天躁夜夜躁狠狠躁2022| 国产日韩欧美中文字幕| 国产精品视频1区| 91久久国产露脸精品国产| 久久99国产精品久久99果冻传媒新版本| 欧美午夜羞羞羞免费视频app | 一区二区久久精品| 91看片app| 国产精品电影一区二区三区| 欧美3级在线| 国产激情二区| 国产精品乱综合在线| 亚洲欧洲日本在线观看| 国产在线拍偷自揄拍视频| 日韩精品一区二区中文字幕| 国产午夜精品av一区二区麻豆| 国产伦精品一区二区三区免费观看| 亚洲国产精品一区二区久久hs | 国产精品视频1区| 亚洲国产99| 日韩一级在线视频| 欧美三区二区一区| 国产乱码一区二区| 四虎精品寂寞少妇在线观看| sb少妇高潮二区久久久久| 国产亚洲久久| 在线电影一区二区| 久久69视频| 久久99国产视频| 日本大码bbw肉感高潮| 国产视频一区二区三区四区| 日韩精品一区二区三区免费观看| 少妇中文字幕乱码亚洲影视| 欧美精品一区二区性色| 日韩精品乱码久久久久久| freexxxx性| 91亚洲欧美日韩精品久久奇米色| 国产日韩欧美网站| 少妇中文字幕乱码亚洲影视| 日韩精品久久一区二区| 91精品一区| 国产精品一区二区在线观看| 国产一级大片| 狠狠色噜噜狠狠狠狠色吗综合 | 少妇中文字幕乱码亚洲影视| 夜色av网站| 亚洲精品www久久久久久广东 | 97人人揉人人捏人人添| 久久久久久久国产| 99国产伦精品一区二区三区| 亚洲国产精品入口| 久久精品99国产精品亚洲最刺激 | 九九视频69精品视频秋欲浓| 国产91高清| 亚洲精品一区二区另类图片| 91亚洲欧美日韩精品久久奇米色| 四虎国产永久在线精品| 亚洲欧美一二三| 久久不卡精品| 99日韩精品视频| 久久99精品国产麻豆婷婷洗澡| 国产欧美日韩va另类在线播放| 久久久久久久久亚洲精品| 日韩国产精品一区二区| 欧美一区二三区人人喊爽| 亚洲国产99| 欧美一区二区三区白人| 国产乱了高清露脸对白| 午夜影院啊啊啊| 日韩av一二三四区|