日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]信息檢索向量空間模型硬件化實現方法無效

專利信息
申請號: 200810059855.6 申請日: 2008-02-22
公開(公告)號: CN101271467A 公開(公告)日: 2008-09-24
發明(設計)人: 陳天洲;鄭臻煒;黃江偉;施清松 申請(專利權)人: 浙江大學
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 杭州求是專利事務所有限公司 代理人: 林懷禹
地址: 310027浙*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 信息 檢索 向量 空間 模型 硬件 實現 方法
【說明書】:

技術領域

發明涉及信息檢索領域和定制化硬件領域,特別是涉及一種信息檢索向量空間模型硬件化實現方法。

背景技術

在信息檢索領域,信息檢索服務系統的任務有:(1)獲取無結構化的文檔,做一定的標準化處理,(2)將獲取的文檔維護在一個海量文檔庫中,(3)響應用戶的查詢請求,從文檔庫中找到與查詢關鍵字匹配度最高的文檔,返回給用戶。這三個任務中,其中(3)對效率的要求最高,要求系統能夠在最短的時間內響應用戶的請求。

向量空間模型是信息檢索業界最廣泛使用的模型。該模型中,文檔中有意義的詞條的字段被提取出來,文檔庫中的所有文檔的所以字段的合集就構成了向量空間,其中每個字段就是向量空間中的一維。一個文檔就是可以由其字段確定為空間的一個向量,而一個查詢也可以由其關鍵詞字段確定為空間的一個向量。在向量空間模型中,查詢的過程就是尋找空間中與查詢向量距離最近的文檔向量。

在向量空間模型中,計算文檔與查詢向量之間的距離,一般采用權重的計算方式,即對于查詢中的每一個字段,計算每一個文檔相對于該特定字段的權重,然后找出權重最大的一部分文檔返回。其權重計算公式如下:

W=TF·IDF

IDF=ln(N/n)

其中W表示一個文檔對于特定字段的權重

TF表示特定字段在文檔中出現的頻率

IDF表示逆文檔頻率,其計算公式中,N表示所以文檔的總數,n表示所以文檔中,具有特定字段的文檔的個數。然后進行自然對數操作。

TF的意義在于,特定字段在一個文檔中出現的頻率越高,該文檔相對于特定字段的權重越大;IDF的意義在于,特定字段在所有其他文檔中出現的頻率越低,說明在目標文檔中該特定字段越具有代表性。然而,無論如何,計算一個字段在一個文檔中的出現頻率在向量空間模型中占據了巨大的計算資源,這提出了對次特定任務做硬件化加速的需求。

在定制硬件領域,硬件化的任務可以由特定硬件部件或者硬件知識產權核來完成,其優點是在硬件級別對特定任務做優化,在硬件級消除多余指令和操作,加速系統的關鍵任務和操作,提高系統效率。其關鍵是提煉系統的關鍵任務,加以硬件化實現。

發明內容

本發明的目的在于提供一種信息檢索向量空間模型硬件化實現方法。

本發明解決其技術問題所采用的技術方案如下:

1)硬件化數據準備:

為了進行硬件化的操作,先要將查詢的字段和文檔的數據做處理以適應硬件化處理的要求;

字段和文檔都被轉化成二進制數據;其中,字段所需要的額外數據是字段的長度以便硬件的處理;根據硬件處理的要求,文檔會被劃分成若干部分,每部分都是一個字段的集合,同時包括每部分文檔中的字段數量,各個字段在每文檔中的偏移量數組;

2)發送數據到本地存儲設備:

數據準備完成之后,就可以把向量空間模型中字段在文檔中出現頻率統計的計算在硬件上完成;

為了進一步提高硬件效率,統計硬件需要有本地存儲支持,把一個待比較的目標字段同目標文檔,以及字段的長度、文檔字段數和文檔字段偏移數據發送到本地存儲,這些數據被放到固定位置上,以便硬件上的處理;

3)字段的比較過程:

當數據被發送到本地存儲之后,就開始了硬件化的字段比較過程,該過程反復進行,直到本地存儲中的文檔字段全部完成比較;

一次的比較過程是這樣的:目標字段被取到字段寄存器,同時有一個計數器計數到當前處理到了文檔中的字段,文檔中的字段被取到文檔寄存器,然后開始硬件的比較過程;

4)字段超長的處理:

因為寄存器是定長的,不能設計成符合字段最長情況下的長度,這樣會造成硬件的浪費,而且字段的長度具有不可預料性,所以會出現字段長度超過字段寄存器的情況;

字段超長情況下,每次比較字段中的一部分數據,每次在字段內部進行偏移,合成多次比較結果,完成一個字段的比較;

5)相似度比較結果統計:

每完成一次文檔中字段與目標字段的比較過程,就要進行一次基于相似度的比較結果統計,該步驟是基于硬件并行完成的;

本方法有一個相似度的閾值,超過這個閾值的相似度比較結果,可以被認為是相同的字段,從而引發計數器,統計目標字段的出現頻率。

本發明與背景技術相比,具有的有益的效果是:

本發明對信息檢索向量空間模型提供了硬件化的支持,通過特化硬件來進行字段頻率的統計操作,其好處在于:硬件上并發字段比較過程;特化硬件具有高計算密度,減小計算資源浪費;特化硬件本身可以并發,提高并發度;具有硬件存儲系統支持;均大幅度提高了信息檢索系統的效率。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200810059855.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产69精品久久99不卡解锁版| 国产精品一区亚洲二区日本三区| 96国产精品| 97久久国产亚洲精品超碰热| 在线国产精品一区| 亚洲精品日本无v一区| 久久99国产视频| 免费在线观看国产精品| 国产品久久久久久噜噜噜狼狼| 国产高清一区二区在线观看| 在线播放国产一区| 欧美乱大交xxxxx古装| 欧美精品免费看| 欧美日韩一级在线观看| 亚洲国产精品女主播| 亚洲精品国产精品国自产网站按摩| 色噜噜狠狠色综合影视| xxxxhdvideosex| 亚洲欧美一区二区三区1000| 国产精华一区二区精华| 亚洲一级中文字幕| 91麻豆精品国产自产欧美一级在线观看| 欧洲激情一区二区| 精品久久国产视频| 欧美一区二区综合| 亚洲精品www久久久| 久草精品一区| 久久国产精品免费视频| 国产精品日本一区二区不卡视频 | 国产第一区二区三区| 99国产精品99久久久久久粉嫩| 国产无遮挡又黄又爽又色视频| 欧美大片一区二区三区| 欧美精品五区| 91精品黄色| 日韩中文字幕久久久97都市激情| 精品久久久久久中文字幕| 一区二区三区欧美精品| 国产盗摄91精品一区二区三区| 激情久久精品| 午夜看大片| 国产日韩欧美精品一区二区| 99久久久国产精品免费调教网站| 午夜看片网| 欧美国产精品久久| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 亚洲va欧美va国产综合先锋| 国内精品国产三级国产99| 视频二区一区国产精品天天| 国产高清在线观看一区| 国产1区2区视频| 日本aⅴ精品一区二区三区日| 偷拍区另类欧美激情日韩91| 午夜爽爽视频| 国产精品1区二区| 午夜av在线电影| 蜜臀久久99精品久久久久久网站| 国产一级一区二区三区| 欧美日韩一区二区三区四区五区| 国产一区二区电影| 狠狠插狠狠爱| 亚洲精品国产综合| 国产精品美女一区二区视频| 亚洲**毛茸茸| 农村妇女精品一二区| 一区二区在线视频免费观看| 99国产精品丝袜久久久久久| 国产91精品一区二区麻豆亚洲| 国产日韩一区二区在线| 国产在线一二区| 欧美精品日韩| 日韩av三区| 欧美一区二区在线不卡| 久久二区视频| 国产午夜亚洲精品羞羞网站| 欧美一区久久| 国产精品亚州| 久久国产欧美一区二区三区精品| 午夜老司机电影| 又色又爽又大免费区欧美| 91丝袜国产在线观看| 午夜一级免费电影| 精品国产区一区二| 中文字幕一区二区三区日韩精品| 国产精品国产一区二区三区四区| 亚洲欧美v国产一区二区| 欧美日韩国产91| 国91精品久久久久9999不卡| 国产日韩麻豆| 国产精品久久久久久av免费看| 久久午夜鲁丝片午夜精品| 亚洲国产精品一区在线观看| 国产一卡在线| 色一情一交一乱一区二区三区| 欧美日韩一区二区电影| 久久久久亚洲精品| 91精品啪在线观看国产| 国产精品对白刺激在线观看| av午夜影院| 中文字幕在线播放一区| 国产午夜精品一区二区三区四区 | 国产一区二区三区四区五区七| 国产一区在线免费观看| 日韩av电影手机在线观看| 欧美久久一区二区三区| 91制服诱惑| 国产精品久久久久久久久久久久冷| 国产精品自产拍在线观看蜜| 狠狠插狠狠插| 午夜天堂电影| 91高清一区| 亚洲va国产| 中文字幕一区二区三区乱码| 欧美乱大交xxxxx| 999久久久国产| 欧美极品少妇xx高潮| 麻豆国产一区二区三区| 秋霞av电影网| 国产伦理久久精品久久久久| 91精品第一页| 欧美在线观看视频一区二区 | 国产女人和拘做受在线视频| 亚洲精品无吗| 丰满岳妇伦4在线观看| 国产麻豆91欧美一区二区| 中文字幕av一区二区三区四区| 国产高清在线一区| 亚洲高清乱码午夜电影网| 亚洲精品91久久久久久| 91麻豆精品国产91久久久无限制版| 狠狠色丁香久久婷婷综| 91精品国产九九九久久久亚洲| 国产白丝一区二区三区| 欧美日韩国产精品一区二区| 精品国产区| 在线国产精品一区二区| 日韩av在线导航| 午夜av在线电影| 午夜理伦影院| 亚洲神马久久| 国产欧美视频一区二区| 精品国产亚洲一区二区三区| 欧美综合在线一区| 一区二区三区电影在线观看| 999亚洲国产精| 一区精品二区国产| 91热精品| 香蕉视频在线观看一区二区| 一区二区三区四区国产| 在线精品一区二区| 精品在线观看一区二区| 欧美高清xxxxx| 亚洲乱小说| 日本一区二区三区免费播放| 最新日韩一区| 国产在线精品一区二区在线播放| 国产乱xxxxx国语对白| 亚洲精欧美一区二区精品| 19videosex性欧美69| 欧美精品免费视频| 欧美日韩一级黄| 午夜诱惑影院| 偷拍自中文字av在线| 国产精品亚洲二区| 国产精品69av| 久久九九国产精品| 亚洲精品久久久久久动漫| 欧美777精品久久久久网| 国产免费一区二区三区网站免费| 精品久久久影院| 日本一二三不卡| 精品少妇的一区二区三区四区| 日韩精品久久久久久久的张开腿让| 国产精品久久久久久久新郎| 欧美日韩三区二区| 国产精品久久久久久久久久久久久久久久久久 | 国产理论一区二区三区| 欧美67sexhd| 国产精品日本一区二区不卡视频 | 欧美日韩中文国产一区发布| 亚洲精品www久久久| 国产69精品久久久久999小说| 麻豆精品一区二区三区在线观看| 亚洲一区2区三区| 黄色av中文字幕| 538国产精品一区二区免费视频| 精品福利一区二区| 亚洲精品国产主播一区| 97国产精品久久| 狠狠色狠狠色综合日日2019| 99日本精品| 亚洲一区二区三区加勒比| 国产一二区精品| 国产99小视频| 国产精品久久亚洲7777| 香蕉久久国产| 亚洲国产一区二区久久久777| 九色国产精品入口| 午夜毛片影院| 国产大片黄在线观看私人影院| 国产88在线观看入口| 久久夜色精品久久噜噜亚| 91久久国产露脸精品| 久精品国产| 欧美资源一区| 午夜影院激情| 久久99精品国产麻豆宅宅| 国产午夜亚洲精品羞羞网站| 久久国产这里只有精品| 午夜wwww| 日韩精品一区二区免费| 国内揄拍国产精品| 欧洲在线一区| 久久二区视频| 亚洲精品久久久中文| 国产精品美女一区二区视频| 中文字幕一区二区三区免费| 91精品国产影片一区二区三区| 精品国产免费久久| a级片一区| 一本色道久久综合亚洲精品图片| 7799国产精品久久99| 国产一区二区日韩| 国产伦精品一区二区三区免费观看| 亚洲精品国产精品国产| 欧美亚洲视频二区| 午夜诱惑影院| 91精品美女| 色噜噜狠狠狠狠色综合久| 日韩精品1区2区3区| 国产欧美精品va在线观看| 国产综合亚洲精品| 国产一区2| 亚洲精品日日夜夜| 国产69精品福利视频| 国产精品一区久久人人爽| 午夜三级大片| 毛片大全免费看| 激情久久久久久| 久久综合狠狠狠色97| 一级久久精品| 国产精品99999999| 自拍偷在线精品自拍偷无码专区| 国产盗摄91精品一区二区三区| 91精品一区二区在线观看 | 一区二区久久久久|