[發(fā)明專利]一種基于內(nèi)容的電子文檔管理方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201610957633.0 | 申請(qǐng)日: | 2016-10-27 |
| 公開(公告)號(hào): | CN107085583B | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設(shè)計(jì))人: | 熊文;丁紫惠 | 申請(qǐng)(專利權(quán))人: | 中國(guó)長(zhǎng)城科技集團(tuán)股份有限公司 |
| 主分類號(hào): | G06F16/93 | 分類號(hào): | G06F16/93 |
| 代理公司: | 深圳中一專利商標(biāo)事務(wù)所 44237 | 代理人: | 張全文 |
| 地址: | 518000 廣東省*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 內(nèi)容 電子 文檔 管理 方法 裝置 | ||
1.一種基于內(nèi)容的電子文檔管理方法,其特征在于,所述方法包括:
接收輸入的電子文檔定位請(qǐng)求,根據(jù)所述電子文檔定位請(qǐng)求獲取定位條件,所述定位條件包括:屬性信息和/或定位關(guān)鍵詞集;
若所述定位條件為屬性信息,則在托管目錄中檢索與所述屬性信息匹配的電子文檔,將檢索到的與所述屬性信息匹配的電子文檔作為文檔定位結(jié)果,所述托管目錄為受計(jì)算設(shè)備保護(hù)且用戶無法直接點(diǎn)擊訪問的目錄,計(jì)算設(shè)備中所有的電子文檔均可存放于所述托管目錄下;
若所述定位條件為定位關(guān)鍵詞集,則獲取所述定位關(guān)鍵詞集包含的各個(gè)關(guān)鍵詞的經(jīng)驗(yàn)權(quán)重,根據(jù)帶權(quán)重的內(nèi)積算法,計(jì)算所述定位關(guān)鍵詞集與目錄索引表中記錄的各個(gè)電子文檔的關(guān)鍵詞集之間的第一相似度,若存在第一目標(biāo)關(guān)鍵詞集,則將與所述第一目標(biāo)關(guān)鍵詞集關(guān)聯(lián)的電子文檔所在的目錄確定為可定位目錄,將所述可定位目錄下的電子文檔作為文檔定位結(jié)果,其中,所述第一目標(biāo)關(guān)鍵詞集為與所述定位關(guān)鍵詞集的第一相似度不小于預(yù)設(shè)的第一相似度閾值的電子文檔的關(guān)鍵詞集,所述目錄索引表為根據(jù)托管目錄實(shí)時(shí)更新的,記錄有托管目錄中每個(gè)電子文檔所在目錄的信息、文檔關(guān)鍵詞集的索引表,其中所述目錄索引表記錄的文檔關(guān)鍵詞集為電子文檔的最多前N個(gè)最大權(quán)重的關(guān)鍵詞組成的關(guān)鍵詞集,N為預(yù)設(shè)的大于或等于2的自然數(shù),所述目錄索引表預(yù)先存儲(chǔ)于計(jì)算設(shè)備的數(shù)據(jù)庫中;
若所述定位條件為屬性信息和定位關(guān)鍵詞集,則分別計(jì)算所述定位關(guān)鍵詞集和目錄索引表中記錄的各個(gè)電子文檔的關(guān)鍵詞集之間的第一相似度,若存在所述第一目標(biāo)關(guān)鍵詞集,則將與所述第一目標(biāo)關(guān)鍵詞集關(guān)聯(lián)的電子文檔所在的目錄確定為可定位目錄,在可定位目錄中檢索與所述屬性信息匹配的電子文檔,將檢索到的與所述屬性信息匹配的電子文檔作為文檔定位結(jié)果;
輸出符合所述定位條件的文檔定位結(jié)果;
所述根據(jù)帶權(quán)重的內(nèi)積算法,計(jì)算所述定位關(guān)鍵詞集與目錄索引表中記錄的各個(gè)電子文檔的關(guān)鍵詞集之間的第一相似度,包括:
將所述定位關(guān)鍵詞集作為向量x,以及將所述目錄索引表中的任一個(gè)電子文檔的關(guān)鍵詞集作為向量y;
判斷在向量x與向量y中是否存在相同的關(guān)鍵詞;
若向量x與向量y中存在相同的關(guān)鍵詞,則累加所有相同的關(guān)鍵詞的經(jīng)驗(yàn)權(quán)重的點(diǎn)積,得到累加結(jié)果;
將所述累加結(jié)果除以向量x與向量y的長(zhǎng)度積的平方根,得到所述定位關(guān)鍵詞集與所述任一個(gè)電子文檔的關(guān)鍵詞集的所述第一相似度;
在所述獲取所述定位關(guān)鍵詞集包含的各個(gè)關(guān)鍵詞的經(jīng)驗(yàn)權(quán)重之后,所述根據(jù)帶權(quán)重的內(nèi)積算法,計(jì)算所述定位關(guān)鍵詞集與目錄索引表中記錄的各個(gè)電子文檔的關(guān)鍵詞集之間的第一相似度之前,還包括:
將所述定位關(guān)鍵詞集與所述目錄索引表中記錄的各個(gè)電子文檔的最大權(quán)重的關(guān)鍵詞作相似度計(jì)算,篩選出所述相似度計(jì)算結(jié)果大于預(yù)設(shè)的第一相似度閾值的電子文檔。
2.如權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)庫還包括:關(guān)鍵詞索引表;所述將所述可定位目錄下的電子文檔作為文檔定位結(jié)果,包括:
在關(guān)鍵詞索引表中查找出處于所述可定位目錄下的各個(gè)電子文檔的關(guān)鍵詞集;
計(jì)算所述定位關(guān)鍵詞集與所述可定位目錄下的各個(gè)電子文檔的關(guān)鍵詞集的第二相似度;
若存在第二目標(biāo)關(guān)鍵詞集,則將與所述第二目標(biāo)關(guān)鍵詞集關(guān)聯(lián)的電子文檔確定為文檔定位結(jié)果,其中,所述第二目標(biāo)關(guān)鍵詞集為與所述定位關(guān)鍵詞集的第二相似度不小于預(yù)設(shè)的第二相似度閾值的電子文檔的關(guān)鍵詞集。
3.如權(quán)利要求1所述的方法,其特征在于,所述輸出符合所述定位條件的文檔定位結(jié)果,包括:
當(dāng)所述文檔定位結(jié)果中的電子文檔新增加了預(yù)設(shè)數(shù)量個(gè)時(shí),輸出所述文檔定位結(jié)果中新增加的各個(gè)電子文檔的文檔名稱。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)長(zhǎng)城科技集團(tuán)股份有限公司,未經(jīng)中國(guó)長(zhǎng)城科技集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610957633.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法
- 一種在多種電子設(shè)備,尤其是在電子服務(wù)提供商的電子設(shè)備和電子服務(wù)用戶的電子設(shè)備之間建立受保護(hù)的電子通信的方法
- 一種電子打火機(jī)及其裝配方法
- 電子檔案管理系統(tǒng)
- 在處理系統(tǒng)化學(xué)分析中使用的電子束激勵(lì)器
- 電子文件管理方法和管理系統(tǒng)
- 一種有效電子憑據(jù)生成、公開驗(yàn)證方法、裝置及系統(tǒng)
- 電子文憑讀寫控制系統(tǒng)和方法
- 具有加密解密功能的智能化電子證件管理裝置
- 一種基于數(shù)字證書的電子印章方法及電子印章系統(tǒng)
- 一種電子印章使用方法、裝置及電子設(shè)備
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫生成方法、裝置及設(shè)備





