[發(fā)明專利]辦公文件管理方法有效
| 申請?zhí)枺?/td> | 201811094750.4 | 申請日: | 2018-09-19 |
| 公開(公告)號: | CN109190001B | 公開(公告)日: | 2022-02-11 |
| 發(fā)明(設(shè)計)人: | 張珮明 | 申請(專利權(quán))人: | 廣東電網(wǎng)有限責(zé)任公司;廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心 |
| 主分類號: | G06F16/93 | 分類號: | G06F16/93;G06F16/35;G06Q10/10 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 張春水;唐京橋 |
| 地址: | 510600 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 辦公 文件 管理 方法 | ||
1.辦公文件管理方法,其特征在于,包括:
收集新的文件資料;
將所述文件資料以電子文檔的形式存儲;
利用分類器對所述文件資料進(jìn)行分類,以標(biāo)記所述文件資料應(yīng)派發(fā)至的負(fù)責(zé)部門;
將所述文件資料派發(fā)給所述負(fù)責(zé)部門;
所述分類器采用機(jī)器學(xué)習(xí)方法訓(xùn)練而成,以便能夠?qū)λ鑫募Y料進(jìn)行自動分類,所述機(jī)器學(xué)習(xí)方法包括:
獲取所有已派發(fā)的過往文件,并標(biāo)記收到所述過往文件的接收部門;
對所述過往文件進(jìn)行編號和文本預(yù)處理;
將所述過往文件按所述編號分為兩組,所述編號為單數(shù)的一組為訓(xùn)練組,所述編號為雙數(shù)的一組為測試組,其中,所述訓(xùn)練組中的所述過往文件為訓(xùn)練文件,所述測試組中的所述過往文件為測試文件;
提取所有所述訓(xùn)練文件的實(shí)詞并組成一份詞匯表;
分別提取每一份所述訓(xùn)練文件的實(shí)詞;
計算每一份所述訓(xùn)練文件的實(shí)詞的訓(xùn)練TF-IDF值;
根據(jù)所述訓(xùn)練TF-IDF值在所述詞匯表中的位置排序,得到每一份所述訓(xùn)練文件的訓(xùn)練特征向量;
對所有所述訓(xùn)練文件按所述接收部門進(jìn)行分組,得到若干個分組;
以每個所述分組中的所有所述訓(xùn)練文件為一個整體,計算得到每個所述分組的分組特征向量;
分別提取每一份所述測試文件的實(shí)詞;
計算每一份所述測試文件的實(shí)詞的測試TF-IDF值;
根據(jù)所述測試TF-IDF值在所述詞匯表中的位置排序,得到每一份所述測試文件的測試特征向量;
針對每一份所述測試文件,分別計算每個所述分組的所述分組特征向量與所述測試特征向量之間的余弦值;
根據(jù)所述余弦值的大小,判斷所述測試文件是否屬于所述余弦值對應(yīng)的所述分組;
將所有所述測試文件的分組結(jié)果與其實(shí)際所屬分組作比較,計算得到所述分類器的準(zhǔn)確率;
若所述準(zhǔn)確率大于等于預(yù)設(shè)值時,則所述分類器采用所述機(jī)器學(xué)習(xí)方法訓(xùn)練而成的工作完成。
2.根據(jù)權(quán)利要求1所述的辦公文件管理方法,其特征在于,所述收集新的文件資料的步驟包括:
通過掃描儀、傳真機(jī)或電子郵件系統(tǒng)收集所述文件資料。
3.根據(jù)權(quán)利要求1所述的辦公文件管理方法,其特征在于,若所述準(zhǔn)確率小于預(yù)設(shè)值時,則將所有分組錯誤的所述測試文件按序號進(jìn)行排序,所述序號為單數(shù)的并入所述訓(xùn)練組,所述序號為雙數(shù)的并入所述測試組,再根據(jù)所述機(jī)器學(xué)習(xí)方法對所述分類器進(jìn)行訓(xùn)練,直至所述分類器的準(zhǔn)確率大于等于所述預(yù)設(shè)值。
4.根據(jù)權(quán)利要求3所述的辦公文件管理方法,其特征在于,所述將所述文件資料派發(fā)給所述負(fù)責(zé)部門的步驟之后還包括:
若所述負(fù)責(zé)部門收到的所述文件資料不是其負(fù)責(zé)的,則標(biāo)記錯發(fā)信息并反饋給所述分類器;
所述分類器接收到所述錯發(fā)信息后,標(biāo)記出錯發(fā)的所述文件資料對應(yīng)的準(zhǔn)確的負(fù)責(zé)部門,以便將錯發(fā)的所述文件資料派發(fā)給對應(yīng)的準(zhǔn)確的所述負(fù)責(zé)部門。
5.根據(jù)權(quán)利要求4所述的辦公文件管理方法,其特征在于,所述若所述負(fù)責(zé)部門收到的所述文件資料不是其負(fù)責(zé)的,則標(biāo)記錯發(fā)信息并反饋給所述分類器的步驟之后還包括:
所述分類器接收到所述錯發(fā)信息后,將錯發(fā)的所述文件資料并入所述訓(xùn)練組,并采用所述機(jī)器學(xué)習(xí)方法重新訓(xùn)練所述分類器。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東電網(wǎng)有限責(zé)任公司;廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心,未經(jīng)廣東電網(wǎng)有限責(zé)任公司;廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811094750.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種工程資料管理方法
- 下一篇:輿情信息處理方法、裝置及電子設(shè)備





