[發明專利]文檔分類系統、文檔分類方法及文檔分類程序無效
| 申請號: | 201380011864.7 | 申請日: | 2013-02-28 |
| 公開(公告)號: | CN104160395A | 公開(公告)日: | 2014-11-19 |
| 發明(設計)人: | 守本正宏;白井喜勝;武田秀樹;蓮子和巳 | 申請(專利權)人: | UBIC股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/18 |
| 代理公司: | 北京瑞盟知識產權代理有限公司 11300 | 代理人: | 劉昕 |
| 地址: | 日本國東京都港區港*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 分類 系統 方法 程序 | ||
技術領域
本發明涉及一種文檔分類系統、文檔分類方法及文檔分類程序,尤其是涉及與訴訟相關文檔信息的文檔分類系統、文檔分類方法及文檔分類程序。
背景技術
現有技術中,已提出一種在發生非法訪問(illegal?access)或機密信息泄露等與計算機相關的犯罪或法律糾紛時,對原因查明或搜查所需的儀器、數據或電子記錄進行收集/分析,并明確其法律上的證據性的裝置或技術。
尤其在美國民事訴訟中,由于需要eDiscovery(電子證據公開)等,該訴訟的原告及被告的任何一方均需要承擔作為證據提交全部相關數字信息的義務。因此,必須將計算機或服務器中所記錄的數字信息作為證據提交。
另一方面,由于隨著IT業迅速發展及普及,在當今商務世界中幾乎所有的信息均由計算機制作,因此即使在同一企業內部,也充斥著大量的數字信息。
因此,在為了向法庭提交證據材料而進行準備工作的過程中,容易產生在證據材料中還包含了未必與該訴訟相關的機密數字信息的失誤。存在提交與該訴訟無關的機密文檔信息的問題。
近幾年來,在專利文獻1~專利文獻3中提出一種與取證系統的文檔信息相關的技術。在專利文獻1中公開一種取證系統,從使用者信息中所包含的至少1人以上的使用者中指定特定人,并根據與被指定的特定人相關的訪問履歷信息,僅抽取特定人所訪問的數字文檔信息,并設定表示各所抽取的數字文檔信息的文檔文件是否與訴訟相關的附帶信息,并且根據附帶信息,輸出與訴訟相關的文檔文件。
另外,在專利文獻2中公開一種取證系統,顯示所記錄的數字信息,對多個文檔文件的每一個設定表示是否與包含于使用者信息的使用者中任意的使用者相關的使用者特定信息,并將該被設定的使用者特定信息記錄在存儲部中,而進行設定,并指定至少一個以上的使用者,對設定有與所指定的使用者相對應的使用者特定信息的文檔文件進行檢索,并借助顯示部,設定表示所檢索的文檔文件是否與訴訟相關的附帶信息,根據附帶信息,輸出與訴訟相關的文檔文件。
另外,在專利文獻3中公開一種取證系統,接受數字文檔信息中所包含的至少一個以上的文檔文件的指定,并接受是否將所指定的文檔文件翻譯為任意一種語言的指定,將接受所指定的文檔文件翻譯為接受指定的語言,從記錄部所記錄的數字文檔信息抽取與所指定的文檔文件顯示同一內容的共同文檔文件,并生成翻譯關聯信息,該翻譯關聯信息表示所抽取的共同的文檔文件因引用被翻譯的文檔文件的翻譯內容而被翻譯,根據翻譯關聯信息輸出與訴訟相關的文檔文件。
專利文獻1:日本專利特開2011-209930號公報
專利文獻2:日本專利特開2011-209931號公報
專利文獻3:日本專利特開2012-32859號公報
然而,例如專利文獻1~3中所公開的取證系統,需要使用多臺計算機及服務器以收集使用者的龐大的文檔信息。
通過被稱為查閱者的用戶閱讀確認,進行分辨將上述的數字化的龐大的文檔信息作為訴訟的證據材料是否合適的操作,必須對該文檔信息逐個進行分辨,這樣需要消耗大量的人力。
發明內容
有鑒于此,本發明提供一種文檔分類系統、文檔分類方法及文檔分類程序,使在收集數字化的文檔信息后,通過對該文檔信息自動賦予分類符號,能夠減輕訴訟中對所使用的文檔信息分類作業的負擔。
本發明的文檔辨別系統獲取記錄在多個計算機或服務器中的數字信息,并對該獲取的數字信息中所包含的文檔信息進行分析,然后進行分類以易于在訴訟中使用,該文檔辨別系統具有:抽取部,其從所述文檔信息中抽取作為數據組而包含規定數量文檔的文檔群;文檔顯示部,其將所述抽取的文檔群顯示在畫面上;分類符號接受部,其接受用戶根據與所述訴訟之間的關聯性對所述顯示的文檔群賦予的分類符號;選定部,其根據所述分類符號,按每個分類符號對所述抽取的文檔群進行分類,解析并選定在該被分類的文檔群中共同出現的關鍵詞;數據庫,其記錄所述被選定的關鍵詞;搜索部,其從所述文檔信息中搜索記錄在所述數據庫中的關鍵詞;得分計算部,其利用所述搜索部的搜索結果和所述選定部的解析結果,計算表示分類符號和文檔之間的關聯性的得分;以及自動分類部,其根據所述得分的結果自動賦予分類符號。
在本發明中,“文檔”是指包含1個以上關鍵詞的數據。例如為電子郵件、企劃案材料、表計算材料、商洽材料、合同書、組織圖、事業企劃書等。
在本發明中,在為某種語言下,“關鍵詞”是指具有一定意義的語句的概括。例如,在從“將文檔分類”的文章選定關鍵詞時,可選“文檔”、“分類”為關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于UBIC股份有限公司,未經UBIC股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380011864.7/2.html,轉載請聲明來源鉆瓜專利網。





