[發(fā)明專利]文獻解析裝置、文獻解析方法、文獻解析程序以及文獻解析系統(tǒng)在審
申請?zhí)枺?/td> | 201910768003.2 | 申請日: | 2019-08-20 |
公開(公告)號: | CN110852142A | 公開(公告)日: | 2020-02-28 |
發(fā)明(設(shè)計)人: | 藤澤正人 | 申請(專利權(quán))人: | IB研究株式會社 |
主分類號: | G06K9/00 | 分類號: | G06K9/00 |
代理公司: | 北京庚致知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11807 | 代理人: | 李永虎;李偉波 |
地址: | 日本新瀉*** | 國省代碼: | 暫無信息 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 文獻 解析 裝置 方法 程序 以及 系統(tǒng) | ||
1.一種文獻解析裝置,其中,具有:
提取部,其提取文獻所含的文字;
確定部,其基于所述提取部提取的所述文字,來確定配置所述文獻所含的附圖的方向;以及
輸出部,其在所述確定部確定的所述方向與預(yù)定方向不同的情況下,輸出用于將所述附圖配置在所述預(yù)定方向上的信息。
2.根據(jù)權(quán)利要求1所述的文獻解析裝置,其中,
所述提取部一邊沿著第1方向掃描所述文獻中的附圖的區(qū)域、構(gòu)造圖的區(qū)域或者包含附圖或構(gòu)造圖中的至少一個的頁面,一邊比較表示提取對象的文字的基準(zhǔn)文字和所述附圖的像素,由此來提取與所述基準(zhǔn)文字對應(yīng)的一個以上的第1文字,并且一邊沿著與所述第1方向正交的第2方向掃描所述文獻中的附圖的區(qū)域、構(gòu)造圖的區(qū)域或者包含附圖或構(gòu)造圖中的至少一個的頁面,一邊比較所述基準(zhǔn)文字和所述附圖的像素,由此來提取與所述基準(zhǔn)文字對應(yīng)的一個以上的第2文字,
所述確定部比較通過所述第1方向的掃描提取的所述一個以上的第1文字和通過所述第2方向的掃描提取的所述一個以上的第2文字,由此來確定所述方向。
3.根據(jù)權(quán)利要求1或2所述的文獻解析裝置,其中,
所述提取部一邊掃描所述文獻中的附圖的區(qū)域、構(gòu)造圖的區(qū)域或者包含附圖或構(gòu)造圖中的至少一個的頁面,一邊比較提取對象的文字以及表示旋轉(zhuǎn)后的所述提取對象的文字的基準(zhǔn)文字和所述附圖的像素,由此來提取與所述提取對象的文字對應(yīng)的一個以上的第1文字和與旋轉(zhuǎn)后的所述提取對象的文字對應(yīng)的一個以上的第2文字,
所述確定部比較通過所述掃描提取的所述一個以上的第1文字和通過所述掃描提取的所述一個以上的第2文字,由此來確定所述方向。
4.根據(jù)權(quán)利要求2或3所述的文獻解析裝置,其中,
還具有第2提取部,所述第2提取部從所述文獻所含的文章提取與預(yù)定文字對應(yīng)的一個以上的第3文字,
所述確定部比較所述一個以上的第1文字以及所述一個以上的第3文字的一致程度和所述一個以上的第2文字以及所述一個以上的第3文字的一致程度,由此來確定所述方向。
5.根據(jù)權(quán)利要求4所述的文獻解析裝置,其中,
所述第2提取部從所述文章提取與所述第3文字建立關(guān)聯(lián)的名稱,
所述輸出部輸出用于將所述附圖配置在所述預(yù)定方向上的信息和用于在所述附圖上顯示與所述第3文字建立關(guān)聯(lián)的所述名稱的信息。
6.根據(jù)權(quán)利要求5所述的文獻解析裝置,其中,
在所述附圖中選擇出了所述第3文字以及所述名稱中的至少一方的情況下,所述輸出部輸出用于在所述文章中改變被選擇出的所述第3文字以及所述名稱中的至少一方的顯示方式的信息。
7.根據(jù)權(quán)利要求5或6所述的文獻解析裝置,其中,
在所述文章中選擇出了所述第3文字以及所述名稱中的至少一方的情況下,所述輸出部輸出用于在所述附圖中改變被選擇出的所述第3文字以及所述名稱中的至少一方的顯示方式的信息。
8.一種文獻解析方法,其中,處理器執(zhí)行:
提取文獻所含的文字的步驟;
基于所述提取步驟提取的所述文字,來確定配置所述文獻所含的附圖的方向的步驟;以及
在所述確定步驟確定的所述方向與預(yù)定方向不同的情況下,輸出用于將所述附圖配置在所述預(yù)定方向上的信息的步驟。
9.一種文獻解析程序,使計算機執(zhí)行:
提取文獻所含的文字的步驟;
基于所述提取步驟提取的所述文字,來確定配置所述文獻所含的附圖的方向的步驟;以及
在所述確定步驟確定的所述方向與預(yù)定方向不同的情況下,輸出用于將所述附圖配置在所述預(yù)定方向上的信息的步驟。
10.一種文獻解析系統(tǒng),其中,具備文獻管理裝置和文獻解析裝置,
所述文獻管理裝置具有:
存儲部,其存儲文獻;以及
提供部,其將所述存儲部存儲的所述文獻提供給所述文獻解析裝置,
所述文獻解析裝置具有:
提取部,其提取從所述文獻管理裝置提供的所述文獻所含的文字;
確定部,其基于所述提取部提取的所述文字,來確定配置所述文獻所含的附圖的方向;以及
輸出部,其在所述確定部確定的所述方向與預(yù)定方向不同的情況下,對所述文獻管理裝置輸出用于將所述附圖配置在所述預(yù)定方向上的信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于IB研究株式會社,未經(jīng)IB研究株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910768003.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合