[發明專利]知識處理裝置以及方法有效
| 申請號: | 201410346227.1 | 申請日: | 2014-07-21 |
| 公開(公告)號: | CN104424350B | 公開(公告)日: | 2017-12-01 |
| 發明(設計)人: | 吉田篤弘 | 申請(專利權)人: | 株式會社東芝;東芝解決方案株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06K9/20 |
| 代理公司: | 永新專利商標代理有限公司72002 | 代理人: | 王成坤,胡建新 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 處理 裝置 以及 方法 | ||
本申請享受2013年9月6日在先提出的日本國專利申請第2013-185634號的優先權的利益,并且包括在先申請的全部內容。
技術領域
實施方式涉及使用知識詞典進行字符串的修正的知識處理裝置、方法以及程序。
背景技術
例如,作為用于對通過OCR(Optical Character Recognition/Reader:光學字符識別)等而字符識別出的字符串進行修正而使其接近正確答案的技術,已知有知識處理。知識處理為,將作為修正的對象的字符串(以下,稱為修正對象字符串)與預先準備的知識詞典(單詞詞典)對照,根據需要用儲存于知識詞典的字符串(單詞)置換修正對象字符串,從而進行對修正對象字符串的修正。例如,如果修正對象字符串是表示姓名的姓的字符串,則將修正對象字符串與儲存了姓中使用的多個單詞的知識詞典對照,如果有符合的單詞則置換修正對象字符串。
然而,在以往的知識處理中,從知識詞典未恰當地篩選出用于置換修正對象字符串的字符串而未獲得足夠的修正精度的情況較多,要求精度的提高。
發明內容
實施方式公開了能夠高精度地進行使用了知識詞典的字符串的修正的知識處理裝置以及方法。
實施方式的知識處理裝置,使用知識詞典進行字符串的修正,該知識處理裝置具備:選擇部、生成部、修正部。選擇部從包含多個字符串且按每個字符串附有該字符串的屬性的文件數據,選擇修正對象字符串。生成部基于所述文件數據中的、屬性與所述修正對象字符串不同的其他的字符串,生成取得置換字符串的候補的條件,該置換字符串用于置換所述修正對象字符串。修正部使用按照所述條件而從所述知識詞典取得的所述置換字符串的候補,進行對所述修正對象字符串的修正。
附圖說明
圖1是對實施方式的知識處理裝置的硬件構成例進行表示的框圖。
圖2是對實施方式的知識處理裝置的功能上的構成例進行表示的框圖。
圖3是對文件數據的一例進行表示的圖。
圖4是對知識詞典的一例進行表示的圖。
圖5是對確定置換字符串的狀況進行示意性地表示的圖。
圖6是對無法唯一地確定置換字符串的例子進行說明的圖。
圖7是對無法唯一地確定置換字符串的例子進行說明的圖。
圖8是對基于“住所”屬性的條件生成用字符串而生成為了取得對“姓”屬性的修正對象字符串進行置換的置換字符串的候補所用的候補取得條件的例子進行說明的圖。
圖9是對基于“出生年月日”屬性的條件生成用字符串而生成為了取得對“名”屬性的修正對象字符串進行置換的置換字符串的候補所用的候補取得條件的例子進行說明的圖。
圖10是對使用按照候補取得條件而取得的置換字符串的候補而篩選置換字符串的狀況進行示意性地表示的圖。
圖11是對使用按照候補取得條件而取得的置換字符串的候補而篩選置換字符串的狀況進行示意性地表示的圖。
圖12是對將置換字符串的候補提示給用戶的情況的提示例進行表示的圖。
圖13是對將置換字符串的候補提示給用戶的情況的提示例進行表示的圖。
圖14是對實施方式的知識處理裝置的處理過程的一例進行表示的流程圖。
圖15是對優先使用按照優先度高的候補取得條件而取得的置換字符串的候補來進行對修正對象字符串的修正的狀況進行示意性地表示的圖。
圖16是對按照優先度進行置換字符串的篩選的過程的一例進行表示的流程圖。
圖17是對按照優先度進行置換字符串的篩選的過程的另一例進行表示的流程圖。
圖18是對將與“姓”屬性的修正對象字符串鄰接的“名”屬性的字符串用于條件生成用字符串來取得置換字符串的候補的例子進行示意性地表示的圖。
圖19是對姓名的男女差進行說明的圖。
圖20是對利用姓名的男女差來進行置換字符串的篩選的例子進行說明的圖。
具體實施方式
以下,參照附圖對實施方式的知識處理裝置以及方法進行詳細地說明。在以下所示的實施方式中,設想進行通過OCR而字符識別出的字符串的修正的例子。然而,通過實施方式的知識處理裝置修正的字符串不限于通過OCR而字符識別出的字符串。實施方式的知識處理裝置能夠廣泛應用于使用知識詞典進行字符串的修正的情況。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝;東芝解決方案株式會社,未經株式會社東芝;東芝解決方案株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410346227.1/2.html,轉載請聲明來源鉆瓜專利網。





