[發(fā)明專利]檢索支援裝置及檢索支援方法有效
| 申請?zhí)枺?/td> | 201210082643.6 | 申請日: | 2012-03-26 |
| 公開(公告)號: | CN103324646B | 公開(公告)日: | 2017-03-01 |
| 發(fā)明(設(shè)計)人: | 新名博;服部雅一 | 申請(專利權(quán))人: | 株式會社東芝;東芝解決方案株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 永新專利商標(biāo)代理有限公司72002 | 代理人: | 陳萍 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 檢索 支援 裝置 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及檢索支援裝置及檢索支援方法。
背景技術(shù)
文書檢索是從作為檢索對象的文書集合中檢索包含用戶指定的檢索關(guān)鍵字的文書的技術(shù)。在此,所謂“文書”,不僅包括電子化的文書,還包括具有文本數(shù)據(jù)的各種內(nèi)容。為了減輕文書檢索中的用戶的操作負(fù)擔(dān),以前提出了各種檢索支援方法。
例如,已知根據(jù)過去的檢索式的履歷,將檢索關(guān)鍵字的候補提示給用戶的方法。在該方法中,若通過用戶的輸入操作而輸入例如“擴散強調(diào)像”這樣的檢索關(guān)鍵字,則作為接在其后的檢索關(guān)鍵字的候補,提議“延遲相位”、“脂肪”、“高信號”、“軸位”等過去的檢索式的履歷之中頻繁地搭配的單詞。根據(jù)該方法,可以使包括多個檢索關(guān)鍵字的檢索式的生成變得容易,并減輕用戶的操作負(fù)擔(dān)。但是,在該方法中,為了提議適當(dāng)?shù)臋z索關(guān)鍵字的候補,需要較多履歷,在履歷較偏、不足的情況下,存在提議的質(zhì)量降低,不能對目的文書進行檢索的擔(dān)憂。
而且,已知使用定義了存在搭配關(guān)系的2個單詞的組合的搭配字典,將檢索關(guān)鍵字的候補提議給用戶的方法。在該方法中,若通過用戶的輸入操作而輸入某一單詞作為檢索關(guān)鍵字,則作為接在其后的檢索關(guān)鍵字的候補,提議作為相對于輸入的檢索關(guān)鍵字的、搭配概率高的單詞而登記在搭配字典中的單詞。根據(jù)該方法,可以使包括多個檢索關(guān)鍵字的檢索式的生成變得容易,并減輕用戶的操作負(fù)擔(dān)。但是,在該方法中,需要準(zhǔn)備事先定義了單詞彼此的搭配關(guān)系的搭配字典,而且,在事先準(zhǔn)備的搭配字典不適用于作為檢索對象的文書集合的情況下,存在提議的質(zhì)量降低,不能對目的文書進行檢索的擔(dān)憂。
如以上所述,在使包括多個檢索關(guān)鍵字的檢索式的生成變得容易的現(xiàn)有技術(shù)中,存在提議的質(zhì)量降低而不能對目的文書進行檢索的情況,要求改良。
現(xiàn)有技術(shù)文獻(xiàn)
專利文獻(xiàn)1:日本特許第2850952號公報
專利文獻(xiàn)2:日本特開2006-48286號公報
發(fā)明內(nèi)容
本發(fā)明要解決的問題是提供檢索支援裝置及檢索支援方法,不對用戶要求事前的繁雜的操作,就可以提議適合于檢索對象的文書集合的、檢索關(guān)鍵字的候補,并適當(dāng)?shù)刂г臅臋z索。
實施方式的檢索支援裝置具備抽取部、計算部、第1檢測部、第1生成部、第2生成部、第1識別部、搭配傳播部、第2識別部、提示部和檢索部。抽取部從檢索對象的文書集合中抽取關(guān)鍵字候補。計算部對于被抽取的2個關(guān)鍵字候補的組合,計算一個關(guān)鍵字候補與另一個關(guān)鍵字候補一起出現(xiàn)在上述文書集合內(nèi)的同一文書中的概率、即搭配概率。第1檢測部檢測上述搭配概率滿足第1條件的2個關(guān)鍵字候補的組合、即搭配關(guān)鍵字組。第1生成部生成搭配字典,該搭配字典是以上述搭配關(guān)鍵字組的一方的關(guān)鍵字候補為詞條,且將另一方的關(guān)鍵字候補作為搭配詞語的字典要素的集合。第2生成部生成字符串補充規(guī)則,該字符串補充規(guī)則是用于對輸入字符串進行補充而得到的上述搭配關(guān)鍵字組中所含的關(guān)鍵字候補的規(guī)則。第1識別部將通過按照上述字符串補充規(guī)則對輸入字符串進行補充而得到的關(guān)鍵字候補,識別為輸入關(guān)鍵字。搭配傳播部反復(fù)進行參照上述搭配字典、取得將上述輸入關(guān)鍵字作為詞條的字典要素的搭配詞語,取得將取得的搭配詞語作為詞條的字典要素的搭配詞語的處理。第2識別部將在將上述輸入關(guān)鍵字和通過上述搭配傳播部的處理而取得的搭配詞語關(guān)聯(lián)起來的字串之中的、滿足第2條件的字串,識別為提議字串。提示部提示上述提議字串。檢索部在選擇了提示的上述提議字串的情況下,根據(jù)該提議字串來生成檢索式而進行針對上述文書集合的檢索。
附圖文字
圖1是示出第1實施方式的檢索支援裝置的功能的構(gòu)成的框圖。
圖2是示出檢索對象的文書集合的一個例子的圖。
圖3是示出從檢索對象的文書集合中抽取的關(guān)鍵字候補的一個例子的圖。
圖4是示出抽取的關(guān)鍵字候補和出現(xiàn)頻率之間的關(guān)系的一個例子的圖。
圖5是示出2個關(guān)鍵字候補的組合的出現(xiàn)頻率的一個例子的圖。
圖6是示出2個關(guān)鍵字候補間的搭配概率的一個例子的圖。
圖7是示出搭配網(wǎng)絡(luò)的一個例子的圖。
圖8是示出搭配關(guān)鍵字組檢測部的處理的一個例子的流程圖。
圖9是示出構(gòu)成搭配字典的字典要素的數(shù)據(jù)結(jié)構(gòu)的一個例子的圖。
圖10是示出搭配字典的一個例子的圖。
圖11是示出PAT樹的一個例子的圖。
圖12是示出字串的數(shù)據(jù)結(jié)構(gòu)的一個例子的圖。
圖13是示出輸入關(guān)鍵字識別部、搭配傳播部及提議字串識別部的處理的一個例子的流程圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社東芝;東芝解決方案株式會社,未經(jīng)株式會社東芝;東芝解決方案株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210082643.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種襪子展示架
- 下一篇:用于凳子或椅子的調(diào)節(jié)支架





