[發明專利]檢索支援裝置及檢索支援方法有效
| 申請號: | 201210082643.6 | 申請日: | 2012-03-26 |
| 公開(公告)號: | CN103324646B | 公開(公告)日: | 2017-03-01 |
| 發明(設計)人: | 新名博;服部雅一 | 申請(專利權)人: | 株式會社東芝;東芝解決方案株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 永新專利商標代理有限公司72002 | 代理人: | 陳萍 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢索 支援 裝置 方法 | ||
1.一種檢索支援裝置,其特征在于,具備:
抽取部,從檢索對象的文書集合中抽取關鍵字候補;
計算部,對于被抽取的2個關鍵字候補的組合,計算一個關鍵字候補與另一個關鍵字候補一起出現在上述文書集合內的同一文書中的概率、即搭配概率;
第1檢測部,檢測上述搭配概率滿足第1條件的2個關鍵字候補的組合、即搭配關鍵字組;
第1生成部,生成搭配字典,該搭配字典是將上述搭配關鍵字組的一方的關鍵字候補作為詞條、且將另一方的關鍵字候補作為搭配詞語的字典要素的集合;
第2生成部,生成字符串補充規則,該字符串補充規則是用于對輸入字符串進行補充而得到上述搭配關鍵字組中所含的關鍵字候補的規則;
第1識別部,將通過按照上述字符串補充規則對輸入字符串進行補充而得到的關鍵字候補,識別為輸入關鍵字;
搭配傳播部,反復進行參照上述搭配字典、取得將上述輸入關鍵字作為詞條的字典要素的搭配詞語、取得將取得的搭配詞語作為詞條的字典要素的搭配詞語的處理;
第2識別部,將在將上述輸入關鍵字和通過上述搭配傳播部的處理而取得的搭配詞語關聯起來的字串之中的、滿足第2條件的字串,識別為提議字串;
提示部,提示上述提議字串;及
檢索部,在選擇了提示的上述提議字串的情況下,根據該提議字串來生成檢索式而進行針對上述文書集合的檢索。
2.如權利要求1所記載的檢索支援裝置,其特征在于,
在把將上述輸入關鍵字作為詞條的字典要素的搭配詞語作為1級搭配詞語、把將L-1級搭配詞語作為詞條的字典要素的搭配詞語作為L級搭配詞語時,上述搭配傳播部反復進行一邊使L每次增加1、一邊取得上述L級搭配詞語的處理,當對上述輸入關鍵字和上述1級搭配詞語之間的搭配概率,順序積算了上述L-1級搭配詞語和上述L級搭配詞語之間的搭配概率而得到的值即積算搭配概率變為小于等于第1閾值時停止上述處理,其中,L是大于等于2的自然數。
3.如權利要求2所記載的檢索支援裝置,其特征在于,
上述第2識別部把將上述輸入關鍵字和上述搭配傳播部連續進行上述處理的期間所取得的搭配詞語關聯起來的字串之中的、按照上述積算搭配概率從大到小的順序為最前面N件的字串,識別為上述提議字串,其中,N是預先設定的自然數。
4.如權利要求1所記載的檢索支援裝置,其特征在于,
在把將上述輸入關鍵字作為詞條的字典要素的搭配詞語作為1級搭配詞語、而把將L-1級搭配詞語作為詞條的字典要素的搭配詞語作為L級搭配詞語時,上述搭配傳播部反復進行一邊使L每次增加1、一邊取得上述L級搭配詞語的處理,若L變成預先設定的規定值則停止上述處理,其中,L是大于等于2的自然數。
5.如權利要求1所記載的檢索支援裝置,其特征在于,
還具備:
第2檢測部,檢測上述搭配概率為零的2個關鍵字候補的組合、即零搭配關鍵字組;及
第3生成部,生成零搭配字典,該零搭配字典是將上述零搭配關鍵字組的一方的關鍵字候補作為詞條、將另一方的關鍵字候補作為零搭配詞語的字典要素的集合;
上述第2識別部參照上述零搭配字典,在將上述輸入關鍵字和通過上述搭配傳播部的處理而取得的搭配詞語關聯起來的字串之中,存在同時包含構成零搭配關鍵字組的2個關鍵字候補的字串的情況下,除該字串之外,將剩余的字串之中的滿足上述第2條件的字串,識別為上述提議字串。
6.如權利要求1所記載的檢索支援裝置,其特征在于,
上述第1檢測部反復進行求得上述搭配概率比第2閾值還大的2個關鍵字候補的組合的個數,若所得到的個數小于第3閾值則使上述第2閾值減少規定量,并求得上述搭配概率比減少了規定量的上述第2閾值大的2個關鍵字候補的組合的個數的處理,將所得到的個數變為大于等于上述第3閾值時的2個關鍵字候補的組合檢測為上述搭配關鍵字組。
7.一種檢索支援方法,在檢索支援裝置中執行,該檢索支援方法的特征在于具備以下步驟:
上述檢索支援裝置的抽取部從檢索對象的文書集合中抽取關鍵字候補的步驟;
上述檢索支援裝置的計算部對于被抽取的2個關鍵字候補的組合計算搭配概率的步驟,其中,該搭配概率是一個關鍵字候補與另一個關鍵字候補一起出現在上述文書集合內的同一文書中的概率;
上述檢索支援裝置的檢測部檢測搭配關鍵字組的步驟,其中,該搭配關鍵字組是上述搭配概率滿足第1條件的2個關鍵字候補的組合;
上述檢索支援裝置的第1生成部生成搭配字典的步驟,其中,該搭配字典是將上述搭配關鍵字組的一方的關鍵字候補作為詞條、將另一方的關鍵字候補作為搭配詞語的字典要素的集合;
上述檢索支援裝置的第2生成部生成字符串補充規則的步驟,其中,該字符串補充規則是用于對輸入字符串進行補充而得到上述搭配關鍵字組中所含的關鍵字候補的規則;
上述檢索支援裝置的第1識別部將按照上述字符串補充規則對輸入字符串進行補充而得到的關鍵字候補,識別為輸入關鍵字的步驟;
上述檢索支援裝置的搭配傳播部反復進行參照上述搭配字典、取得將上述輸入關鍵字作為詞條的字典要素的搭配詞語、取得將取得的搭配詞語作為詞條的字典要素的搭配詞語的處理的步驟;
上述檢索支援裝置的第2識別部把將輸入關鍵字和通過上述搭配傳播部的處理而取得的搭配詞語關聯起來的字串之中的、滿足第2條件的字串,識別為提議字串的步驟;
上述檢索支援裝置的提示部提示上述提議字串的步驟;及
上述檢索支援裝置的檢索部在提示的上述提議字串被選擇的情況下,根據該提議字串來生成檢索式而進行針對上述文書集合的檢索的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝;東芝解決方案株式會社,未經株式會社東芝;東芝解決方案株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210082643.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種襪子展示架
- 下一篇:用于凳子或椅子的調節支架





