[發明專利]文檔搜索裝置和文檔搜索方法在審
| 申請號: | 201280067066.1 | 申請日: | 2012-12-27 |
| 公開(公告)號: | CN104221012A | 公開(公告)日: | 2014-12-17 |
| 發明(設計)人: | 藤井洋一;石井純 | 申請(專利權)人: | 三菱電機株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 金春實 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 搜索 裝置 方法 | ||
1.一種文檔搜索裝置,具備:根據預先準備的文檔制作的搜索索引;以及文檔搜索部,接收來自用戶的輸入,使用所述搜索索引從所述文檔內搜索與該用戶輸入有關聯的項目,該文檔搜索裝置的特征在于,具備:
發聲估計模型,學習了詢問所述文檔的內容的設想提問與成為該設想提問的回答的所述文檔內的項目的對應關系;
發聲內容估計部,基于所述發聲估計模型從所述文檔內估計與所述用戶輸入的回答相當的項目;以及
結果合并部,將從所述文檔搜索部得到的文檔搜索結果與從所述發聲內容估計部得到的文檔估計結果進行合并來生成最終搜索結果。
2.根據權利要求1所述的文檔搜索裝置,其特征在于,
所述發聲內容估計部對估計出的所述文檔內的項目賦予與和所述用戶輸入的關聯程度相應的分數,
所述結果合并部在從所述發聲內容估計部得到的文檔估計結果的分數大于預先決定的值的情況下,忽略從所述文檔搜索部得到的文檔搜索結果來生成最終搜索結果。
3.根據權利要求1所述的文檔搜索裝置,其特征在于,
所述文檔搜索部對搜索出的所述文檔內的項目賦予與和所述用戶輸入的關聯程度相應的分數,
所述發聲內容估計部對估計出的所述文檔內的項目賦予與和所述用戶輸入的關聯程度相應的分數,
所述結果合并部將從所述文檔搜索部得到的文檔搜索結果的分數與從所述發聲內容估計部得到的文檔估計結果的分數以一定的比例相加來進行合并。
4.根據權利要求1所述的文檔搜索裝置,其特征在于,
具備搜索對象限定部,該搜索對象限定部提取從所述發聲內容估計部得到的文檔估計結果中的滿足規定的條件的項目,
所述發聲內容估計部基于學習了比所述搜索索引的搜索的最小單位大的單位的項目與所述設想提問的對應關系的發聲估計模型進行估計,
所述結果合并部將從所述發聲內容估計部得到的文檔估計結果中的由所述搜索對象限定部提取的項目與從所述文檔搜索部得到的文檔搜索結果進行合并。
5.根據權利要求1所述的文檔搜索裝置,其特征在于,具備:
輸入分析部,分析預先準備的文檔以及收集發聲數據,其中,該收集發聲數據定義了詢問該文檔的內容的設想提問與成為該提問的回答的該文檔內的項目的對應關系;
搜索索引制作部,根據從所述輸入分析部輸出的所述文檔的分析結果制作所述搜索索引;以及
發聲估計模型制作部,使用從所述輸入分析部輸出的所述收集發聲數據的分析結果,學習所述設想提問與所述文檔內的項目的對應關系,制作所述發聲估計模型。
6.一種文檔搜索方法,其特征在于,具備以下步驟:
用戶輸入步驟,接收來自用戶的輸入;
文檔搜索步驟,使用根據預先準備的文檔制作的搜索索引,從該文檔內搜索與所述用戶輸入有關聯的項目;
發聲內容估計步驟,基于學習了詢問所述文檔的內容的設想提問與成為該設想提問的回答的所述文檔內的項目的對應關系的發聲估計模型,從所述文檔內估計與所述用戶輸入的回答相當的項目;以及
結果合并步驟,將從所述文檔搜索步驟得到的文檔搜索結果與從所述發聲內容估計步驟得到的文檔估計結果進行合并來生成最終搜索結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三菱電機株式會社,未經三菱電機株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201280067066.1/1.html,轉載請聲明來源鉆瓜專利網。





