[發明專利]文獻搜索方法及設備、作者搜索方法及設備在審
| 申請號: | 201610007271.9 | 申請日: | 2016-01-06 |
| 公開(公告)號: | CN106951420A | 公開(公告)日: | 2017-07-14 |
| 發明(設計)人: | 宋雙永;房璐;繆慶亮;孟遙 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 康建峰,吳瓊 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文獻 搜索 方法 設備 作者 | ||
技術領域
本發明一般地涉及自然語言處理領域。具體而言,本發明涉及一種能夠準確地獲得搜索結果的文獻搜索方法及設備、作者搜索方法及設備。
背景技術
近年來,隨著信息存儲能力和網絡搜索技術的快速提升,目前的學術文獻的查找和相關學者的搜索大部分通過網絡檢索平臺完成。網絡檢索平臺多采用與通用搜索引擎類似的基于關鍵詞匹配和文本相似度的檢索方式,這樣的檢索方式雖然在通用搜索引擎中表現不錯,但是針對學術文獻/作者的搜索,則欠缺考慮學術領域的分類、領域層次結構等方面的信息,使得搜索返回的結果不夠精準。
舉例來說,數據挖掘技術有一個具體的分支是情感分析。如果搜索情感分析方面的學術文獻,不可避免地會返回一些甚至很多專注于數據挖掘這一高層次抽象研究的文獻,可能僅僅因為在其中提及了情感分析,或者對情感分析進行簡要介紹。但是,搜索者實際上并不關心抽象的數據挖掘,而是希望獲得情感分析這一較低層次的具體研究成果。當搜索情感分析領域的作者時,返回結果中也會摻雜有專注于數據挖掘的抽象研究的作者。
可見,現有技術的問題在于搜索結果不夠精準,產生問題的根源在于沒有充分利用層次信息。
因此,本發明旨在準確地進行文獻搜索和作者搜索。
發明內容
在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖確定本發明的關鍵或重要部分,也不是意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
本發明的目的是提出一種返回準確搜索結果的文獻搜索方法及設備、作者搜索方法及設備。
為了實現上述目的,根據本發明的一個方面,提供了一種文獻搜索方法,該方法包括:接收關于要搜索的文獻的查詢文本;利用層次語義模型,確定與查詢文本相關的層次語義主題;以及從與所確定的層次語義主題相關的文獻中,選擇文獻,作為搜索結果。
根據本發明的另一個方面,提供了一種文獻搜索設備,該設備包括:查詢文本接收裝置,被配置為:接收關于要搜索的文獻的查詢文本;主題確定裝置,被配置為:利用層次語義模型來確定與查詢文本相關的層次語義主題;以及文獻選擇裝置,被配置為:從與所確定的層次語義主題相關的文獻中,選擇文獻,作為搜索結果。
根據本發明的再一方面,提供了一種作者搜索方法,該方法包括:接收關于要搜索的作者的查詢文本;利用層次語義模型,確定與查詢文本相關的層次語義主題;以及從與所確定的層次語義主題相關的作者中,選擇作者,作為搜索結果。
根據本發明的又一方面,提供了一種作者搜索設備,該設備包括:查詢文本接收裝置,被配置為:接收關于要搜索的作者的查詢文本;主題確定裝置,被配置為:利用層次語義模型來確定與查詢文本相關的層次語義主題;以及作者選擇裝置,被配置為:從與所確定的層次語義主題相關的作者中,選擇作者,作為搜索結果。
另外,根據本發明的另一方面,還提供了一種存儲介質。所述存儲介 質包括機器可讀的程序代碼,當在信息處理設備上執行所述程序代碼時,所述程序代碼使得所述信息處理設備執行根據本發明的上述方法。
此外,根據本發明的再一方面,還提供了一種程序產品。所述程序產品包括機器可執行的指令,當在信息處理設備上執行所述指令時,所述指令使得所述信息處理設備執行根據本發明的上述方法。
附圖說明
參照下面結合附圖對本發明的實施例的說明,會更加容易地理解本發明的以上和其它目的、特點和優點。附圖中的部件只是為了示出本發明的原理。在附圖中,相同的或類似的技術特征或部件將采用相同或類似的附圖標記來表示。附圖中:
圖1示出了根據本發明的實施例的文獻搜索方法的流程圖;
圖2示出了層次主題模型得到的隱含層次主題結構的示例;
圖3示出了層次主題模型得到的隱含層次主題結構的示例;
圖4示出了步驟S2的具體實現方式;
圖5示出了根據本發明的實施例的作者搜索方法的流程圖;
圖6示出了根據本發明的實施例的文獻搜索設備的結構方框圖;
圖7示出了根據本發明的實施例的作者搜索設備的結構方框圖;以及
圖8示出了可用于實施根據本發明的實施例的方法和設備的計算機的示意性框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610007271.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:高效飼料混合機
- 下一篇:一種緩沖型化工雙攪拌裝置





