[發明專利]信息的獲取方法和裝置有效
| 申請號: | 201110096477.0 | 申請日: | 2011-04-18 |
| 公開(公告)號: | CN102750278B | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 焦峰;李亞楠;楊月奎 | 申請(專利權)人: | 深圳市世紀光速信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司11138 | 代理人: | 劉映東 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 獲取 方法 裝置 | ||
技術領域
本發明涉及通信技術領域,特別涉及一種信息的獲取方法和裝置。
背景技術
問答系統是互聯網用戶獲取知識的一種常見工具,其用于幫助解答用戶提出的新問題或提供相關知識供用戶瀏覽,例如百度知道、搜搜問問等。為了滿足用戶的信息需求,問答系統會通過相關問題檢索系統向用戶推薦一些相關問題。例如,用戶在提問時,相關問題檢索系統會顯示與其輸入問題相關的問題和答案;用戶在瀏覽問題時,相關問題檢索系統會推送與當前瀏覽問題相關的其他問題或答案。如何提升用戶的滿意度,使用戶通過問答系統更便利的獲取其關注的問題及答案,成為目前問答系統的主要發展方向。
現有的問答系統,通過檢索與用戶問題最接近的幾個相關問題并依次展示給用戶。其技術實現為:首先,獲取用戶點擊或輸入的問題Q;然后,利用信息檢索或自然語言處理技術,從以往收集或記錄的問題數據庫中檢索出與問題Q相關的問題集R(Q);然后,對R(Q)中相關問題按照與Q的語義相關度進行排序;最后,選取R(Q)中排名最高的N條相關問題進行展示。其中,N為相關問題在頁面上顯示條數的最大值。
現有的問答系統,為用戶提供與用戶提出的問題在語義上相關的信息。而用戶往往具有不同的信息需求,例如,當用戶希望獲取與其輸入的問題相關的多方面內容時,通過現有的問答系統給出的相關問題則都是與用戶輸入的問題在語義上相同的問題,即使數據庫中存在與該用戶輸入問題相關其他方面的信息,也可能由于該其他方面的信息與用于輸入的問題在語義上不同而無法被現有的問答系統檢索到,從而無法反饋給用戶,用戶只有通過多次輸入不同語義的為題,來獲取其關注的信息。
發明內容
為了簡化搜索操作,提高用戶體驗,本發明實施例提供了一種信息的獲取方法,所述方法包括:
獲取用戶輸入的關鍵字;
根據預設的關鍵字匹配條件,獲取與所述關鍵字內容匹配的信息集;
將所述信息集中的信息區分為所述關鍵字的同義信息和近義信息,所述同義信息為與所述關鍵字的語義相同的信息,所述近義信息為與所述關鍵字的語義相近的信息;
發送所述同義信息和所述近義信息至所述用戶。
所述將所述信息集中的信息區分為所述關鍵字的同義信息和近義信息具體包括:
計算所述信息集中的信息與所述關鍵字的語義相似度;
判斷所述語義相似度是否大于或等于預設相似度閾值,如果所述語義相似度大于或等于預設相似度閾值大于,則所述信息為同義信息;如果所述語義相似度小于預設相似度閾值,則所述信息為近義信息。
所述將所述信息集中的信息區分為所述關鍵字的同義信息和近義信息具體包括:
獲取所述關鍵字的信息特征值;
查詢本地保存的信息與信息特征值的對應關系,獲取所述信息集中各信息的信息特征值;
獲取所述信息集中信息特征值大于所述關鍵字的信息特征值的信息,得到第一臨時信息集,將所述第一臨時信息集中的信息作為同義信息;
獲取所述信息集中信息特征值小于所述關鍵字的信息特征值的信息,得到第二臨時信息集,將所述第二臨時信息集中的信息作為近義信息。
所述獲取所述關鍵字的信息特征值之前,所述方法還包括:
根據預設的信息特征提取條件,獲取本地保存的信息的信息特征;
根據預設的信息特征的權值和所述本地保存的信息的信息特征,生成所述本地保存的信息的信息特征值;
生成所述本地保存的信息與其信息特征值的對應關系,并將所述對應關系保存在本地。
所述將所述信息集中的信息區分為所述關鍵字的同義信息和近義信息具體包括:
根據預設的語義轉換標準,計算所述信息集中的信息轉換成所述關鍵字的概率;
判斷所述概率是否大于或等于預設的轉換概率,如果所述概率大于或等于預設的轉換概率,則所述信息為同義信息;如果所述概率小于預設的轉換概率,則所述信息為近義信息。
所述發送所述同義信息和所述近義信息至所述用戶具體包括:
對所述同義信息按其與所述關鍵字的匹配度由高到低進行排序;
將排序后的同義信息,按順序依次發送給用戶;
對所述近義信息按其與所述關鍵字的匹配度由高到低進行排序;
將排序后的近義信息,按順序依次發送給用戶。
本發明實施例還提供了一種信息的獲取裝置,所述裝置包括:
關鍵字獲取模塊,用于獲取用戶輸入的關鍵字;
信息集獲取模塊,用于根據預設的關鍵字匹配條件,獲取與所述關鍵字內容匹配的信息集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市世紀光速信息技術有限公司,未經深圳市世紀光速信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110096477.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:流體混合器和使用流體混合器的裝置
- 下一篇:通信網絡中中繼節點的標識
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





