[發明專利]一種提供聚合類型回答的方法和裝置有效
| 申請號: | 201510975343.4 | 申請日: | 2015-12-22 |
| 公開(公告)號: | CN105608183B | 公開(公告)日: | 2018-11-02 |
| 發明(設計)人: | 鄭思晴 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京天達知識產權代理事務所(普通合伙) 11386 | 代理人: | 張春;馬東偉 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提供 聚合 類型 回答 方法 裝置 | ||
本發明提供了一種提供聚合類型的智能回答的方法和裝置,所述方法根據接收到的查詢詞,獲取與所述查詢詞對應的聚合問題;在知識庫中獲取與所述聚合問題所對應的聚合答案數據;輸出所述聚合問題所對應的所述回答數據。該方法可以縮短用戶信息尋找路徑,改善用戶的體驗,使得用戶界面更加友好。此外,本發明的技術方案還能夠有效的提高信息獲取效率,將原來需要多次勞動才能得到的結論通過聚合方式進行集成綜合處理,從而大大簡化了用戶的操作。
技術領域
本發明涉及互聯網技術領域,尤其涉及一種提供聚合類型回答的方法和裝置。
背景技術
隨著互聯網技術的不斷發展,用戶對于互聯網信息的需求越來越高,搜索引擎成為用戶獲取互聯網信息的重要工具。用戶在搜索引擎對應應用的搜索框中輸入查詢詞,即搜索關鍵詞,由應用將搜索關鍵詞發送給搜索引擎;而搜索引擎根據搜索關鍵詞,在數據庫中進行搜索,將獲取與搜索關鍵詞匹配的資源作為若干個搜索結果項,返回給應用進行輸出。
現有技術中,如果用戶想要通過搜索關鍵詞獲取問答查詢的查詢結果,由于原始知識庫中的資源都是相互獨立的單一資源,使得每個搜索結果項也是單一內容,使得用戶需要逐個點開多個搜索結果項,以獲取一個綜合性認知結論,無法快速滿足用戶真正的搜索意圖。除了個別與第三方網站有合作的站點可以提供建議答案外,對于絕大多數問答查詢,結果中都只有自然結果的羅列。用戶需要點擊普通自然結果進入相應落地頁,在落地頁中再去尋找需要的內容。
現有技術的存在如下缺陷:1)用戶從搜索行為到最終找到想要的內容,由于點擊-跳出-再點擊的成本很高,導致用戶操作不便且耗時較長,體驗不佳;2)信息獲取效率偏低;3)會增加應用與搜索引擎之間的數據交互,從而增加了搜索引擎的處理負擔。
發明內容
為了解決現有技術中的上述問題,本發明提出了一種提供聚合類型的智能回答的方法和裝置。
根據本發明的一個方面,提供了一種提供聚合類型的智能回答的方法,包括:
根據接收到的查詢詞,獲取與所述查詢詞對應的聚合問題;
在知識庫中獲取與所述聚合問題所對應的聚合答案數據;
輸出所述聚合問題對應的所述聚合答案數據。
進一步的,所述知識庫為問答對,即聚合問題-聚合答案資源對。
進一步的,所述根據接收到的查詢詞,獲取與所述查詢詞對應的聚合問題,包括:
基于語義的匹配方式,獲取與所述查詢詞匹配的聚合問題。
進一步的,還包括:
對問題類查詢詞進行基于語義的聚合處理,以獲取聚合問題;
獲取聚合問題的歷史查詢語句對應的歷史庫搜索結果中的網頁;
根據預設規則確定上述網頁中用于建立知識庫的多個網頁;
確定所述多個網頁中包含的至少一組答案類數據;
基于所確定的答案類數據進行聚合,生成知識庫。
進一步的,所述根據預設規則確定用于建立知識庫的多個網頁,包括:
根據歷史搜索結果中的網頁的站點的比例及站點類型確定哪些站點的網頁用于建立知識庫庫。
進一步的,所述確定所述多個網頁中包含的至少一組答案類數據,包括:
分析所述用于建立數據庫的多個網頁的頁面數據,得到所述多個網頁中包含的至少一組問答類數據;
抽取所得到的問答類數據中包含的答案類數據。
進一步的,所述抽取所得到的問答類數據中包含的答案類數據,包括
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510975343.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:苯并呋喃殺寄生物劑
- 下一篇:一種分布式大數據分析方法





