[發明專利]基于深度問答的查詢結果的展現方法和裝置有效
| 申請號: | 201611224370.9 | 申請日: | 2016-12-27 |
| 公開(公告)號: | CN106777236B | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 陳雁峰 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/338;G06F16/35 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 問答 查詢 結果 展現 方法 裝置 | ||
1.一種基于深度問答的查詢結果的展現方法,其特征在于,包括:
接收查詢,所述查詢為預設領域的預設類型的查詢;
獲取與所述查詢對應的聚合結果的短觀點,每個聚合結果根據同一個觀點簇內的觀點句所在的網頁聚合得到,聚合結果的短觀點根據對應的觀點簇內的觀點句得到;
展現所述聚合結果的短觀點;
其中,所述獲取與所述查詢對應的聚合結果的短觀點,包括:
對接收的查詢進行識別,判斷所述查詢是否為預設領域的預設類型的查詢;
在所述查詢為預設領域的預設類型的查詢時,執行如下內容:
在預先建立的網頁資源庫中獲取與所述查詢對應的網頁;
在所述網頁中抽取觀點句;
對所述觀點句進行聚合和歸一化,得到觀點簇及其短觀點;
對所述觀點簇進行簇外和簇內排序和選擇,得到選擇后的觀點簇和選擇后的觀點簇內的觀點句所在的網頁,以及,將每個選擇后的觀點簇內的觀點句所在的網頁聚合成一個聚合結果,并將每個選擇后的觀點簇的短觀點確定為對應的聚合結果的短觀點;
其中,所述在所述網頁中抽取觀點句,包括:
對所述網頁進行分句,得到所述網頁中的句子;
如果所述句子為短句,則基于機器學習判斷所述短句是否為觀點句;
如果所述短句為觀點句,則將所述短句作為所述網頁中的觀點句;
其中,所述基于機器學習判斷所述短句是否為觀點句包括:
提取所述短句的特征;
將所述短句的特征輸入到預先建立的與所述查詢所屬類型對應的分類器中,獲取所述短句的置信度;
如果所述置信度大于預設值,則確定所述短句為觀點句;
其中,與所屬述查詢所類型對應的分類器是通過收集與所屬述查詢所類型對應的答案句子,并對所述答案句子進行是否為觀點句的標注,并提取所述答案句子的特征,依據提取的特征和標注結果進行訓練得到的;
其中,所述對所述觀點句進行聚合和歸一化,得到觀點簇及其短觀點,包括:
計算觀點句之間的相似度,并根據相似度對觀點句進行聚類,得到多個類;確定每個類的關鍵詞,并對關鍵詞相同的類進行合并,將合并后的每個類作為一個觀點簇;
對觀點簇內的觀點句進行歸一化,得到觀點簇的短觀點。
2.根據權利要求1所述的方法,其特征在于,還包括:
接收到對聚合結果的選擇指令后,展現選擇的聚合結果對應的網頁信息。
3.根據權利要求1所述的方法,其特征在于,還包括:
在得到聚合結果后,根據聚合結果的短觀點生成摘要信息,并對應所述聚合結果展現摘要信息。
4.根據權利要求1所述的方法,其特征在于,所述網頁資源庫包括:
通用網頁資源庫;以及,
所述預設領域的垂類網頁資源庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611224370.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種評估不同數據源數據準確度的方法和裝置
- 下一篇:一種表面缺陷的分析方法





