[發(fā)明專利]信息查詢方法、系統(tǒng)以及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202310367208.6 | 申請(qǐng)日: | 2023-04-07 |
| 公開(kāi)(公告)號(hào): | CN116089599B | 公開(kāi)(公告)日: | 2023-07-25 |
| 發(fā)明(設(shè)計(jì))人: | 郝亮;馬永亮;周明 | 申請(qǐng)(專利權(quán))人: | 北京瀾舟科技有限公司 |
| 主分類號(hào): | G06F16/335 | 分類號(hào): | G06F16/335;G06F16/338;G06F16/34;G06F16/9535;G06F16/9538 |
| 代理公司: | 深圳市智享知識(shí)產(chǎn)權(quán)代理有限公司 44361 | 代理人: | 鄒學(xué)瓊 |
| 地址: | 100000 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 查詢 方法 系統(tǒng) 以及 存儲(chǔ) 介質(zhì) | ||
本發(fā)明涉及信息檢索技術(shù)領(lǐng)域,特別涉及一種信息查詢方法、系統(tǒng)及存儲(chǔ)介質(zhì),本發(fā)明提供的信息查詢方法,包括以下步驟:根據(jù)獲取的搜索詞確定對(duì)應(yīng)的多個(gè)第一目標(biāo)文檔;提取每個(gè)第一目標(biāo)文檔中與搜索詞相關(guān)的多個(gè)要點(diǎn)及對(duì)應(yīng)的多個(gè)段落;進(jìn)行要點(diǎn)整合,獲得多個(gè)第一要點(diǎn)及對(duì)應(yīng)多個(gè)第一段落;判斷是否存在至少一個(gè)與第一目標(biāo)文檔或第一要點(diǎn)相關(guān)的相關(guān)特征值小于對(duì)應(yīng)的預(yù)設(shè)特征閾值,和/或搜索輪次是否大于預(yù)設(shè)閾值;若是,則將多個(gè)第一要點(diǎn)和多個(gè)第一段落進(jìn)行全局整合形成層次化摘要進(jìn)行展示。實(shí)現(xiàn)了用戶只需發(fā)起一次搜索,就可直接閱讀返回的文本信息,無(wú)需手動(dòng)點(diǎn)擊鏈接、提取信息、整合、重新搜索,大幅節(jié)省用戶查詢信息的交互成本。
技術(shù)領(lǐng)域
本發(fā)明涉及信息檢索技術(shù)領(lǐng)域,特別涉及一種信息查詢方法、系統(tǒng)以及存儲(chǔ)介質(zhì)。
背景技術(shù)
現(xiàn)有查詢信息的方式主要為搜索引擎,現(xiàn)有搜索引擎的交互方式是:用戶輸入搜索詞,表達(dá)自己的搜索意圖,搜索引擎返回結(jié)果,以網(wǎng)站鏈接的列表形式展現(xiàn)。用戶瀏覽這些結(jié)果,從里面提取出和搜索意圖有關(guān)的信息,進(jìn)行整合。如果用戶想要獲得更多相關(guān)的信息,或者深入了解某一點(diǎn),需要再次輸入搜索詞,發(fā)起新的搜索。用戶需將幾次搜索獲得的信息整合起來(lái)。
但這種交互方式中有幾處均需要用戶人工參與的工作:從搜索結(jié)果中提取出需要的信息、信息的整合、換搜索詞再次發(fā)起搜索,這些工作增加了用戶使用搜索引擎獲取信息的成本。
發(fā)明內(nèi)容
為解決使用現(xiàn)有搜索引擎進(jìn)行搜索將增加獲取信息的成本中的問(wèn)題,本發(fā)明提供了一種信息查詢方法、系統(tǒng)以及存儲(chǔ)介質(zhì)。
本發(fā)明解決技術(shù)問(wèn)題的方案是提供一種信息查詢方法,包括以下步驟:
獲取搜索詞,根據(jù)所述搜索詞確定對(duì)應(yīng)的多個(gè)第一目標(biāo)文檔;
提取每個(gè)所述第一目標(biāo)文檔中與所述搜索詞相關(guān)的多個(gè)要點(diǎn)及對(duì)應(yīng)的多個(gè)段落;
將多個(gè)所述第一目標(biāo)文檔中提取出來(lái)的多個(gè)要點(diǎn)及對(duì)應(yīng)的多個(gè)段落進(jìn)行要點(diǎn)整合,獲得多個(gè)第一要點(diǎn)及對(duì)應(yīng)多個(gè)第一段落;
判斷是否存在至少一個(gè)與所述第一目標(biāo)文檔或所述第一要點(diǎn)相關(guān)的相關(guān)特征值小于對(duì)應(yīng)的預(yù)設(shè)特征閾值,和/或搜索輪次是否大于預(yù)設(shè)閾值;
若是,則將多個(gè)所述第一要點(diǎn)和多個(gè)所述第一段落進(jìn)行全局整合形成層次化摘要進(jìn)行展示。
優(yōu)選地,獲取搜索詞,根據(jù)所述搜索詞返回對(duì)應(yīng)的多個(gè)第一目標(biāo)文檔,具體包括以下步驟:
獲取用戶輸入的搜索詞;
通過(guò)搜索引擎對(duì)所述搜索詞進(jìn)行搜索,以返回對(duì)應(yīng)的多個(gè)文檔列表;
根據(jù)文檔列表的排序,確定搜索詞對(duì)應(yīng)的多個(gè)第一目標(biāo)文檔。
優(yōu)選地,提取每個(gè)所述第一目標(biāo)文檔中與所述搜索詞相關(guān)的多個(gè)要點(diǎn)及對(duì)應(yīng)的多個(gè)段落,具體包括以下步驟:
通過(guò)摘要模型從每個(gè)所述第一目標(biāo)文檔中提取出與所述搜索詞相關(guān)的多個(gè)要點(diǎn);
通過(guò)閱讀理解模型在每個(gè)所述第一目標(biāo)文檔中抽取出與多個(gè)所述要點(diǎn)對(duì)應(yīng)的多個(gè)段落。
優(yōu)選地,將多個(gè)所述第一目標(biāo)文檔中提取出來(lái)的多個(gè)要點(diǎn)及對(duì)應(yīng)的多個(gè)段落進(jìn)行要點(diǎn)整合,獲得多個(gè)第一要點(diǎn)及對(duì)應(yīng)多個(gè)第一段落,具體包括以下步驟:
通過(guò)匹配模型將提取出的多個(gè)要點(diǎn)進(jìn)行一一匹配,獲得多個(gè)要點(diǎn)之間對(duì)應(yīng)的多個(gè)相似度;
判斷是否存在至少一個(gè)所述相似度大于預(yù)設(shè)第一閾值;
若是,則進(jìn)行去重并將所述相似度大于預(yù)設(shè)第一閾值對(duì)應(yīng)的要點(diǎn)所對(duì)應(yīng)的段落進(jìn)行合并,獲得多個(gè)第一段落;
判斷去重后的剩余要點(diǎn)之間是否存在至少一個(gè)相似度大于預(yù)設(shè)第二閾值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京瀾舟科技有限公司,未經(jīng)北京瀾舟科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310367208.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 帶有前處理和后處理的數(shù)據(jù)庫(kù)復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫(kù)查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語(yǔ)言的查詢方法及查詢系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





