[發(fā)明專利]信息檢索方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201810065115.7 | 申請(qǐng)日: | 2018-01-23 |
| 公開(公告)號(hào): | CN108446295B | 公開(公告)日: | 2021-02-12 |
| 發(fā)明(設(shè)計(jì))人: | 康平陸;楊新宇;陳欽明 | 申請(qǐng)(專利權(quán))人: | 深圳市阿西莫夫科技有限公司 |
| 主分類號(hào): | G06F16/951 | 分類號(hào): | G06F16/951;G06F16/953;G06F16/9532;G06F16/33;G06F16/332;G06K9/62 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 謝曲曲 |
| 地址: | 518051 廣東省深圳市南山區(qū)粵海街*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 檢索 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種信息檢索方法,所述方法包括:
接收用戶的信息檢索請(qǐng)求,所述信息檢索請(qǐng)求攜帶了目標(biāo)問題;
獲取預(yù)設(shè)的多個(gè)檢索路徑以及每個(gè)所述檢索路徑對(duì)應(yīng)的調(diào)用順序;
根據(jù)所述調(diào)用順序獲取第一順序的檢索路徑,利用獲取到的檢索路徑對(duì)所述目標(biāo)問題進(jìn)行檢索,得到臨時(shí)信息庫(kù);所述臨時(shí)信息庫(kù)包括多個(gè)信息對(duì),所述信息對(duì)包括檢索結(jié)果,以及所述檢索結(jié)果對(duì)應(yīng)的關(guān)聯(lián)問題;
識(shí)別所述目標(biāo)問題的問題類別;
識(shí)別多個(gè)關(guān)聯(lián)問題的問題類別;
根據(jù)所述關(guān)聯(lián)問題的問題類別和所述目標(biāo)問題的問題類別,對(duì)所述信息對(duì)進(jìn)行過濾;
計(jì)算過濾得到的多個(gè)信息對(duì)中每個(gè)檢索結(jié)果與所述目標(biāo)問題的相似度;
檢測(cè)是否存在與所述目標(biāo)問題的相似度達(dá)到閾值的信息對(duì);
當(dāng)不存在與所述目標(biāo)問題的相似度達(dá)到閾值的信息對(duì)時(shí),根據(jù)所述調(diào)用順序獲取下一順序的檢索路徑,返回所述利用獲取到的檢索路徑對(duì)所述目標(biāo)問題進(jìn)行檢索的步驟;
當(dāng)存在與所述目標(biāo)問題的相似度達(dá)到閾值的信息對(duì)時(shí),抽取所述相似度達(dá)到閾值的檢索結(jié)果作為目標(biāo)結(jié)果,展示所述目標(biāo)結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,識(shí)別所述目標(biāo)問題的問題類別的步驟,包括:
對(duì)所述目標(biāo)問題進(jìn)行預(yù)處理,得到所述目標(biāo)問題對(duì)應(yīng)的目標(biāo)關(guān)鍵詞;
獲取預(yù)設(shè)的多個(gè)問題類別以及每個(gè)問題類別對(duì)應(yīng)的多個(gè)詞袋,所述詞袋包括多個(gè)預(yù)設(shè)關(guān)鍵詞;
將所述目標(biāo)關(guān)鍵詞與多個(gè)詞袋中的預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配;
當(dāng)所述目標(biāo)問題包含了一個(gè)詞袋時(shí),根據(jù)相匹配的詞袋對(duì)應(yīng)的問題類別對(duì)所述目標(biāo)問題進(jìn)行分類;
當(dāng)所述目標(biāo)問題包含了多個(gè)詞袋時(shí),根據(jù)相匹配的多個(gè)詞袋包含預(yù)設(shè)關(guān)鍵詞的數(shù)量和/或權(quán)重確定相匹配的多個(gè)詞袋的優(yōu)先級(jí),根據(jù)相匹配的多個(gè)詞袋包含預(yù)設(shè)關(guān)鍵詞的數(shù)量和/或權(quán)重確定相匹配的多個(gè)詞袋的優(yōu)先級(jí)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,對(duì)所述目標(biāo)問題進(jìn)行預(yù)處理的步驟,包括:
對(duì)所述目標(biāo)問題進(jìn)行拆分處理,得到對(duì)應(yīng)的多個(gè)目標(biāo)分詞;所述目標(biāo)分詞包括停用詞或標(biāo)點(diǎn)符號(hào);
對(duì)多個(gè)目標(biāo)分詞進(jìn)行過濾,刪除所述停用詞和所述標(biāo)點(diǎn)符號(hào);
對(duì)過濾后的多個(gè)目標(biāo)分詞進(jìn)行同義詞替換;
對(duì)過濾后的多個(gè)目標(biāo)分詞進(jìn)行命名實(shí)體替換。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,在獲取預(yù)設(shè)的多個(gè)問題類別以及每個(gè)問題類別對(duì)應(yīng)的多個(gè)詞袋的步驟之前,還包括:
獲取問題語料;所述問題語料包括多個(gè)問題類別以及每個(gè)問題類別對(duì)應(yīng)的多個(gè)預(yù)設(shè)問題;
對(duì)多個(gè)預(yù)設(shè)問題進(jìn)行預(yù)處理,得到每個(gè)預(yù)設(shè)問題對(duì)應(yīng)的一個(gè)或多個(gè)中間關(guān)鍵詞;
計(jì)算每個(gè)中間關(guān)鍵詞的TF-IDF值,根據(jù)所述TF-IDF值對(duì)多個(gè)中間關(guān)鍵詞進(jìn)行篩選,將篩選得到的多個(gè)中間關(guān)鍵詞作為預(yù)設(shè)關(guān)鍵詞;
利用每個(gè)預(yù)設(shè)問題對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)設(shè)關(guān)鍵詞,生成相應(yīng)預(yù)設(shè)問題的詞袋,將所述詞袋與相應(yīng)的問題類別進(jìn)行關(guān)聯(lián)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)TF-IDF值對(duì)多個(gè)中間關(guān)鍵詞進(jìn)行篩選,將篩選得到的多個(gè)中間關(guān)鍵詞作為預(yù)設(shè)關(guān)鍵詞的步驟,包括:
根據(jù)所述TF-IDF值對(duì)多個(gè)中間關(guān)鍵詞進(jìn)行排序;
按照排序?qū)Χ鄠€(gè)中間關(guān)鍵詞進(jìn)行遍歷,若當(dāng)前順序的中間關(guān)鍵詞的TF-IDF值超過預(yù)設(shè)倍數(shù)的下一順序中間關(guān)鍵詞的TF-IDF值,將所述當(dāng)前順序的中間關(guān)鍵詞與所述下一順序中間關(guān)鍵詞之間的位置作為截取位置;
根據(jù)所述截取位置截取排序靠前的多個(gè)中間關(guān)鍵詞,將截取到的多個(gè)中間關(guān)鍵詞作為預(yù)設(shè)關(guān)鍵詞。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
獲取多個(gè)目標(biāo)結(jié)果的滿意度反饋;
對(duì)所述滿意度反饋進(jìn)行大數(shù)據(jù)分析;
根據(jù)大數(shù)據(jù)分析結(jié)果對(duì)所述閾值和/或多個(gè)檢索路徑的調(diào)用順序進(jìn)行調(diào)整。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市阿西莫夫科技有限公司,未經(jīng)深圳市阿西莫夫科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810065115.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





