[發(fā)明專利]一種信息查詢方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)在審
| 申請?zhí)枺?/td> | 201910818419.0 | 申請日: | 2019-08-30 |
| 公開(公告)號: | CN112307073A | 公開(公告)日: | 2021-02-02 |
| 發(fā)明(設(shè)計(jì))人: | 不公告發(fā)明人 | 申請(專利權(quán))人: | 北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號: | G06F16/2457 | 分類號: | G06F16/2457;G06F16/248 |
| 代理公司: | 北京遠(yuǎn)智匯知識產(chǎn)權(quán)代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 信息 查詢 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種信息查詢方法,其特征在于,包括:
基于預(yù)先采集的數(shù)據(jù)構(gòu)建語料庫,并統(tǒng)計(jì)所述語料庫中的每個(gè)詞的詞頻;
獲取用戶輸入的語音查詢指令,并對所述語音查詢指令進(jìn)行用戶意圖識別,得到所述用戶意圖對應(yīng)的文字對象;
根據(jù)所述文字對象的拼音和聲調(diào),在所述語料庫中進(jìn)行檢索,得到至少一個(gè)檢索結(jié)果,其中所述檢索結(jié)果為與所述文字對象具有相同發(fā)音的詞;
讀取每個(gè)檢索結(jié)果對應(yīng)的詞頻,并根據(jù)所述詞頻對所述至少一個(gè)檢索結(jié)果進(jìn)行排序;
根據(jù)排序結(jié)果顯示所述至少一個(gè)檢索結(jié)果,以供用戶選擇;
響應(yīng)于用戶對某一檢索結(jié)果的觸發(fā)操作,導(dǎo)航到下一級頁面進(jìn)行信息查詢。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于預(yù)先采集的數(shù)據(jù)構(gòu)建語料庫,并統(tǒng)計(jì)所述語料庫中每個(gè)詞的詞頻,包括:
對采集到的數(shù)據(jù)進(jìn)行分詞處理,去除其中包括的停用詞或無意義詞,得到語料庫;
基于TF-IDF算法進(jìn)行詞頻統(tǒng)計(jì),并將詞頻統(tǒng)計(jì)結(jié)果以數(shù)據(jù)列表的形式保存在語料庫中。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
將排在第一位的檢索結(jié)果進(jìn)行高亮顯示。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述用戶語音查詢指令進(jìn)行用戶意圖識別,得到所述用戶意圖對應(yīng)的文字對象,包括:
對用戶的語音查詢指令進(jìn)行識別,得到所述語音查詢指令對應(yīng)的文字信息;
將所述文字信息與預(yù)先存儲(chǔ)的意圖列表進(jìn)行匹配,以確定用戶意圖以及用戶意圖對應(yīng)的文字對象。
5.一種信息查詢裝置,其特征在于,所述裝置包括:
構(gòu)建模塊,用于基于預(yù)先采集的數(shù)據(jù)構(gòu)建語料庫,并統(tǒng)計(jì)所述語料庫中的每個(gè)詞的詞頻;
獲取識別模塊,用于獲取用戶輸入的語音查詢指令,并對所述語音查詢指令進(jìn)行用戶意圖識別,得到所述用戶意圖對應(yīng)的文字對象;
檢索模塊,用于根據(jù)所述文字對象的拼音和聲調(diào),在所述語料庫中進(jìn)行檢索,得到至少一個(gè)檢索結(jié)果,其中所述檢索結(jié)果為與所述文字對象具有相同發(fā)音的詞;
排序模塊,用于讀取每個(gè)檢索結(jié)果對應(yīng)的詞頻,并根據(jù)所述詞頻對所述至少一個(gè)檢索結(jié)果進(jìn)行排序;
顯示模塊,用于根據(jù)排序結(jié)果顯示所述至少一個(gè)檢索結(jié)果,以供用戶選擇;
響應(yīng)模塊,用于響應(yīng)于用戶對某一檢索結(jié)果的觸發(fā)操作,導(dǎo)航到下一級頁面進(jìn)行信息查詢。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述構(gòu)建模塊包括:
構(gòu)建單元,用于對采集到的數(shù)據(jù)進(jìn)行分詞處理,去除其中包括的停用詞或無意義詞,得到語料庫;
統(tǒng)計(jì)單元,用于基于TF-IDF算法進(jìn)行詞頻統(tǒng)計(jì),并將詞頻統(tǒng)計(jì)結(jié)果以數(shù)據(jù)列表的形式保存在語料庫中。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述裝置還包括:
高亮處理模塊,用于將排在第一位的檢索結(jié)果進(jìn)行高亮顯示。
8.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述獲取識別模塊包括:
語音識別單元,用于對用戶的語音查詢指令進(jìn)行識別,得到所述語音查詢指令對應(yīng)的文字信息;
意圖匹配單元,用于將所述文字信息與預(yù)先存儲(chǔ)的意圖列表進(jìn)行匹配,以確定用戶意圖以及用戶意圖對應(yīng)的文字對象。
9.一種設(shè)備,其特征在于,包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如權(quán)利要求1-4中任一所述的信息查詢方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-4中任一所述的信息查詢方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910818419.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 帶有前處理和后處理的數(shù)據(jù)庫復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語言的查詢方法及查詢系統(tǒng)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





