[發明專利]語音查詢的方法、裝置、存儲介質及終端設備有效
| 申請號: | 201810059882.7 | 申請日: | 2018-01-22 |
| 公開(公告)號: | CN108170859B | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 吳文權;劉占一;吳華 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/632 | 分類號: | G06F16/632 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 王珺;徐瑞紅 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 查詢 方法 裝置 存儲 介質 終端設備 | ||
1.一種語音查詢的方法,其特征在于,包括:
接收用戶的語音查詢請求;
對所述語音查詢請求進行語音識別,獲取查詢語句;
對所述查詢語句進行意圖識別和對象識別,獲得所述查詢語句的查詢意圖和查詢對象詞語;其中,所述查詢對象詞語對應于至少一個查詢對象,根據意圖分類模型對所述查詢語句進行識別;
基于所述查詢對象詞語確定所述查詢語句的查詢對象;以及
根據所述查詢意圖和所述查詢語句的查詢對象查詢檢索數據庫,獲得查詢結果;其中,所述方法還包括:
從所述檢索數據庫的檢索日志中獲取歷史查詢語句和基于所述歷史查詢語句的查詢結果用戶選擇的訪問地址;
根據正則表達式意圖識別算法,識別所述歷史查詢語句的意圖;
將已識別出意圖的歷史查詢語句與其識別出的意圖對應的意圖詞關聯;
對于未識別出意圖的歷史查詢語句,判斷所述未識別出意圖的歷史查詢語句對應的用戶選擇的訪問地址與已識別出意圖的歷史查詢語句對應的用戶選擇的訪問地址是否存在有相同的訪問地址;以及
若是,將所述未識別出意圖的歷史查詢語句與存在有相同的訪問地址的歷史查詢語句所關聯的意圖詞進行關聯;
將相互關聯的歷史查詢語句和意圖詞組成數據對,并更新于訓練數據庫中;以及
根據更新后的訓練數據庫對所述意圖分類模型進行訓練更新。
2.如權利要求1所述的語音查詢的方法,其特征在于,所述基于所述查詢對象詞語確定所述查詢語句的查詢對象,包括:
判斷所述查詢對象詞語對應的查詢對象的數量是否大于1;
若是,則返回所述查詢對象詞語對應的所有查詢對象給所述用戶,以供所述用戶進行選擇確認;
接收所述用戶返回的查詢對象;以及
將接收到的查詢對象作為所述查詢語句的查詢對象。
3.如權利要求1所述的語音查詢的方法,其特征在于,所述對所述查詢語句進行意圖識別和對象識別,獲得所述查詢語句的查詢意圖和查詢對象詞語,包括:
根據意圖分類模型對所述查詢語句進行識別,獲得所述查詢語句的查詢意圖;以及
根據所述查詢意圖和對象識別模型對所述查詢語句進行識別,獲得所述查詢語句的查詢對象詞語。
4.如權利要求3所述的語音查詢的方法,其特征在于,所述將所述關聯的查詢語句和意圖詞組成數據對,包括:
將相互關聯的歷史查詢語句和意圖詞中的歷史查詢語句進行結構化處理,獲得具有句法特征和語義特征的歷史查詢語句;以及
將結構化處理后的歷史查詢語句與所述意圖詞組成數據對。
5.如權利要求4所述的語音查詢的方法,其特征在于,在根據意圖分類模型對所述查詢語句進行識別之前,還包括:
對所述查詢語句進行結構化處理,獲得具有句法特征和語義特征的查詢語句。
6.如權利要求2所述的語音查詢的方法,其特征在于,以語音信號形式返回所述查詢對象詞語對應的所有查詢對象給所述用戶以供所述用戶進行選擇確認,以及,所述方法還包括:以語音信號形式返回所述查詢結果給所述用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810059882.7/1.html,轉載請聲明來源鉆瓜專利網。





