[發明專利]一種查詢語句的生成方法和裝置在審
| 申請號: | 202010761820.8 | 申請日: | 2020-07-31 |
| 公開(公告)號: | CN114064861A | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 李裕田 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/36;G06F40/211;G06F40/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 趙娟 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 查詢 語句 生成 方法 裝置 | ||
本申請實施例提供了一種查詢語句的生成方法和裝置,包括:獲取文本信息;在所述文本信息中提取查詢關鍵詞;根據文本信息,確定所述查詢關鍵詞對應的槽位類型;采用所述查詢關鍵詞以及所述查詢關鍵詞對應的槽位類型,生成查詢語句。可以從文本信息中直接確定查詢關鍵詞以及查詢關鍵詞對應的槽位類型,并生成查詢語句查詢數據庫,可以提高處理效率,且可以獲得較高的準確率。
技術領域
本申請涉及文本處理技術領域,特別是涉及一種查詢語句的生成方法和一種查詢語句的生成裝置。
背景技術
在現有技術中,為了實現人與計算機之間的交互,計算機通常可以獲取人輸入的文本信息,將文本信息轉換為計算機可以理解的查詢語句,并返回查詢語句對應的答案。
但是,為了將文本信息轉換為計算機可以理解的查詢語句,通常需要采用大量預設的文本信息-查詢語句對訓練模型或者建立語法數據庫。但是,如果獲取到的文本信息不存在于預設的文本信息-查詢語句對中的情況下,容易出現準確率降低的情況。并且端到端的模型訓練,對領域有很強的依賴性,較難將在一個領域中訓練好的模型遷移到一個新的領域。
發明內容
鑒于上述問題,提出了本申請實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種查詢語句的生成和相應的一種查詢語句的生成裝置。
為了解決上述問題,本申請實施例公開了一種查詢語句的生成方法,包括:
獲取文本信息;
在所述文本信息中提取查詢關鍵詞;
根據文本信息,確定所述查詢關鍵詞對應的槽位類型;
采用所述查詢關鍵詞以及所述查詢關鍵詞對應的槽位類型,生成查詢語句;
在預設的數據庫中,查找所述查詢語句對應的查詢結果信息。
可選地,所述在所述文本信息中提取查詢關鍵詞的步驟,包括:
在所述文本信息中提取候選關鍵詞以及候選關鍵詞對應的數據類型;
根據所述候選關鍵詞對應的數據類型,在所述候選關鍵詞中確定目標關鍵詞,作為查詢關鍵詞。
可選地,所述數據庫包括至少一個預設實體數據以及所述預設實體數據對應的數據類型;
所述在所述文本信息中提取候選關鍵詞以及候選關鍵詞對應的數據類型的步驟,包括:
提取所述文本信息中,與所述數據庫中預設實體數據匹配的候選實體詞;
在所述候選實體詞中確定目標實體詞,作為候選關鍵詞,并確定所述候選關鍵詞對應的數據類型。
可選地,所述在所述候選實體詞中確定目標實體詞,作為候選關鍵詞,并確定所述候選關鍵詞對應的數據類型的步驟,包括:
基于所述候選實體詞與所述預設實體數據之間的相似度,在所述候選實體詞中確定目標實體詞,作為候選關鍵詞;
將與所述候選關鍵詞匹配的預設實體數據對應的數據類型,作為所述候選關鍵詞對應的數據類型。
可選地,所述基于所述候選實體詞與所述預設實體數據之間的相似度,在所述候選實體詞中確定目標實體詞,作為候選關鍵詞的步驟,包括:
采用預設的實體標注模型,確定所述文本信息中候選實體詞對應的實體類型概率;
基于所述候選實體詞與所述預設實體數據之間的相似度,以及所述候選實體詞對應的實體類型概率,在所述候選實體詞中確定目標實體詞,作為候選關鍵詞。
可選地,所述根據所述候選關鍵詞對應的數據類型,在所述候選關鍵詞中確定目標關鍵詞,作為查詢關鍵詞的步驟,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010761820.8/2.html,轉載請聲明來源鉆瓜專利網。





