[發明專利]問句語料生成方法、裝置、設備及計算機可讀存儲介質在審
| 申請號: | 202010772241.3 | 申請日: | 2020-08-04 |
| 公開(公告)號: | CN111767387A | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 周磊;馮波 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/335;G06F16/36;G06F40/30 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 劉暉銘;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 問句 語料 生成 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
1.一種問句語料生成方法,其特征在于,包括:
獲取關鍵詞組;所述關鍵詞組包括至少兩個關鍵詞;
獲取所述關鍵詞組對應的至少一個目標問句表達式;所述目標問句表達式用于根據至少一個連接符號連接所述至少兩個關鍵詞;
根據所述關鍵詞組和所述至少一個目標問句表達式生成對應的至少一個問句語料。
2.根據權利要求1所述的方法,其特征在于,所述關鍵詞的關鍵詞類別包括以下至少之一:主語類別、關系類別和賓語類別。
3.根據權利要求2所述的方法,其特征在于,所述獲取所述關鍵詞組對應的至少一個目標問句表達式,包括:
獲取所述關鍵詞組的詞組信息;所述詞組信息包括以下至少之一:關鍵詞信息和連接符號信息;
所述關鍵詞信息包括所述關鍵詞組中關鍵詞類別數量和每一關鍵詞類別對應的關鍵詞數量;所述連接符號信息包括所述關鍵詞組中至少一個關鍵詞類別對應的連接符號類別;
根據所述詞組信息在預設的問句表達式集中獲取所述至少一個目標問句表達式;所述問句表達式集包括多個問句表達式。
4.根據權利要求3所述的方法,其特征在于,在所述詞組信息包括關鍵詞信息的情況下,所述獲取所述關鍵詞組的詞組信息,包括:
獲取所述關鍵詞組中每一所述關鍵詞的關鍵詞類別;
根據每一所述關鍵詞的關鍵詞類別確定所述關鍵詞類別數量和所述每一關鍵詞類別對應的關鍵詞數量。
5.根據權利要求4所述的方法,其特征在于,在所述詞組信息包括連接符號信息的情況下,所述獲取所述關鍵詞組的詞組信息,包括:
在所述主語類別對應的關鍵詞數量為至少兩個的情況下,根據主語類別對應的關鍵詞的屬性信息確定所述主語類別對應的連接符號類別;所述主語類別對應的連接符號類別包括以下至少之一:并列類別和修飾類別;
在所述關系類別對應的關鍵詞數量為至少兩個的情況下,根據關系類別對應的關鍵詞的屬性信息確定所述關系類別對應的連接符號類別;所述關系類別對應的連接符號類別包括以下至少之一:并列類別和修飾類別;
在所述賓語類別對應的關鍵詞數量為至少一個的情況下,根據賓語類別對應的關鍵詞的屬性信息確定所述賓語類別對應的連接符號類別;所述賓語類別對應的連接符號類別包括以下至少之一:單元素類別、集合元素類別和域類別。
6.根據權利要求3至5任一項所述的方法,其特征在于,所述根據所述詞組信息在預設的問句表達式集中獲取所述至少一個目標問句表達式,包括:
在所述詞組信息包括關鍵詞信息的情況下,確定所述多個問句表達式中每一問句表達式對應的表達式信息;所述表達式信息包括問句表達式中關鍵詞類別數量和每一關鍵詞類別對應的關鍵詞數量;
根據所述關鍵詞組中關鍵詞類別數量和每一關鍵詞類別對應的關鍵詞數量在每一所述問句表達式對應的表達式信息中進行匹配,以獲取所述至少一個目標問句表達式。
7.根據權利要求3至5任一項所述的方法,其特征在于,所述根據所述詞組信息在預設的問句表達式集中獲取所述至少一個目標問句表達式,包括:
在所述詞組信息包括關鍵詞信息和連接符號信息的情況下,確定所述多個問句表達式中每一問句表達式對應的表達式信息;所述表達式信息包括問句表達式中關鍵詞類別數量、每一關鍵詞類別對應的關鍵詞數量和至少一個關鍵詞類別對應的連接符號類別;
根據所述關鍵詞組中關鍵詞類別數量、每一關鍵詞類別對應的關鍵詞數量和至少一個關鍵詞類別對應的連接符號類別在每一所述問句表達式對應的表達式信息中進行匹配,以獲取所述至少一個目標問句表達式。
8.一種問句語料生成裝置,其特征在于,包括:
第一獲取模塊,用于接獲取關鍵詞組,所述關鍵詞組包括至少兩個關鍵詞;
第二獲取模塊,用于獲取所述關鍵詞組對應的至少一個目標問句表達式;所述目標問句表達式用于根據至少一個連接符號連接所述至少兩個關鍵詞;
生成模塊,用于根據所述關鍵詞組和所述至少一個目標問句表達式生成對應的至少一個問句語料。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010772241.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種冷套膜機
- 下一篇:一種分區采樣的氨逃逸測量系統及方法





