[發明專利]一種語言識別方法、系統及裝置有效
| 申請號: | 201911408163.2 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN113128216B | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 鄧千;剛周偉;郭麟;陳田川 | 申請(專利權)人: | 中國移動通信集團貴州有限公司;中國移動通信集團有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F18/22 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 李秋華;趙傳海 |
| 地址: | 550081 貴*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語言 識別 方法 系統 裝置 | ||
1.一種語言識別方法,其特征在于,包括:
獲取語句的指標類描述;
判斷所述指標類描述是否在標準詞匯庫中具有完全對應的標準指標名;
若是,以所述標準指標名為指標類信息;
若否,結合所述標準詞匯庫和常規詞庫對所述指標類描述進行分詞后得到分詞列表,解析所述分詞列表得到目標指標名,以所述目標指標名為所述指標類信息;
所述解析所述分詞列表得到目標指標名,包括:
在所述標準詞匯庫中,查找與分詞列表中各分詞至少部分對應的標準指標名,依據至少部分對應的所述標準指標名,生成各分詞對應的分詞集合,所述分詞集合中的元素為標準詞匯庫中的標準指標名;
將所有分詞的分詞集合取交集;
若所述交集為非空集合時,以所述交集的元素為目標指標名;
若所述交集為空集時,將所有分詞的分詞集合取并集,分別計算所述并集中每個元素與所述分詞列表的相似度,依據相似度的計算結果,從所述并集中獲取目標元素,并作為目標指標名。
2.根據權利要求1所述的語言識別方法,其特征在于,所述結合所述標準詞匯庫和常規詞庫對所述指標類描述進行分詞后得到分詞列表,包括:
提取指標類描述中的第一分詞,所述第一分詞在所述標準詞匯庫中具有對應標準詞匯;
提取指標類描述中的第二分詞,所述第二分詞在所述常規詞庫中具有對應的常規詞匯;
結合所述第一分詞和所述第二分詞得到所述分詞列表。
3.根據權利要求1所述的語言識別方法,其特征在于,所述分別計算所述并集中每個元素與所述分詞列表的相似度,包括:
將所述并集中的每個元素按標準詞匯庫中的標準詞匯進行分詞,得到每個元素的元素分詞;
依次計算分詞相似度,所述分詞相似度為每個元素中的每個元素分詞與所述分詞列表中的各分詞的相似度;
計算每個元素中所有的分詞相似度的平均值,作為對應元素與分詞列表的相似度。
4.根據權利要求1所述的語言識別方法,其特征在于,所述依據相似度的計算結果,從所述并集中獲取目標元素,并作為目標指標名,包括:
以所述并集中相似度最高的元素作為目標元素,獲得目標指標名;或
以所述并集中相似度至少前兩名的元素作為至少兩個目標元素,獲得至少兩個目標指標名。
5.根據權利要求2所述的語言識別方法,其特征在于,在所述提取指標類描述詞匯之前,還包括:
提取語句的時間性描述,獲得時間信息:和/或
提取語句的地理位置性描述,獲得地理位置信息;和/或
提取語句的數據操作性描述,獲得數據操作信息;和/或
剔除語句的停用詞匯;
在所述得到所述指標類信息之后,還包括:
依據所述指標類信息,以及所述時間信息和/或所述地理位置信息和/或所述數據操作信息識別得到語句語義。
6.根據權利要求5所述的語言識別方法,其特征在于,所述獲取語句的指標類描述之前,包括:接收待識別的輸入語句;
在所述依據所述指標類信息,以及所述時間信息和/或所述地理位置信息和/或所述數據操作信息識別得到語句語義中,包括:依據所述指標類信息,以及所述時間信息和/或所述地理位置信息和/或所述數據操作信息識別得到輸入語句的語義;
在所述依據所述指標類信息,以及所述時間信息和/或所述地理位置信息和/或所述數據操作信息識別得到語句語義之后,包括:
針對所述輸入語句的語義,輸出對應的回答數據;
接收用戶針對所述回答數據是否滿意的反饋信息;
根據所述反饋信息,更新映射庫中關于所述待識別的輸入語句與所述回答數據的映射關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團貴州有限公司;中國移動通信集團有限公司,未經中國移動通信集團貴州有限公司;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911408163.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:水質監管系統
- 下一篇:降低干擾方法、接入網設備、通信終端和計算機可讀介質





