[發明專利]一種位置識別方法、裝置、電子設備和存儲介質在審
| 申請號: | 202110830026.9 | 申請日: | 2021-07-22 |
| 公開(公告)號: | CN113539270A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 姚雷;杜新凱;紀誠;黃瑩 | 申請(專利權)人: | 陽光保險集團股份有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G06F40/295;G06F40/30;G06N3/08;G06N20/00 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 田云 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 位置 識別 方法 裝置 電子設備 存儲 介質 | ||
1.一種位置識別方法,其特征在于,包括:
在獲取到語音數據之后,通過語音識別技術將所述語音數據轉化成文本信息;
在將所述文本信息輸入到預先訓練的用于對文字進行模糊識別的定位模型之后,通過所述定位模型識別所述文本信息中與地名的語義相似度超過預設閾值的文字,以將所述文字作為目標文字;
針對每個目標文字,從文字與地理位置的對應關系中,查找包含所述目標文字的地理位置信息,以將所述地理位置信息中的地理位置確定為該目標文字所對應的地理位置。
2.根據權利要求1所述的方法,其特征在于,所述定位模型是通過以下方式訓練的:
在獲取到多個樣本語音數據之后,針對每個樣本語音數據,通過語音識別技術將所述樣本語音數據轉化為訓練文本;
為所述訓練文本中用于表示地名的名稱的首個文字標記第一標識,為用于表示地名的名稱的非首個文字標記第二標識,以將攜帶有所述第一標識和所述第二標識的訓練文本作為目標訓練文本;
將包含多個目標訓練文本的數據集輸入到BERT+CRF模型中,以通過有監督學習的方式將所述BERT+CRF模型訓練成所述定位模型。
3.根據權利要求2所述的方法,其特征在于,將包含多個目標訓練文本的數據集輸入到BERT+CRF模型中,以通過有監督學習的方式將所述BERT+CRF模型訓練成所述定位模型,包括:
將所述數據集中的目標訓練文件按照預設比例分別放入訓練集、驗證集和測試集;
在將所述訓練集、驗證集和測試集分別輸入所述BERT+CRF模型后,針對預先為所述BERT+CRF模型設置的每個超參數,通過所述訓練集中的至少一個目標訓練文本以及該至少一個目標訓練文本攜帶的所述第一標識和第二標識,對該超參數下的所述BERT+CRF模型進行訓練,以得到BERT+CRF模型在該超參數下的參數;其中,所述BERT+CRF模型根據所述參數識別所述文本信息中與地名的語義相似度超過預設閾值的文字;
在得到所述參數之后,針對每個超參數,通過所述驗證集對所述BERT+CRF模型在該超參數下的參數進行驗證,以得到該模型在該參數下的第一識別率;其中,第一識別率是所述BERT+CRF模型在該參數下識別所述驗證集中的目標訓練文本中與地名的語義相似度超過預設閾值的文字的成功率;
在根據所述第一識別率確定所述BERT+CRF模型的超參數之后,通過測試集對所述BERT+CRF模型在該超參數下的參數進行測試,以得到該模型在該參數下的第二識別率;其中,第二識別率是所述BERT+CRF模型在該參數下識別所述測試集中的目標訓練文本中與地名的語義相似度超過預設閾值的文字的成功率;
判斷所述第二識別率是否大于或等于預設識別率,當所述BERT+CRF模型的第二識別率大于或等于預設識別率時,將該模型作為所述定位模型,以通過所述定位模型識別所述文本信息中與地名的語義相似度超過預設閾值的文字。
4.根據權利要求2所述的方法,其特征在于,所述文字與地理位置的對應關系是通過以下方式構建的:
在獲取到至少一個包含地理位置、用于表示該地理位置名稱的文字以及該文字與該地理位置的對應關系的地理位置信息之后,針對所述地理位置信息中的每個地理位置,從該地理位置對應的至少一個地理位置信息中,將該地理位置、用于表示該地理位置名稱的至少一個文字或詞匯以及該至少一個文字或詞匯與該地理位置的對應關系放入該地理位置對應的地理位置集合中;
將所述地理位置集合保存到所述文字與地理位置的對應關系中。
5.根據權利要求4所述的方法,其特征在于,在獲取到至少一個包含地理位置、用于表示該地理位置名稱的文字以及該文字與該地理位置的對應關系的地理位置信息之前,所述方法還包括:
對于每個標記詞匯,將所述標記詞匯作為預設地名,并為每個預設地名設置該預設地名對應的地理位置;其中,所述標記詞匯為攜帶目標標識的文字構成的詞匯,所述目標標識包括第一標識和第二標識;
針對每個預設地名,將所述預設地名、該預設地名的地理位置以及該預設地名與該地理位置的對應關系保存到該預設地名對應的地理位置信息中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陽光保險集團股份有限公司,未經陽光保險集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110830026.9/1.html,轉載請聲明來源鉆瓜專利網。





