[發明專利]一種位置識別方法、裝置、電子設備和存儲介質在審

申請號：	202110830026.9	申請日：	2021-07-22
公開（公告）號：	CN113539270A	公開（公告）日：	2021-10-22
發明（設計）人：	姚雷;杜新凱;紀誠;黃瑩	申請（專利權）人：	陽光保險集團股份有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G06F40/295;G06F40/30;G06N3/08;G06N20/00
代理公司：	北京超凡宏宇專利代理事務所(特殊普通合伙) 11463	代理人：	田云
地址：	518000 廣東省深圳市福田***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種位置識別方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請提供了一種位置識別方法、裝置、電子設備和存儲介質，其中，該方法包括：在獲取到語音數據之后，通過語音識別技術將所述語音數據轉化成文本信息；在將所述文本信息輸入到預先訓練的用于對文字進行模糊識別的定位模型之后，通過所述定位模型識別所述文本信息中與地名的語義相似度超過預設閾值的文字，以將所述文字作為目標文字；針對每個目標文字，從文字與地理位置的對應關系中，查找包含所述目標文字的地理位置信息，以將所述地理位置信息中的地理位置確定為該目標文字所對應的地理位置。本申請實施例通過上述方法，能夠提高對語音中的地名識別的準確率。

技術領域

本申請涉及語音識別技術領域，具體而言，涉及一種位置識別方法、裝置、電子設備和存儲介質。

背景技術

隨著語音識別技術的出現，語音這種人機交互方式逐漸應用到更多的場合，在進行位置識別時，也逐漸采用語音錄入的方式對語音中的位置進行識別。

發明人在研究中發現，現有技術中通常是通過語音識別技術將語音轉換為文本，并通過逐字或逐詞對比的方式確定出該文本中的地名。在實際應用時，由于語音識別技術還不夠成熟，當語音數據中存在噪聲、語調變化、說話方式不統一等干擾時，應用語音識別技術將語音轉換成文本的時候會產生一些誤差，使得轉換之后的文本中的部分詞語發生變化，通過逐詞或逐字對比的方式識別語音中地名時，準確率較低。

發明內容

有鑒于此，本申請實施例提供了一種位置識別方法、裝置、電子設備和存儲介質，以解決識別語音中地名的準確率較低的問題。

第一方面，本申請實施例提供了一種位置識別方法，包括：

在獲取到語音數據之后，通過語音識別技術將所述語音數據轉化成文本信息；

在將所述文本信息輸入到預先訓練的用于對文字進行模糊識別的定位模型之后，通過所述定位模型識別所述文本信息中與地名的語義相似度超過預設閾值的文字，以將所述文字作為目標文字；

針對每個目標文字，從文字與地理位置的對應關系中，查找包含所述目標文字的地理位置信息，以將所述地理位置信息中的地理位置確定為該目標文字所對應的地理位置。

在一個可行的實施方案中，所述定位模型是通過以下方式訓練的：

在獲取到多個樣本語音數據之后，針對每個樣本語音數據，通過語音識別技術將所述樣本語音數據轉化為訓練文本；

為所述訓練文本中用于表示地名的名稱的首個文字標記第一標識，為用于表示地名的名稱的非首個文字標記第二標識，以將攜帶有所述第一標識和所述第二標識的訓練文本作為目標訓練文本；

將包含多個目標訓練文本的數據集輸入到BERT+CRF模型中，以通過有監督學習的方式將所述BERT+CRF模型訓練成所述定位模型。

在一個可行的實施方案中，將包含多個目標訓練文本的數據集輸入到 BERT+CRF模型中，以通過有監督學習的方式將所述BERT+CRF模型訓練成所述定位模型，包括：

將所述數據集中的目標訓練文件按照預設比例分別放入訓練集、驗證集和測試集；

在將所述訓練集、驗證集和測試集分別輸入所述BERT+CRF模型后，針對預先為所述BERT+CRF模型設置的每個超參數，通過所述訓練集中的至少一個目標訓練文本以及該至少一個目標訓練文本攜帶的所述第一標識和第二標識，對該超參數下的所述BERT+CRF模型進行訓練，以得到 BERT+CRF模型在該超參數下的參數；其中，所述BERT+CRF模型根據所述參數識別所述文本信息中與地名的語義相似度超過預設閾值的文字；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于陽光保險集團股份有限公司，未經陽光保險集團股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110830026.9/2.html，轉載請聲明來源鉆瓜專利網。