[發明專利]一種識別方法和系統在審
| 申請號: | 202010894361.0 | 申請日: | 2020-08-31 |
| 公開(公告)號: | CN112016316A | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 馬凱 | 申請(專利權)人: | 北京嘀嘀無限科技發展有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06K9/62 |
| 代理公司: | 成都七星天知識產權代理有限公司 51253 | 代理人: | 楊永梅 |
| 地址: | 100193 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 方法 系統 | ||
本申請實施例公開了一種識別方法和系統。所述識別方法包括:獲取待識別數據;將所述待識別數據輸入識別模型中,其中,所述識別模型由與目標相關的第一訓練數據和與目標無關的第二訓練數據共同訓練自注意力模型后獲得;以及根據所述待識別數據和所述識別模型,確定所述待識別數據是否與所述目標相關。本申請可以判斷乘車人是否存在安全相關的問題,提高了識別的準確性,可在乘車人乘車過程中提供安全問題保障服務,保障乘車人的出行安全。
技術領域
本申請涉及數據識別領域,特別涉及一種識別方法和系統。
背景技術
在數據識別領域,通常根據識別出的特征判斷所識別數據的性質。例如,在自然語言處理技術領域,識別文本中包含的關鍵詞,然后再根據文本中包含的關鍵詞判斷文本的含義。再例如,在圖像識別領域,識別圖像中包含的物體,判斷圖像表示的含義。但若只關注識別數據的特有特征,數據識別的含義實際會存在界限不明或出現混淆的情況。
以乘車出行服務中乘客的安全問題為例,傳統的智能客服判定乘客是否存在安全問題時是通過判別乘客溝通過程中是否提及了安全問題相關的詞匯實現。實際中,乘客與客服溝通過程中可能存在安全問題界限不明、出現混淆的情況。例如包含“司機存在危險駕駛”相關的語句,與包含“什么是危險駕駛行為”的語句中,均有“危險駕駛”這一詞匯。傳統的識別方式,容易將這兩種情況均判定為存在安全問題,識別不準確的同時,容易導致人工客服工作繁重。
因此需要提供一種高效準確的識別方法,提高數據識別的準確性,避免數據識別過程中存在的界限不明或出現混淆的情況。
發明內容
本申請實施例之一提供一種識別方法。所述識別方法包括:獲取待識別數據;將所述待識別數據輸入識別模型中,其中,所述識別模型由與目標相關的第一訓練數據和與目標無關的第二訓練數據共同訓練自注意力模型后獲得;以及根據所述待識別數據和所述識別模型,確定所述待識別數據是否與所述目標相關。
在一些實施例中,所述識別方法還包括訓練所述自注意力模型獲取所述識別模型,所述訓練過程包括:獲取兩套或以上的多套訓練數據,其中,所述多套訓練數據包括至少一套與所述目標相關的第一訓練數據,以及至少一套與所述目標無關的第二訓練數據;以及基于所述多套訓練數據,通過自注意力機制訓練所述自注意力模型,生成所述識別模型。
在一些實施例中,所述多套訓練數據包括多套語料中每個單詞經預處理生成的詞向量,所述訓練過程包括:對于每個單詞,獲取所述單詞的兩種或以上詞向量,所述兩種或以上的詞向量與不同的上下文相關;拼接所述兩種或以上詞向量以獲取共有詞向量;以及將所述共有詞向量與每套語料除該單詞外其他單詞的詞向量通過自注意力機制確定該單詞的注意力。
在一些實施例中,拼接所述一種或以上詞向量以獲取共有詞向量包括:將每個單詞在所述多套訓練數據中的詞向量加權求和。
在一些實施例中,所述多套語料為兩套語料,所述兩套語料包括一套與安全問題相關的語料和一套與安全問題無關的語料。
在一些實施例中,所述預處理過程包括:使用詞向量生成算法,生成所述單詞的詞向量。
在一些實施例中,所述詞向量生成算法為Word2Vec。
在一些實施例中,所述識別方法進一步包括:基于識別出所述待識別數據是否與所述目標相關的結果,執行相應的措施。
在一些實施例中,所述目標與安全問題相關,所述措施包括監控人員對駕駛行為人進行繼續溝通、持續監控、警告中的一種或多種組合。
本申請實施例之一提供一種識別系統,包括獲取模塊以及數據識別模塊;所述獲取模塊用于獲取待識別數據;所述數據識別模塊用于將所述待識別數據輸入識別模型中;其中,所述識別模型由與目標相關的第一訓練數據和與目標無關的第二訓練數據共同訓練自注意力模型后獲得;根據所述待識別數據和所述識別模型,確定所述待識別數據是否與所述目標相關。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司,未經北京嘀嘀無限科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010894361.0/2.html,轉載請聲明來源鉆瓜專利網。





