[發(fā)明專利]語義識別的方法、裝置、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010622078.2 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111832315A | 公開(公告)日: | 2020-10-27 |
| 發(fā)明(設(shè)計)人: | 郭元凱;王斌;史亮;孟二利;胡羽藍;王鑠;王穎哲 | 申請(專利權(quán))人: | 北京小米松果電子有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289 |
| 代理公司: | 北京英創(chuàng)嘉友知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11447 | 代理人: | 魏云鹿 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語義 識別 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本公開涉及一種語義識別的方法、裝置、電子設(shè)備和存儲介質(zhì),該方法包括:對待處理語句進行詞語識別處理,得到多個詞語和每個詞語對應(yīng)的詞性信息,根據(jù)待處理詞語和待處理詞語的詞性信息,通過詞語處理模型,確定目標集合更新操作,若目標集合更新操作對應(yīng)的依存關(guān)系為第一依存關(guān)系,分別通過每個預(yù)設(shè)集合更新操作,確定待處理詞語的依存關(guān)系以及依存關(guān)系對應(yīng)的置信度,并根據(jù)該預(yù)設(shè)集合更新操作更新待處理詞語集,否則,通過目標集合更新操作,確定待處理詞語的依存關(guān)系以及依存關(guān)系對應(yīng)的置信度,并更新待處理詞語集,根據(jù)更新后的待處理詞語集,重復(fù)執(zhí)行上述步驟,直至得到多個依存分析結(jié)果,并根據(jù)最優(yōu)分析結(jié)果對待處理語句進行語義識別。
技術(shù)領(lǐng)域
本公開涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種語義識別的方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著人工智能的不斷發(fā)展,對語義識別的準確度的要求也越來越高。語義識別是自然語言處理(英文:Natural Language Processing,縮寫:NLP)技術(shù)的重要組成部分之一。在自然語言處理中,用詞與詞之間的依存關(guān)系(即詞與詞之間的支配關(guān)系)來描述語言結(jié)構(gòu)的框架稱為依存句法,利用依存句法進行句法分析是自然語言處理的關(guān)鍵技術(shù)之一。依存句法分析旨在將句子從詞語的序列形式按照某種語法體系轉(zhuǎn)化為圖結(jié)構(gòu)(通常為樹結(jié)構(gòu)),以揭示詞與詞之間的從屬關(guān)系,為語義識別提供了關(guān)鍵的信息。
相關(guān)技術(shù)中,主要是通過基于轉(zhuǎn)移的依存句法分析的方式,使用貪心算法,在每次選擇轉(zhuǎn)移動作時,選擇當前狀態(tài)下最好的轉(zhuǎn)移動作(例如:移進、規(guī)約等轉(zhuǎn)移動作),并通過一系列的轉(zhuǎn)移動作構(gòu)建一棵依存句法樹。但是,只考慮當前狀態(tài)下最好的轉(zhuǎn)移動作,而不考慮后續(xù)狀態(tài)的影響,可能會導(dǎo)致選擇到錯誤的轉(zhuǎn)移動作,降低了依存句法分析的準確度,進而影響語義識別的準確度。
發(fā)明內(nèi)容
為克服相關(guān)技術(shù)中存在的問題,本公開提供一種語義識別的方法、裝置、電子設(shè)備和存儲介質(zhì)。
根據(jù)本公開實施例的第一方面,提供一種語義識別的方法,所述方法包括:
對終端獲取的信息進行語義分析時,獲取待處理語句;
對所述待處理語句進行詞語識別處理,得到多個詞語和所述多個詞語中每個詞語對應(yīng)的詞性信息;
根據(jù)待處理詞語集中的待處理詞語和所述待處理詞語的詞性信息,通過預(yù)先訓(xùn)練的詞語處理模型,從多個預(yù)設(shè)集合更新操作中確定所述待處理詞語集對應(yīng)的目標集合更新操作;所述待處理詞語集為所述多個詞語中當前待處理的詞語的集合;
在所述目標集合更新操作對應(yīng)的依存關(guān)系為第一依存關(guān)系的情況下,分別通過所述多個預(yù)設(shè)集合更新操作中每個所述預(yù)設(shè)集合更新操作,確定所述待處理詞語的依存關(guān)系以及所述依存關(guān)系對應(yīng)的置信度,并根據(jù)該預(yù)設(shè)集合更新操作更新所述待處理詞語集;所述第一依存關(guān)系表示兩個所述詞語中,順序在后的詞語為順序在先的詞語的從屬詞;
在所述目標集合更新操作對應(yīng)的依存關(guān)系不為第一依存關(guān)系的情況下,通過所述目標集合更新操作,確定所述待處理詞語的依存關(guān)系以及所述依存關(guān)系對應(yīng)的置信度,并根據(jù)所述目標集合更新操作更新所述待處理詞語集;
根據(jù)更新后的待處理詞語集,重復(fù)執(zhí)行所述根據(jù)待處理詞語集中的待處理詞語和所述待處理詞語的詞性信息,通過預(yù)先訓(xùn)練的詞語處理模型,從多個預(yù)設(shè)集合更新操作中確定所述待處理詞語集對應(yīng)的目標集合更新操作的步驟至所述根據(jù)所述目標集合更新操作更新所述待處理詞語集的步驟,直至得到所述待處理語句的多個依存分析結(jié)果,所述依存分析結(jié)果用于表征所述多個詞語之間的依存關(guān)系;
將所述多個依存分析結(jié)果中,所述多個詞語之間的依存關(guān)系對應(yīng)的置信度之和最高的依存分析結(jié)果作為最優(yōu)分析結(jié)果,并根據(jù)所述最優(yōu)分析結(jié)果對所述待處理語句進行語義識別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京小米松果電子有限公司,未經(jīng)北京小米松果電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010622078.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





