[發(fā)明專利]一種句法分析方法、裝置、存儲介質(zhì)及電子設(shè)備有效
| 申請?zhí)枺?/td> | 202010638300.8 | 申請日: | 2020-07-06 |
| 公開(公告)號: | CN111523302B | 公開(公告)日: | 2020-10-02 |
| 發(fā)明(設(shè)計)人: | 宋子文晗;江嶺 | 申請(專利權(quán))人: | 成都曉多科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 成都睿道專利代理事務(wù)所(普通合伙) 51217 | 代理人: | 薛波 |
| 地址: | 610000 四川省成都市天府新區(qū)華*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 句法 分析 方法 裝置 存儲 介質(zhì) 電子設(shè)備 | ||
本申請?zhí)峁┝艘环N句法分析方法、裝置、存儲介質(zhì)及電子設(shè)備,方法用于解析原始語句,使得原始語句中的多個字詞向量從緩存空間全部轉(zhuǎn)移至棧空間的過程,方法包括:對當前位于緩存空間中的多個字詞向量分別對應(yīng)的第一索引重新組合排列,獲得K種候選詞組索引單元組成的第一字詞索引集合;查詢與每個候選詞組索引單元對應(yīng)的詞組向量,獲得每個詞組向量的第一得分,將最高的第一得分對應(yīng)的詞組向量預(yù)測為當前從緩存空間轉(zhuǎn)移至棧空間進行移位操作時移動的詞組向量,使得對語句的識別更準確。
技術(shù)領(lǐng)域
本申請涉及自然語言處理技術(shù)領(lǐng)域,具體而言,涉及一種句法分析方法、裝置、存儲介質(zhì)及電子設(shè)備。
背景技術(shù)
目前,自然語言處理(Natural Language Processing)是人工智能和語言學(xué)領(lǐng)域的分支學(xué)科。在此領(lǐng)域中探討如何處理及運用自然語言,包括自然語言認知,自然語言生成和自然語言理解等。自然語言認知則是指讓電腦“懂”人類的語言;自然語言生成系統(tǒng)把計算機數(shù)據(jù)轉(zhuǎn)化為自然語言;自然語言理解系統(tǒng)把自然語言轉(zhuǎn)化為計算機程序更易于處理的形式。自然語言處理的主要任務(wù)包括詞性標注、情感分析、句法分析等。
目前,自然語言理解在日常生活中的應(yīng)用越來越廣泛,例如自動語音識別、神經(jīng)機器翻譯等。對于固定搭配、俗語、習(xí)語和網(wǎng)絡(luò)用語等詞組的識別是現(xiàn)有技術(shù)中一直存在的問題,這是因為這些詞組既不是地點、人名名詞性的實體,也不能僅僅從字面意思去理解,使得這些詞組與通常的命名實體識別任務(wù)不一樣。現(xiàn)有技術(shù)通常使用神經(jīng)網(wǎng)絡(luò)結(jié)合條件隨機場的方法來學(xué)習(xí)出一個能夠識別命名實體的模型,該模型只能通過句子內(nèi)本身詞與詞的上下文關(guān)系來判定是否是一組連續(xù)的詞組,使得識別結(jié)果不夠準確。
發(fā)明內(nèi)容
本申請的目的在于提供一種句法分析方法、裝置、存儲介質(zhì)及電子設(shè)備,以有效的改善現(xiàn)有技術(shù)中識別結(jié)果不準確的技術(shù)缺陷。
本申請的實施例通過以下技術(shù)方案實現(xiàn):
第一方面,本申請實施例提供了一種句法分析方法,方法用于解析原始語句,使得原始語句中的多個字詞向量從緩存空間全部轉(zhuǎn)移至棧空間的過程,方法包括:對當前位于緩存空間中的多個字詞向量分別對應(yīng)的第一索引重新組合排列,獲得K種候選詞組索引單元組成的第一字詞索引集合,其中,包括:根據(jù)多個字詞向量在緩存空間的存儲地址,將每個字詞向量在緩存空間的存儲地址賦予互不相同的數(shù)值,將每個字詞向量的數(shù)值確定為每個字詞向量的第一索引;根據(jù)組合的數(shù)量和組合的順序,對第一索引進行組合排列,每一種組合排列方式形成一種候選詞組索引單元,第一字詞索引集合包括了當前位于緩存空間中第一索引組合排列形成的所有可能性的候選詞組單元;查詢與每個候選詞組索引單元對應(yīng)的詞組向量,獲得每個詞組向量的第一得分,將最高的第一得分對應(yīng)的詞組向量預(yù)測為當前從緩存空間轉(zhuǎn)移至棧空間進行移位操作時移動的詞組向量。
結(jié)合第一方面,在第一種可能的實現(xiàn)方式中,方法還包括:獲得當前可建立句法關(guān)系的第二字詞索引集合,其中,第二字詞索引集合包括當前位于緩存空間中的第一個字詞向量對應(yīng)的第二字詞索引、當前位于棧空間中的棧頂?shù)淖衷~向量對應(yīng)的第二字詞索引以及與棧頂相鄰位置的字詞向量對應(yīng)的第二字詞索引,當前位于棧空間中的棧頂和與棧頂相鄰位置的兩個字詞向量之間可以進行左弧操作或右弧操作,左弧操作基于57種句法關(guān)系,右弧操作基于57種句法關(guān)系;根據(jù)句法關(guān)系,將第二字詞索引集合中的所有第二字詞索引映射成114種由字詞向量組成的句法關(guān)系詞組向量,獲得114種句法關(guān)系詞組向量的第二得分,根據(jù)第二得分預(yù)測當前從緩存空間轉(zhuǎn)移至棧空間時字詞向量進行左弧操作或右弧操作對應(yīng)的句法關(guān)系。
結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,方法還包括:根據(jù)K個詞組向量的所述第一得分和114種句法關(guān)系詞組向量的第二得分,對當前從緩存空間轉(zhuǎn)移至棧空間時字詞向量將在移位操作、左弧操作和右弧操作的三種操作中做出預(yù)測。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都曉多科技有限公司,未經(jīng)成都曉多科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010638300.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





