[發(fā)明專利]語義關(guān)系的識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110287327.1 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN113010642A | 公開(公告)日: | 2021-06-22 |
| 發(fā)明(設(shè)計)人: | 劉志煌 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06F16/35;G06F16/36;G06F40/211;G06F40/253;G06F40/279;G06F40/30 |
| 代理公司: | 北京市立方律師事務(wù)所 11330 | 代理人: | 張筱寧 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語義 關(guān)系 識別 方法 裝置 電子設(shè)備 可讀 存儲 介質(zhì) | ||
本申請實施例提供了一種語義關(guān)系的識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì),涉及大數(shù)據(jù)以及云技術(shù)領(lǐng)域。該方法包括:獲取待處理文本;對待處理文本進(jìn)行上下文分析,得到待處理文本中包含的語法關(guān)系序列;將語法關(guān)系序列與特定語義關(guān)系的類序列規(guī)則庫進(jìn)行匹配,基于匹配結(jié)果,確定待處理文本是否包含特定語義關(guān)系;其中,類序列規(guī)則庫中包括特定語義關(guān)系對應(yīng)的語法關(guān)系序列規(guī)則,語法關(guān)系序列規(guī)則是通過對包含特定語義關(guān)系的多個樣本文本進(jìn)行語法關(guān)系的類序列規(guī)則挖掘得到的。在本申請實施例中,由于語法關(guān)系序列規(guī)則是對進(jìn)行語法關(guān)系的類序列規(guī)則挖掘得到的,此時不依賴于規(guī)則和制定模式,提高了模型識別語義關(guān)系的泛化能力,具備良好的可操作性。
技術(shù)領(lǐng)域
本申請涉及大數(shù)據(jù)以及云技術(shù)的技術(shù)領(lǐng)域,具體而言,本申請涉及一種語義關(guān)系的識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
隨著語言的發(fā)展和互聯(lián)網(wǎng)用語的不斷變化衍生,特定語義關(guān)系識別對于自然語言理解是個重要的任務(wù),包括知識圖譜構(gòu)建、領(lǐng)域知識庫構(gòu)建、關(guān)系鏈識別、詞條標(biāo)簽自動化構(gòu)建等在內(nèi)的諸多應(yīng)用場景都離不開特定語義關(guān)系識別。特定語義關(guān)系包括上下義關(guān)系、總分關(guān)系、同義關(guān)系、反義關(guān)系等,以及從其他邏輯關(guān)系定義中的種屬關(guān)系、組成關(guān)系等,涵蓋訪問很廣。
目前在進(jìn)行語義關(guān)系識別時,主要采用的方式為基于模式匹配的語義關(guān)系識別方法和基于機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的語義關(guān)系識別方法。但是經(jīng)研究發(fā)現(xiàn),基于模式匹配的語義關(guān)系識別方法只能夠抽取具有人工指定規(guī)則的顯示關(guān)系,而許多的語義關(guān)系隱含模式是靈活變化的,該方法極大降低了關(guān)系抽取的覆蓋率,同時規(guī)則擴(kuò)展要依賴專家和先驗知識庫,提高了人力成本和耗時,線上更新不夠及時;而基于機(jī)器學(xué)習(xí)的方法主要依賴于特征工程,特征工程往往要進(jìn)行繁瑣的特征選擇和特征提取,計算開銷大且容易存在錯誤傳播的問題。因此,如何快速有效的進(jìn)行語義關(guān)系識別是一個需要解決的重要問題。
發(fā)明內(nèi)容
本申請實施例提供一種語義關(guān)系的識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì),能夠快速有效的進(jìn)行語義關(guān)系識別。
一方面,本申請實施例提供了一種語義關(guān)系的識別方法,該方法包括:
獲取待處理文本;
對待處理文本進(jìn)行上下文分析,得到待處理文本中包含的語法關(guān)系序列;
將語法關(guān)系序列與特定語義關(guān)系的類序列規(guī)則庫進(jìn)行匹配,基于匹配結(jié)果,確定待處理文本是否包含特定語義關(guān)系;
其中,類序列規(guī)則庫中包括特定語義關(guān)系對應(yīng)的語法關(guān)系序列規(guī)則,語法關(guān)系序列規(guī)則是通過對包含特定語義關(guān)系的多個樣本文本進(jìn)行語法關(guān)系的類序列規(guī)則挖掘得到的。
另一方面,本申請實施例提供了一種語義關(guān)系的識別裝置,包括:
文本獲取模塊,用于獲取待處理文本;
文本分析模塊,用于對待處理文本進(jìn)行上下文分析,得到待處理文本中包含的語法關(guān)系序列;
語法關(guān)系匹配模塊,用于將語法關(guān)系序列與特定語義關(guān)系的類序列規(guī)則庫進(jìn)行匹配,基于匹配結(jié)果,確定待處理文本是否包含特定語義關(guān)系;
其中,類序列規(guī)則庫中包括特定語義關(guān)系對應(yīng)的語法關(guān)系序列規(guī)則,語法關(guān)系序列規(guī)則是通過對包含特定語義關(guān)系的多個樣本文本進(jìn)行語法關(guān)系的類序列規(guī)則挖掘得到的。
再一方面,本申請實施例提供了一種電子設(shè)備,該電子設(shè)備包括處理器以及存儲器:
存儲器被配置用于存儲計算機(jī)程序,該計算機(jī)程序在由處理器執(zhí)行時,使得處理器執(zhí)行本申請任一方面所提供的方法。
又一方面,本申請實施例提供了一種計算機(jī)可讀存儲介質(zhì),該計算機(jī)可讀存儲介質(zhì)中存儲有計算機(jī)程序,當(dāng)該計算機(jī)程序在計算機(jī)上運(yùn)行時,使得計算機(jī)可以執(zhí)行本申請任一方面所提供的方法。
本申請實施例提供的技術(shù)方案帶來的有益效果是:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110287327.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





