[發(fā)明專利]一種基于多種中文知識資源的中文詞語語義關(guān)系識別方法和裝置有效
| 申請?zhí)枺?/td> | 201710707420.7 | 申請日: | 2017-08-17 |
| 公開(公告)號: | CN107451123B | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計)人: | 鹿文鵬;孟凡擎;杜月寒 | 申請(專利權(quán))人: | 齊魯工業(yè)大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250353 山東省濟南*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多種 中文 知識 資源 詞語 語義 關(guān)系 識別 方法 裝置 | ||
本發(fā)明公開了一種基于多種中文知識資源的中文詞語語義關(guān)系識別方法和裝置。方法包括:結(jié)合多種中文知識資源獲取反義詞集合,根據(jù)反義詞集合判定詞語間語義關(guān)系是否具有反義關(guān)系;使用多種中文知識資源提取部分詞集合,根據(jù)部分詞集合判定詞語間是否具有整體部分關(guān)系;利用多種中文知識資源提取同義詞集合,基于同義詞集合判定詞語間是否具有同義關(guān)系;借助于多種中文知識資源提取下位詞集合,根據(jù)下位詞集合判定詞語間是否具有上下位關(guān)系。利用本發(fā)明,可以充分發(fā)揮多種中文知識資源的作用,更準確有效地識別中文詞語語義關(guān)系。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,具體涉及一種基于多種中文知識資源的中文詞語語義關(guān)系識別方法和裝置。
背景技術(shù)
語義關(guān)系識別是指給定詞語對自動判定詞語間所具有的語義關(guān)系。典型的語義關(guān)系包括:反義關(guān)系、整體部分關(guān)系、同義關(guān)系、上下位關(guān)系等。語義關(guān)系識別是自然語言處理領(lǐng)域的基礎(chǔ)性任務(wù),對詞義消歧、知識本體構(gòu)建、機器翻譯、信息檢索、文本分類等具有直接影響。
當前大多數(shù)語義關(guān)系識別研究工作主要針對英文,通?;谝环N或多種知識資源,利用支持向量機、貝葉斯分類器等統(tǒng)計學習的方法完成英文語義關(guān)系的分類或識別任務(wù),取得了較好的效果。在中文語義關(guān)系識別方面的研究工作相對較少,多數(shù)相關(guān)工作通常采用某一種知識資源,借助于統(tǒng)計學習方法來進行語義關(guān)系的識別。現(xiàn)有的研究工作只采用某一種知識資源,而忽略了對其它語言知識資源的挖掘利用;統(tǒng)計學習方法難免受到標注語料的規(guī)模的制約,準確率也難以保證。隨著各類語言知識資源的建設(shè)和完善,這些資源互為補充,為語義關(guān)系的識別提供了更可靠的知識。
面對中文詞語語義關(guān)系識別所存在的以上技術(shù)問題,本發(fā)明專利充分挖掘多種知識資源的內(nèi)在語義關(guān)系,實現(xiàn)一種基于多種中文知識資源的中文詞語語義關(guān)系識別方法和裝置,力求能夠在一定程度上推動這些問題的解決。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)存在的不足,本發(fā)明公開了一種基于多種中文知識資源的中文詞語語義關(guān)系識別方法和裝置,以更準確有效地判定中文詞語間的語義關(guān)系。
為此,本發(fā)明提供如下技術(shù)方案:
一種基于多種中文知識資源的中文詞語語義關(guān)系識別方法,包括以下步驟:
步驟一、結(jié)合多種中文知識資源獲取反義詞集合,根據(jù)反義詞集合判定詞語間語義關(guān)系是否具有反義關(guān)系;
步驟二、使用多種中文知識資源提取部分詞集合,根據(jù)部分詞集合判定詞語間是否具有整體部分關(guān)系;
步驟三、利用多種中文知識資源提取同義詞集合,基于同義詞集合判定詞語間是否具有同義關(guān)系;
步驟四、借助于多種中文知識資源提取下位詞集合,根據(jù)下位詞集合判定詞語間是否具有上下位關(guān)系;
進一步的,所述步驟一中,在判定反義語義關(guān)系時,具體為:
步驟1-1)利用HowNet中顯式定義的反義關(guān)系,對給定詞語A和B進行詞語A的反義詞集合ASETA提取操作,如果B∈ASETA,那么兩詞語存在反義關(guān)系,否則轉(zhuǎn)步驟1-2),另外HowNet中定義的對義關(guān)系也作為一種反義關(guān)系處理;
步驟1-2)使用百度漢語提取給定詞語A的反義詞集合ASETA,利用哈工大同義詞詞林擴展版提取詞語A的同義詞集合SSETA,對于每個詞語W∈SSETA提取其反義詞并合并到ASETA,如果詞語B∈ASETA,則詞語A和B存在反義關(guān)系,否則轉(zhuǎn)步驟1-3);
步驟1-3)使用百度百科提取詞語A的反義詞集合ASETA,如果詞語B∈ASETA,則兩詞語存在反義關(guān)系,否則轉(zhuǎn)步驟2-1)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于齊魯工業(yè)大學,未經(jīng)齊魯工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710707420.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種墻紙涂膠裝置
- 下一篇:一種發(fā)泡膠槍轉(zhuǎn)接頭





