[發明專利]一種基于樹庫轉化的越南語依存樹庫錯誤檢測的方法在審
| 申請號: | 201810021822.6 | 申請日: | 2018-01-10 |
| 公開(公告)號: | CN108280060A | 公開(公告)日: | 2018-07-13 |
| 發明(設計)人: | 郭劍毅;邱國柯;余正濤;線巖團;毛存禮 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 越南語 錯誤檢測 短語類型 規則知識庫 短語結構 樹庫轉化 依存結構 推導 自然語言處理技術 機器翻譯 測試 人力物力 上層應用 信息抽取 信息檢索 依存關系 父節點 子節點 構建 轉化 支撐 成功 | ||
1.一種基于樹庫轉化的越南語依存樹庫錯誤檢測的方法,其特征在于:所述方法的具體步驟如下:
Step1、首先定義越南語的依存關系類型;
Step2、其次利用Step1的結果構建一個規則知識庫,并利用該規則知識庫推導出測試依存結構樹中父節點和子節點構成的短語類型;
Step3、然后將測試依存結構樹轉化為短語結構樹;若轉化失敗,則直接說明測試依存結構樹中最基礎的分詞與詞性標注錯誤;若轉化成功,則進入Step4;
Step4、最后將Step3中實際轉化成功得到的短語結構樹的短語類型與Step2中推導出的短語類型進行對比;若對比一致,則說明測試依存結構樹不存在錯誤;若對比不一致,則說明測試依存結構樹中最基礎的分詞與詞性標注正確,而更上層的依存關系標注錯誤。
2.根據權利要求1所述的基于樹庫轉化的越南語依存樹庫錯誤檢測的方法,其特征在于:所述步驟Step1的具體步驟為:
Step1.1、首先依據語義方式找出句子中哪些詞語之間存在依存關系;
Step1.2、其次依據主干方式找出句子中哪些詞語與謂詞之間存在依存關系;
Step1.3、最后歸類出Step1.1和Step1.2中所找出詞語之間具體屬于哪一種依存關系類型。
3.根據權利要求1所述的基于樹庫轉化的越南語依存樹庫錯誤檢測的方法,其特征在于:所述步驟Step2中,構建一個規則知識庫的具體步驟如下:
Step2.1、首先定義規則知識庫的具體框架;
Step2.2、然后自動抽取條件庫;遍歷依存樹庫中每一棵依存樹,并將樹中每一條弧線關聯的父節點詞性、子節點詞性以及它們之間的依存關系類型都一一抽取出來,將它們組合在一起就構成了條件庫;
Step2.3、最后人工輔助添加結論。
4.根據權利要求1所述的基于樹庫轉化的越南語依存樹庫錯誤檢測的方法,其特征在于:所述步驟Step3中,依據中心子節點的思想、遞歸算法將越南語的依存結構樹轉化成短語結構樹。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810021822.6/1.html,轉載請聲明來源鉆瓜專利網。





