[發明專利]一種基于規則的樹庫自動轉換方法及系統有效
| 申請號: | 202211224562.5 | 申請日: | 2022-10-09 |
| 公開(公告)號: | CN115292549B | 公開(公告)日: | 2022-12-20 |
| 發明(設計)人: | 楊麟兒;謝晨暉;胡正升;廖田昕;楊爾弘 | 申請(專利權)人: | 北京語言大學 |
| 主分類號: | G06F16/84 | 分類號: | G06F16/84 |
| 代理公司: | 北京市廣友專利事務所有限責任公司 11237 | 代理人: | 張仲波 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 規則 自動 轉換 方法 系統 | ||
1.一種基于規則的樹庫自動轉換方法,其特征在于,包括以下步驟:
S1:將輸入的短語結構字符串進行多叉樹數據結構構建,形成短語樹;初始化短語樹中xml存儲根節點的xml_root對象;
S2:從所述短語樹的根節點出發,對多叉樹進行先序遍歷;判斷句子中是否存在小句,如果存在則進行小句的切分,若不存在則進行規則轉換流程;
S3:遍歷每個子節點,判斷子節點是否符合句法成分轉換規則以及句式轉換規則,如果符合則按照預設規則進行轉換,轉換成功后新建xml_root的子節點;若不符合,則判斷子節點是否符合特殊轉換規則,如果符合則按照預設特殊轉換規則進行轉換;若不符合,則結束轉換;
所述步驟S3中,遍歷每個子節點,判斷子節點是否符合句法成分轉換規則以及句式轉換規則,如果符合則按照預設規則進行轉換,轉換成功后新建xml_root的子節點;若不符合,則判斷子節點是否符合特殊轉換規則,如果符合則按照預設特殊轉換規則進行轉換;若不符合,則結束轉換,包括:
S31:遍歷每個子節點,判斷子節點是否符合句法成分轉換規則以及句式轉換規則,若符合,則根據句法成分轉換規則以及句式轉換規則進行轉換;
S32:若不符合句法成分轉換規則以及句式轉換規則,則對特殊情況或多標簽組合的情況進行判斷,根據特殊情況的轉換規則進行轉換,其中所述特殊情況包括:
子節點不能直接對應句法成分轉換規則、句式轉換規則,必須增加限制條件;或子節點的標簽超過三個及以上;
S33:轉換成功后新建xml_root的子節點;
S4:根據詞性轉換規則表,將所述短語樹的終端節點的短語詞性轉換為句式結構詞性;
S5:將不斷更新的xml_root轉換為xml字符串,生成xml文件,完成短語結構樹庫向句式結構樹庫的自動轉換。
2.根據權利要求1所述的方法,其特征在于,所述步驟S1中,所述短語樹中每個節點的屬性包括:根節點、標簽值以及子節點屬性。
3.根據權利要求1所述的方法,其特征在于,所述步驟S31中,句法成分轉換規則,包括:核心轉換規則以及輔助轉換規則;句式轉換規則包括:合成謂語句的轉換規則、兼語句的轉換規則以及連動句的轉換規則;其中,句法成分轉換是將短語結構樹庫的節點轉換為句式結構樹庫的句法成分。
4.根據權利要求3所述的方法,其特征在于,所述核心轉換規則為利用短語結構樹庫的功能標簽和短語標簽進行轉換。
5.根據權利要求3所述的方法,其特征在于,所述輔助轉換規則為利用短語結構樹庫的詞性標簽,將標簽下的葉子節點轉換為句式結構樹庫的句法成分。
6.根據權利要求1所述的方法,其特征在于,所述步驟S32中,所述特殊情況的轉換規則,包括:限制性轉換規則以及多標簽組合的轉換規則。
7.根據權利要求6所述的方法,其特征在于,所述多標簽組合的情況包括:三個及以上的標簽通過連接符號連接為一個標簽,其中,句式結構樹庫中對應的有效標記居于組合尾部;
所述多標簽組合的轉換規則包括:判斷組合中最后一個標記是否符合核心轉換方法或輔助轉換方法,如果不符合,則判斷前一個標記,直到符合轉換條件為止。
8.根據權利要求1所述的方法,其特征在于,所述步驟S4中,根據詞性轉換規則表,將所述短語樹的終端節點的短語詞性轉換為句式結構詞性,包括:
根據短語結構樹庫與句式結構樹庫的詞性標簽體系的對應規律,將短語結構樹庫的詞性標簽轉換為句式結構樹庫的詞性標簽。
9.一種基于規則的樹庫自動轉換系統,其特征在于,所述系統適用于上述權利要求1-8中任意一項所述的方法,所述系統包括:
多叉樹數據構造模塊,用于將輸入的短語結構字符串進行多叉樹數據結構構建,形成短語樹;初始化短語樹中xml存儲根節點的xml_root對象;
遍歷模塊,用于從所述短語樹的根節點出發,對多叉樹進行先序遍歷;判斷句子中是否存在小句,如果存在則進行小句的切分,若不存在則進行規則轉換流程;
句法句式轉換模塊,用于遍歷每個子節點,判斷子節點是否符合句法成分轉換規則以及句式轉換規則,如果符合則按照預設規則進行轉換,轉換成功后新建xml_root的子節點;若不符合,則判斷子節點是否符合特殊轉換規則,如果符合則按照預設特殊轉換規則進行轉換;若不符合,則結束轉換;
句法句式轉換模塊,用于遍歷每個子節點,判斷子節點是否符合句法成分轉換規則以及句式轉換規則,若符合,則根據句法成分轉換規則以及句式轉換規則進行轉換;
若不符合句法成分轉換規則以及句式轉換規則,則根據句法成分轉換規則以及句式轉換規則,對特殊情況或多標簽組合的情況進行判斷,根據特殊情況的轉換規則進行轉換,其中所述特殊情況包括:子節點不能直接對應句法成分轉換規則、句式轉換規則,必須增加限制條件;子節點的標簽超過三個及以上;
轉換成功后新建xml_root的子節點;
詞性轉換模塊,用于根據詞性轉換規則表,將所述短語樹的終端節點的短語詞性轉換為句式結構詞性;
文件生成模塊,用于將不斷更新的xml_root轉換為xml字符串,生成xml文件,完成短語結構樹庫向句式結構樹庫的自動轉換。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京語言大學,未經北京語言大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211224562.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種橡膠粉碎裝置
- 下一篇:一種基于船舶狀態監測的海纜安全預警方法及系統





