[發明專利]一種中文句法分析方法和系統在審
| 申請號: | 202110023058.8 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112699664A | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 俞蓮 | 申請(專利權)人: | 中國專利信息中心 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/253;G06F40/289;G06N20/00 |
| 代理公司: | 北京中普鴻儒知識產權代理有限公司 11822 | 代理人: | 劉浩 |
| 地址: | 100088 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中文 句法 分析 方法 系統 | ||
1.一種中文句法分析方法,其特征在于,包括以下步驟:
步驟S1:對輸入的文本進行分句、分詞,并標注詞性;
步驟S2:識別句子中的詞組;
步驟S3:識別句子中的短語;
步驟S4:識別句子的構架;
步驟S5:對句子進行句法分析,并按中文語法標注和輸出句子組分的語法關系。
2.根據權利要求1所述的方法,其特征在于,在所述步驟S2中,所述詞組包括慣用型詞組和一般詞組,所述慣用型詞組指詞組形式的慣用表達以及包含特定字或名詞的詞組形式的慣用表達,一般詞組指組合式名詞。
3.根據權利要求1所述的方法,其特征在于,在所述步驟S3中,所述短語包括慣用型短語和一般短語,所述慣用型短語指以短語節點庫中的字、詞或其搭配詞作為節點的短語形式的慣用表達,由節點和組分構成,所述組分包括名詞、詞組、動詞、形容詞、副詞、短語或子句。
4.根據權利要求3所述的方法,其特征在于,所述步驟3包括:
S31、對每個分句從左到右與短語節點庫進行對比,識別單節點或雙節點;
S32、將句子從左到右距離最近的雙節點和所述雙節點之間的內容標注為雙節點慣用型短語;
S33、識別一般短語,所述一般短語指動詞+名詞組成的短語和 “的”字形容詞短語,其中,“的”字前為名詞、代詞、形容詞或“名詞+動詞”;
S34、如果識別出前單節點,則將所述前單節點到緊隨其后的不在形容詞短語或雙節點慣用型短語中的“動詞+名詞”,或動詞,或詞組或名詞的部分標注為單節點慣用型短語,如果識別出后單節點,則將所述后單節點到緊靠其前的“動詞+名詞”,或動詞,或詞組或名詞的部分標注為單節點慣用型短語。
5.根據權利要求1所述的方法,其特征在于,所述步驟S4包含:
S41、對比慣用型句式庫,判斷句子是否為復合句;
S42、對比慣用型句式庫,識別并標注慣用型句式;
S43、識別并標注句子核心動詞;
S44、識別“的”字所屬結構;當分句中存在兩個以上“的”字,并且所述“的”字的前后均為名詞、詞組或代詞時,按中文語法將“的”字解析為名詞、詞組或代詞間的所屬關系,以最后的“的”字及其前的內容為其后內容的定語;
S45、對于句子中的代詞、短語、形容詞、副詞、介詞、連詞、助詞、數量詞、關系詞以及標點符號按中文語法解析并標注語法成分或關系;
S46、確定并標注句子的主語、謂語和賓語,對于一般句式,核心動詞為句子的謂語,除去虛詞(副詞、介詞、連詞、助詞、嘆詞和擬聲詞)、關系詞、作定語或狀語的短語以及子句,將核心動詞左側的組分標注為句子的主語,將核心動詞右側的組分標注為句子的賓語;慣用型句式的主語、謂語、賓語的判斷根據人工設定。
6.根據權利要求5所述的方法,其特征在于,所述步驟S43包括:
1)找到一般句式中不能作為核心動詞的動詞,判斷方法為:主句句首動詞不作核心動詞,句首動詞包括其前帶有短語、副詞、介詞、形容詞或數量詞的動詞;詞組中的動詞不作核心動詞;形容詞短語中的動詞不作核心動詞;節點為非動詞的慣用型短語中的動詞不作核心動詞;“的”字前/后的動詞不作核心動詞;
2)除所述不作核心動詞的動詞,將主句或分句自左到右的第一個動詞標注為該句的核心動詞。
7.一種中文句法分析系統,其特征在于,所述系統包括詞語識別模塊、短語識別模塊、句子識別模塊、句法分析模塊和數據庫,其中,
數據庫包括詞語庫、慣用型短語節點庫和慣用型句式庫;
詞語識別模塊用于識別詞語,包括名詞和詞組;
短語識別模塊用于識別短語,包括慣用型短語和一般短語;
句子識別模塊用于識別句子主體構架,包括一般句式和慣用型句式;
句法分析模塊用于對句子進行句法分析、標注句子組分的語法成分及輸出句法分析結果,包括應用的語法規則,所述句子組分包括詞和詞組、短語、核心動詞、形容詞、副詞、連詞、數量詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國專利信息中心,未經中國專利信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110023058.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種磁耦合電感器
- 下一篇:一種面向鐵路編組站的尾部編組計劃確定系統及方法





