[發明專利]現代漢語成分分析的一種人工智能方法在審
| 申請號: | 201911188728.0 | 申請日: | 2019-11-19 |
| 公開(公告)號: | CN110909537A | 公開(公告)日: | 2020-03-24 |
| 發明(設計)人: | 曲英洲 | 申請(專利權)人: | 曲英洲 |
| 主分類號: | G06F40/253 | 分類號: | G06F40/253;G06F40/289;G06F40/205 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 730000 甘肅省蘭州市七里河*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 現代漢語 成分 分析 一種 人工智能 方法 | ||
1.一種使用人工智能分析現代漢語句子成分的方法,其特征是:建立和調用詞庫以及將文本切分成語段、句和詞——具體表現為:(1)詞庫按詞所包含的字符從多到少依次存放,(2)詞變量有字符串形式、詞性、感情色彩、使用頻率等4個以上屬性,(3)詞庫調用要遵循2原則,(4)具有詞性、短語屬性、語法成分、起始位置和包含的字符數等5個以上屬性的詞單元,(5)記錄短語屬性和短語始末點的變量二維數組的短語單元等5項特征。
2.如權利要求1所述的方法,其特征是:一詞多性可操作的設置——具體表現為:“(1)名詞‘月’當前面出現數詞或者‘正’‘初’等詞匯時,作時間動詞”等78條數據設計。
3.如權利要求2所述的方法,其特征是:必須預設置的固定或者確定的短語屬性——具體表現為:“(1)如果‘子’‘兒’‘頭’只是單一的詞素并且不居于句子的開頭,它的前一個詞如果是偏正短語、聯合短語、‘的’字結構、引用、形容詞、動詞、不及物動詞、表心理活動的動詞、量詞、數詞等,那么它們構成聯合短語”等66條數據設計。
4.如權利要求3所述的方法,其特征是:建立習慣用法詞庫和調用規則——具體表現為:(1)建立習慣用法詞庫,應該先建立一個變量組,這個變量組的每一個變量都由2個元素組成,(2)習慣用法詞庫主要包括邏輯和語法2類,(3)習慣用法詞庫的符號設計,(4)詞庫調用的規則等4項特征。
5.如權利要求4所述的方法,其特征是:短語構成的判定——具體表現為:(1)基本組合的短語構造如“(1)數詞+數詞=數量短語”等共85條數據設計,(2)動態組合的短語的循環組合方式、動態循環庫中如“①劃分偏正短語……”等18種形態設計以及如【偏正短語】構造如“(86)聯合短語+名詞、代詞、人稱代詞=聯合短語”等130條數據設計。
6.如權利要求5所述的方法,其特征是:短語組成計算以及記錄模塊的設計——具體表現為:(1)檢查系統的設計,(2)組成限制中“偏正短語”等14種類短語限制的設計,(3)記錄組合結果種方法和步驟的設計。
7.如權利要求6所述的方法,其特征是:介詞結構、動賓結構、聯合短語、【的】字短語等特定用法的區分規定設計——具體表現為:(1)“的”作語氣助詞、結構助詞與【的】字結構,(2)【的】字短語,(3)動賓短語(4)介賓短語,(5)偏正短語,(6)姓氏短語,(7)地名和物品名稱,(8)頓號、連接詞的連詞和連接句子的連詞構成的聯合類短語等8種特別規定或函數的設計。
8.如權利要求7所述的方法,其特征是:根據短語和詞的構成方式劃分句子成分以及劃分函數庫的設置——具體表現為:(1)以一個完整句為單位按順序劃分成分的關于完整句的規定和劃分順序的規定,(2)劃分成分的方法的4個步驟,(3)劃分函數庫的設置,包括關于狀動短語、連動短語、動補短語、兼語短語、動賓短語、祈使短語、存變合成謂語等5個特殊函數的設計。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于曲英洲,未經曲英洲許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911188728.0/1.html,轉載請聲明來源鉆瓜專利網。





