[發明專利]一種文章段落分析注釋方法、系統、可讀介質及設備有效
| 申請號: | 202210376828.1 | 申請日: | 2022-04-12 |
| 公開(公告)號: | CN114462424B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 李根柱 | 申請(專利權)人: | 北京思源智通科技有限責任公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F40/247;G06F40/216 |
| 代理公司: | 深圳市添源創鑫知識產權代理有限公司 44855 | 代理人: | 沈冠雄 |
| 地址: | 102400 北京市房山區閻*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文章 段落 分析 注釋 方法 系統 可讀 介質 設備 | ||
1.一種文章段落分析注釋方法,其特征在于,該方法包括:
獲取待分析文章,進行語義采集生成為段落數據和詞匯數據;
根據所述詞匯數據進行語義分析,生成近義詞庫;
獲取全部的句子,根據所述近義詞庫進行關鍵段關聯程度計算,形成目標關鍵段落;
提取每個詞匯的出現頻率,計算每個詞匯的指示詞詞頻和每個句子的自創程度;
對每個段落中的詞匯進行語義提取,生成語義轉折段落;
根據所述語義轉折段落、所述自創程度和所述目標關鍵段落進行在線的段落標記、語句標記和詞匯標記;
其中,所述提取每個詞匯的出現頻率,計算每個詞匯的指示詞詞頻和每個句子的自創程度,具體包括:
設置第一預設權重和第二預設權重;
提取每個詞匯出現的頻率;
提取每個詞匯對應的近義詞的出現頻率;
利用第三計算公式計算每個詞匯的所述指示詞詞頻;
利用第四計算公式計算每個句子的所述自創程度;
對所有的句子進行近義詞替換,生成近義詞轉化后的句庫,并標記所述近義詞轉化后的句庫中全部的能夠通過歷史知識庫查詢到的句子為已有數據;
利用第五計算公式判斷每個詞匯是否為高頻詞匯;
利用第六計算公式計算每個句子是否為自創句子;
所述第三計算公式為:
其中,
所述第四計算公式為:
其中,
所述第五計算公式為:
其中,
所述第六計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京思源智通科技有限責任公司,未經北京思源智通科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210376828.1/1.html,轉載請聲明來源鉆瓜專利網。





