[發明專利]一種基于調和級數的文本圖結構表示模型無效
| 申請號: | 201210059404.9 | 申請日: | 2012-03-08 |
| 公開(公告)號: | CN102629266A | 公開(公告)日: | 2012-08-08 |
| 發明(設計)人: | 陳雪;吳超 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 何文欣 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 調和級數 文本 結構 表示 模型 | ||
1.一種基于調和級數的文本圖結構表示模型,其特征在于:采用圖結構模型對單篇文本進行表示,其中使用調和級數法對關鍵詞和關鍵詞對的權重進行計算;所述的圖結構模型就是將文本的關鍵詞根據關鍵詞對在同一個句子中的共現關系建立連接關系;其具體步驟如下:
打開領域文集中的單篇文本;
將文本內容按照重要性程度由大到小重新排列;
對文本進行分詞并保留標點符號;
統計關鍵詞和關鍵詞對的出現次數;
以關鍵詞為圖的節點,將共現次數不為0的關鍵詞對進行連接;
使用調和級數法對關鍵詞和關鍵詞對的權重進行計算。
2.按權利要求1所述的基于調和級數的文本圖結構表示模型,其特征在于:所述步驟(6)中的調和級數法,其關鍵詞和關鍵詞對權重計算式如下:
其中,n為關鍵詞和關鍵詞對的出現次數,為歐拉常數,。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210059404.9/1.html,轉載請聲明來源鉆瓜專利網。





