[發明專利]一種個性化自動文摘算法在審
| 申請號: | 202110497850.7 | 申請日: | 2021-05-08 |
| 公開(公告)號: | CN113420142A | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 蔣健 | 申請(專利權)人: | 廣東恒宇信息科技有限公司 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F16/35;G06F16/9535;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 516600 廣東省汕尾*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 個性化 自動 文摘 算法 | ||
1.一種個性化自動文摘算法,其特征在于:包括以下步驟:
步驟1:基于模糊聚類算法建模用戶興趣;
步驟2:根據數據建模、模糊三元聚類算法對社交標簽網絡中的三類節點(文檔,用戶和標簽)進行協同聚類;
步驟3:實驗結果與分析;
步驟4:基于卷積神經網絡為句子打分;
步驟5:對使用卷積神經網絡架構進行文本進行摘要抽??;
步驟6:實驗結果與分析;
步驟7:獲取用戶興趣點發現;
步驟8:生成個性化自動摘要;
步驟9:實驗結果與分析。
2.根據權利要求1所述的一種個性化自動文摘算法,其特征在于:所述在步驟1中,根據用戶興趣為目標文檔生成摘要,工作研究如何利用社會標簽系統的三元網絡來增強網絡聚類,從而推斷用戶興趣,能產生包括用戶和標簽的聚類結構以及不同實體的聚類之間的關系等信息。
3.根據權利要求1所述的一種個性化自動文摘算法,其特征在于:所述在步驟2中,用戶節點和標簽節點可以同樣建模,通過這種表示模型,通過任何基于矢量空間模型(VSM)的聚類方法將社交標記網絡的三種類型的節點分別聚類。分別對這三種類型的節點進行聚類,可忽略了不同類型的節點之間的影響。在一個典型的社交標簽系統中,語義相關的標簽通常被分配給具有相似主題的文檔以及具有相似興趣的用戶;同樣,具有共同興趣的用戶通常使用語義相關的標簽來標注與局部相關的網頁,利用不同類型節點的類結構之間的關系,該算法將聚類的數量作為輸入,并且隨機初始化模糊分類矩陣。基于每個類的committee計算其質心向量,并通過計算每一輪迭代中對象與各類的質心間的余弦相似度,更新對象的成員隸屬度。
4.根據權利要求1所述的一種個性化自動文摘算法,其特征在于:所述在步驟3中,模糊三元聚類的聚類結果與結合社會標簽的K-Means聚類方法接近,但與結合社會標簽的K-Means聚類方法相比,模糊三元聚類算法能產生更多的信息,包括用戶和標簽的聚類結構以及不同實體的聚類之間的關系。而且,三元聚類不依賴于簽的K-資源的內容,因此可以將Means聚類方法相比其應用于對在社交標簽系統中注釋的不同類型的資源(例如圖像和視頻)進行聚類。
5.根據權利要求1所述的一種個性化自動文摘算法,其特征在于:所述在步驟4中,算法框架中,自動文摘問題被轉化為計算句子得分的回歸任務,引入卷積神經網絡模型解決特征學習問題和回歸問題,卷積神經網絡架構包括卷積層、最大池化層和正則化。
6.根據權利要求5所述的一種個性化自動文摘算法,其特征在于:所述卷積層通過一個對應的特征映射獲取窗口中的詞的一個簽的K-的特征,其卷積運算作用在一個濾波器和一個連接向量之間,所述最大池化層通過最大池化層操作h=max(c)來獲得與這個濾波器相對應的一個特征,多個濾波器被應用到不同權重和不同窗口大小來生成一個特征向量,本研究中將窗口大小定為3,并使用400個濾波器,以上參數的選擇應對學習性能和學習復雜度之間進行權衡,所述正則化在最大池化層之后,可得到倒數第二層h=[h1,h2,…]表示濾波器的數量,在倒數第二層上本研究應用參數避免過擬合。
7.根據權利要求1所述的一種個性化自動文摘算法,其特征在于:所述在步驟5中,抽取式自動文摘算法被定義為在單文檔或多文檔中根據重要性分值選擇句子并對其生成摘要的過程,采用的框架背后的動機是應用CNN模型來學習每個句子的特征向量并為其分配一個重要性分值,訓練卷積神經網絡模型,計算文章中的每個句子的得分,采用了被廣泛接受的自動摘要評價指標ROUGE來計算句子得分。
8.根據權利要求1所述的一種個性化自動文摘算法,其特征在于:所述在步驟6中,每當用戶使用標簽對文檔進行注釋時,系統便會在這三種對象之間建立起對應的三元關系,文檔,用戶和標簽之間的三元關系為發現主題相關文檔,興趣類似的用戶和語義相近的標簽提供了有價值的信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東恒宇信息科技有限公司,未經廣東恒宇信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110497850.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于護欄生產的噴涂設備
- 下一篇:一種便攜式谷物品質快速無損檢測鑒定裝置





