[發明專利]一種基于文章結構樹的文章評價方法及系統有效
| 申請號: | 201911143150.7 | 申請日: | 2019-11-20 |
| 公開(公告)號: | CN111309854B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 董喆;何雙江;秦威 | 申請(專利權)人: | 武漢烽火信息集成技術有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/31;G06F16/35;G06Q10/0639 |
| 代理公司: | 武漢東喻專利代理事務所(普通合伙) 42224 | 代理人: | 雷霄 |
| 地址: | 430076 湖北省武漢市東湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文章 結構 評價 方法 系統 | ||
1.一種基于文章結構樹的文章評價方法,其特征在于,包括;
讀取用戶輸入的待評價文章,構建待評價文章的文章結構樹;
構建包含多個樣本文章及對應評價信息的樣本庫,構建樣本文章的文章結構樹;
獲取待評價文章的文章結構樹與樣本文章的文章結構樹的相似度,根據該相似度獲取與待評價文章相似的樣本文章;
根據該相似的樣本文章的評價信息獲取待評價文章的評價信息;
其中,構建文章結構樹具體包括:
生成一棵空的文章結構樹,將文章標題作為文章結構樹的根節點,將文章的子標題和/或段落按層級關系添加到根節點下作為子節點,為每個子節點賦值;
并且,根據以下公式為每個子節點賦值:
其中,P為子節點的賦值,m為該子節點下所有的文字數量,n為該文章的所有文字數量,Cm為該子節點下所有文字與文章標題的近似度。
2.如權利要求1所述的一種基于文章結構樹的文章評價方法,其特征在于,從文章結構樹的葉子節點到根節點的路徑上將葉子節點下的所有文字數累加到路徑上所有子節點上,獲取m和n的值,對子節點的文字進行分詞,計算所有分詞與文章標題的相似度,計算平均相似度,即為Cm的值。
3.如權利要求1所述的一種基于文章結構樹的文章評價方法,其特征在于,所述獲取待評價文章的文章結構樹與樣本文章的文章結構樹的相似度具體是:逐層計算待評價文章的文章結構樹與樣本文章的文章結構樹的層相似度,根據層相似度獲取待評價文章的文章結構樹與樣本文章的文章結構樹的相似度。
4.如權利要求1所述的一種基于文章結構樹的文章評價方法,其特征在于,根據以下公式獲取待評價文章的評價信息,
S表示待評價文章的評價信息,n獲取與待評價文章最相似的n篇樣本文章,Si表示n篇文章的第i篇的已有評價信息。
5.如權利要求1所述的一種基于文章結構樹的文章評價方法,其特征在于,若獲取的待評價文章的評價信息低于預設閾值,則將獲取的與待評價文章最相似的樣本文章推送給用戶。
6.一種基于文章結構樹的文章評價系統,其特征在于,包括:
讀取模塊,用于讀取用戶輸入的待評價文章,構建待評價文章的文章結構樹;
樣本庫構建模塊,用于構建包含多個樣本文章及對應評價信息的樣本庫,構建樣本文章的文章結構樹;
相似樣本獲取模塊,用來獲取待評價文章的文章結構樹與樣本文章的文章結構樹的相似度,根據該相似度獲取與待評價文章相似的樣本文章;
評價信息獲取模塊,用于根據相似的樣本文章的評價信息獲取待評價文章的評價信息;
其中,構建文章結構樹具體包括:
生成一棵空的文章結構樹,將文章標題作為文章結構樹的根節點,將文章的子標題和/或段落按層級關系添加到根節點下作為子節點,為每個子節點賦值;
并且,根據以下公式為每個子節點賦值:
其中,P為子節點的賦值,m為該子節點下所有的文字數量,n為該文章的所有文字數量,Cm為該子節點下所有文字與文章標題的近似度。
7.一種電子設備,包括處理器和存儲器,其特征在于,
其中,所述處理器通過讀取所述存儲器中存儲的可執行程序代碼來運行與所述可執行程序代碼對應的程序,以用于實現如權利要求1至5中任一項所述的方法。
8.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至5中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢烽火信息集成技術有限公司,未經武漢烽火信息集成技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911143150.7/1.html,轉載請聲明來源鉆瓜專利網。





