[發明專利]一種基于自然語言對稿件完整性的評估方法在審
| 申請號: | 202111572608.8 | 申請日: | 2021-12-21 |
| 公開(公告)號: | CN114254077A | 公開(公告)日: | 2022-03-29 |
| 發明(設計)人: | 黃飛躍;戚俊 | 申請(專利權)人: | 南京路特軟件有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35 |
| 代理公司: | 南京蘇博知識產權代理事務所(普通合伙) 32411 | 代理人: | 柳強 |
| 地址: | 210012 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 稿件 完整性 評估 方法 | ||
本發明涉及自然語言處理技術領域,具體涉及一種基于自然語言對稿件完整性的評估方法;可以通過本方法對稿件內容進行計算,得出的分值可以用于評估稿件新聞要素的完整性,是否缺失了敘事三要素“時間、地點、人物”等,降低內容風險;通過批量化的評分可以提高內容生產中質量低下的痛點,避免大量的“洗稿”“重復稿”“爛稿”充斥在各信息發布渠道中;可以通過訓練多種分析器來提高評分的可靠性,維度越多分析器越多,得到的評分數據越可信,適用于各種場景下的內容質量評估要求。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種基于自然語言對稿件完整性的評估方法。
背景技術
新聞稿作為公司/機構/學校等單位發送予傳媒的通信渠道,用來公布有新聞價值的消息。通常會分發于報章、雜志、電臺、電視臺(電視網絡)等渠道。新聞稿異于新聞,新聞稿是鼓勵新聞記者在該題材上撰寫的稿件。隨著媒體融合進程的加劇,如何生產出更有質量的新聞稿內容成了重中之重,
目前,對新聞稿要素完整性的評估仍然使用人工經驗判斷的方式進行,導致效率低下,且無法量化評定標準。
發明內容
本發明的目的在于提供一種基于自然語言對稿件完整性的評估方法,旨在解決現有技術中對新聞稿要素完整性的評估仍然使用人工經驗判斷的方式進行,導致效率低下,且無法量化評定標準的技術問題。
為實現上述目的,本發明提供了一種基于自然語言對稿件完整性的評估方法,包括如下步驟:
稿件完成撰寫后,將稿件送通過信息化系統流轉至評分系統中;
對稿件進行預先格式化,準備進行自然語義分析;
稿件完成格式化后,通過機器學習及自然語言處理訓練出對應的分析器模型,將信息傳輸至由機器學習訓練出的模型中進行推理,并得出分值;
匯聚多個分析器的分值,匯聚完成后進行合并計算。
其中,在對稿件進行預先格式化,準備進行自然語義分析的步驟中:
所述格式化包括去除無意義的符號和文字、截取超長字符串或補足字符串最低長度、對內容進行中文分詞、提取詞向量。
其中,在稿件完成格式化后,通過機器學習及自然語言處理訓練出對應的分析器模型,將信息傳輸至由機器學習訓練出的模型中進行推理,并得出分值的步驟中:
所述分析器模型通過根據內容總字數、分段閥值、要素總數、要素加權值和要素完整性計算分值,通過所述內容總字數除以分段閥值得到第一數值,所述要素總數除以所述第一數值得到第二數值,所述要素總數與所述要素加權值相乘得到第三數值,所述第二數值加上所述第三數值得到所述分值,所述分值表示要素完整性。
其中,在稿件完成格式化后,通過機器學習及自然語言處理訓練出對應的分析器模型,將信息傳輸至由機器學習訓練出的模型中進行推理,并得出分值的步驟中:
所述分析器模型通過根據內容總字數、分段閥值、要素總數、要素加權值和要素完整性計算分值,通過所述內容總字數除以分段閥值得到第一數值,所述要素總數除以所述第一數值得到第二數值,所述要素總數與所述要素加權值相乘得到第三數值,所述第二數值加上所述第三數值得到所述分值,所述分值表示要素完整性。
其中,在稿件完成格式化后,通過機器學習及自然語言處理訓練出對應的分析器模型,將信息傳輸至由機器學習訓練出的模型中進行推理,并得出分值的步驟中:
所述分段閥值根據業務場景進行設置,代表了內容長度對評分結果的影響。
在匯聚多個分析器的分值,匯聚完成后進行合并計算的步驟中:
根據業務場景生成多個分析器,所述業務場景包括時間維度、地點維度、環境維度、人群維度和行業維度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京路特軟件有限公司,未經南京路特軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111572608.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種光模塊
- 下一篇:一種文件系統性能測試方法





