[發(fā)明專(zhuān)利]一種基于自然語(yǔ)言對(duì)稿件完整性的評(píng)估方法在審
| 申請(qǐng)?zhí)枺?/td> | 202111572608.8 | 申請(qǐng)日: | 2021-12-21 |
| 公開(kāi)(公告)號(hào): | CN114254077A | 公開(kāi)(公告)日: | 2022-03-29 |
| 發(fā)明(設(shè)計(jì))人: | 黃飛躍;戚俊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 南京路特軟件有限公司 |
| 主分類(lèi)號(hào): | G06F16/33 | 分類(lèi)號(hào): | G06F16/33;G06F16/35 |
| 代理公司: | 南京蘇博知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32411 | 代理人: | 柳強(qiáng) |
| 地址: | 210012 江蘇省南*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 自然語(yǔ)言 稿件 完整性 評(píng)估 方法 | ||
1.一種基于自然語(yǔ)言對(duì)稿件完整性的評(píng)估方法,其特征在于,包括如下步驟:
稿件完成撰寫(xiě)后,將稿件送通過(guò)信息化系統(tǒng)流轉(zhuǎn)至評(píng)分系統(tǒng)中;
對(duì)稿件進(jìn)行預(yù)先格式化,準(zhǔn)備進(jìn)行自然語(yǔ)義分析;
稿件完成格式化后,通過(guò)機(jī)器學(xué)習(xí)及自然語(yǔ)言處理訓(xùn)練出對(duì)應(yīng)的分析器模型,將信息傳輸至由機(jī)器學(xué)習(xí)訓(xùn)練出的模型中進(jìn)行推理,并得出分值;
匯聚多個(gè)分析器的分值,匯聚完成后進(jìn)行合并計(jì)算。
2.如權(quán)利要求1所述的一種基于自然語(yǔ)言對(duì)稿件完整性的評(píng)估方法,其特征在于,在對(duì)稿件進(jìn)行預(yù)先格式化,準(zhǔn)備進(jìn)行自然語(yǔ)義分析的步驟中:
所述格式化包括去除無(wú)意義的符號(hào)和文字、截取超長(zhǎng)字符串或補(bǔ)足字符串最低長(zhǎng)度、對(duì)內(nèi)容進(jìn)行中文分詞、提取詞向量。
3.如權(quán)利要求2所述的一種基于自然語(yǔ)言對(duì)稿件完整性的評(píng)估方法,其特征在于,在稿件完成格式化后,通過(guò)機(jī)器學(xué)習(xí)及自然語(yǔ)言處理訓(xùn)練出對(duì)應(yīng)的分析器模型,將信息傳輸至由機(jī)器學(xué)習(xí)訓(xùn)練出的模型中進(jìn)行推理,并得出分值的步驟中:
所述分析器模型包含的算法有基于深度學(xué)習(xí)的文本分類(lèi)算法,基于機(jī)器學(xué)習(xí)的文本分類(lèi)算法,基于機(jī)器學(xué)習(xí)的聚類(lèi)算法,基于深度序列模型的分詞、詞性標(biāo)注、命名實(shí)體識(shí)別算法,基于深度學(xué)習(xí)和圖的句法依存解析和語(yǔ)義依存解析算法,基于概率統(tǒng)計(jì)和深度學(xué)習(xí)的相似度算法,基于規(guī)則解析的特殊詞組提取算法,基于依存樹(shù)和句子結(jié)構(gòu)的句子解析算法,基于深度學(xué)習(xí)的語(yǔ)義槽與意圖識(shí)別算法,通過(guò)上述算法計(jì)算稿件與歷史稿件的相似度。
4.如權(quán)利要求3所述的一種基于自然語(yǔ)言對(duì)稿件完整性的評(píng)估方法,其特征在于,在稿件完成格式化后,通過(guò)機(jī)器學(xué)習(xí)及自然語(yǔ)言處理訓(xùn)練出對(duì)應(yīng)的分析器模型,將信息傳輸至由機(jī)器學(xué)習(xí)訓(xùn)練出的模型中進(jìn)行推理,并得出分值的步驟中:
所述分析器模型通過(guò)根據(jù)內(nèi)容總字?jǐn)?shù)、分段閥值、要素總數(shù)、要素加權(quán)值和要素完整性計(jì)算分值,通過(guò)所述內(nèi)容總字?jǐn)?shù)除以分段閥值得到第一數(shù)值,所述要素總數(shù)除以所述第一數(shù)值得到第二數(shù)值,所述要素總數(shù)與所述要素加權(quán)值相乘得到第三數(shù)值,所述第二數(shù)值加上所述第三數(shù)值得到所述分值,所述分值表示要素完整性。
5.如權(quán)利要求4所述的一種基于自然語(yǔ)言對(duì)稿件完整性的評(píng)估方法,其特征在于,在稿件完成格式化后,通過(guò)機(jī)器學(xué)習(xí)及自然語(yǔ)言處理訓(xùn)練出對(duì)應(yīng)的分析器模型,將信息傳輸至由機(jī)器學(xué)習(xí)訓(xùn)練出的模型中進(jìn)行推理,并得出分值的步驟中:
所述分段閥值根據(jù)業(yè)務(wù)場(chǎng)景進(jìn)行設(shè)置,代表了內(nèi)容長(zhǎng)度對(duì)評(píng)分結(jié)果的影響。
6.如權(quán)利要求5所述的一種基于自然語(yǔ)言對(duì)稿件完整性的評(píng)估方法,其特征在于,在匯聚多個(gè)分析器的分值,匯聚完成后進(jìn)行合并計(jì)算的步驟中:
根據(jù)業(yè)務(wù)場(chǎng)景生成多個(gè)分析器,所述業(yè)務(wù)場(chǎng)景包括時(shí)間維度、地點(diǎn)維度、環(huán)境維度、人群維度和行業(yè)維度。
7.如權(quán)利要求6所述的一種基于自然語(yǔ)言對(duì)稿件完整性的評(píng)估方法,其特征在于,在匯聚多個(gè)分析器的分值,匯聚完成后進(jìn)行合并計(jì)算的步驟中:
通過(guò)上述的流程可以完成對(duì)新聞稿件內(nèi)容的要素識(shí)別并評(píng)分,評(píng)分?jǐn)?shù)值與稿件代表要素的完整性呈正相關(guān),根據(jù)評(píng)分?jǐn)?shù)值判斷稿件質(zhì)量。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于南京路特軟件有限公司,未經(jīng)南京路特軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111572608.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種光模塊
- 下一篇:一種文件系統(tǒng)性能測(cè)試方法
- 一種自然語(yǔ)言的搜索方法及系統(tǒng)
- 基于交互上下文處理自然語(yǔ)言方法
- 計(jì)算機(jī)化的自然語(yǔ)言查詢(xún)意圖分派
- 自然語(yǔ)言描述信息的生成方法及裝置
- 風(fēng)格可定制的文本生成
- 多輪預(yù)制對(duì)話(huà)
- 改變應(yīng)答以提供表現(xiàn)豐富的自然語(yǔ)言對(duì)話(huà)的方法、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言查詢(xún)的轉(zhuǎn)換
- 一種自然語(yǔ)言處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言理解模型訓(xùn)練方法、自然語(yǔ)言理解方法及裝置





