[發(fā)明專利]文本摘要評測方法、裝置、系統(tǒng)及評測服務(wù)器在審
| 申請?zhí)枺?/td> | 201910718019.2 | 申請日: | 2019-08-05 |
| 公開(公告)號: | CN110427483A | 公開(公告)日: | 2019-11-08 |
| 發(fā)明(設(shè)計)人: | 鄭小輝 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F16/36;G06N3/08 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 評測 文本 句子向量 中心向量 文檔 服務(wù)器 申請 自然語言處理技術(shù) 人工智能技術(shù) 模型生成 評測結(jié)果 人工比對 人工成本 相似距離 摘要生成 自動評測 主觀性 句子 耗時 參考 學(xué)習(xí) | ||
1.一種文本摘要評測方法,其特征在于,所述方法包括:
獲取待評測文檔及所述待評測文檔的待評測文本摘要;
獲取所述待評測文檔的中心向量及句子向量集;
從所述句子向量集中,獲取所述待評測文本摘要對應(yīng)的摘要句子向量;
依據(jù)所述摘要句子向量與所述中心向量之間的相似距離,得到所述待評測文本摘要的評測結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從所述句子向量集中,獲取所述待評測文本摘要對應(yīng)的摘要句子向量,包括:
對所述待評測文本摘要進(jìn)行預(yù)處理,得到組成所述待評測文本摘要的多個摘要句子;
從所述句子向量集中,選擇與所述多個摘要句子各自對應(yīng)的句子向量,并將選擇的句子向量確定為相應(yīng)摘要句子的摘要句子向量。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述依據(jù)所述摘要句子向量與所述中心向量之間的相似距離,得到所述待評測文本摘要的評測結(jié)果,包括:
獲取所述摘要句子向量與所述中心向量之間的相似距離;
依據(jù)獲取的多個相似距離統(tǒng)計結(jié)果,得到所述待評測文本摘要與所述待評測文本的相似距離;
從摘要質(zhì)量等級表中,確定出與所述待評測文本摘要的相似距離匹配的摘要質(zhì)量等級;
利用所述摘要質(zhì)量等級,生成所述待評測文本摘要的評測結(jié)果。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述依據(jù)所述摘要句子向量與所述中心向量之間的相似距離,得到所述待評測文本摘要的評測結(jié)果,包括:
獲取確定出的多個摘要句子向量各自與所述中心向量之間的相似距離,得到與所述相似距離對應(yīng)的相似分?jǐn)?shù);
對得到的多個相似分?jǐn)?shù)進(jìn)行平均值運算,得到相似平均分;
利用所述相似平均分,得到相應(yīng)待評測文本摘要的評測結(jié)果。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述待評測文本摘要的數(shù)量為多個,且多個待評測文本摘要由不同類型的摘要生成模型得到的情況下,所述方法還包括:
將多個待評測文本摘要對應(yīng)的相似平均分進(jìn)行比較,得到比較結(jié)果,所述比較結(jié)果包括最大相似平均分、最小相似平均分及平均差異分;
所述利用所述相似平均分,得到相應(yīng)待評測文本摘要的評測結(jié)果,包括:
利用所述比較結(jié)果及所述多個待評測文本摘要各自的相似平均分,生成所述待評測文檔的多個待評測文本摘要的評測結(jié)果;
將所述評測結(jié)果發(fā)送至業(yè)務(wù)服務(wù)器,以使得所述業(yè)務(wù)服務(wù)器依據(jù)所述評測結(jié)果,實現(xiàn)對相應(yīng)摘要生成模型的優(yōu)化。
6.根據(jù)權(quán)利要求1~5任一項所述的方法,其特征在于,所述獲取待評測文檔及所述待評測文檔的待評測文本摘要,包括:
響應(yīng)文檔評測請求,確定出待評測文檔;
將所述待評測文檔發(fā)送至業(yè)務(wù)服務(wù)器,由所述業(yè)務(wù)服務(wù)器獲取所述待評測文檔的至少一個待評測文本摘要;
獲取所述業(yè)務(wù)服務(wù)器反饋的針對所述待評測文檔的至少一個待評測文本摘要。
7.根據(jù)權(quán)利要求1~5任一項所述的方法,其特征在于,所述獲取所述待評測文檔的中心向量及句子向量集,包括:
對所述待評測文檔進(jìn)行預(yù)處理器,得到多個文檔句子編碼向量;
將所述多個文檔句子編碼向量依次輸入文本深度表示模型,得到文檔空間向量及相應(yīng)的多個句子向量,所述文本深度表示模型是樣本文檔對Doc2vec網(wǎng)絡(luò)訓(xùn)練得到的;
將所述文檔空間向量確定為所述待評測文檔的中心向量,并由得到的多個句子向量構(gòu)成所述待評測文檔的句子向量集。
8.一種文本摘要評測裝置,其特征在于,所述裝置包括:
待評測數(shù)據(jù)獲取模塊,用于獲取待評測文檔及所述待評測文檔的待評測文本摘要;
文檔向量獲取模塊,用于獲取所述待評測文檔的中心向量及句子向量集;
摘要句子向量獲取模塊,用于從所述句子向量集中,獲取所述待評測文本摘要對應(yīng)的摘要句子向量;
評測模塊,用于依據(jù)所述摘要句子向量與所述中心向量之間的相似距離,得到所述待評測文本摘要的評測結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910718019.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





