[發(fā)明專利]一種單文本的摘要確定方法和相關(guān)裝置在審
| 申請?zhí)枺?/td> | 202011328977.8 | 申請日: | 2020-11-24 |
| 公開(公告)號: | CN112307198A | 公開(公告)日: | 2021-02-02 |
| 發(fā)明(設(shè)計)人: | 程瑞;張金超;肖飛 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F40/289;G06F40/30;G06N3/04 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王兆林 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 摘要 確定 方法 相關(guān) 裝置 | ||
本申請實施例公開了一種單文本的摘要確定方法和相關(guān)裝置,至少涉及人工智能中的自然語言處理和機(jī)器學(xué)習(xí),針對基于檢索串確定的目標(biāo)文本,以目標(biāo)文本中多個分詞分別對應(yīng)的分詞向量,以及檢索串中檢索詞對應(yīng)的檢索詞向量確定每個分詞的相關(guān)度參數(shù)。確定目標(biāo)文本的文本向量時,除了需要依據(jù)分詞的分詞向量,還會參考分詞的相關(guān)度參數(shù),由此生成的文本向量中會強(qiáng)化與用戶意圖相關(guān)分詞的信息,弱化與用戶意圖不相關(guān)分詞的信息,起到了基于用戶意圖選擇文本向量中信息的作用。由于該文本向量中攜帶更多與用戶意圖相關(guān)分詞的信息,通過該文本向量確定出的摘要內(nèi)容會更貼近檢索串示出的用戶意圖,從而根據(jù)用戶意圖動態(tài)生成摘要內(nèi)容,提高用戶的閱讀體驗。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理領(lǐng)域,特別是涉及一種單文本的摘要確定方法和相關(guān)裝置。
背景技術(shù)
摘要可以體現(xiàn)原始文檔中的重要信息,而且篇幅一般遠(yuǎn)小于原始文檔,用戶可以通過閱讀摘要來了解原始文檔主旨思想的目的,從而可以從大量原始文檔中快速找到符合自身需求的文檔,避免了大篇幅內(nèi)容閱讀的篩查時間。
相關(guān)技術(shù)中,可以通過自動摘要技術(shù),根據(jù)神經(jīng)網(wǎng)絡(luò)模型基于語義理解原始文檔的內(nèi)容,并以此自動從原始文檔中提取重要信息來生成對應(yīng)的摘要。
然而,隨著用戶的閱讀需求日漸豐富,上述摘要提取方式生成的摘要越來越難以滿足用戶需求。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本申請?zhí)峁┝艘环N單文本的摘要確定方法和相關(guān)裝置,在對原始文檔生成摘要時,可以滿足用戶的需求。
本申請實施例公開了如下技術(shù)方案:
一方面,本申請?zhí)峁┮环N單文本的摘要確定方法,所述方法包括:
獲取基于檢索串確定的目標(biāo)文本,所述檢索串包括至少一個檢索詞,所述目標(biāo)文本包括多個分詞;
確定所述檢索詞對應(yīng)的檢索詞向量,以及所述分詞對應(yīng)的分詞向量;
根據(jù)所述檢索詞向量和所述分詞向量,確定所述分詞相對于所述檢索串的相關(guān)度參數(shù);
通過所述多個分詞分別對應(yīng)的相關(guān)度參數(shù)以及分詞向量,得到所述目標(biāo)文本的文本向量;
基于所述文本向量生成所述目標(biāo)文本對應(yīng)的摘要內(nèi)容。
另一方面,本申請?zhí)峁┮环N單文本的摘要確定裝置,所述裝置包括:第一獲取單元、第一確定單元、第二確定單元、第二獲取單元和生成單元;
所述第一獲取單元,用于獲取基于檢索串確定的目標(biāo)文本,所述檢索串包括至少一個檢索詞,所述目標(biāo)文本包括多個分詞;
所述第一確定單元,用于確定所述檢索詞對應(yīng)的檢索詞向量,以及所述分詞對應(yīng)的分詞向量;
所述第二確定單元,用于根據(jù)所述檢索詞向量和所述分詞向量,確定所述分詞相對于所述檢索串的相關(guān)度參數(shù);
所述第二獲取單元,用于通過所述多個分詞分別對應(yīng)的相關(guān)度參數(shù)以及分詞向量,得到所述目標(biāo)文本的文本向量;
所述生成單元,用于基于所述文本向量生成所述目標(biāo)文本對應(yīng)的摘要內(nèi)容。
另一方面,本申請?zhí)峁┮环N計算機(jī)設(shè)備,所述設(shè)備包括處理器以及存儲器:
所述存儲器用于存儲程序代碼,并將所述程序代碼傳輸給所述處理器;
所述處理器用于根據(jù)所述程序代碼中的指令執(zhí)行上述方面所述的方法。
另一方面,本申請實施例提供了一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)用于存儲計算機(jī)程序,所述計算機(jī)程序用于執(zhí)行上述方面所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011328977.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





