[發明專利]生成被調整到目標受眾詞匯的文本內容的目標概要在審
| 申請號: | 201811050696.3 | 申請日: | 2018-09-10 |
| 公開(公告)號: | CN109815459A | 公開(公告)日: | 2019-05-28 |
| 發明(設計)人: | S·沙瑪;K·克里什那;B·V·西里尼瓦桑;A·姆赫卡爾 | 申請(專利權)人: | 奧多比公司 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G06N99/00 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 酆迅;姚杰 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞語 目標受眾 生成模型 文本內容 詞匯 語言偏好 同義詞 反饋提供 機器學習 數字媒體 訓練數據 語料庫 偏好 文本 反饋 學習 | ||
在數字媒體環境中生成被調整到目標受眾詞匯的文本內容的目標概要。詞語生成模型獲得文本內容,并生成文本內容的目標概要。在目標概要的生成期間,使用語言偏好模型將由詞語生成模型生成的目標概要的詞語調整到目標受眾詞匯。使用對與目標受眾詞匯的文本的語料庫相對應的目標受眾訓練數據的機器學習來訓練語言偏好模型,以學習相似詞語(例如,同義詞)之間的目標受眾詞匯的詞語偏好。在使用詞語生成模型和語言偏好模型來生成每個詞語之后,將關于所生成的詞語的反饋提供回詞語生成模型。詞語生成模型利用反饋來生成概要的后續詞語。
背景技術
文本內容的自動概要可以通過提供可由用戶快速閱讀的文本內容(例如,文檔或文章)的概述來用于為最終用戶節省時間。傳統的提取概要技術從輸入文本內容中提取出關鍵短語,然后選擇這些短語的子集以放置在概要中。然而,由這些傳統的概要技術生成的概要通常不像人類那樣。此外,一些傳統的概要技術生成概要,然后可以在概要的生成之后將概要“調整”到目標受眾作為后處理步驟。然而,在概要被生成后將概要調整到目標受眾通常會導致改變原始文本的含義。例如,考慮句子“整個旅程比團隊更大”?;谀繕耸鼙姷恼Z言偏好,詞語“總共”可能優于詞語“整個”,并且詞語“旅行”可能優于詞語“旅程”。雖然這兩個詞語都是原始詞語的精細替換,但是通過替換這些詞語形成的結果句子,例如“總共旅行比團隊更大”,并不具有與原始句子相同的含義。此外,現有的概要技術無法生成被調整到不同的目標受眾詞匯的多個概要。
發明內容
為了克服這些問題,在數字媒體環境中生成被調整到目標受眾詞匯的文本內容的目標概要。詞語生成模型獲得文本內容,并生成文本內容的目標概要。在目標概要的生成期間,使用語言偏好模型將由詞語生成模型生成的目標概要的詞語調整到目標受眾詞匯。使用對與目標受眾詞匯的文本的語料庫相對應的目標受眾訓練數據的機器學習來訓練語言偏好模型,以學習相似詞語(例如,同義詞)之間的目標受眾詞匯的詞語偏好。在使用詞語生成模型和語言偏好模型生成每個詞語之后,將關于所生成的詞語的反饋提供回詞語生成模型。詞語生成模型利用反饋來生成概要的后續詞語,使得文本文檔的上下文和概要的已生成的詞語被保持。
本發明內容以簡化的形式介紹了一些概念,這些概念將在下面的具體實施方式中進一步描述。因此,本發明內容不旨在標識所要求保護的主題的必要特征,也不旨在用作輔助確定所要求保護的主題的范圍。
附圖說明
參考附圖描述了詳細描述。
圖1是示例實現中的數字媒體環境的圖示,該數字媒體環境可操作用于采用生成被調整到本文描述的目標受眾詞匯技術的目標概要。
圖2描繪了其中使用對目標受眾訓練數據上的機器學習來訓練語言偏好模型的示例實現中的系統。
圖3描繪了其中圖1的詞語生成模型生成被調整到目標受眾詞匯的文本內容的目標概要的示例實現中的系統。
圖4圖示了根據一個或多個實現的當被配置為神經編碼器時圖1和圖3的詞語生成模型的示例。
圖5圖示了使用不同的概要技術生成的輸入文章的各種概要的示例。
圖6圖示了各種概要技術的基于度量的評估的結果。
圖7描繪了使用機器意向和目標受眾訓練數據來訓練語言偏好模型的示例過程。
圖8描繪了生成被調整到目標受眾詞匯的文本內容的目標概要的示例過程。
圖9描繪了生成被調整到目標受眾詞匯的文本內容的目標概要的附加示例過程。
圖10圖示了包括表示可以實現本文描述的各種技術的一個或多個計算系統和/或設備的示例計算設備的示例系統。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于奧多比公司,未經奧多比公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811050696.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:設置圖片待修的方法與裝置
- 下一篇:基于管理規定的人事檔案調整方法及系統





