[發明專利]基于作者的文本分類和轉換有效
| 申請號: | 201610848473.6 | 申請日: | 2016-08-08 |
| 公開(公告)號: | CN106997370B | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 布萊恩·帕特里克·斯特羅普;馬修·斯蒂德曼·亨德森 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/151 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 周亞榮;安翔 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 作者 文本 分類 轉換 | ||
本發明涉及基于作者的文本分類和轉換。包括在計算機存儲介質上編碼的計算機程序的方法、系統和裝置,用于基于對來自特定作者的訓練文本的分析對文本進行轉換和分類。其中方法中的一種包括:接收輸入文本,所述輸入文本包括一個或多個詞以及請求的作者;基于編碼器語言模型,生成表示所述輸入文本的向量流,所述向量流包括一個或多個多維向量,每個多維向量與輸入文本的詞中的關聯詞相關聯,并且表示上下文的分布,其中關聯詞出現在多個訓練文本中;以及至少部分基于解碼器語言模型、所生成的向量流、以及請求的作者,產生表示所述輸入文本的特定轉換的輸出文本。
背景技術
本說明書描述了與基于對來自特定作者訓練文本的分析來轉換及分類文本有關的技術。
文本編寫應用(例如,文字處理器、電子郵件客戶端、web瀏覽器以及其它的應用)經由鍵盤或其它輸入設備來接收來自用戶的文本輸入。在某些情形中,這些應用可以允許用戶對文本進行格式化和布置。一些應用對輸入文本進行分析以識別出通常的錯誤。例如,拼寫錯誤、語法錯誤或者格式錯誤。
發明內容
本說明書描述了與用請求的語言風格來重寫文本有關的技術。通常,本說明書中所描述主題的一個創新方面可以體現在一種方法中,所述方法包括以下動作:接收輸入文本,所述輸入文本包括一個或多個詞和請求作者的名稱;基于編碼器語言模型,生成表示所述輸入文本的向量流,其中所述向量流包括一個或多個多維向量,每個所述多維向量與輸入文本中的詞中的一個或多個關聯詞相關聯,并且表示上下文分布,其中關聯詞出現在由所述編碼器語言模型所處理的多個訓練文本中;以及至少部分基于解碼器語言模型、所生成的向量流、以及請求作者,來產生表示所述輸入文本的特定轉換的輸出文本,其中所述解碼器語言模型存儲有由特定作者在多個訓練文本中所使用的詞的分布,所述多個訓練文本使得所述編碼器語言模型產生表示所述詞的特定向量。
本說明書中所描述主題的另一個創新方面可以被體現在一種方法中,所述方法包括以下操作:接收輸入文本,所述輸入文本包括一個或多個詞和請求作者的名稱;基于編碼器語言模型,生成表示所述輸入文本的向量流,其中所述向量流包括一個或多個多維向量,每個所述多維向量與輸入文本中的詞中的一個或多個關聯詞相關聯,并且表示上下文分布,其中所述關聯詞出現在由所述編碼器語言模型所處理的多個訓練文本中;以及基于解碼器語言模型、所生成的向量流、輸入文本和作者,來產生輸入文本的分類,其中所述解碼器語言模型存儲有由特定作者在多個訓練文本中所使用的詞的分布,所述多個訓練文本使得所述編碼器語言模型產生表示所述詞的特定向量。
為了實現下述的好處中的一個或多個,可以在特定實施例中實現本說明書中所描述的主題。通過允許用戶將輸入文本轉換成特定作者的風格,輸入文本可以被改變成使用針對與目標作者相關聯的特定寫作風格所通用的詞和短語,這樣使得文本更可能被期望那種寫作風格的讀者所理解。進一步地,輸入文本可以被轉換成讀者期望的針對文本的寫作風格,這樣,更可能使文本被讀者很好地接收。例如,基于之前由預定接收者所發送的電子郵件消息,可以將輸入文本轉換成包括所述輸入文本的電子郵件預定接收者所使用的風格。而且,通過將輸入文本轉換成所期望的作者的風格,輸入文本的作者可以改善輸入文本的質量,例如,在輸入文本作者不是以輸入文本的語言為母語的人的情況下。
在附圖和以下描述中闡述了本說明書主題的一個或多個實施例的細節。通過描述、附圖和權利要求,本主題的其它特征、方面和優勢將是顯而易見的。
附圖說明
圖1示出了用于使用利用來自不同作者的文本所訓練的語言模型對文本進行轉換和分類的示例系統。
圖2示出了用于訓練編碼器語言模型和解碼器語言模型的示例系統。
圖3示出了用于將輸入文本轉換成根據特定作者的風格重寫的輸出文本的示例系統。
圖4示出了用于產生輸入文本分類的示例系統。
圖5是用于將輸入文本轉換成根據特定作者風格重寫的輸出文本的示例過程的流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610848473.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多功能話筒(FP?1770)
- 下一篇:平板天線(三合一)





