[發明專利]文本復述方法、裝置、服務器及存儲介質有效
| 申請號: | 201810550596.0 | 申請日: | 2018-05-31 |
| 公開(公告)號: | CN110555203B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 蔣帥 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/247 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 復述 方法 裝置 服務器 存儲 介質 | ||
本發明實施例公開了一種文本復述方法、裝置、服務器及存儲介質。該方法包括:針對原始文本中每一原始語句,依據該原始語句中包含的各原始詞語的同義詞語以及預先確定的不同詞語連續出現的概率,對該原始語句中各原始詞語的同義詞語進行篩選;順序連接該原始語句中各原始詞語的同義詞語得到該原始語句的復述語句。本發明實施例提供的技術方案,減少了對人工的依賴性,提高了文本復述的效率。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種文本復述方法、裝置、服務器及存儲介質。
背景技術
信息時代,數據變得越來越重要。因此在內容生態建設的背景下,構建自己特有的內容資源十分重要,而文本復述是構建內容資源的重要途徑。
目前主要通過人工編輯的方式對文章進行復述,但是人工復述存在如下缺陷:造成大量人力財力的消耗;偏主觀性,不同的主觀偏見往往會影響文本復述的最終效果;局限性,由于人力有限,往往不能對所有的文本進行復述;復雜低效,成本高且效能低。因此,提供一種不依賴于人的新的文本復述方法是十分必要的。
發明內容
本發明實施例提供一種文本復述方法、裝置、服務器及存儲介質,減少了對人工的依賴性,提高了文本復述的效率。
第一方面,本發明實施例提供了一種文本復述方法,該方法包括:
針對原始文本中每一原始語句,依據該原始語句中包含的各原始詞語的同義詞語以及預先確定的不同詞語連續出現的概率,對該原始語句中各原始詞語的同義詞語進行篩選;
順序連接該原始語句中各原始詞語的同義詞語得到該原始語句的復述語句。
第二方面,本發明實施例還提供了一種文本復述裝置,該裝置包括:
同義詞篩選模塊,用于針對原始文本中每一原始語句,依據該原始語句中包含的各原始詞語的同義詞語以及預先確定的不同詞語連續出現的概率,對該原始語句中各原始詞語的同義詞語進行篩選;
復述語句確定模塊,用于順序連接該原始語句中各原始詞語的同義詞語得到該原始語句的復述語句。
第三方面,本發明實施例還提供了一種服務器,該服務器包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現第一方面中任意所述的文本復述方法。
第四方面,本發明實施例還提供了一種存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現第一方面中任意所述的文本復述方法。
本發明實施例提供的文本復述方法、裝置、服務器及存儲介質,對要進行文本復述的原始文本中每一原始語句,依據該原始語句中包含的各原始詞語的同義詞語以及預先確定的不同詞語連續出現的概率,對該原始語句中各原始詞語的同義詞語進行篩選,并將篩選后的各原始詞語的同義詞語順序連接得到該原始語句的復述語句,進而得到原始文本的復述文本。該方法減少了對人工的依賴性,在規避版權風險的同時,提高了文本復述的效率。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發明的其它特征、目的和優點將會變得更明顯:
圖1是本發明實施例一中提供的一種文本復述方法的流程圖;
圖2A是本發明實施例二中提供的一種文本復述方法的流程圖;
圖2B是本發明實施例二中提供的一種文本復述的架構示意圖;
圖3是本發明實施例三中提供的一種文本復述方法的流程圖;
圖4是本發明實施例四中提供的一種文本復述裝置的結構框圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810550596.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文摘播報的生成方法和設備
- 下一篇:情緒判斷的方法和裝置





