[發明專利]文章縮略文意生成方法、裝置及服務器有效
| 申請號: | 201710109424.5 | 申請日: | 2017-02-27 |
| 公開(公告)號: | CN106897267B | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 趙明斌 | 申請(專利權)人: | 廣州阿里巴巴文學信息技術有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/258;G06F40/289 |
| 代理公司: | 北京合智同創知識產權代理有限公司 11545 | 代理人: | 李杰 |
| 地址: | 510000 廣東省廣州市天河區黃埔大*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文章 縮略 生成 方法 裝置 服務器 | ||
1.一種文章縮略文意生成方法,其特征在于,所述方法包括:
獲取關鍵詞以及與每個所述關鍵詞對應的權重值;
根據所述關鍵詞以及所述關鍵詞對應的權重值計算得到所述文章的正文中每個語句的權重值;
依據每個所述語句的權重值按照預設條件篩選出重要語句;
根據文章的標題及所述重要語句生成所述文章的縮略文意,
其中,所述根據文章的標題及所述重要語句生成所述文章的縮略文意的步驟包括:
按照所述重要語句在所述文章中出現的先后順序,對所述重要語句進行整合以形成文章的縮略文意的正文;
將所述文章的標題放置于所述縮略文意的正文之前,形成文章的縮略文意。
2.如權利要求1所述的文章縮略文意生成方法,其特征在于,所述獲取關鍵詞以及與每個所述關鍵詞對應的權重值的步驟包括:
對所述文章進行分詞處理得到所述關鍵詞;
根據預設規則得到每個所述關鍵詞對應的權重值。
3.如權利要求2所述的文章縮略文意生成方法,其特征在于,所述對所述文章進行分詞得到所述關鍵詞的步驟包括:
對所述文章的正文及標題進行分詞處理得到各個分詞;
對各個所述分詞進行處理得到關鍵詞。
4.如權利要求3所述的文章縮略文意生成方法,其特征在于,所述對各個所述分詞進行處理得到關鍵詞的步驟包括:
剔除分詞處理得到的各個分詞中的非表意詞,將剔除后的剩余的分詞作為關鍵詞。
5.如權利要求2所述的文章縮略文意生成方法,其特征在于,所述根據預設規則得到每個所述關鍵詞對應的權重值的步驟包括:
按照預設排序規則對所述關鍵詞進行排序,對排序后的所述關鍵詞按權重值由大到小依次賦值,得到每個所述關鍵詞對應的權重值。
6.如權利要求5所述的文章縮略文意生成方法,其特征在于,所述按照預設排序規則對所述關鍵詞進行排序的步驟包括:
判斷所述關鍵詞是否為響應用戶操作生成的,若所述關鍵詞為響應用戶操作生成的,將響應用戶操作生成的關鍵詞排在其它所有所述關鍵詞之前;
判斷所述關鍵詞是否為對所述文章的標題進行分詞處理得到的關鍵詞,如果是對所述標題進行分詞處理得到的所述關鍵詞,將對所述標題進行分詞處理得到的所述關鍵詞排在響應用戶操作生成的關鍵詞之后;
判斷所述關鍵詞是否為對所述文章的正文進行分詞處理得到的所述關鍵詞,如果是對所述正文進行分詞處理得到的所述關鍵詞,統計所述關鍵詞在正文中出現的次數,并根據出現次數以降序的方式排在對所述文章的標題進行分詞處理得到的關鍵詞之后。
7.如權利要求1-6任一項所述的文章縮略文意生成方法,其特征在于,所述根據所述關鍵詞以及所述關鍵詞對應的權重值計算得到所述文章的正文中每個語句的權重值的步驟包括:
獲取所述文章的正文中每個語句包含的所述關鍵詞;
根據每個語句包含的所述關鍵詞所對應的權重值計算得到每個所述語句的權重值。
8.如權利要求1-6任一項所述的文章縮略文意生成方法,其特征在于,所述依據每個所述語句的權重值按照預設條件篩選出重要語句的步驟包括:
根據所述每個所述語句的權重值以降序的方式對所述每個語句進行排序;
將排序在預設名次之前的語句作為重要語句。
9.如權利要求2或5任意一項所述的文章縮略文意生成方法,其特征在于,所述方法還包括:
根據文章的不同屬性對應設置不同的所述預設條件及所述預設規則,所述文章的屬性包括文章的類型或文章的字數。
10.如權利要求9所述的文章縮略文意生成方法,其特征在于,在所述獲取關鍵詞以及與每個所述關鍵詞對應的權重值的步驟之前,所述方法還包括:
檢測所述文章的文章屬性,并匹配出與所述文章屬性對應的所述預設條件及所述預設規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州阿里巴巴文學信息技術有限公司,未經廣州阿里巴巴文學信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710109424.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于智能機器人的文本處理方法及系統
- 下一篇:文本語義理解方法、裝置和系統





