[發明專利]智能文章生成方法和裝置在審
| 申請號: | 201710047603.0 | 申請日: | 2017-01-22 |
| 公開(公告)號: | CN106844322A | 公開(公告)日: | 2017-06-13 |
| 發明(設計)人: | 袁潔 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G06F17/30 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙)11201 | 代理人: | 張潤 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 文章 生成 方法 裝置 | ||
1.一種智能文章生成方法,其特征在于,包括:
提取熱點事件中的實體,并確定所述實體的實體類別;
獲取所述實體類別對應的結構化數據,以及獲取所述實體對應的多個維度特征;
基于所述結構化數據和所述多個維度特征生成文章。
2.根據權利要求1所述的方法,其特征在于,所述獲取所述實體對應的多個維度特征,包括:
基于知識圖譜數據和用戶行為數據,獲取所述實體對應的多個維度特征。
3.根據權利要求1所述的方法,其特征在于,還包括:
收集知識圖譜數據和新聞語料數據;
基于所述知識圖譜數據和新聞語料數據進行模板抽取,得到多個模板,并基于多個模板建立模板庫,所述模板表明實體類別與結構化數據之間的對應關系。
4.根據權利要求3所述的方法,其特征在于,所述獲取所述實體類別對應的結構化數據,包括:
從所述模板庫中查詢得到與所述實體類別對應的結構化數據。
5.根據權利要求1所述的方法,其特征在于,還包括:
基于預先建立的潤色庫,對生成的文章進行潤色。
6.根據權利要求5所述的方法,其特征在于,還包括:
對潤色后的文章進行質量管理。
7.一種智能文章生成裝置,其特征在于,還包括:
提取模塊,用于提取熱點事件中的實體,并確定所述實體的實體類別;
獲取模塊,用于獲取所述實體類別對應的結構化數據,以及獲取所述實體對應的多個維度特征;
生成模塊,用于基于所述結構化數據和所述多個維度特征生成文章。
8.根據權利要求7所述的裝置,其特征在于,所述獲取模塊用于獲取所述實體對應的多個維度特征,包括:
基于知識圖譜數據和用戶行為數據,獲取所述實體對應的多個維度特征。
9.根據權利要求7所述的裝置,其特征在于,還包括:
收集模塊,用于收集知識圖譜數據和新聞語料數據;
模板庫建立模塊,用于基于所述知識圖譜數據和新聞語料數據進行模板抽取,得到多個模板,并基于多個模板建立模板庫,所述模板表明實體類別與結構化數據之間的對應關系。
10.根據權利要求9所述的裝置,其特征在于,所述獲取模塊獲取所述實體類別對應的結構化數據,包括:
從所述模板庫中查詢得到與所述實體類別對應的結構化數據。
11.根據權利要求7所述的裝置,其特征在于,還包括:
潤色模塊,用于基于預先建立的潤色庫,對生成的文章進行潤色。
12.根據權利要求7所述的裝置,其特征在于,還包括:
質量管理模塊,用于對潤色后的文章進行質量管理。
13.一種設備,其特征在于,包括:
一個或多個處理器;
用于存儲一個或多個程序的存儲器;
當所述一個或多個程序被所述一個或多個處理器執行時,使得所述一個或多個處理器執行如權利要求1-6任一項所述的方法。
14.一種非易失性計算機可讀存儲介質,其特征在于,當所述存儲介質中的一個或多個程序由設備的一個或多個處理器執行時,使得所述一個或多個處理器執行如權利要求1-6任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710047603.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種光伏組件用銘牌及條碼打印粘貼一體裝置
- 下一篇:一種自動包裹商標設備





