[發明專利]基于人工智能的生成文章的方法和裝置有效
| 申請號: | 201710352222.3 | 申請日: | 2017-05-18 |
| 公開(公告)號: | CN107193792B | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 劉凱;劉昊;呂雅娟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F40/30;G06F16/25 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 生成 文章 方法 裝置 | ||
1.一種基于人工智能的生成文章的方法,其特征在于,所述方法包括:
獲取用于生成文章的預定結構數據;
將所述預定結構數據通過句子生成模型生成候選句子;
按照包含預設信息點的句子出現的概率選擇候選句子拼接形成篇章,包括:按照句子在段首出現的概率選擇候選句子作為段首句;按照句子與前一句子銜接的概率依次選擇候選句子拼接形成篇章;或者按照句子在段尾出現的概率選擇候選句子作為段尾句;按照句子銜接后一句子的概率依次選擇候選句子向前排列形成篇章;其中,每選擇一個候選句子,根據預設剔除規則剔除與已選擇的候選句子相關的候選句子;
響應于沒有可用的候選句子,基于拼接所形成的篇章生成文章。
2.根據權利要求1所述的方法,其特征在于,所述獲取用于生成文章的預定結構數據包括:
從預定網站按主題抓取數據,其中,所抓取的數據包括預定結構數據和非預定結構數據;
將非預定結構數據按照預定結構數據的數據結構進行結構化,轉化成預定結構數據。
3.根據權利要求1所述的方法,其特征在于,所述按照包含預設信息點的句子出現的概率選擇候選句子拼接形成篇章包括:
對每個預設信息點,選擇句子生成概率最高的句子作為該預設信息點對應的待用句子;
根據預設的篇章組合模型確定待用句子排列概率最高的排列順序,以拼接形成篇章。
4.根據權利要求1所述的方法,其特征在于,所述響應于沒有可用的候選句子,基于拼接所形成的篇章生成文章包括:
獲取與待生成文章的主題相關聯的多媒體材料,其中,所述多媒體材料包括以下至少一項:圖片、動畫、音頻、視頻;
響應于沒有可用的候選句子,根據所形成的篇章從所述多媒體材料中選取多媒體材料與所形成的篇章一起生成文章。
5.一種基于人工智能的生成文章的裝置,其特征在于,所述裝置包括:
數據獲取模塊,配置用于獲取用于生成文章的預定結構數據;
句子生成模塊,配置用于將所述預定結構數據通過句子生成模型生成候選句子;
句子拼接模塊,配置用于按照包含預設信息點的句子出現的概率選擇候選句子拼接形成篇章,包括:按照句子在段首出現的概率選擇候選句子作為段首句;按照句子與前一句子銜接的概率依次選擇候選句子拼接形成篇章;或者按照句子在段尾出現的概率選擇候選句子作為段尾句;按照句子銜接后一句子的概率依次選擇候選句子向前排列形成篇章;其中,每選擇一個候選句子,根據預設剔除規則剔除與已選擇的候選句子相關的候選句子;
文章生成模塊,配置用于響應于沒有可用的候選句子,基于拼接所形成的篇章生成文章。
6.根據權利要求5所述的裝置,其特征在于,所述數據獲取模塊進一步配置用于:
從預定網站按主題抓取數據,其中,所抓取的數據包括預定結構數據和非預定結構數據;
將非預定結構數據按照預定結構數據的數據結構進行結構化,轉化成預定結構數據。
7.根據權利要求5所述的裝置,其特征在于,所述句子拼接模塊還配置用于:
對每個預設信息點,選擇句子生成概率最高的句子作為該預設信息點對應的待用句子;
根據預設的篇章組合模型確定待用句子排列概率最高的排列順序,以拼接形成篇章。
8.根據權利要求5所述的裝置,其特征在于,所述文章生成模塊包括:
多媒體材料獲取單元,配置用于獲取與待生成文章的主題相關聯的多媒體材料,其中,所述多媒體材料包括以下至少一項:圖片、動畫、音頻、視頻;
文章生成單元,配置用于響應于沒有可用的候選句子,根據所形成的篇章從所述多媒體材料中選取多媒體材料與所形成的篇章一起生成文章。
9.一種計算設備,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-4中任一所述的方法。
10.一種非易失性計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-4中任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710352222.3/1.html,轉載請聲明來源鉆瓜專利網。





