[發明專利]基于人工智能的生成文章的方法和裝置有效
| 申請號: | 201710352222.3 | 申請日: | 2017-05-18 |
| 公開(公告)號: | CN107193792B | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 劉凱;劉昊;呂雅娟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F40/30;G06F16/25 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 生成 文章 方法 裝置 | ||
本申請公開了基于人工智能的生成文章的方法和裝置。該方法的一具體實施方式包括:獲取用于生成文章的預定結構數據;將上述預定結構數據通過句子生成模型生成候選句子;按照包含預設信息點的句子出現的概率選擇候選句子拼接形成篇章,其中,每選擇一個候選句子,根據預設剔除規則剔除與已選擇的候選句子相關的候選句子;響應于沒有可用的候選句子,基于拼接所形成的篇章生成文章。該實施方式可以提高生成文章的有效性。
技術領域
本申請涉及計算機技術領域,具體涉及互聯網技術領域,尤其涉及基于人工智能的生成文章的方法和裝置。
背景技術
人工智能(Artificial Intelligence,英文縮寫為AI),是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。
在自然語言處理的應用中,涉及將計算機數據生成自然語言表達的文章。現有的生成文章的方法,往往采用文章結構模板的方式對各類句子以一定的結構進行拼接,需要手工編寫大量相應篇章結構拼接邏輯模板;每當有新的類型句子加入當前文章生成過程,可能需要對大量的對應的篇章結構拼接邏輯模板進行修改和調整;對于非預定結構數據,不在文章生成過程起作用。因此,可以將人工智能應用于句子選擇,還可以充分利用各種數據,提高生成文章的有效性。
發明內容
本申請的目的在于提出一種改進的基于人工智能的生成文章的方法和裝置,來解決以上背景技術部分提到的技術問題。
第一方面,本申請提供了一種基于人工智能的生成文章的方法,該方法包括:獲取用于生成文章的預定結構數據;將上述預定結構數據通過句子生成模型生成候選句子;按照包含預設信息點的句子出現的概率選擇候選句子拼接形成篇章,其中,每選擇一個候選句子,根據預設剔除規則剔除與已選擇的候選句子相關的候選句子;響應于沒有可用的候選句子,基于拼接所形成的篇章生成文章。
在一些實施例中,獲取用于生成文章的預定結構數據包括:從預定網站按主題抓取數據,其中,所抓取的數據包括預定結構數據和非預定結構數據;將非預定結構數據按照預定結構數據的數據結構進行結構化,轉化成預定結構數據。
在一些實施例中,按照包含預設信息點的句子出現的概率選擇候選句子拼接形成篇章包括:按照句子在段首出現的概率選擇候選句子作為段首句;按照句子與前一句子銜接的概率依次選擇候選句子拼接形成篇章;或者,按照句子在段尾出現的概率選擇候選句子作為段尾句;按照句子銜接后一句子的概率依次選擇候選句子向前排列形成篇章。
在一些實施例中,按照包含預設信息點的句子出現的概率選擇候選句子拼接形成篇章包括:對每個預設信息點,選擇句子生成概率最高的句子作為該預設信息點對應的待用句子;根據預設的篇章組合模型確定待用句子排列概率最高的排列順序,以拼接形成篇章。
在一些實施例中,響應于沒有可用的候選句子,基于拼接所形成的篇章生成文章包括:獲取與待生成文章的主題相關聯的多媒體材料,其中,上述多媒體材料包括以下至少一項:圖片、動畫、音頻、視頻;響應于沒有可用的候選句子,根據所形成的篇章從所述多媒體材料中選取多媒體材料與所形成的篇章一起生成文章。
第二方面,本申請還提供了一種基于人工智能的生成文章的裝置,該裝置包括:數據獲取模塊,配置用于獲取用于生成文章的預定結構數據;句子生成模塊,配置用于將上述預定結構數據通過句子生成模型生成候選句子;句子拼接模塊,配置用于按照包含預設信息點的句子出現的概率選擇候選句子拼接形成篇章,其中,每選擇一個候選句子,根據預設剔除規則剔除與已選擇的候選句子相關的候選句子;文章生成模塊,配置用于響應于沒有可用的候選句子,基于拼接所形成的篇章生成文章。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710352222.3/2.html,轉載請聲明來源鉆瓜專利網。





