[發明專利]一種基于模板的自動生成作文的系統及實現方法在審
| 申請號: | 201710322347.1 | 申請日: | 2017-05-09 |
| 公開(公告)號: | CN107291680A | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 毛姍婷 | 申請(專利權)人: | 毛姍婷 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G06F17/28;G06F17/30 |
| 代理公司: | 北京卓唐知識產權代理有限公司11541 | 代理人: | 唐海力,韓來兵 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模板 自動 生成 作文 系統 實現 方法 | ||
技術領域
本發明涉及自然語言處理領域,特別涉及一種基于模板的自動生成作文的系統及實現方法。
背景技術
早在2009年,英國考試機構愛德思就宣布使用電腦批閱英語寫作試卷。英國《泰晤士報教育增刊》當時的報道說,經過特殊編程的電腦將“掃描”試卷,評估學生的語法與詞匯,辨定可能正確的答案,并給出總分。
在2014年,英國《衛報》進行了一項紙媒測試計劃。“機器人”被安排將社交網絡上的分享熱點和關注熱度進行統計分析,隨即進行內容篩選、編輯排版和印刷,最后生成一份報紙。
在2015年,日本公立函館未來大學研發團隊利用人工智能創作的這篇作文,是由人類事先設定好登場人物、內容大綱等“零部件”后,人工智能再根據這些“零部件”自動生成的。
近日,以色列創業公司Articoolo開發了一種算法,可根據用戶選擇的任何主題去生成作文,只要這樣的主題能用2到5個單詞去描述。用戶需要準確總結自己的主題,告訴計算機用戶希望作文有多少單詞,并選擇偏好,隨后點擊生成按鈕,即可等待人工智能完成作文的創作。
可見,目前自動生成作文的方法有的基于人工智能領域中機器自主學習的過程,有的基于分類算法和機器自主學習的方式。現有技術中也有一些解決方案,比如,中國專利申請CN201611003822.0,基于描述文本自動生成作文的方法及系統,方法包括:接收待生成作文的描述文本;確定所述描述文本的主題,并將該主題作為待生成作文的主題;根據與所述主題對應的文本語料構建主題詞圖;根據構建的主題詞圖生成對應所述主題的作文。本發明可以提高生成作文的效率及準確性。缺點在于:為了保證生成結果的一致性,文本預料和主題的對應關系方式單一。又比如,中國專利申請CN201610803388.8,一種應用文自動生成方法,步驟1)建立語料庫;步驟2)選擇多個適用實體并輸入其對應的具體內容;步驟3)建立模板庫并從中選擇一個模板;步驟4)對所選擇的模板進行潤色。雖然建立足夠大的預料庫,但是缺點在于:無法保證作文能夠符合多領域的不同要求。
發明內容
本發明要解決的技術問題是,提供能夠針對特殊模塊和關鍵詞進行準確定位的一種基于模板的自動生成作文的系統。
解決上述技術問題,本發明提供了一種基于模板的自動生成作文的系統,包括:模板單元、規則單元、選取單元、話題單元,
所述模板單元,用以提供作文模板接口,
所述規則單元,用以提供生成規則接口,
所述選取單元,用以選定擬生成作文中的中心話題和關鍵詞,
所述話題單元,用以根據中心話題話題提供可調用話題參數,
基于上述作文模板和生成規則,并根據所述中心話題和關鍵詞,生成作文。
更進一步,系統還包括:一客戶端,所述客戶端包括:輸入條件頁面和作文生成結果頁面,
用戶通過在所述輸入條件頁面輸入擬生成作文的{參數,條件};
所述作文生成結果頁面接收上述{參數,條件},并向后臺服務器發出作文內容請求,
所述服務器向所述作文生成結果頁面返回作文模板內容,并通過所述作文生成結果頁面轉化后向用戶顯示作文內容。
更進一步,所述模板單元包括:第一模板、第二模板、第三模板以及第四模板,
所述第一模板,用以建立一網絡爬蟲程序獲取網頁中模板內容相關的內容,
所述第二模板,用以建立中文作文模板,
所述第三模板,用以建立英文作文模板,
所述第四模板,用以建立可互譯的作文語料庫。
更進一步,所述規則單元包括:
時態單元,用以建立符合中文/英文的時態使用規則
語態單元,用以建立符合中文/英文的語態使用規則,
詞法單元,用以建立符合中文/英文的詞法處理規則。
更進一步,所述選取單元包括:查詢接口、關聯接口以及匹配接口,
所述查詢接口,用以提供所述關鍵詞/中心話題的查詢接口,
所述關聯接口,用以根據所述關鍵詞和/或中心話題進行關聯,
所述匹配接口,用以根據查詢和關聯結構進行匹配。
更進一步,所述關鍵詞包括:中文關鍵詞、英文關鍵詞以及修正關鍵詞,
所述中文關鍵詞或英文關鍵詞,用以作為作文中的標簽數據,
所述修正關鍵詞,用以對上述中文關鍵詞或英文關鍵詞的語義進行修正。
更進一步,所述中心話題包括:{必要話題、熱點話題、學術話題}的標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于毛姍婷,未經毛姍婷許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710322347.1/2.html,轉載請聲明來源鉆瓜專利網。





