[發明專利]使用解說詞文檔自動生成營養健康教育視頻的方法及系統有效
| 申請號: | 201310291597.5 | 申請日: | 2013-07-11 |
| 公開(公告)號: | CN103324760A | 公開(公告)日: | 2013-09-25 |
| 發明(設計)人: | 楊穎;陳瑛;高萬林 | 申請(專利權)人: | 中國農業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩 |
| 地址: | 100193 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 解說詞 文檔 自動 生成 營養 健康 教育 視頻 方法 系統 | ||
1.一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述方法包含以下步驟:
1)關鍵詞自動提取,提取一段解說詞文本中的所有關鍵詞;
2)圖片自動搜索,采用元搜索技術在互聯網上搜索與關鍵詞相關的圖片,采用關鍵詞匹配的文本檢索方法在本地圖片庫上自動搜索與關鍵詞相關的圖片;
3)營養健康教育視頻字幕背景生成,對搜索到的圖片與原文本中的句子或/和詞進行匹配,生成教育視頻。
2.根據權利要求1所述的一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述步驟1)的關鍵詞自動提取的方法為:基于詞頻統計的關鍵詞提取方法;基于知識庫搜索的關鍵詞提取方法。
3.根據權利要求2所述的一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述的基于詞頻統計的關鍵詞提取方法為:
首先使用自動分詞法,即對文檔使用模式匹配的方法進行分句,然后對句子使用全監督式分詞模型進行分詞,最后對每個詞使用全監督式模型進行詞性標注;
然后使用詞頻統計法,即在已經標注過詞性的詞中篩選出名詞,對每一個名詞統計其在解說文檔中的詞頻,最后把排名靠前的名詞作為該解說文檔的關鍵詞。
4.根據權利要求2所述的一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述的基于知識庫搜索的關鍵詞提取方法為:
采用爬蟲技術下載網絡百科詞典,獲取相應的百科詞條;
對于每一個解說詞文檔,使用模式匹配的方法進行分句;
對于每一個句子,使用模式匹配的方法提取出其中出現的百科詞條。
5.根據權利要求1所述的一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述步驟2)的互聯網圖片自動搜索法為:
首先將每個關鍵詞設置為查詢詞,并調用搜索引擎,檢索相關高畫質圖片;
然后將搜索引擎搜索到的圖片進行整合,存儲在以該關鍵詞命名的圖片存儲目錄下。
6.根據權利要求1所述的一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述步驟2)的本地圖片自動搜索法為:將每個關鍵詞設置為查詢詞,依次搜索本地各級文件存儲目錄,查找文件名包含關鍵詞的圖片,找到之后存儲在以該關鍵詞命名的圖片存儲目錄下。
7.根據權利要求1所述的一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述步驟3)的營養健康教育視頻字幕背景生成方法為:首先使用解說詞自動換行截取法,然后使用解說詞文本和圖像的對齊匹配法進行營養健康教育視頻字幕背景的生成。
8.根據權利要求7所述的一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述的使用解說詞自動換行截取法為:
首先采用模式匹配的方法將解說詞文檔分句,并將解說詞中的標點符號全部去掉,對于每一個句子,通過采用全監督式分詞模型進行分詞,獲取任意相鄰兩個詞的分割位置;
然后對于每個句子,統計每句話的長度:如果小于20字就不做修改;而如果大于20字,則需對該句子進行分行處理,即從該句首字位置算起,直到句子長度達到17字的位置處進行自動截斷換行,如果截斷位置不是兩個詞的分割位置,則對截斷位置進行適當的調整,保證截斷位置為兩個詞的分割位置,即保證不把一個完整的詞分到兩行;如果截斷后的后面句子的長度還是大于20字,繼續重復本條權利要求中大于20字的操作方法,直到截取后的每行文本長度都在17字左右。
9.根據權利要求8所述的一種使用解說詞文檔自動生成營養健康教育視頻的方法,其特征在于,所述的使用解說詞文本和圖像的對齊匹配法為:對解說詞中截取后的每行文本匹配相關的對應圖片,并采用視頻制作軟件合成解說詞行文本和相關的對應圖片,其中該相關的對應圖片的查找目錄為該行文本中包含的關鍵詞對應的圖片目錄,其中該目錄下的圖片為上述圖片自動搜索模塊所獲得的圖片。
10.一種使用解說詞文檔自動生成營養健康教育視頻的裝置,其特征在于,該裝置包含以下模塊:
關鍵詞自動提取模塊,該模塊采用基于詞頻統計的關鍵詞提取方法和基于知識庫搜索的關鍵詞提取方法提取一段解說詞文本中的所有關鍵詞;
圖片自動搜索模塊,該模塊采用元搜索技術在互聯網上搜索與關鍵詞相關的圖片,采用關鍵詞匹配的文本檢索方法在本地圖片庫上自動搜索與關鍵詞相關的圖片;
營養健康教育視頻字幕背景生成模塊,該模塊對解說詞文本自動斷行,形成行文本作為每張視頻畫面顯示的字幕,并自動匹配搜索到的相關的對應圖片,利用視頻合成工具將每行文本、相關的對應圖片生成營養健康教育視頻。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業大學,未經中國農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310291597.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:零速接紙機儲紙輥及其靜動態分析方法
- 下一篇:一種網站信息采編管理系統





