[發(fā)明專利]使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310291597.5 | 申請日: | 2013-07-11 |
| 公開(公告)號: | CN103324760A | 公開(公告)日: | 2013-09-25 |
| 發(fā)明(設計)人: | 楊穎;陳瑛;高萬林 | 申請(專利權(quán))人: | 中國農(nóng)業(yè)大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王瑩 |
| 地址: | 100193 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 使用 解說詞 文檔 自動 生成 營養(yǎng) 健康 教育 視頻 方法 系統(tǒng) | ||
1.一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述方法包含以下步驟:
1)關(guān)鍵詞自動提取,提取一段解說詞文本中的所有關(guān)鍵詞;
2)圖片自動搜索,采用元搜索技術(shù)在互聯(lián)網(wǎng)上搜索與關(guān)鍵詞相關(guān)的圖片,采用關(guān)鍵詞匹配的文本檢索方法在本地圖片庫上自動搜索與關(guān)鍵詞相關(guān)的圖片;
3)營養(yǎng)健康教育視頻字幕背景生成,對搜索到的圖片與原文本中的句子或/和詞進行匹配,生成教育視頻。
2.根據(jù)權(quán)利要求1所述的一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述步驟1)的關(guān)鍵詞自動提取的方法為:基于詞頻統(tǒng)計的關(guān)鍵詞提取方法;基于知識庫搜索的關(guān)鍵詞提取方法。
3.根據(jù)權(quán)利要求2所述的一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述的基于詞頻統(tǒng)計的關(guān)鍵詞提取方法為:
首先使用自動分詞法,即對文檔使用模式匹配的方法進行分句,然后對句子使用全監(jiān)督式分詞模型進行分詞,最后對每個詞使用全監(jiān)督式模型進行詞性標注;
然后使用詞頻統(tǒng)計法,即在已經(jīng)標注過詞性的詞中篩選出名詞,對每一個名詞統(tǒng)計其在解說文檔中的詞頻,最后把排名靠前的名詞作為該解說文檔的關(guān)鍵詞。
4.根據(jù)權(quán)利要求2所述的一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述的基于知識庫搜索的關(guān)鍵詞提取方法為:
采用爬蟲技術(shù)下載網(wǎng)絡百科詞典,獲取相應的百科詞條;
對于每一個解說詞文檔,使用模式匹配的方法進行分句;
對于每一個句子,使用模式匹配的方法提取出其中出現(xiàn)的百科詞條。
5.根據(jù)權(quán)利要求1所述的一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述步驟2)的互聯(lián)網(wǎng)圖片自動搜索法為:
首先將每個關(guān)鍵詞設置為查詢詞,并調(diào)用搜索引擎,檢索相關(guān)高畫質(zhì)圖片;
然后將搜索引擎搜索到的圖片進行整合,存儲在以該關(guān)鍵詞命名的圖片存儲目錄下。
6.根據(jù)權(quán)利要求1所述的一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述步驟2)的本地圖片自動搜索法為:將每個關(guān)鍵詞設置為查詢詞,依次搜索本地各級文件存儲目錄,查找文件名包含關(guān)鍵詞的圖片,找到之后存儲在以該關(guān)鍵詞命名的圖片存儲目錄下。
7.根據(jù)權(quán)利要求1所述的一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述步驟3)的營養(yǎng)健康教育視頻字幕背景生成方法為:首先使用解說詞自動換行截取法,然后使用解說詞文本和圖像的對齊匹配法進行營養(yǎng)健康教育視頻字幕背景的生成。
8.根據(jù)權(quán)利要求7所述的一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述的使用解說詞自動換行截取法為:
首先采用模式匹配的方法將解說詞文檔分句,并將解說詞中的標點符號全部去掉,對于每一個句子,通過采用全監(jiān)督式分詞模型進行分詞,獲取任意相鄰兩個詞的分割位置;
然后對于每個句子,統(tǒng)計每句話的長度:如果小于20字就不做修改;而如果大于20字,則需對該句子進行分行處理,即從該句首字位置算起,直到句子長度達到17字的位置處進行自動截斷換行,如果截斷位置不是兩個詞的分割位置,則對截斷位置進行適當?shù)恼{(diào)整,保證截斷位置為兩個詞的分割位置,即保證不把一個完整的詞分到兩行;如果截斷后的后面句子的長度還是大于20字,繼續(xù)重復本條權(quán)利要求中大于20字的操作方法,直到截取后的每行文本長度都在17字左右。
9.根據(jù)權(quán)利要求8所述的一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的方法,其特征在于,所述的使用解說詞文本和圖像的對齊匹配法為:對解說詞中截取后的每行文本匹配相關(guān)的對應圖片,并采用視頻制作軟件合成解說詞行文本和相關(guān)的對應圖片,其中該相關(guān)的對應圖片的查找目錄為該行文本中包含的關(guān)鍵詞對應的圖片目錄,其中該目錄下的圖片為上述圖片自動搜索模塊所獲得的圖片。
10.一種使用解說詞文檔自動生成營養(yǎng)健康教育視頻的裝置,其特征在于,該裝置包含以下模塊:
關(guān)鍵詞自動提取模塊,該模塊采用基于詞頻統(tǒng)計的關(guān)鍵詞提取方法和基于知識庫搜索的關(guān)鍵詞提取方法提取一段解說詞文本中的所有關(guān)鍵詞;
圖片自動搜索模塊,該模塊采用元搜索技術(shù)在互聯(lián)網(wǎng)上搜索與關(guān)鍵詞相關(guān)的圖片,采用關(guān)鍵詞匹配的文本檢索方法在本地圖片庫上自動搜索與關(guān)鍵詞相關(guān)的圖片;
營養(yǎng)健康教育視頻字幕背景生成模塊,該模塊對解說詞文本自動斷行,形成行文本作為每張視頻畫面顯示的字幕,并自動匹配搜索到的相關(guān)的對應圖片,利用視頻合成工具將每行文本、相關(guān)的對應圖片生成營養(yǎng)健康教育視頻。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國農(nóng)業(yè)大學,未經(jīng)中國農(nóng)業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310291597.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





