[發明專利]一種面向模糊文本挖掘的新聞視頻主題分割方法有效
| 申請號: | 201910062048.8 | 申請日: | 2019-01-23 |
| 公開(公告)號: | CN109902289B | 公開(公告)日: | 2022-12-13 |
| 發明(設計)人: | 姜大志;黃志均;曾文信;黃瑞香;漆原 | 申請(專利權)人: | 汕頭大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F40/279;G10L13/02;G10L13/08;G10L15/04;G10L15/26 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 周增元;曹江 |
| 地址: | 515000 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 模糊 文本 挖掘 新聞 視頻 主題 分割 方法 | ||
本發明實施例公開了一種面向模糊文本挖掘的新聞視頻主題分割方法,包括步驟:將新聞視頻轉換成音頻,使用語音識別技術將音頻轉換成模糊文本;使用語音識別技術將音頻轉換成模糊文本;文本的分詞;文本的表示;分析音頻信息,找出靜音點作為潛在分割點;對模糊文本進行分割點識別,更新潛在分割點;把詞性分析后篩選出的詞語序列,用語言模型轉換成句子向量,并根據句子向量的相似度分布來更新潛在分割點;基于PSO確定TextTiling算法參數進行文本主題分割。采用本發明,把視頻信息以故事為單位進行語義分割從而形成獨立的語義單元,可應用于眾多視頻檢索的應用領域,如影視、監控、交通視頻等。
技術領域
本發明涉及人工智能領域,尤其涉及一種面向模糊文本挖掘的新聞視頻主題分割方法。
背景技術
隨著互聯網、電子信息以及通信技術的飛速發展,各個行業與領域均積累了海量的數據,但是數據量的急劇增大給有效的信息檢索帶來了極大的挑戰。新聞視頻是多媒體傳播信息的一種重要的途徑,其中的視頻信息中包含了豐富和生動的語義信息,但由于新聞視頻一般缺乏良好的結構組織以及索引,獲取某一方面的新聞需要全篇瀏覽視頻,無法對過往的視頻進行檢索。如果需要查詢某一個主題的新聞視頻,則要重新瀏覽新聞視頻,這對于人力、物力以及時間方面都是一個極大的消耗。而通過對視頻的檢索,可以快速的獲取對應的信息,減少閱讀和查找的時間,提高搜索效率,因此如何實現高效的新聞視頻搜索已經成為了一個研究的熱點。
目前,可知的研究中對新聞視頻主題分割方面的研究和發明有了一段的積累。新聞視頻的主題分割技術從信息類型上主要有3種,分別是基于視頻鏡頭的主題分割、基于聲學特征的主題分割和基于文本信息的主題分割。
新加坡的L Chaisorn在《A Hierarchical Multi-Modal approach to storysegmentation in news video》(新聞視頻中故事分割的分層多模態方法)論文中提出的故事分割方法,將鏡頭分成十三個類別,根據類別確定故事邊界,以達到新聞視頻主題分割的目的。
劉華詠在《基于音視頻特征和文字信息自動分段新聞故事》論文中通過靜音檢測和字幕檢測來實現新聞主題分割。
余驍捷等人在《新聞播報節目的內容自動標注系統》中通過語音識別技術實現了基于語義的主題分割模型。
凌堅等人在論文《新聞單元的自動快速分割方法》以及劉群等人在論文《采用多特征融合的鏡頭邊界檢測方法》中,根據圖片的顏色分布情況及其特征,分析出視頻中的說話人和說話人所處的環境變化,進而對視頻中的場景進行分類,實現了新聞視頻的基于圖像之間相鄰幀的相似度變化的主題分割。
對于上述新聞視頻主題分割技術出現的調節效果不理想的問題,可能是多方面的影響,如設備、算法、實現模式、作用模式等。
從Hearst在《Segmenting Text Into Multi-Paragraph Subtopic Passages》論文中提出TextTiling算法,利用文本塊之間的差異性來實現文本主題的分割。由此我們可以得出文本信息和新聞視頻主題兩者之間的相互關聯。因而我們可以通過設計兩者之間的關系模型實現基于基于模糊文本挖掘的新聞視頻主題分割技術。
其中,對于文本主題分割的實現,目前國內已有大量的研究和專利,并且方案均比較成熟。例如,鐘彬彬等人在論文《基于GA的文本子主題切分中的參數優化研究》中提出了用遺傳算法來優化TextTiling算法中的參數的主題分割方法,在中文文本中的主題分割模型中取得了較好的效果。
由以上可知,目前對于“新聞視頻的主題分割”問題在技術手段上已經有了較大的突破。
上述現有技術中存在有以下缺陷:
1、基于語音分析的新聞視頻分割技術,無法對同一主持人播報不同新聞的情況進行很好的主題變化的切割。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于汕頭大學,未經汕頭大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910062048.8/2.html,轉載請聲明來源鉆瓜專利網。





