[發(fā)明專利]基于比較的視頻字幕錯(cuò)別字詞糾錯(cuò)的方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710187454.8 | 申請(qǐng)日: | 2017-03-27 |
| 公開(kāi)(公告)號(hào): | CN106973333B | 公開(kāi)(公告)日: | 2019-11-12 |
| 發(fā)明(設(shè)計(jì))人: | 羅華欣 | 申請(qǐng)(專利權(quán))人: | 山東浪潮商用系統(tǒng)有限公司 |
| 主分類號(hào): | H04N21/488 | 分類號(hào): | H04N21/488;H04N21/435 |
| 代理公司: | 濟(jì)南信達(dá)專利事務(wù)所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250100 山東省濟(jì)南市*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 比較 視頻 字幕 錯(cuò)別字 糾錯(cuò) 方法 裝置 | ||
本發(fā)明實(shí)施例提供了一種基于比較的視頻字幕錯(cuò)別字詞糾錯(cuò)的方法及裝置,涉及智能電視技術(shù)領(lǐng)域,用以降低字幕中出現(xiàn)錯(cuò)別字的現(xiàn)象,提高用戶體驗(yàn)。所述方法包括:獲取n個(gè)字幕文件,并在所述n個(gè)字幕文件中確定出應(yīng)用字幕文件及備用字幕文件;所述n為大于2的整數(shù);所述應(yīng)用字幕文件是播放裝置待使用的字幕文件;將所述n個(gè)字幕文件中的每個(gè)字幕文件劃分為至少一個(gè)字幕數(shù)組;其中,所述字幕數(shù)組中包含有字幕條目及所述字幕條目對(duì)應(yīng)的播放時(shí)間;根據(jù)所述備用字幕文件的至少一個(gè)字幕數(shù)組,依次對(duì)應(yīng)用字幕文件的至少一個(gè)字幕數(shù)組進(jìn)行字幕檢驗(yàn);在檢驗(yàn)出所述至少一個(gè)字幕數(shù)組中存在錯(cuò)別字詞時(shí),糾正所述錯(cuò)別字詞。
技術(shù)領(lǐng)域
本發(fā)明涉及智能電視技術(shù)領(lǐng)域,尤其涉及一種基于比較的視頻字幕錯(cuò)別字詞糾錯(cuò)的方法及裝置。
背景技術(shù)
隨著科技的發(fā)展,人們觀看視頻的方法不在僅局限于有線電視的方法,越來(lái)越多的數(shù)字電視被使用。數(shù)字電視不僅可以播放廣電網(wǎng)中的電視節(jié)目,而且還可以播放互聯(lián)網(wǎng)視頻媒體。
現(xiàn)有的互聯(lián)網(wǎng)視頻媒體往往通過(guò)字幕爬蟲(chóng)的方式來(lái)獲取在線字幕,而在互聯(lián)網(wǎng)上各字幕文件的質(zhì)量參差不齊,往往會(huì)存在錯(cuò)別字詞的現(xiàn)象,導(dǎo)致用戶體驗(yàn)一般。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種基于比較的視頻字幕錯(cuò)別字詞糾錯(cuò)的方法及裝置,用以降低字幕中出現(xiàn)錯(cuò)別字的現(xiàn)象,提高用戶體驗(yàn)。
為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
本發(fā)明實(shí)施例提供了一種基于比較的視頻字幕錯(cuò)別字詞糾錯(cuò)的方法,包括:獲取n個(gè)字幕文件,并在所述n個(gè)字幕文件中確定出應(yīng)用字幕文件及備用字幕文件;所述n為大于2的整數(shù);所述應(yīng)用字幕文件是播放裝置待使用的字幕文件;將所述n個(gè)字幕文件中的每個(gè)字幕文件劃分為至少一個(gè)字幕數(shù)組;其中,所述字幕數(shù)組中包含有字幕條目及所述字幕條目對(duì)應(yīng)的播放時(shí)間;根據(jù)所述備用字幕文件的至少一個(gè)字幕數(shù)組,依次對(duì)應(yīng)用字幕文件的至少一個(gè)字幕數(shù)組進(jìn)行字幕檢驗(yàn);在檢驗(yàn)出所述至少一個(gè)字幕數(shù)組中存在錯(cuò)別字詞時(shí),糾正所述錯(cuò)別字詞。
進(jìn)一步的,根據(jù)所述備用字幕文件的至少一個(gè)字幕數(shù)組,依次對(duì)應(yīng)用字幕文件的字幕數(shù)組進(jìn)行字幕檢驗(yàn),在檢驗(yàn)出所述應(yīng)用字幕文件的字幕數(shù)組中存在錯(cuò)別字詞時(shí),糾正所述錯(cuò)別字詞包括:將第i個(gè)字幕數(shù)組中的字幕條目與所有備用字幕文件中的所有字幕數(shù)組的字幕條目進(jìn)行字符串匹配,確定所有備用字幕文件中的所有字幕數(shù)組的字幕條目中是否存在至少兩個(gè)字幕條目與所述第i個(gè)字幕數(shù)組中的字幕條目相同;i為大于0,不大于應(yīng)用字幕文件劃分的字幕數(shù)組的總個(gè)數(shù)的整數(shù);若不存在,則在所述各個(gè)備用字幕文件中確定出各個(gè)校驗(yàn)字幕數(shù)組;所述校驗(yàn)字幕數(shù)組中的字幕條目對(duì)應(yīng)的播放時(shí)間與所述第i個(gè)字幕條目對(duì)應(yīng)的播放時(shí)間間隔不超過(guò)預(yù)設(shè)閾值;將所述各個(gè)校驗(yàn)字幕數(shù)組中的字幕條目進(jìn)行比較,確定是否存在相似字幕條目;若存在相似字幕條目,且相似字幕條目的數(shù)量達(dá)到預(yù)設(shè)相似閾值,則確定所述第i個(gè)字幕數(shù)組中的字幕條目存在錯(cuò)別字詞;在檢驗(yàn)出所述第i個(gè)字幕數(shù)組中存在錯(cuò)別字詞時(shí),糾正所述錯(cuò)別字詞;更新i的取值,繼續(xù)檢驗(yàn)應(yīng)用字幕文件的下一個(gè)字幕數(shù)組。
進(jìn)一步的,所述將所述各個(gè)校驗(yàn)字幕數(shù)組中的字幕條目進(jìn)行比較,確定是否存在相似字幕條目包括:在所述各個(gè)校驗(yàn)字幕數(shù)組中的字幕條目中,確定出待比較的兩個(gè)校驗(yàn)字幕數(shù)組中的字幕條目;將所述待比較的兩個(gè)校驗(yàn)字幕數(shù)組中的字幕條目進(jìn)行字符串比較;若所述待比較的兩個(gè)校驗(yàn)字幕數(shù)組中的字幕條目不同,則進(jìn)行二進(jìn)制比較,確定字符串不同的部分與待比較的字幕條目間的比例是否超過(guò)預(yù)設(shè)比例閾值;若未超過(guò)預(yù)設(shè)比例閾值,則確定所述待比較的兩個(gè)校驗(yàn)字幕數(shù)組中的字幕條目為相似字幕條目。
進(jìn)一步的,還包括:若存在至少兩個(gè)字幕條目與所述第i個(gè)字幕數(shù)組中的字幕條目相同,則確定所述第i個(gè)字幕數(shù)組中的字幕條目沒(méi)有錯(cuò)別字,更新i的取值,繼續(xù)檢驗(yàn)應(yīng)用字幕文件的下一個(gè)字幕數(shù)組。
進(jìn)一步的,還包括:若不存在相似字幕條目,則確定所述第i個(gè)字幕數(shù)組中的字幕條目沒(méi)有錯(cuò)別字,更新i的取值,繼續(xù)檢驗(yàn)應(yīng)用字幕文件的下一個(gè)字幕數(shù)組。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東浪潮商用系統(tǒng)有限公司,未經(jīng)山東浪潮商用系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710187454.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點(diǎn)播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機(jī)頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠(yuǎn)程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過(guò)內(nèi)容產(chǎn)生器獨(dú)立于分配過(guò)程實(shí)現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件





