[發明專利]有聲電子書的字幕顯示方法、電子設備及計算機存儲介質有效
| 申請號: | 201810687631.3 | 申請日: | 2018-06-28 |
| 公開(公告)號: | CN108959163B | 公開(公告)日: | 2020-01-21 |
| 發明(設計)人: | 黃鑫霞;文思遠;姜山;殷祥 | 申請(專利權)人: | 掌閱科技股份有限公司 |
| 主分類號: | G06F15/02 | 分類號: | G06F15/02;G09B5/06 |
| 代理公司: | 11276 北京市浩天知識產權代理事務所(普通合伙) | 代理人: | 宋菲;劉蘭蘭 |
| 地址: | 100124 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 計算機存儲介質 轉換 標準文本 電子設備 字幕文本 字幕顯示 字幕 語音轉文本 播放過程 播放內容 校驗結果 用戶體驗 字幕信息 校驗 收聽 播放 | ||
1.一種有聲電子書的字幕顯示方法,包括:
對有聲電子書的音頻進行語音轉文本處理,得到與所述有聲電子書的音頻相對應的轉換文本,確定所述音頻與所述轉換文本之間的第一對應關系;
獲取與所述有聲電子書的音頻對應的標準文本;
根據所述標準文本對所述轉換文本進行校驗;其中,分別將轉換文本中的各個文本與標準文本中的各個文本進行比對,根據比對結果確定轉換文本中包含的至少一個第一匹配文本組以及標準文本中包含的與至少一個第一匹配文本組相對應的至少一個第二匹配文本組;并根據標準文本中與至少一個第二匹配文本組相鄰的第二非匹配文本,對轉換文本中與至少一個第一匹配文本組相鄰的第一非匹配文本進行校驗;其中,第一匹配文本組和第二匹配文本組是由連續N個相互匹配的文本塊構成的一個文本組,其中,N為大于1的自然數;
根據校驗結果以及所述音頻與所述轉換文本之間的第一對應關系,確定所述音頻與所述有聲電子書的字幕文本之間的第二對應關系;其中,根據校驗結果對所述轉換文本進行修正,根據修正后的轉換文本確定所述有聲電子書的字幕文本;根據所述音頻與所述轉換文本之間的第一對應關系,確定所述音頻與所述有聲電子書的字幕文本之間的第二對應關系;
根據所述音頻與所述有聲電子書的字幕文本之間的第二對應關系,在所述有聲電子書的播放過程中顯示與播放內容相對應的字幕信息;其中,根據校驗結果對所述轉換文本進行修正,且所述字幕文本根據修正后的轉換文本確定;
其中,所述音頻與所述轉換文本之間的第一對應關系包括:所述音頻中的各個時間單元與所述轉換文本中的各個文本單元之間的對應關系;且所述音頻與所述有聲電子書的字幕文本之間的第二對應關系包括:所述音頻中的各個時間單元與所述字幕文本中的各個文本單元之間的對應關系;且所述文本單元包括:以詞匯、和/或字為文本單位的文本單元。
2.根據權利要求1所述的方法,其中,所述獲取與所述有聲電子書的音頻對應的標準文本;根據所述標準文本對所述轉換文本進行校驗的步驟具體包括:
從所述轉換文本中按第一預設順序依次提取第一預設數量的第一文本塊加入第一校驗集合,并從所述標準文本中按第二預設順序依次提取第二預設數量的第二文本塊加入第二校驗集合;
將所述第一校驗集合中的各個第一文本塊分別與所述第二校驗集合中的各個第二文本塊進行比對,根據比對結果對所述第一校驗集合中的各個第一文本塊進行校驗。
3.根據權利要求2所述的方法,其中,所述從所述轉換文本中按第一預設順序依次提取第一預設數量的第一文本塊加入第一校驗集合的步驟具體包括:
每當從所述轉換文本中按第一預設順序提取第一預設數量的第一文本塊加入第一校驗集合后,將所述轉換文本中已提取的第一文本塊標記為第一已提取文本,并將所述轉換文本中與所述第一已提取文本相對應的下一個文本所處的位置標記為第一待提取初始位置,以便下一次從所述第一待提取初始位置提取第一預設數量的第一文本塊加入第一校驗集合,以更新所述第一校驗集合的內容;
所述從所述標準文本中按第二預設順序依次提取第二預設數量的第二文本塊加入第二校驗集合的步驟具體包括:
每當從所述標準文本中按第二預設順序提取第二預設數量的第二文本塊加入第二校驗集合后,將所述標準文本中已提取的第二文本塊標記為第二已提取文本,并將所述標準文本中與所述第二已提取文本相對應的下一個文本所處的位置標記為第二待提取初始位置,以便下一次從所述第二待提取初始位置提取第二預設數量的第二文本塊加入第二校驗集合,以更新所述第二校驗集合的內容。
4.根據權利要求2或3所述的方法,其中,所述將所述第一校驗集合中的各個第一文本塊分別與所述第二校驗集合中的各個第二文本塊進行比對,根據比對結果對所述第一校驗集合進行校驗的步驟具體包括:
分別將所述第一校驗集合中的各個第一文本塊與所述第二校驗集合中的各個第二文本塊進行比對,根據比對結果確定所述第一校驗集合中包含的至少一個第一匹配文本組以及所述第二校驗集合中包含的與所述至少一個第一匹配文本組相對應的至少一個第二匹配文本組;
根據所述第二校驗集合中與所述至少一個第二匹配文本組相鄰的第二非匹配文本,對所述第一校驗集合中與所述至少一個第一匹配文本組相鄰的第一非匹配文本進行校驗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于掌閱科技股份有限公司,未經掌閱科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810687631.3/1.html,轉載請聲明來源鉆瓜專利網。





