[發明專利]內容編目方法、裝置和電子設備在審
| 申請號: | 202110015813.8 | 申請日: | 2021-01-07 |
| 公開(公告)號: | CN112699687A | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 陳孝良;趙昂;葉森;馮大航 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G10L15/18;G10L15/26;G10L25/48 |
| 代理公司: | 北京竹辰知識產權代理事務所(普通合伙) 11706 | 代理人: | 聶鵬 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 內容 編目 方法 裝置 電子設備 | ||
1.一種內容編目方法,其特征在于,包括:
獲取待編目音頻;
對所述待編目音頻進行識別轉寫得到所述待編目音頻的文本內容以及所述文本內容對應的時間軸;
對所述文本內容進行語義分析得到文本內容的編目結果;其中,編目結果表示所述文本內容被劃分為預設的格式的文本;
將所述時間軸與所述編目結果進行對應得到帶時間軸的編目結果。
2.如權利要求1所述的內容編目方法,其特征在于,所述獲取待編目音頻,包括:
獲取待編目視頻;
獲取所述待編目視頻中的待編目音頻。
3.如權利要求1或2中任一項所述的內容編目方法,其特征在于,所述對所述待編目音頻進行識別轉寫得到所述待編目音頻的文本內容以及所述文本內容對應的時間軸,包括:
對所述待編目音頻進行語音識別得到所述待編目音頻中的分句文本以及每一個分句所對應的時間軸。
4.如權利要求3所述的內容編目方法,其特征在于,所述對所述文本內容進行語義分析得到文本內容的編目結果,包括:
將所述分句文本進行段落劃分得到至少一個文本段落;
生成所述文本段落的標題,其中所述標題以所述文本段落中的關鍵詞表示。
5.如權利要求4所述的內容編目方法,其特征在于,所述將所述分句文本進行段落劃分得到至少一個文本段落,包括:
將所述分句文本按照其時間軸排序得到分句文本序列;
分析所述分句文本序列中的每一個分句文本與其前后的分句文本的語義關聯關系;
根據所述語義關聯關系將至少一個分句文本劃分為一個文本段落。
6.如權利要求5所述的內容編目方法,其特征在于,所述分析所述分句文本序列中的每一個分句文本與其前后的分句文本的語義關聯關系,包括:
設置分析窗口大小,所述窗口大小為奇數;
在所述分句文本序列中移動所述分析窗口得到待分析的分句文本集合;
對所述分句文本集合中的分句文本進行分析,得到所述窗口的中間分句文本與所述窗口中的其他位置的分句文本的關聯關系。
7.如權利要求5所述的內容編目方法,其特征在于,所述根據所述語義關聯關系將至少一個分句文本劃分為一個文本段落,包括:
如果分句文本與其前邊的分句文本和/或后邊的分句文本語義關聯,則將所述分句文本、所述分句文本前邊的分句文本和所述分句文本后邊的分句文本劃分在同一個文本段落;
如果所述分句文本與其前邊的分句文本和后邊的分句文本均無語義關聯,則將所述分句文本劃分為一個文本段落。
8.如權利要求4所述的內容編目方法,其特征在于,所述生成所述文本段落的標題,包括:
在所述文本段落中檢測第一次出現所述標題的關鍵詞的位置以及關鍵詞的內容,其中所述關鍵詞的位置用關鍵詞首位兩個字在所述文本段落中的位置表示,所述關鍵詞的內容為所述首位兩個字中間的內容。
9.如權利要求4所述的內容編目方法,其特征在于,所述將所述時間軸與所述編目結果進行對應得到帶時間軸的編目結果,包括:
獲取所述文本段落中的分句文本的時間軸中的最小時間點和最大時間點;
根據所述最小時間點和最大時間點生成所述文本段落的時間軸。
10.如權利要求4所述的內容編目方法,其特征在于,所述方法還包括:
將所述帶時間軸的編目結果以預設格式顯示。
11.一種內容編目裝置,其特征在于,包括:
音頻獲取模塊,用于獲取待編目音頻;
轉寫模塊,用于對所述待編目音頻進行識別轉寫得到所述待編目音頻的文本內容以及所述文本內容對應的時間軸;
編目模塊,用于對所述文本結果進行語義分析得到文本內容的編目結果;其中,編目結果表示文本內容被劃分為預設的格式;將所述時間軸與所述編目結果進行對應得到帶時間軸的編目結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110015813.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:主機序列入侵檢測方法
- 下一篇:信息輸出方法、裝置和電子設備
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





