[發(fā)明專利]一種語料標注方法和裝置及終端在審
| 申請?zhí)枺?/td> | 201611097247.5 | 申請日: | 2016-12-02 |
| 公開(公告)號: | CN106782509A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計)人: | 焦玉娜 | 申請(專利權(quán))人: | 樂視控股(北京)有限公司;樂視致新電子科技(天津)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/26 |
| 代理公司: | 北京三聚陽光知識產(chǎn)權(quán)代理有限公司11250 | 代理人: | 吳黎 |
| 地址: | 100025 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語料 標注 方法 裝置 終端 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,具體涉及一種語料標注方法和裝置及終端。
背景技術(shù)
語音識別技術(shù)有兩個關(guān)鍵資源,語音模型和聲學模型,其中聲學模型需要人工來標注語料內(nèi)容,將標注后的語料內(nèi)容作為訓(xùn)練集進行訓(xùn)練。為了提高識別率,可以根據(jù)語料內(nèi)容進行分類,如:性別、年齡、噪聲類型等,整理之后進行有針對性的訓(xùn)練,實現(xiàn)提高識別率的目的。
現(xiàn)有的語料標注方式多為本地標注,將語料發(fā)放給工作人員,工作人員新建文件用來記載音頻名稱及其對應(yīng)的音頻內(nèi)容文本。在標注的過程中,需要采用音頻播放器逐個播放語料音頻文件,然后工作人員找出播放的音頻對應(yīng)的音頻名稱,再標注音頻名稱對應(yīng)的文本內(nèi)容。這種語料標注方式,時間成本高,工作人員需要花費大部分時間進行音頻語料與音頻名稱的匹配工作。本地保存不便于管理,多文件操作也降低了工作效率。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供了一種語料標注方法和裝置及終端,以解決現(xiàn)有技術(shù)語料標注的時間成本高、工作效率低的問題。
根據(jù)第一方面,本發(fā)明實施例提供了一種語料標注方法,適用于帶有顯示屏的終端,該語料標注方法包括:獲取并顯示批量語料列表,其中,所述批量語料列表包含音頻列表和文本列表,其中,所述音頻列表中的每一單元格對應(yīng)所述文本列表中的一個單元格;在接收到用于指示所述音頻列表中目標音頻進行播放的音頻播放命令時,播放所述目標音頻;接收從多個預(yù)設(shè)文本內(nèi)容中選中的所述目標音頻對應(yīng)的文本內(nèi)容,作為所述文本列表中所述目標音頻對應(yīng)的單元格上標注的文本內(nèi)容。
可選地,還包括:在接收到文件導(dǎo)出命令時,獲取標注有文本內(nèi)容的批量語料列表對應(yīng)的文件;導(dǎo)出所述標注有文本內(nèi)容的批量語料列表對應(yīng)的文件,其中,所述文件導(dǎo)出命令用于指示批量導(dǎo)出所述標注有文本內(nèi)容的批量語料列表對應(yīng)的文件。
可選地,所述在接收到用于指示所述音頻列表中目標音頻進行播放的音頻播放命令時,播放所述目標音頻,包括:判斷是否存在選中所述音頻列表或者文本列表中單元格的操作;當存在所述選中所述音頻列表或者文本列表中單元格的操作時,查找所述音頻列表或者文本列表中被選中的單元格;播放所述被選中的單元格對應(yīng)的音頻。
可選地,接收從多個預(yù)設(shè)文本內(nèi)容中選中的所述目標音頻對應(yīng)的文本內(nèi)容,包括:接收用于打開在所述文本列表中所述目標音頻對應(yīng)的單元格的下拉列表的命令,獲取所述下拉列表中的所述多個預(yù)設(shè)文本內(nèi)容,所述文本列表中的每一單元格對應(yīng)一個下拉列表;接收通過鼠標輸入的用于從所述多個預(yù)設(shè)文本內(nèi)容中選擇文本的選中命令,將所述選中命令所指示的文本內(nèi)容標注在所述目標音頻對應(yīng)的單元格上;或者,接收用于打開在所述文本列表中所述目標音頻對應(yīng)的單元格的下拉列表的命令,獲取所述下拉列表中的所述多個預(yù)設(shè)文本內(nèi)容,所述文本列表中的每一單元格對應(yīng)一個下拉列表;接收通過鍵盤輸入的用于從所述多個預(yù)設(shè)文本內(nèi)容中選擇文本的選中命令,確定所述選中命令所對應(yīng)的文本內(nèi)容,標注在所述目標音頻對應(yīng)的單元格上。
可選地,在接收從多個預(yù)設(shè)文本內(nèi)容中選中的所述目標音頻對應(yīng)的文本內(nèi)容之后,還包括:判斷是否存在選中所述文本列表中另一單元格的操作;當存在所述選中所述文本列表中另一單元格的操作時,保存所述文本列表中前一單元格上標注的文本內(nèi)容。
根據(jù)第二方面,本發(fā)明實施例提供了一種語料標注裝置,適用于帶有顯示屏的終端,該語料標注裝置包括:第一獲取單元,用于獲取并顯示批量語料列表,其中,所述批量語料列表包含音頻列表和文本列表,其中,所述音頻列表中的每一單元格對應(yīng)所述文本列表中的一個單元格;播放單元,用于在接收到用于指示所述音頻列表中目標音頻進行播放的音頻播放命令時,播放所述目標音頻;接收單元,用于接收從多個預(yù)設(shè)文本內(nèi)容中選中的所述目標音頻對應(yīng)的文本內(nèi)容,作為所述文本列表中所述目標音頻對應(yīng)的單元格上標注的文本內(nèi)容。
可選地,還包括:第二獲取單元,用于在接收到文件導(dǎo)出命令時,獲取標注有文本內(nèi)容的批量語料列表對應(yīng)的文件;導(dǎo)出單元,用于導(dǎo)出所述標注有文本內(nèi)容的批量語料列表對應(yīng)的文件,其中,所述文件導(dǎo)出命令用于指示批量導(dǎo)出所述標注有文本內(nèi)容的批量語料列表對應(yīng)的文件。
可選地,所述播放單元包括:判斷模塊,用于判斷是否存在選中所述音頻列表或者文本列表中單元格的操作;查找模塊,用于當存在所述選中所述音頻列表或者文本列表中單元格的操作時,查找所述音頻列表或者文本列表中被選中的單元格;播放模塊,用于播放所述被選中的單元格對應(yīng)的音頻。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于樂視控股(北京)有限公司;樂視致新電子科技(天津)有限公司,未經(jīng)樂視控股(北京)有限公司;樂視致新電子科技(天津)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611097247.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





