[發(fā)明專利]語(yǔ)音標(biāo)注質(zhì)量確定方法、裝置、設(shè)備及計(jì)算機(jī)可讀介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910306732.6 | 申請(qǐng)日: | 2019-04-17 |
| 公開(公告)號(hào): | CN110070854A | 公開(公告)日: | 2019-07-30 |
| 發(fā)明(設(shè)計(jì))人: | 張晴晴;何淑琳;劉天宇;楊金富;羅磊;馬光謙;汪洋 | 申請(qǐng)(專利權(quán))人: | 北京愛數(shù)智慧科技有限公司 |
| 主分類號(hào): | G10L15/01 | 分類號(hào): | G10L15/01;G10L15/26;G10L15/06;G06K9/62;G06F16/35 |
| 代理公司: | 北京智沃律師事務(wù)所 11620 | 代理人: | 李笑丹 |
| 地址: | 100044 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標(biāo)注 文本 計(jì)算機(jī)可讀介質(zhì) 標(biāo)注信息 過(guò)程信息 語(yǔ)音標(biāo)注 質(zhì)量確定 貝葉斯 可信度 目標(biāo)音頻 文件輸入 語(yǔ)音識(shí)別 語(yǔ)音數(shù)據(jù) 出錯(cuò) 申請(qǐng) 預(yù)設(shè) 質(zhì)檢 驗(yàn)收 | ||
1.一種語(yǔ)音標(biāo)注質(zhì)量確定方法,其特征在于,包括:
將目標(biāo)音頻文件輸入預(yù)設(shè)的語(yǔ)音識(shí)別模型中,得到預(yù)識(shí)別文本及所述預(yù)識(shí)別文本的貝葉斯風(fēng)險(xiǎn)值;
獲取標(biāo)注員對(duì)所述預(yù)識(shí)別文本在標(biāo)注過(guò)程中的標(biāo)注過(guò)程信息及所述標(biāo)注員在標(biāo)注歷史標(biāo)注文本時(shí)的歷史標(biāo)注信息;
基于所述貝葉斯風(fēng)險(xiǎn)值、所述標(biāo)注過(guò)程信息及歷史標(biāo)注信息確定所述標(biāo)注員對(duì)所述預(yù)識(shí)別文本進(jìn)行標(biāo)注的得到的標(biāo)注文本的文本可信度;
根據(jù)所述文本可信度確定所述標(biāo)注文本的標(biāo)注質(zhì)量。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音標(biāo)注質(zhì)量確定方法,其特征在于,所述基于所述貝葉斯風(fēng)險(xiǎn)值、所述標(biāo)注過(guò)程信息及歷史標(biāo)注信息確定所述標(biāo)注員對(duì)所述預(yù)識(shí)別文本進(jìn)行標(biāo)注的得到的標(biāo)注文本的文本可信度,包括:
若所述貝葉斯風(fēng)險(xiǎn)值超過(guò)預(yù)設(shè)風(fēng)險(xiǎn)閾值、根據(jù)所述歷史標(biāo)注信息確定的所述標(biāo)注員的歷史標(biāo)注質(zhì)量低于預(yù)設(shè)標(biāo)注質(zhì)量閾值且根據(jù)所述標(biāo)注過(guò)程信息確定所述標(biāo)注員對(duì)所述預(yù)識(shí)別文本的修改量小于預(yù)設(shè)修改閾值,則確定所述文本可信度低。
3.根據(jù)權(quán)利要求2所述的語(yǔ)音標(biāo)注質(zhì)量確定方法,其特征在于,所述歷史標(biāo)注質(zhì)量根據(jù)所述標(biāo)注員的認(rèn)真度和準(zhǔn)確度確定;
根據(jù)所述歷史標(biāo)注信息確定所述標(biāo)注員的歷史標(biāo)注質(zhì)量是否低于預(yù)設(shè)標(biāo)注質(zhì)量閾值,包括:
根據(jù)所述歷史標(biāo)注信息確定所述標(biāo)注員的認(rèn)真度和準(zhǔn)確度;
基于所述認(rèn)真度、預(yù)設(shè)認(rèn)真度權(quán)重系數(shù)、準(zhǔn)確度及預(yù)設(shè)準(zhǔn)確度權(quán)重系數(shù)計(jì)算所述標(biāo)注員的歷史標(biāo)注質(zhì)量;
將所述歷史標(biāo)注質(zhì)量與預(yù)設(shè)標(biāo)注質(zhì)量閾值比較;
若所述歷史標(biāo)注質(zhì)量小于所述預(yù)設(shè)標(biāo)注質(zhì)量閾值,確定所述標(biāo)注員的歷史標(biāo)注質(zhì)量低于預(yù)設(shè)標(biāo)注質(zhì)量閾值;否則,確定所述標(biāo)注員的歷史標(biāo)注質(zhì)量大于預(yù)設(shè)標(biāo)注質(zhì)量閾值。
4.根據(jù)權(quán)利要求2所述的語(yǔ)音標(biāo)注質(zhì)量確定方法,其特征在于,所述歷史標(biāo)注質(zhì)量根據(jù)所述標(biāo)注員的準(zhǔn)確度和標(biāo)注時(shí)長(zhǎng)確定;
根據(jù)所述歷史標(biāo)注信息確定所述標(biāo)注員的歷史標(biāo)注質(zhì)量是否低于預(yù)設(shè)標(biāo)注質(zhì)量閾值,包括:
根據(jù)所述歷史標(biāo)注信息確定所述標(biāo)注員的認(rèn)真度和準(zhǔn)確度;
基于所述認(rèn)真度、預(yù)設(shè)認(rèn)真度權(quán)重系數(shù)、準(zhǔn)確度及預(yù)設(shè)準(zhǔn)確度權(quán)重系數(shù)計(jì)算所述標(biāo)注員的歷史標(biāo)注質(zhì)量;
將所述歷史標(biāo)注質(zhì)量與預(yù)設(shè)標(biāo)注質(zhì)量閾值比較;
若所述歷史標(biāo)注質(zhì)量小于所述預(yù)設(shè)標(biāo)注質(zhì)量閾值,確定所述標(biāo)注員的歷史標(biāo)注質(zhì)量低于預(yù)設(shè)標(biāo)注質(zhì)量閾值;否則,確定所述標(biāo)注員的歷史標(biāo)注質(zhì)量大于預(yù)設(shè)標(biāo)注質(zhì)量閾值。
5.根據(jù)權(quán)利要求1所述的語(yǔ)音標(biāo)注質(zhì)量確定方法,其特征在于,所述方法還包括:
獲取所述目標(biāo)音頻文件的文件信息;
在多個(gè)標(biāo)注團(tuán)隊(duì)中,查找與所述文件信息匹配的標(biāo)注團(tuán)隊(duì);
基于所述標(biāo)注團(tuán)隊(duì)中多個(gè)標(biāo)注員的歷史標(biāo)注信息,確定對(duì)所述目標(biāo)音頻文件進(jìn)行語(yǔ)音識(shí)別標(biāo)注的標(biāo)注員。
6.根據(jù)權(quán)利要求1所述的語(yǔ)音標(biāo)注質(zhì)量確定方法,其特征在于,所述根據(jù)所述文本可信度確定所述標(biāo)注文本的標(biāo)注質(zhì)量,包括:
若所述文本可信度大于預(yù)設(shè)可信度閾值,確定所述標(biāo)注文本的標(biāo)注質(zhì)量合格;
若所述文本可信度小于所述預(yù)設(shè)可信度閾值,確定所述標(biāo)注文本的標(biāo)注質(zhì)量不合格,待進(jìn)一步校驗(yàn)。
7.一種語(yǔ)音標(biāo)注質(zhì)量確定裝置,其特征在于,包括:
輸入模塊,用于將目標(biāo)音頻文件輸入預(yù)設(shè)的語(yǔ)音識(shí)別模型中,得到預(yù)識(shí)別文本及所述預(yù)識(shí)別文本的貝葉斯風(fēng)險(xiǎn)值;
第一獲取模塊,用于獲取標(biāo)注員對(duì)所述預(yù)識(shí)別文本在標(biāo)注過(guò)程中的標(biāo)注過(guò)程信息及所述標(biāo)注員在標(biāo)注歷史標(biāo)注文本時(shí)的歷史標(biāo)注信息;
第一確定模塊,用于基于所述貝葉斯風(fēng)險(xiǎn)值、所述標(biāo)注過(guò)程信息及歷史標(biāo)注信息確定所述標(biāo)注員對(duì)所述預(yù)識(shí)別文本進(jìn)行標(biāo)注的得到的標(biāo)注文本的文本可信度;
第二確定模塊,用于根據(jù)所述文本可信度確定所述標(biāo)注文本的標(biāo)注質(zhì)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京愛數(shù)智慧科技有限公司,未經(jīng)北京愛數(shù)智慧科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910306732.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 標(biāo)注信息生成裝置、查詢裝置及共享系統(tǒng)
- 一種圖像分割標(biāo)注方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)標(biāo)注方法
- 一種基于群智的語(yǔ)料庫(kù)數(shù)據(jù)標(biāo)注方法及系統(tǒng)
- 一種圖像標(biāo)注方法和裝置
- 一種樣本標(biāo)注方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 數(shù)據(jù)標(biāo)注管理方法及裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 標(biāo)注的更新方法、裝置、存儲(chǔ)介質(zhì)、處理器以及運(yùn)載工具
- 數(shù)據(jù)的標(biāo)注方法和裝置
- 一種智能標(biāo)注平臺(tái)的方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 通過(guò)下載證書來(lái)控制對(duì)計(jì)算機(jī)可讀內(nèi)容的訪問(wèn)的系統(tǒng)及方法
- 用于生產(chǎn)組合物的監(jiān)測(cè)設(shè)備
- 計(jì)算機(jī)可讀的掩模收縮控制處理器
- 用于動(dòng)態(tài)授權(quán)對(duì)被許可內(nèi)容的訪問(wèn)的方法、系統(tǒng)和產(chǎn)品
- 監(jiān)視和控制計(jì)算機(jī)可讀介質(zhì)上的數(shù)據(jù)的訪問(wèn)的裝置和方法
- 光電子模塊和用于操作所述光電子模塊的方法
- 用于將操作系統(tǒng)存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的BIOS代碼
- 相機(jī)組同步曝光控制方法及系統(tǒng)、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、相機(jī)組控制系統(tǒng)
- 炒鍋翻炒方法、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及智能炒菜機(jī)
- 用于計(jì)算機(jī)系統(tǒng)啟動(dòng)操作的系統(tǒng)及方法
- 標(biāo)注信息生成裝置、查詢裝置及共享系統(tǒng)
- 語(yǔ)料標(biāo)注方法及設(shè)備
- 電子地圖信息標(biāo)注方法、裝置及終端
- 顯示標(biāo)注信息方法和電子設(shè)備
- 用于標(biāo)注數(shù)據(jù)的方法和裝置
- 信息處理方法及裝置、電子設(shè)備、機(jī)器可讀存儲(chǔ)介質(zhì)
- 數(shù)據(jù)標(biāo)注方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種影像序列的標(biāo)注方法、裝置、處理器及存儲(chǔ)介質(zhì)
- 一種基于眾智的視頻學(xué)習(xí)資源提取及知識(shí)標(biāo)注方法及系統(tǒng)
- 醫(yī)學(xué)圖像數(shù)據(jù)的信息標(biāo)注方法、裝置及系統(tǒng)





