日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]特定領域語言模型生成方法及語音數據標注系統有效

專利信息
申請號: 201811099240.6 申請日: 2018-09-20
公開(公告)號: CN110930993B 公開(公告)日: 2023-07-25
發明(設計)人: 孫玨;李潔瓊;邵鵬 申請(專利權)人: 蔚來(安徽)控股有限公司
主分類號: G10L15/06 分類號: G10L15/06
代理公司: 中國專利代理(香港)有限公司 72001 代理人: 王星;楊美靈
地址: 230601 安徽省合*** 國省代碼: 安徽;34
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 特定 領域 語言 模型 生成 方法 語音 數據 標注 系統
【說明書】:

發明涉及一種特定領域語言模型生成方法,包括:基于第一文本集建立第一語言模型;基于第一語言模型來進行特定領域的語料擴展,以獲得第二文本集;基于第二文本集建立第二語言模型;針對第一文本集和第二文本集的重合詞元,將重合詞元在第一語言模型上的詞概率與其在第二語言模型上的詞概率進行插值運算,以建立第三語言模型。這種方法集成了通用語言模型的適用廣度,以及特定領域中對專業詞匯的識別精度的特征,有利于提高新語言模型的識別準確度和應用普適性。

技術領域

本發明涉及語音識別技術領域,更具體地說,涉及一種特定領域語言模型生成方法以及一種語音數據標注系統。

背景技術

在語音識別研究領域,語料資源的標注以及信息的校對工作一直是困擾研究人員的難題。因為這樣的工作通常涉及繁瑣的人力操作,而并沒有太多的專業性要求。一種縮減標注工作量的做法是,先將語音數據由已有的語音識別系統識別為文本,如果識別出的文本和原始文本一致,就認為該條標注通過質檢。

然而,人類語言博大精深,不同專業領域的人甚至無法理解對方在說什么。當文本標注庫中的內容是關于一些特定的細分領域時,用一個規范的通用語言模型來進行語音識別,識別效果會大打折扣,也就會出現真實標注正確而識別錯誤的情況,無法給標注質檢工作提供有效參考。

發明內容

本發明的目的在于提供一種特定領域語言模型的生成方法。

為實現上述目的,本發明提供如下各種技術方案。

一種特定領域語言模型生成方法,包括:a)、基于第一文本集建立第一語言模型;b)、基于第一語言模型來進行特定領域的語料擴展,以獲得第二文本集;c)、基于第二文本集建立第二語言模型;以及d)、針對第一文本集和第二文本集的重合詞元,將重合詞元在第一語言模型上的詞概率與其在第二語言模型上的詞概率進行插值運算,以建立第三語言模型。

可選地,步驟b)具體包括:利用第一語言模型分別計算第一文本集中的各句子的困惑度;從困惑度不低于困惑度閾值的句子中提取出至少一條專業詞匯;利用專業詞匯來進行特定領域的語料擴展。

可選地,步驟d)具體包括:基于重合詞元在第一語言模型上的詞概率與其在第二語言模型上的詞概率進行線性插值;其中,線性插值的插值因子至少基于如下項其中之一確定:驗證文本集中的至少一個句子在第三語言模型上的困惑度與在第一語言模型上的困惑度之間的差異;測試文本集中的至少一個句子在第一語言模型上的困惑度的統計信息。

本發明另外提供一種語音數據標注方法,包括:獲取語音數據集以及對應的標注文本集;基于標注文本集建立原始語言模型;基于原始語言模型來進行特定領域的語料擴展,以獲得特定領域文本集;基于特定領域文本集建立特定領域語言模型;以及針對標注文本集和特定領域文本集的重合詞元,將重合詞元在原始語言模型上的詞概率與其在特定領域語言模型上的詞概率進行插值運算,以建立融合語言模型;利用融合語言模型對語音數據集進行語音識別。

可選地,進行特定領域的語料擴展包括:利用原始語言模型分別計算標注文本集中的各句子的困惑度;從困惑度不低于困惑度閾值的句子中提取出至少一條專業詞匯;以專業詞匯進行句式擴展來得到特定領域文本集。

可選地,進行插值運算包括:基于重合詞元在原始語言模型上的詞概率與其在融合語言模型上的詞概率進行線性插值;其中,線性插值的插值因子至少基于如下項其中之一確定:驗證文本集中的至少一個句子在融合語言模型上的困惑度與在原始語言模型上的困惑度之間的差異;測試文本集中的至少一個句子在原始語言模型上的困惑度的統計信息。

本發明還提供一種語言模型生成系統,包括:第一模型建立單元,其基于第一文本集建立第一語言模型;語料擴展單元,其基于第一語言模型來進行特定領域的語料擴展,以獲得第二文本集;第二模型建立單元,其基于第二文本集建立第二語言模型;以及模型融合單元,其針對第一文本集和第二文本集的重合詞元,將重合詞元在第一語言模型上的詞概率與其在第二語言模型上的詞概率進行插值運算,以建立第三語言模型。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蔚來(安徽)控股有限公司,未經蔚來(安徽)控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201811099240.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美视频1区| 中文字幕一区二区三区四| 国产大片黄在线观看私人影院| 久久精品麻豆| 久久国产精品久久| 国产91麻豆视频| 91一区二区三区久久国产乱| 狠狠色噜噜狠狠狠合久| 黄毛片在线观看| 一区二区精品久久| 亚洲视频h| 四虎国产永久在线精品| 狠狠躁日日躁狂躁夜夜躁av| 欧美片一区二区| 九九视频69精品视频秋欲浓 | 狠狠躁天天躁又黄又爽| 国产一区二区电影| 国产91免费观看| 日韩精品1区2区3区| 香蕉av一区| 国产精品suv一区二区6| 国产国产精品久久久久| 久久噜噜少妇网站| 国产精品久久99| 99国产精品9| 精品国产二区三区| 国产精品伦一区二区三区级视频频| 国产乱码精品一区二区三区介绍| 夜夜嗨av禁果av粉嫩av懂色av| 香蕉av一区二区| 日韩精品午夜视频| 国产在线精品二区| 久久精品国产亚洲一区二区| 91精品国模一区二区三区| 精品国产区| 亚洲精品卡一卡二 | 亚洲欧美日韩视频一区| 亚洲第一天堂无码专区| 亚洲激情中文字幕| 四虎国产精品久久| 狠狠色综合久久丁香婷婷| 欧美一区二区三区爽大粗免费| 亚洲三区在线| 香蕉av一区二区三区| 欧美黄色一二三区| 成年人性生活免费看| 91精品婷婷国产综合久久竹菊| 毛片大全免费看| 国产日韩欧美精品一区 | 国产精品美女久久久免费| 日韩一区免费| 日韩欧美国产第一页| 日韩亚洲精品在线观看| 精品91av| 欧美日韩久久一区| 午夜情所理论片| 北条麻妃久久99精品| 国产91精品高清一区二区三区| 国产91丝袜在线播放动漫| 2023国产精品自产拍在线观看| 国产三级精品在线观看| 亚洲一区中文字幕| 午夜激情免费电影| 夜夜爽av福利精品导航| 久久国产精品精品国产| 中文字幕一区二区三区免费视频| 国产精品19乱码一区二区三区| 国产69精品久久777的优势| 99视频国产在线| 久久精品国语| 国产精品欧美久久久久一区二区 | 国产精品乱码一区| 狠狠干一区| 久久精品爱爱视频| 国产美女三级无套内谢| 亚洲精品国产久| 亚洲精品久久久久一区二区| 国产欧美一区二区三区沐欲| 国产农村妇女精品一区二区| 国产精品亚洲一区| 99精品在免费线偷拍| 久久不卡精品| 婷婷午夜影院| 日韩精品在线一区二区三区| 日韩一区二区中文字幕| 亚洲欧美色图在线| 国产偷国产偷亚洲清高| 亚洲欧美v国产一区二区| 男女视频一区二区三区| 欧美网站一区二区三区| 午夜爱爱电影| 亚洲少妇中文字幕| 午夜av电影院| 国产日韩欧美专区| 狠狠色丁香久久婷婷综合丁香| 欧美xxxxxhd| 欧美高清xxxxx| 久久一区二| 色噜噜狠狠色综合久| 国产精品欧美久久| 欧美乱偷一区二区三区在线| 午夜在线看片| 久久精品国产亚洲7777| 99久久精品国| 国产在线欧美在线| 91久久免费| 久久久综合亚洲91久久98| 日本高清h色视频在线观看| 日日狠狠久久8888偷色| 国产精品入口麻豆九色| 福利电影一区二区三区| 夜夜爽av福利精品导航| 国产全肉乱妇杂乱视频在线观看| 丰满少妇高潮惨叫久久久| 国产一二区视频| 性生交片免费看片| 在线观看欧美一区二区三区| 国产精品日本一区二区不卡视频| 国产一区二区四区| 国产一区二区三区精品在线| 美女张开腿黄网站免费| 久久久久久久亚洲视频| 中文丰满岳乱妇在线观看| 美日韩一区| 国产精品视频久久久久久久 | 91黄在线看| 乱子伦农村| 色噜噜狠狠色综合中文字幕| 亚洲乱亚洲乱妇28p| 国产女人和拘做受在线视频| 国产91精品一区| 亚洲欧美一区二| 日韩精品一二区| 国产天堂第一区| 福利片91| 欧美国产精品久久| 欧美精品日韩| 国产精品久久国产三级国电话系列| 欧美日韩国产精品一区二区 | 日韩欧美中文字幕一区| 日韩欧美国产高清91| 狠狠色狠狠色很很综合很久久| 欧美精品第一区| 国产女人好紧好爽| 精品一区二区超碰久久久| 国产精品中文字幕一区| 99精品久久久久久久婷婷| 999偷拍精品视频| 国产日韩一二三区| 中文字幕欧美日韩一区 | 手机看片国产一区| 美女直播一区二区三区| 日韩女女同一区二区三区| 三级电影中文| 国产精品二区一区二区aⅴ| 波多野结衣巨乳女教师| 中文乱码在线视频| 国产一区二区精华| 日韩精品一区在线视频| 亚洲精品少妇久久久久| 免费久久一级欧美特大黄| 久久久久国产亚洲| 久久一二区| 久久久久偷看国产亚洲87| 97国产婷婷综合在线视频,| 国产亚洲精品久久久久久久久动漫| 精品国产一二区| 国产欧美一区二区精品性| 国产亚洲精品久久久久久网站| 国产一二区在线| 国产一区二区大片| 97精品久久久午夜一区二区三区| 美女被羞羞网站视频软件| ass美女的沟沟pics| 高清人人天天夜夜曰狠狠狠狠| 93久久精品日日躁夜夜躁欧美| 男女无遮挡xx00动态图120秒| 国产韩国精品一区二区三区| 国产精品人人爽人人做av片| 午夜av网址| 三上悠亚亚洲精品一区二区 | 久久精品99国产精品亚洲最刺激| 久久国产免费视频| 久久精视频| 日本美女视频一区二区| freexxxx性| 亚洲五码在线| 欧美一区二区三区免费在线观看| 亚洲精欧美一区二区精品| 在线视频国产一区二区| 午夜精品99| 国产91一区二区在线观看| 欧美国产亚洲精品| 国产一区二区国产| 国产综合久久精品| 国产一区二区三区四| 亚洲神马久久| 欧美午夜看片在线观看字幕| 亚洲精品一区中文字幕| 性欧美一区二区| 精品久久一区| 日日狠狠久久8888偷色| 在线观看v国产乱人精品一区二区| 国产欧美一区二区三区在线播放| 99视频国产精品| 国产精品偷伦一区二区| 亚洲一二三在线| 男女午夜爽爽| 鲁丝一区二区三区免费| 国产清纯白嫩初高生在线播放性色| 综合色婷婷一区二区亚洲欧美国产| 中文字幕欧美另类精品亚洲| 日本一二三区视频在线| 色妞www精品视频| 一区精品二区国产| 香蕉av一区二区三区| 91夜夜夜| 男人的天堂一区二区| 中文字幕一区二区三区四| 日韩国产精品久久| 国产一区二区麻豆| 欧美一区二区三区激情| 国产69精品久久久久999小说| 国产一区二区在线观看免费| 一区二区欧美视频| 国产69精品久久99的直播节目| 香港三日本8a三级少妇三级99| 国产一二区精品| 午夜电影天堂| 欧美精品五区| 日本一区二区三区免费视频| 国产97在线播放| 日本午夜影视| 国产精品视频一区二区在线观看| 国产精品自拍在线| 欧美人妖一区二区三区| 狠狠色噜噜狠狠狠狠视频| 久久免费视频一区| 国产极品一区二区三区| 久久国产精久久精产国| av中文字幕一区二区| 激情欧美一区二区三区| 中文字幕一区二区三区不卡| 国产无套精品久久久久久| 亚洲精品国产精品国自| 日本午夜影视|