[發(fā)明專利]電子設(shè)備及其語(yǔ)音識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201711210851.9 | 申請(qǐng)日: | 2017-11-27 |
| 公開(kāi)(公告)號(hào): | CN108242235A | 公開(kāi)(公告)日: | 2018-07-03 |
| 發(fā)明(設(shè)計(jì))人: | 李政仁;韓瀾;鄭皙榮 | 申請(qǐng)(專利權(quán))人: | 三星電子株式會(huì)社 |
| 主分類號(hào): | G10L15/183 | 分類號(hào): | G10L15/183;G10L15/197;G10L15/26 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 吳曉兵 |
| 地址: | 韓國(guó)*** | 國(guó)省代碼: | 韓國(guó);KR |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)言模型 電子設(shè)備 語(yǔ)音識(shí)別 語(yǔ)音數(shù)據(jù) 通用語(yǔ)言模型 集成語(yǔ)言 接收語(yǔ)音數(shù)據(jù) 外部電子設(shè)備 語(yǔ)音識(shí)別結(jié)果 上下文信息 預(yù)設(shè)時(shí)間段 關(guān)聯(lián) 通信接口 用戶指定 存儲(chǔ)器 處理器 構(gòu)建 詞語(yǔ) 存儲(chǔ) 輸出 | ||
提供了一種電子設(shè)備及其語(yǔ)音識(shí)別方法。該電子設(shè)備可以包括:通信接口,用于從外部電子設(shè)備接收語(yǔ)音數(shù)據(jù);存儲(chǔ)器,用于存儲(chǔ)默認(rèn)用于語(yǔ)音識(shí)別的通用語(yǔ)言模型、針對(duì)每個(gè)用戶指定的第一語(yǔ)言模型、與每個(gè)用戶的上下文信息相關(guān)聯(lián)的第二語(yǔ)言模型、以及與由電子設(shè)備在從語(yǔ)音數(shù)據(jù)的接收時(shí)間起的預(yù)設(shè)時(shí)間段內(nèi)所收集的詞語(yǔ)相關(guān)聯(lián)的第三語(yǔ)言模型;以及處理器,用于執(zhí)行如下過(guò)程:將第一語(yǔ)言模型、第二語(yǔ)言模型和第三語(yǔ)言模型中的至少一個(gè)與通用語(yǔ)言模型相組合以構(gòu)建集成語(yǔ)言模型,基于語(yǔ)音數(shù)據(jù)和集成語(yǔ)言模型來(lái)執(zhí)行語(yǔ)音識(shí)別,并且輸出與語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的語(yǔ)音識(shí)別結(jié)果。
技術(shù)領(lǐng)域
本公開(kāi)涉及一種電子設(shè)備及其語(yǔ)音識(shí)別方法。
背景技術(shù)
諸如智能電話、平板個(gè)人計(jì)算機(jī)、便攜式多媒體播放器、個(gè)人數(shù)字助理、膝上型個(gè)人計(jì)算機(jī)和可穿戴設(shè)備之類的各種電子設(shè)備已經(jīng)普及。此外,這樣的電子設(shè)備可以配備有用于基于用戶發(fā)出的語(yǔ)音聲音來(lái)控制電子設(shè)備的各種功能的技術(shù)。
為了根據(jù)用戶的語(yǔ)音聲音來(lái)控制功能,電子設(shè)備可以具有用于識(shí)別由用戶發(fā)出的語(yǔ)音的語(yǔ)音識(shí)別功能。
語(yǔ)音識(shí)別技術(shù)能夠使用聲學(xué)模型和語(yǔ)言模型來(lái)識(shí)別由用戶發(fā)出的語(yǔ)音。聲學(xué)模型可以指這樣的數(shù)據(jù)庫(kù),所述數(shù)據(jù)庫(kù)中映射和存儲(chǔ)了通過(guò)處理語(yǔ)音數(shù)據(jù)而獲得的特征向量和包括與特征向量相對(duì)應(yīng)的音素的音素候選組。語(yǔ)言模型可以指存儲(chǔ)如下這樣的信息的數(shù)據(jù)庫(kù),所述信息用于基于與語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)并從聲學(xué)模型中提取的音素來(lái)對(duì)詞語(yǔ)或音節(jié)之間的語(yǔ)言順序關(guān)系進(jìn)行建模。可以通過(guò)收集常用和頻繁使用的詞語(yǔ)或句子模式來(lái)創(chuàng)建語(yǔ)言模型。
可以在用于語(yǔ)音識(shí)別的語(yǔ)言模型中使用附加技術(shù),以提高語(yǔ)音識(shí)別精度。例如,可以使用從用戶的個(gè)性化設(shè)備中提取信息并根據(jù)所提取的用戶信息修改語(yǔ)言模型的技術(shù)。使用基于通用語(yǔ)言模型根據(jù)用戶信息可調(diào)整的語(yǔ)言模型的語(yǔ)音識(shí)別技術(shù)能夠有助于提高針對(duì)特定用戶的語(yǔ)音識(shí)別性能。
然而,為了提高語(yǔ)音識(shí)別的精度,不僅要反映用戶的特性,還要反映關(guān)于執(zhí)行語(yǔ)音識(shí)別的時(shí)間和情況的信息。
因此,為了提高語(yǔ)音識(shí)別的精度,必須組合使用各種語(yǔ)音識(shí)別模型,包括反映用戶的特性的語(yǔ)音識(shí)別模型。
發(fā)明內(nèi)容
為了解決上述缺陷,本公開(kāi)的主要目的是解決上述問(wèn)題和/或缺點(diǎn),并提供至少下述優(yōu)點(diǎn)。因此,本公開(kāi)的一方面是提供一種使用各種詳細(xì)語(yǔ)言模型來(lái)構(gòu)建集成語(yǔ)言模型的裝置和方法,以便在執(zhí)行語(yǔ)音識(shí)別的各種情況下提高語(yǔ)音識(shí)別的精度。
本公開(kāi)的另一方面是提供一種裝置和方法,所述裝置和方法通過(guò)在類型和組合方面改變與通用語(yǔ)言模型集成的詳細(xì)語(yǔ)言模型,在執(zhí)行語(yǔ)音識(shí)別的各種情況下最大化語(yǔ)音識(shí)別性能。
本公開(kāi)的各種實(shí)施例涉及使用通過(guò)組合各種語(yǔ)音模型而產(chǎn)生的集成語(yǔ)言模型來(lái)執(zhí)行語(yǔ)音識(shí)別。
根據(jù)本公開(kāi)的一方面,提供了一種電子設(shè)備。該電子設(shè)備可以包括:通信接口,用于從外部電子設(shè)備接收用戶的語(yǔ)音數(shù)據(jù)和用戶信息;存儲(chǔ)器,用于存儲(chǔ)默認(rèn)用于語(yǔ)音識(shí)別的通用語(yǔ)言模型、針對(duì)每個(gè)用戶指定的第一語(yǔ)言模型、與每個(gè)用戶的上下文信息相關(guān)聯(lián)的第二語(yǔ)言模型、以及與由電子設(shè)備在從語(yǔ)音數(shù)據(jù)的接收時(shí)間起的預(yù)設(shè)時(shí)間段內(nèi)所收集的詞語(yǔ)相關(guān)聯(lián)的第三語(yǔ)言模型;以及處理器,用于執(zhí)行如下過(guò)程:將第一語(yǔ)言模型、第二語(yǔ)言模型和第三語(yǔ)言模型中的至少一個(gè)與通用語(yǔ)言模型相組合以構(gòu)建集成語(yǔ)言模型,基于語(yǔ)音數(shù)據(jù)和集成語(yǔ)言模型來(lái)執(zhí)行語(yǔ)音識(shí)別,并且輸出與語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的語(yǔ)音識(shí)別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于三星電子株式會(huì)社,未經(jīng)三星電子株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711210851.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于語(yǔ)言模型切換和自適應(yīng)的裝置和方法
- 群集系統(tǒng)、方法、程序和使用群集系統(tǒng)的屬性估計(jì)系統(tǒng)
- 一種建立用于語(yǔ)音識(shí)別的語(yǔ)言模型的方法及裝置
- 語(yǔ)言模型訓(xùn)練系統(tǒng)、語(yǔ)音識(shí)別系統(tǒng)及相應(yīng)方法
- 一種語(yǔ)言模型的訓(xùn)練方法及裝置、設(shè)備
- 對(duì)象的模型生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種多種語(yǔ)言模型的文本轉(zhuǎn)換方法及裝置
- 跨領(lǐng)域語(yǔ)言模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 多語(yǔ)言模型的訓(xùn)練方法和裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 語(yǔ)言模型的訓(xùn)練方法、語(yǔ)音識(shí)別方法、裝置及電子設(shè)備
- 語(yǔ)音識(shí)別系統(tǒng)和方法
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 一種語(yǔ)音識(shí)別設(shè)備的更新方法、裝置及系統(tǒng)
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種基于手機(jī)互聯(lián)的車載語(yǔ)音識(shí)別系統(tǒng)及識(shí)別方法
- 一種基于云計(jì)算與置信度計(jì)算的語(yǔ)音識(shí)別方法與系統(tǒng)
- 語(yǔ)音識(shí)別方法和裝置
- 一種用于調(diào)度機(jī)的語(yǔ)音識(shí)別裝置
- 語(yǔ)音識(shí)別方法、裝置、系統(tǒng)、電子設(shè)備和存儲(chǔ)介質(zhì)
- 模型訓(xùn)練、語(yǔ)音識(shí)別方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 導(dǎo)航系統(tǒng)
- 一種語(yǔ)音檢測(cè)方法和系統(tǒng)
- 語(yǔ)音數(shù)據(jù)庫(kù)創(chuàng)建方法、聲紋注冊(cè)方法、裝置、設(shè)備及介質(zhì)
- 即時(shí)聊天中語(yǔ)音數(shù)據(jù)的摘要生成方法、服務(wù)器及系統(tǒng)
- 一種語(yǔ)音智能識(shí)別設(shè)備及語(yǔ)音智能識(shí)別方法
- 語(yǔ)音數(shù)據(jù)的獲取方法和系統(tǒng)
- 一種語(yǔ)音數(shù)據(jù)處理方法及裝置
- 語(yǔ)音數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種語(yǔ)音數(shù)據(jù)主題識(shí)別的方法及裝置
- 語(yǔ)音喚醒方法、裝置、系統(tǒng)、設(shè)備和存儲(chǔ)介質(zhì)





