[發(fā)明專利]語音識別設(shè)備及其操作方法在審
| 申請?zhí)枺?/td> | 201880070671.1 | 申請日: | 2018-12-06 |
| 公開(公告)號: | CN111295708A | 公開(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計)人: | 白瑞鉉;洪斗和;柳宗燁;洪知延;金銀璟;崔成子;李在原;薩提什·英得西 | 申請(專利權(quán))人: | 三星電子株式會社 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/18;G10L15/30 |
| 代理公司: | 北京銘碩知識產(chǎn)權(quán)代理有限公司 11286 | 代理人: | 曾世驍;田方 |
| 地址: | 韓國京畿*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識別 設(shè)備 及其 操作方法 | ||
本公開涉及一種用于基于內(nèi)容分析用戶輸入并且生成并輸出應(yīng)答的語音識別設(shè)備及其操作方法,所述操作方法包括:接收音頻信號并對音頻信號執(zhí)行語音識別;獲取正在被執(zhí)行的內(nèi)容的內(nèi)容信息;基于所述內(nèi)容信息,從通過執(zhí)行語音識別而識別出的語音分析用戶輸入;根據(jù)分析出的用戶輸入和內(nèi)容信息生成應(yīng)答;并且輸出所述應(yīng)答。
技術(shù)領(lǐng)域
本公開涉及一種語音識別設(shè)備及其操作方法,并且例如,涉及一種用于基于正在被執(zhí)行的內(nèi)容分析用戶輸入并且生成并輸出應(yīng)答的語音識別方法和設(shè)備。
本公開還涉及一種用于使用諸如深度學(xué)習(xí)的機器學(xué)習(xí)算法來模擬諸如識別和確定的功能的人工智能(AI)系統(tǒng)及其應(yīng)用。
背景技術(shù)
人工智能(AI)系統(tǒng)是具有人類水平的智能的計算機系統(tǒng)。與現(xiàn)有的基于規(guī)則的智能系統(tǒng)不同,AI系統(tǒng)能夠自主學(xué)習(xí)、做出決定并變得智能。隨著AI系統(tǒng)的使用更準(zhǔn)確地提高了識別速率和對用戶品味的理解,現(xiàn)有的基于規(guī)則的智能系統(tǒng)已逐漸被基于深度學(xué)習(xí)的AI系統(tǒng)所取代。
AI技術(shù)包括機器學(xué)習(xí)(深度學(xué)習(xí))和使用機器學(xué)習(xí)的元技術(shù)。
機器學(xué)習(xí)可指一種對多條輸入數(shù)據(jù)的特征進行自主分類/自主學(xué)習(xí)的算法技術(shù)。元技術(shù)可指使用諸如深度學(xué)習(xí)的機器學(xué)習(xí)算法來模擬諸如人腦的識別和確定的功能的技術(shù),并且包括語言理解、視覺理解、推斷/預(yù)測、知識表達、運動控制等。
應(yīng)用AI技術(shù)的各種領(lǐng)域如下。語言理解是一種識別并應(yīng)用/處理人類語言/字符的技術(shù),并且包括自然語言處理、機器翻譯、對話系統(tǒng)、詢問和應(yīng)答、語音識別/合成等。視覺理解是一種像人類視覺一樣識別并處理對象的技術(shù),并且包括對象識別、對象跟蹤、圖像搜索、人類識別、場景理解、空間理解、圖像增強等。推斷/預(yù)測是一種確定信息以執(zhí)行邏輯推斷和預(yù)測的技術(shù),并且包括基于知識/概率的推斷、優(yōu)化預(yù)測、基于偏好的計劃、推薦等。知識表達是一種將人類的經(jīng)驗信息自動處理為知識數(shù)據(jù)的技術(shù),并且包括知識構(gòu)建(數(shù)據(jù)創(chuàng)建/分類)、知識管理(數(shù)據(jù)利用)等。運動控制是一種控制車輛的自動駕駛和機器人的運動的技術(shù),并且包括運動控制(導(dǎo)航、碰撞和駕駛)、操作控制(行為控制)等。
近來,隨著用于執(zhí)行各種功能的結(jié)合的電子裝置(諸如智能電話)的發(fā)展,已經(jīng)推出了具有用于改善可操縱性的語音識別功能的電子裝置。語音識別功能允許電子裝置的用戶通過語音容易地控制裝置,而無需操作單獨的按鈕或?qū)τ|摸模塊觸摸。
對于語音識別功能,可使用各種AI技術(shù)。通過語言理解,可準(zhǔn)確地識別用戶說話的內(nèi)容,并且可檢測包括在說話內(nèi)容中的用戶意圖。此外,通過視覺理解,可理解由用戶使用的內(nèi)容,并且通過推斷/預(yù)測,可生成根據(jù)用戶意圖和由用戶正在執(zhí)行的內(nèi)容的合適的應(yīng)答。此外,通過運動控制,可以以合適的形式輸出所生成的應(yīng)答。
發(fā)明內(nèi)容
技術(shù)的解決方案
根據(jù)本公開的一方面,一種語音識別設(shè)備的操作方法包括:接收音頻信號并執(zhí)行語音識別;獲取正在被執(zhí)行的內(nèi)容的內(nèi)容信息;基于所述內(nèi)容信息,從通過執(zhí)行語音識別而識別出的語音分析用戶輸入;基于分析出的用戶輸入和所述內(nèi)容信息生成應(yīng)答;并且輸出所述應(yīng)答。
有益效果
提供了一種用于基于內(nèi)容分析用戶輸入并且生成并輸出應(yīng)答的語音識別設(shè)備及其操作方法。
附圖說明
從以下結(jié)合附圖的描述,本公開的特定實施例的以上和其他方面、特征和優(yōu)點將更加顯而易見,其中:
圖1是示出根據(jù)實施例的語音識別方法的示圖;
圖2是示出根據(jù)實施例的示例語音識別方法的框圖;
圖3是示出根據(jù)實施例的語音識別設(shè)備的操作方法的流程圖;
圖4、圖5和圖6是示出根據(jù)實施例的語音識別系統(tǒng)的示圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于三星電子株式會社,未經(jīng)三星電子株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880070671.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:設(shè)備冷卻裝置
- 下一篇:熱轉(zhuǎn)印片
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗設(shè)備、驗證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





