[發(fā)明專利]離線命令詞與云端解析結(jié)合的語音識別方法、裝置和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201811439285.3 | 申請日: | 2018-11-29 |
| 公開(公告)號: | CN109410927B | 公開(公告)日: | 2020-04-03 |
| 發(fā)明(設(shè)計(jì))人: | 趙曉朝;戴帥湘;袁志偉 | 申請(專利權(quán))人: | 北京驀然認(rèn)知科技有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/22;G10L15/08;G10L15/26;G10L15/34 |
| 代理公司: | 北京智丞瀚方知識產(chǎn)權(quán)代理有限公司 11810 | 代理人: | 楊樂 |
| 地址: | 100083 北京市海淀區(qū)學(xué)院*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 離線 命令 云端 解析 結(jié)合 語音 識別 方法 裝置 系統(tǒng) | ||
本發(fā)明實(shí)施例公開了一種離線命令詞與云端解析相結(jié)合的語音識別方法,包括:接收用戶的語音輸入;對接收到的語音進(jìn)行識別;輸出識別結(jié)果;根據(jù)識別結(jié)果調(diào)用本地命令詞庫和/或?qū)⒆R別后的文本發(fā)送到云端進(jìn)行語義解析;根據(jù)語義解析結(jié)果生成指令;執(zhí)行指令。通過本地命令詞庫的構(gòu)建和對語音輸入、文本結(jié)果的識別,根據(jù)識別結(jié)果選擇調(diào)用本地命令詞庫進(jìn)行語義解析或發(fā)送到云端進(jìn)行語義解析,能夠提高語音識別、語義解析的響應(yīng)速度,并且為不同用戶定制不同的本地命令詞庫,以提供定制化的語音識別服務(wù)。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及人工智能領(lǐng)域,特別涉及人工智能領(lǐng)域中的語音識別技術(shù)。
背景技術(shù)
人工智能(Artificial Intelligence)研究的一個(gè)主要目標(biāo)是使機(jī)器能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作,為了執(zhí)行人的指令,高效、準(zhǔn)確的人機(jī)交互是必需的。語音識別是目前應(yīng)用最多的人機(jī)交互方式之一,傳統(tǒng)的語音交互方式通常是通過用戶終端在本地完成語音識別,識別后的文本傳輸?shù)皆贫?,通過云端進(jìn)行語義解析并生成指令或?qū)υ?,將指令或?qū)υ拏鬏敾赜脩艚K端。這樣的模式響應(yīng)速度慢。本地存儲離線命令庫的方法能夠提高響應(yīng)速度,但是由于本地存儲空間的有限性,本地存儲離線命令庫無法像云端解析一樣實(shí)現(xiàn)各類命令的解析。因此,亟需離線命令詞與云端解析相結(jié)合的語音識別方法。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種離線命令詞與云端解析相結(jié)合的語音識別方法,包括:接收用戶的語音輸入;對接收到的語音進(jìn)行識別;輸出識別結(jié)果;根據(jù)識別結(jié)果調(diào)用本地命令詞庫和/或?qū)⒆R別后的文本發(fā)送到云端進(jìn)行語義解析;根據(jù)語義解析結(jié)果生成指令;執(zhí)行指令。
其中,識別結(jié)果包括用戶的屬性信息。用戶的屬性信息指用戶是特定用戶,還是非特定用戶。特定用戶包括但不限于:家庭成員,辦公室成員,授權(quán)用戶,使用頻次較高的用戶,本地聯(lián)系人列表中存儲的用戶,臨時(shí)建立的群中的用戶等。非特定用戶包括但不限于:訪客,非授權(quán)用戶,使用頻次低的用戶,未存儲在本地聯(lián)系人列表中的用戶等。
根據(jù)用戶的識別結(jié)果調(diào)用本地命令詞庫和/或?qū)⒆R別后的文本發(fā)送到云端進(jìn)行語義解析進(jìn)一步包括,如果用戶屬于特定用戶,則調(diào)用本地命令詞庫進(jìn)行解析,如果用戶屬于非特定用戶,則將識別后的文本發(fā)送到云端進(jìn)行解析。
進(jìn)一步包括,特定用戶的本地命令詞庫包含的關(guān)鍵詞多于非特定用戶的本地命令詞庫;或者特定用戶能夠調(diào)用本地命令詞,而非特定用戶僅能進(jìn)行云端解析;或者特定用戶能夠調(diào)用與自身的權(quán)限級別相適應(yīng)的本地命令詞庫集合,用戶的權(quán)限級別越高能夠調(diào)用的本地命令詞庫集合包含的本地命令詞越多,或包含的本地命令詞庫的級別越高。
如果用戶屬于特定用戶,則進(jìn)一步包括,調(diào)用本地存儲的3D用戶畫像,根據(jù)3D用戶畫像調(diào)用相應(yīng)的本地命令詞庫進(jìn)行解析。3D用戶畫像包括用戶的基本信息、行為屬性、社會關(guān)系、心理特征、興趣愛好中的一個(gè)或多個(gè)。3D用戶畫像由用戶自行輸入,或根據(jù)用戶的數(shù)據(jù)疊加、抽象形成。
如果用戶屬于非特定用戶,則進(jìn)一步包括,允許非特定用戶被授權(quán)構(gòu)建3D用戶畫像,3D用戶畫像包括用戶的基本信息、行為屬性、社會關(guān)系、心理特征、興趣愛好中的一個(gè)或多個(gè)。3D用戶畫像由用戶自行輸入,或根據(jù)用戶的數(shù)據(jù)疊加、抽象形成。非特定用戶被授權(quán)構(gòu)建3D用戶畫像后,可以根據(jù)3D用戶畫像調(diào)用相應(yīng)的本地命令詞庫進(jìn)行解析。
其中,識別結(jié)果還包括語音識別后的文本的長度,如果文本的長度大于設(shè)定值,則將文本進(jìn)行拆分,部分調(diào)用本地命令詞庫進(jìn)行解析,部分上傳云端進(jìn)行解析,解析完成后回傳本地,在本地對兩部分解析結(jié)果進(jìn)行合成并輸出指令。
其中,如果識別出現(xiàn)無法進(jìn)行本地語義解析的命令詞,則將命令詞及其鄰近的上下文信息上傳云端進(jìn)行解析,解析完成后回傳本地,在本地對兩部分解析結(jié)果進(jìn)行合并后輸出控制指令。
進(jìn)一步包括,當(dāng)需要進(jìn)行拆分時(shí),在拆分處,或在無法解析的命令詞的上文和下文處插入標(biāo)記,所述在本地對兩部分解析結(jié)果進(jìn)行合并時(shí)根據(jù)插入的標(biāo)記位進(jìn)行合并。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京驀然認(rèn)知科技有限公司,未經(jīng)北京驀然認(rèn)知科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811439285.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





