[發(fā)明專利]語音的功能控制方法和裝置在審
| 申請?zhí)枺?/td> | 201710210831.5 | 申請日: | 2017-03-31 |
| 公開(公告)號: | CN107122179A | 公開(公告)日: | 2017-09-01 |
| 發(fā)明(設(shè)計(jì))人: | 潘葚 | 申請(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號: | G06F9/44 | 分類號: | G06F9/44;G06F3/16;G10L15/22;G10L15/26 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司11415 | 代理人: | 林祥 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 功能 控制 方法 裝置 | ||
技術(shù)領(lǐng)域
本申請涉及網(wǎng)絡(luò)通信技術(shù)領(lǐng)域,尤其涉及一種語音的功能控制方法和裝置。
背景技術(shù)
語音助手是運(yùn)行在終端上的一種軟件,能夠和用戶進(jìn)行語音交流,以及協(xié)助用戶實(shí)現(xiàn)其指定的各項(xiàng)功能,如進(jìn)行信息搜索、終端操作等。自從蘋果推出其語音助手Siri以后,用戶對語音助手類的軟件的關(guān)注程度和使用率有了極大的提高,也給語音助手的發(fā)展帶來了動力。
目前語音助手能夠與安裝在終端上的應(yīng)用程序相結(jié)合,用戶向語音助手發(fā)出執(zhí)行某項(xiàng)任務(wù)的指令,由語音助手調(diào)用相應(yīng)的應(yīng)用程序來完成該項(xiàng)任務(wù),從而極大的豐富了用戶能夠以語音助手為單一入口來完成的功能。
現(xiàn)有技術(shù)中,以Siri為例,Siri可以與六類應(yīng)用程序(打車、通訊、照片搜索、支付、網(wǎng)絡(luò)電話、健身)協(xié)作,當(dāng)Siri接收到用戶的語音輸入時(shí),判斷用戶的意圖,并決定是由自己處理還是調(diào)用應(yīng)用程序處理。如果決定調(diào)用應(yīng)用程序,Siri從自己對用戶語音的識別結(jié)果中提取相關(guān)信息交給應(yīng)用程序。應(yīng)用程序按照Siri提供的信息,執(zhí)行該信息指定的功能。
可見,Siri提供的信息是用戶指定的任務(wù)是否能被正確完成的基礎(chǔ)。當(dāng)Siri識別出的輸入語音不夠準(zhǔn)確時(shí),用戶通過語音進(jìn)行的功能控制就難以達(dá)到令人滿意的水平。
發(fā)明內(nèi)容
有鑒于此,本申請?zhí)峁┮环N語音的功能控制方法,應(yīng)用在終端的語音助手上,包括:
根據(jù)對用戶輸入語音的識別結(jié)果,確定關(guān)聯(lián)應(yīng)用程序;所述關(guān)聯(lián)應(yīng)用程序用來實(shí)現(xiàn)用戶要使用的功能;
將用戶的輸入語音傳遞給所述關(guān)聯(lián)應(yīng)用程序,供所述關(guān)聯(lián)應(yīng)用程序?qū)τ脩舻妮斎胝Z音進(jìn)行識別,并根據(jù)識別結(jié)果進(jìn)行所述功能的實(shí)現(xiàn)。
本申請?zhí)峁┑囊环N語音的功能控制方法,應(yīng)用在用來實(shí)現(xiàn)除語音助手外其他功能的終端應(yīng)用程序上,包括:
接收來自語音助手的用戶的輸入語音;
識別用戶的輸入語音,根據(jù)識別結(jié)果進(jìn)行用戶要使用功能的實(shí)現(xiàn)。
本申請還提供了一種語音的功能控制裝置,應(yīng)用在終端的語音助手上,包括:
關(guān)聯(lián)應(yīng)用程序單元,用于根據(jù)對用戶輸入語音的識別結(jié)果,確定關(guān)聯(lián)應(yīng)用程序;所述關(guān)聯(lián)應(yīng)用程序用來實(shí)現(xiàn)用戶要使用的功能;
輸入語音傳遞單元,用于將用戶的輸入語音傳遞給所述關(guān)聯(lián)應(yīng)用程序,供所述關(guān)聯(lián)應(yīng)用程序?qū)τ脩舻妮斎胝Z音進(jìn)行識別,并根據(jù)識別結(jié)果進(jìn)行所述功能的實(shí)現(xiàn)。
本申請?zhí)峁┑囊环N語音的功能控制裝置,應(yīng)用在用來實(shí)現(xiàn)除語音助手外其他功能的終端應(yīng)用程序上,包括:
輸入語音接收單元,用于接收來自語音助手的用戶的輸入語音;
功能實(shí)現(xiàn)單元,用于識別用戶的輸入語音,根據(jù)識別結(jié)果進(jìn)行用戶要使用功能的實(shí)現(xiàn)。
由以上技術(shù)方案可見,本申請的實(shí)施例中,在語音助手根據(jù)對用戶輸入語音的識別結(jié)果確定關(guān)聯(lián)應(yīng)用程序后,將用戶的輸入語音傳遞給關(guān)聯(lián)應(yīng)用程序,由關(guān)聯(lián)應(yīng)用程序自行識別輸入語音后執(zhí)行用戶的指令;由于關(guān)聯(lián)應(yīng)用程序都有其專屬的應(yīng)用領(lǐng)域,比如高德地圖是地圖及導(dǎo)航領(lǐng)域,因此在其所屬的功能類型的語音識別準(zhǔn)確度在絕大多數(shù)情況下高于通用于所有功能類型的語音助手的準(zhǔn)確度,從而能夠更為準(zhǔn)確和快速的完成用戶需要的功能,提高語音功能控制的效率。
附圖說明
圖1是本申請實(shí)施例中一種應(yīng)用在終端的語音助手上、語音的功能控制方法的流程圖;
圖2是本申請實(shí)施例中一種應(yīng)用在終端的應(yīng)用程序上、語音的功能控制方法的流程圖;
圖3是本申請應(yīng)用示例的工作原理示意圖;
圖4是終端的一種硬件結(jié)構(gòu)圖;
圖5是本申請實(shí)施例中一種應(yīng)用在終端的語音助手上、語音的功能控制裝置的邏輯結(jié)構(gòu)圖;
圖6是本申請實(shí)施例中一種應(yīng)用在終端的應(yīng)用程序上、語音的功能控制裝置的邏輯結(jié)構(gòu)圖。
具體實(shí)施方式
現(xiàn)有技術(shù)中,終端上安裝的很多非語音助手類的應(yīng)用程序本身也具有接收用戶語音輸入,識別出并執(zhí)行用戶的語音指令,實(shí)現(xiàn)用戶要使用功能的能力。簡便起見,以下將語音助手類的應(yīng)用程序稱為語音助手,將非語音助手類、用來實(shí)現(xiàn)除語音助手外的其他功能的應(yīng)用程序稱為應(yīng)用程序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710210831.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





