[發(fā)明專利]一種拍照方法、移動終端及計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810955505.1 | 申請日: | 2018-08-21 |
| 公開(公告)號: | CN109302528B | 公開(公告)日: | 2021-05-25 |
| 發(fā)明(設(shè)計)人: | 陳浩 | 申請(專利權(quán))人: | 努比亞技術(shù)有限公司 |
| 主分類號: | H04M1/72439 | 分類號: | H04M1/72439;H04M1/72484;G10L15/22;G10L15/08 |
| 代理公司: | 深圳市凱達知識產(chǎn)權(quán)事務(wù)所 44256 | 代理人: | 劉大彎 |
| 地址: | 518057 廣東省深圳市南山區(qū)高新區(qū)北環(huán)大道9018*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 拍照 方法 移動 終端 計算機 可讀 存儲 介質(zhì) | ||
本發(fā)明公開了一種終端,其包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的拍照方法、通過獲取待識別語音拍照指令;提取待識別語音拍照指令中的語音信號特征;在預(yù)設(shè)的語音特征數(shù)據(jù)庫中查找是否存在與語音信號特征相匹配的標(biāo)準(zhǔn)語音信號特征;若存在與語音信號特征相匹配的標(biāo)準(zhǔn)語音信號特征,則執(zhí)行標(biāo)準(zhǔn)語音信號特征對應(yīng)的所述預(yù)設(shè)語音拍照指令;由于預(yù)設(shè)語音拍照指令包括預(yù)設(shè)的拍照關(guān)鍵詞和拍照模式,當(dāng)待識別的語音指令被識別后,執(zhí)行預(yù)設(shè)語音拍照指令,達到不僅可以拍照還可以對拍照模式進行調(diào)整的目的,解決現(xiàn)有拍照程序語音指令不能對拍照模式進行調(diào)整的問題,以達到增強人機交互、提升用戶體驗的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及音視頻信號處理技術(shù)領(lǐng)域,尤其涉及一種基于語音識別的拍照方法、移動終端及計算機可讀存儲介質(zhì)。
背景技術(shù)
語音識別技術(shù)又稱為自動語音識別(Automatic Speech Recognition,ASR),是把人類語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀輸入;隨著社會進步以及信息產(chǎn)業(yè)的飛速發(fā)展,語音識別技術(shù)作為人機交互的一項關(guān)鍵技術(shù),其應(yīng)用越來越廣泛,譬如車載語音導(dǎo)航、話機語音識別撥號、語音智能玩具等均涉及到語音識別技術(shù)。而語音識別在終端,特別是移動終端上的應(yīng)用是現(xiàn)階段互聯(lián)網(wǎng)公司最為火熱的研究方向,其目的是通過語音交互的便利模式迅速占領(lǐng)客戶群。
移動終端在人們的日常生活中使用越來越廣泛,其對人們的生活與交際產(chǎn)生了巨大的影響。以智能手機為例,隨著科技的發(fā)展,其已經(jīng)開始逐步取代傳統(tǒng)的PC并滲透進入了人們娛樂、生活的各個方面,同時也從過去單一的通話功能,到今天集通話、攝影、上網(wǎng)、短信、購物、視頻等功能于一身??萍及l(fā)展至今,不得不說智能手機給我們的生活帶了極大的便捷,同時人們對于智能手機的要求隨之增加?,F(xiàn)有的智能手機都包括拍照軟件,眾多的拍照軟件中基本都有語音拍照的功能,其主要通過語音命令的識別來控制拍照軟件的執(zhí)行,這一設(shè)計給用戶帶來了更多的方便和交互體驗。但是,由于這些語音命令一般都是由系統(tǒng)指定,用戶只能通過對系統(tǒng)指定的語音命令來實現(xiàn)語音拍照;其帶來的問題在于:1.不同人的說話方式、發(fā)音的不同以及方言的存在都可能對指定語音命令的識別帶來誤判,2.當(dāng)用戶希望通過語音來實現(xiàn)自拍時,使用指定的語音命令實現(xiàn)的自拍效果可能不能同時滿足每個用戶的要求,如,有人用“cheese”語音指令可達到最美的微笑,但有人更喜歡用“茄子”等,3.語音命令下的拍照模式必須提前設(shè)定,即用戶需要先設(shè)定拍照模式為美顏拍照、非美顏拍照、定時拍照等等,再設(shè)置語音指令進行拍照,對用戶帶來不便。
因此,有必要設(shè)計一種應(yīng)用于移動終端的基于語音識別的拍照方法,以解決現(xiàn)有語音拍照軟件的問題,提高移動終端拍照的便利性,給用戶更好的交互體驗。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提出一種基于語音識別的拍照方法及終端,旨在解決現(xiàn)有基于語音識別的拍照程序容易誤判,語音指令不能對拍照模式進行設(shè)置的問題,以達到增強人機交互、提升用戶體驗的效果。
首先,為實現(xiàn)上述目的,本發(fā)明提供一種基于語音識別的拍照方法,應(yīng)用于移動終端,所述拍照方法包括以下步驟:
獲取待識別語音拍照指令;
提取所述待識別語音拍照指令中的語音信號特征;
在預(yù)設(shè)的語音特征數(shù)據(jù)庫中查找是否存在與所述語音信號特征相匹配的標(biāo)準(zhǔn)語音信號特征;其中,所述預(yù)設(shè)的語音特征數(shù)據(jù)庫為預(yù)設(shè)語音拍照指令與所述預(yù)設(shè)語音拍照指令對應(yīng)的所述標(biāo)準(zhǔn)語音信號特征的關(guān)聯(lián)數(shù)據(jù)庫,所述預(yù)設(shè)語音拍照指令包括預(yù)設(shè)的拍照關(guān)鍵詞和與所述拍照關(guān)鍵詞對應(yīng)的拍照模式;
若存在與所述語音信號特征相匹配的所述標(biāo)準(zhǔn)語音信號特征,則執(zhí)行所述標(biāo)準(zhǔn)語音信號特征對應(yīng)的所述預(yù)設(shè)語音拍照指令。
可選地,所述語音信號特征包括第一級語音信號特征和第二級語音信號特征,所述標(biāo)準(zhǔn)語音信號特征包括第一級標(biāo)準(zhǔn)語音信號特征和第二級標(biāo)準(zhǔn)語音信號特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于努比亞技術(shù)有限公司,未經(jīng)努比亞技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810955505.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





