[發(fā)明專利]一種唇部狀態(tài)檢測方法及裝置在審
| 申請?zhí)枺?/td> | 201711209022.9 | 申請日: | 2017-11-27 |
| 公開(公告)號: | CN107992813A | 公開(公告)日: | 2018-05-04 |
| 發(fā)明(設(shè)計)人: | 辛?xí)哉?/a>;馮陽;楊文文;李斌 | 申請(專利權(quán))人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司11227 | 代理人: | 王玲,王寶筠 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 唇部 狀態(tài) 檢測 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明實施例涉及計算機技術(shù)領(lǐng)域,具體涉及一種唇部狀態(tài)檢測方法及裝置。
背景技術(shù)
隨著人工智能技術(shù)的發(fā)展,語音交互成為一種應(yīng)用廣泛的技術(shù)。然而,由于語音交互易受環(huán)境影響,容易出現(xiàn)噪聲干擾,導(dǎo)致語音識別結(jié)果不準確。為了改善語音識別不準確的問題,出現(xiàn)了唇語識別技術(shù)。唇語識別技術(shù)是一種對面部圖像進行識別、以獲取對應(yīng)的語言識別結(jié)果的技術(shù)。目前的唇語識別技術(shù)為了減少噪聲數(shù)據(jù)的影響,通常會在接收到語音信號時,開始采集視頻圖像;在語音信號結(jié)束時,停止采集視頻圖像。這種方式從一定程度上避免了噪聲數(shù)據(jù)的影響。但當語音交互所處的環(huán)境較為嘈雜時,環(huán)境噪音會被當作語音信號采集,這時盡管用戶沒有開口說話,仍然會采集視頻數(shù)據(jù)。因此,現(xiàn)有技術(shù)的方案無法有效消除靜音幀等噪聲數(shù)據(jù),影響唇語識別結(jié)果。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種唇部狀態(tài)檢測方法及裝置,旨在解決現(xiàn)有技術(shù)提供的唇語識別方法存在的噪聲數(shù)據(jù)干擾、識別效率低的技術(shù)問題。
為此,本發(fā)明實施例提供如下技術(shù)方案:
第一方面,本發(fā)明實施例提供了一種唇部狀態(tài)檢測方法,包括:對目標圖像進行唇部區(qū)域檢測,獲取所述目標圖像包括的唇部區(qū)域圖像;確定所述唇部區(qū)域圖像的多個關(guān)鍵特征點;根據(jù)所述多個關(guān)鍵特征點對應(yīng)的特征值確定所述唇部區(qū)域的狀態(tài);所述唇部區(qū)域的狀態(tài)包括開口狀態(tài)或者閉口狀態(tài)。由于可以識別出唇部區(qū)域的狀態(tài),例如閉口狀態(tài),而閉口狀態(tài)對應(yīng)的畫面是靜音幀。在進行唇語識別時,可以僅對非靜音幀處理,有效消除靜音幀等噪聲數(shù)據(jù),提高唇語識別的效率和準確性。
第二方面,本發(fā)明實施例提供了一種唇部狀態(tài)檢測裝置,包括:檢測單元,用于對目標圖像進行唇部區(qū)域檢測,獲取所述目標圖像包括的唇部區(qū)域圖像;特征點確定單元,用于確定所述唇部區(qū)域圖像的多個關(guān)鍵特征點;狀態(tài)確定單元,用于根據(jù)所述多個關(guān)鍵特征點對應(yīng)的特征值確定所述唇部區(qū)域的狀態(tài);所述唇部區(qū)域的狀態(tài)包括開口狀態(tài)或者閉口狀態(tài)。
第三方面,本發(fā)明實施例提供了一種用于唇部狀態(tài)檢測的裝置,包括有存儲器,以及一個或者一個以上的程序,其中一個或者一個以上程序存儲于存儲器中,且經(jīng)配置以由一個或者一個以上處理器執(zhí)行所述一個或者一個以上程序包含用于進行以下操作的指令:對目標圖像進行唇部區(qū)域檢測,獲取所述目標圖像包括的唇部區(qū)域圖像;確定所述唇部區(qū)域圖像的多個關(guān)鍵特征點;根據(jù)所述多個關(guān)鍵特征點對應(yīng)的特征值確定所述唇部區(qū)域的狀態(tài);所述唇部區(qū)域的狀態(tài)包括開口狀態(tài)或者閉口狀態(tài)。
第四方面,本發(fā)明實施例提供了一種機器可讀介質(zhì),其上存儲有指令,當由一個或多個處理器執(zhí)行時,使得裝置執(zhí)行如第一方面所示的唇部狀態(tài)檢測方法。
本發(fā)明實施例提供的唇部狀態(tài)檢測方法及裝置,可以在目標圖像檢測出唇部區(qū)域圖像,并確定唇部區(qū)域圖像包括的多個關(guān)鍵特征點,根據(jù)所述多個關(guān)鍵特征點的特征值確定唇部區(qū)域處于開口狀態(tài)或者閉口狀態(tài)。本發(fā)明實施例提供的方法可以有效檢測唇部區(qū)域狀態(tài),識別準確性高,并能有效去除靜音幀等噪聲數(shù)據(jù)對唇語識別結(jié)果的影響,減少干擾,提高數(shù)據(jù)處理效率。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一實施例提供的唇部狀態(tài)檢測方法流程圖;
圖2為本發(fā)明另一實施例提供的唇部狀態(tài)檢測方法流程圖;
圖3為本發(fā)明一實施例提供的唇部狀態(tài)檢測裝置示意圖;
圖4是根據(jù)一示例性實施例示出的一種用于唇部狀態(tài)檢測裝置的框圖;
圖5是根據(jù)一示例性實施例示出的服務(wù)器的框圖。
具體實施方式
申請人在實現(xiàn)本發(fā)明時發(fā)現(xiàn),在執(zhí)行唇部狀態(tài)檢測時,可以通過接收的語音數(shù)據(jù)的變化或者紅外傳感器等額外的外部傳感器來進行檢測,但這些方式需要借助額外的設(shè)備或者傳感器,無法通過單純的圖像視覺信息進行唇部狀態(tài)檢測。
本發(fā)明實施例提供了一種唇部狀態(tài)檢測方法及裝置,可以有效檢測唇部區(qū)域狀態(tài),識別準確性高,成本低,并能有效去除靜音幀等噪聲數(shù)據(jù)對唇語識別結(jié)果的影響,減少干擾,提高數(shù)據(jù)處理效率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711209022.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種唇語識別方法及裝置
- 下一篇:對象尋找方法及裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





