[發(fā)明專利]基于目光連接的聲音命令下達裝置和方法有效
| 申請?zhí)枺?/td> | 201410461030.2 | 申請日: | 2014-09-11 |
| 公開(公告)號: | CN104253944B | 公開(公告)日: | 2018-05-01 |
| 發(fā)明(設(shè)計)人: | 陳飛 | 申請(專利權(quán))人: | 陳飛;鮑可捷 |
| 主分類號: | H04N5/232 | 分類號: | H04N5/232 |
| 代理公司: | 廈門市首創(chuàng)君合專利事務(wù)所有限公司35204 | 代理人: | 楊依展 |
| 地址: | 310000 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 目光 連接 聲音 命令 下達 裝置 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于目光連接的聲音命令下達裝置和方法。
背景技術(shù)
語音識別中有一個難點,就是聲音采集裝置無法判斷用戶什么時候在和其它對象聊天,什么時候是向語音系統(tǒng)下達命令,目前采用的手段多為通過設(shè)定按鈕來開啟錄音,這種方式帶來很多不便,而且既然要按下按鈕,在操作步驟簡單的場景,下達語音命令就有些多余,直接制作不同的按鈕按下即可。
發(fā)明內(nèi)容
本發(fā)明提供了基于目光連接的聲音命令下達裝置和方法,其克服了背景技術(shù)中聲音命令下達裝置和方法所存在的不足。
本發(fā)明解決其技術(shù)問題的所采用的技術(shù)方案之一是:
基于目光連接的聲音命令下達裝置,包括至少一聲音采集器、一第一攝像機、一第一分析器、至少一裝設(shè)有第二攝像機和光線發(fā)射器的自動云臺、一第二分析器和一控制器;
該第一攝像機用于捕捉攝制可視空間內(nèi)的圖像以獲第一視頻數(shù)據(jù),該第一分析器信號連接第一攝像機以用于分析第一視頻數(shù)據(jù),判斷是否有人臉朝向第一攝像機且持續(xù)停留超過設(shè)定時間t1,如有則標定該人臉所處方位且至少將方位信息傳輸給控制器;
該控制器信號連接自動云臺和光線發(fā)射器,該控制器依據(jù)方位信息調(diào)整自動云臺使第二攝像機攝制人臉以獲第二視頻數(shù)據(jù),控制光線發(fā)射器以向人眼發(fā)射光線,以獲得人眼的反光圖像;該第二分析器信號連接第二攝像機且分析第二視頻數(shù)據(jù),以獲人臉實時三維坐標,且依據(jù)人眼圖像和經(jīng)人眼反射的反光圖像及位置判斷人眼是否正在注視攝像機;
該控制器信號連接第二分析器以判斷人眼注視是否超過設(shè)定時間t2,如是則認定目光連接且向?qū)?yīng)實時三維坐標的聲音采集器發(fā)送命令以控制聲音采集器采集聲音。
一實施例之中:該光線發(fā)射器包括多個發(fā)射光源,所發(fā)射的光線為固定距離的多個發(fā)射光源組合發(fā)射,以獲得人眼的包含多個反光點的反光圖像。
一實施例之中:該自動云臺的第二攝像機和光線發(fā)射器的發(fā)射光源相對固定在一起,并保持相對固定的距離,確保采集到的反光點圖像的穩(wěn)定和可計算性。
一實施例之中:該第一攝像機為廣角攝像機,該第一分析器為廣角圖像采集分析器;該第二攝像機為長可變焦攝像機,第二分析器為長焦圖像采集分析器。
一實施例之中:該第一分析器將該方位信息和人臉圖像傳輸給控制器;該第二攝像機依據(jù)控制器傳輸?shù)娜四槇D像進行捕捉及自動變焦調(diào)整,使攝制圖像調(diào)至合適大小。
一實施例之中:還包括一顯示裝置和一數(shù)據(jù)庫,該數(shù)據(jù)庫內(nèi)保存有包括與人臉信息一一對應(yīng)在內(nèi)的用戶信息;該第二分析器還獲取人臉信息,控制器獲取人臉信息且依據(jù)人臉信息獲取用戶其它信息,并在顯示裝置上顯示該用戶相關(guān)的其它信息。
一實施例之中:該光線發(fā)射器發(fā)射出的光線為攝像機能捕捉且不刺激人眼的光線。
一實施例之中:還包括語義分析裝置,信號連接控制器和聲音采集器。
本發(fā)明解決其技術(shù)問題的所采用的技術(shù)方案之二是:
基于目光連接的聲音命令下達方法,包括:
步驟11,捕捉攝制可視空間內(nèi)的圖像以獲第一視頻數(shù)據(jù);
步驟12,分析第一視頻數(shù)據(jù),判斷是否有人臉朝向第一攝像機且持續(xù)停留超過設(shè)定時間t1,如有則標定該人臉所處方位且獲方位信息,然后執(zhí)行步驟2,否則繼續(xù)執(zhí)行步驟11;
步驟2,依據(jù)方位信息調(diào)整第二攝像機,使第二攝像機攝制人臉以獲第二視頻數(shù)據(jù),控制光線發(fā)射器以向人眼發(fā)射光線,所發(fā)射的光線為與第二攝像機固定距離的至少一個發(fā)射光源組合發(fā)射,以獲得人眼反射的反光圖像;
步驟3,分析第二視頻數(shù)據(jù),以獲人臉實時三維坐標,且依據(jù)人眼圖像和經(jīng)人眼反射的反光圖像及位置判斷人眼是否正在注視攝像機;
步驟4,判斷人眼注視是否超過設(shè)定時間t2,如是則認定目光連接;
步驟5,向?qū)?yīng)實時三維坐標的聲音采集器發(fā)送命令,聲音采集器采集聲音,識別聲音以獲語義內(nèi)容,將語義內(nèi)容提供給其它需要語義內(nèi)容的設(shè)備訪問,并判斷對話是否結(jié)束,如結(jié)束則執(zhí)行步驟11,如未結(jié)束,則忽略對話期間第一視頻數(shù)據(jù)中轉(zhuǎn)向攝像機組的人臉相關(guān)信息。
一實施例之中:該步驟3中,通過分析第二視頻數(shù)據(jù),還獲取人臉圖像;
該步驟5中,控制器依據(jù)人臉圖像從數(shù)據(jù)庫中獲取對應(yīng)的用戶信息,還通過顯示器顯示對話過程中需要顯示的提前設(shè)定的與該用戶相關(guān)的其它信息。
本發(fā)明解決其技術(shù)問題的所采用的技術(shù)方案之三是:
基于目光連接的聲音命令下達方法,包括:
步驟11,捕捉攝制可視空間內(nèi)的圖像以獲第一視頻數(shù)據(jù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于陳飛;鮑可捷,未經(jīng)陳飛;鮑可捷許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410461030.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





