[發(fā)明專利]基于目光連接的聲音命令下達裝置和方法有效

申請?zhí)枺?/td>	201410461030.2	申請日：	2014-09-11
公開（公告）號：	CN104253944B	公開（公告）日：	2018-05-01
發(fā)明（設計）人：	陳飛	申請（專利權）人：	陳飛;鮑可捷
主分類號：	H04N5/232	分類號：	H04N5/232
代理公司：	廈門市首創(chuàng)君合專利事務所有限公司35204	代理人：	楊依展
地址：	310000 浙江省杭***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于目光連接聲音命令下達裝置方法
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發(fā)明涉及一種基于目光連接的聲音命令下達裝置和方法。

背景技術

語音識別中有一個難點，就是聲音采集裝置無法判斷用戶什么時候在和其它對象聊天，什么時候是向語音系統(tǒng)下達命令，目前采用的手段多為通過設定按鈕來開啟錄音，這種方式帶來很多不便，而且既然要按下按鈕，在操作步驟簡單的場景，下達語音命令就有些多余，直接制作不同的按鈕按下即可。

發(fā)明內(nèi)容

本發(fā)明提供了基于目光連接的聲音命令下達裝置和方法，其克服了背景技術中聲音命令下達裝置和方法所存在的不足。

本發(fā)明解決其技術問題的所采用的技術方案之一是：

基于目光連接的聲音命令下達裝置，包括至少一聲音采集器、一第一攝像機、一第一分析器、至少一裝設有第二攝像機和光線發(fā)射器的自動云臺、一第二分析器和一控制器；

該第一攝像機用于捕捉攝制可視空間內(nèi)的圖像以獲第一視頻數(shù)據(jù)，該第一分析器信號連接第一攝像機以用于分析第一視頻數(shù)據(jù)，判斷是否有人臉朝向第一攝像機且持續(xù)停留超過設定時間t1，如有則標定該人臉所處方位且至少將方位信息傳輸給控制器；

該控制器信號連接自動云臺和光線發(fā)射器，該控制器依據(jù)方位信息調(diào)整自動云臺使第二攝像機攝制人臉以獲第二視頻數(shù)據(jù)，控制光線發(fā)射器以向人眼發(fā)射光線，以獲得人眼的反光圖像；該第二分析器信號連接第二攝像機且分析第二視頻數(shù)據(jù)，以獲人臉實時三維坐標，且依據(jù)人眼圖像和經(jīng)人眼反射的反光圖像及位置判斷人眼是否正在注視攝像機；

該控制器信號連接第二分析器以判斷人眼注視是否超過設定時間t2，如是則認定目光連接且向?qū)獙崟r三維坐標的聲音采集器發(fā)送命令以控制聲音采集器采集聲音。

一實施例之中：該光線發(fā)射器包括多個發(fā)射光源，所發(fā)射的光線為固定距離的多個發(fā)射光源組合發(fā)射，以獲得人眼的包含多個反光點的反光圖像。

一實施例之中：該自動云臺的第二攝像機和光線發(fā)射器的發(fā)射光源相對固定在一起，并保持相對固定的距離，確保采集到的反光點圖像的穩(wěn)定和可計算性。

一實施例之中：該第一攝像機為廣角攝像機，該第一分析器為廣角圖像采集分析器；該第二攝像機為長可變焦攝像機，第二分析器為長焦圖像采集分析器。

一實施例之中：該第一分析器將該方位信息和人臉圖像傳輸給控制器；該第二攝像機依據(jù)控制器傳輸?shù)娜四槇D像進行捕捉及自動變焦調(diào)整，使攝制圖像調(diào)至合適大小。

一實施例之中：還包括一顯示裝置和一數(shù)據(jù)庫，該數(shù)據(jù)庫內(nèi)保存有包括與人臉信息一一對應在內(nèi)的用戶信息；該第二分析器還獲取人臉信息，控制器獲取人臉信息且依據(jù)人臉信息獲取用戶其它信息，并在顯示裝置上顯示該用戶相關的其它信息。

一實施例之中：該光線發(fā)射器發(fā)射出的光線為攝像機能捕捉且不刺激人眼的光線。

一實施例之中：還包括語義分析裝置，信號連接控制器和聲音采集器。

本發(fā)明解決其技術問題的所采用的技術方案之二是：

基于目光連接的聲音命令下達方法，包括：

步驟11，捕捉攝制可視空間內(nèi)的圖像以獲第一視頻數(shù)據(jù)；

步驟12，分析第一視頻數(shù)據(jù)，判斷是否有人臉朝向第一攝像機且持續(xù)停留超過設定時間t1，如有則標定該人臉所處方位且獲方位信息，然后執(zhí)行步驟2，否則繼續(xù)執(zhí)行步驟11；

步驟2，依據(jù)方位信息調(diào)整第二攝像機，使第二攝像機攝制人臉以獲第二視頻數(shù)據(jù)，控制光線發(fā)射器以向人眼發(fā)射光線，所發(fā)射的光線為與第二攝像機固定距離的至少一個發(fā)射光源組合發(fā)射，以獲得人眼反射的反光圖像；

步驟3，分析第二視頻數(shù)據(jù)，以獲人臉實時三維坐標，且依據(jù)人眼圖像和經(jīng)人眼反射的反光圖像及位置判斷人眼是否正在注視攝像機；

步驟4，判斷人眼注視是否超過設定時間t2，如是則認定目光連接；

步驟5，向?qū)獙崟r三維坐標的聲音采集器發(fā)送命令，聲音采集器采集聲音，識別聲音以獲語義內(nèi)容，將語義內(nèi)容提供給其它需要語義內(nèi)容的設備訪問，并判斷對話是否結(jié)束，如結(jié)束則執(zhí)行步驟11，如未結(jié)束，則忽略對話期間第一視頻數(shù)據(jù)中轉(zhuǎn)向攝像機組的人臉相關信息。

一實施例之中：該步驟3中，通過分析第二視頻數(shù)據(jù)，還獲取人臉圖像；

該步驟5中，控制器依據(jù)人臉圖像從數(shù)據(jù)庫中獲取對應的用戶信息，還通過顯示器顯示對話過程中需要顯示的提前設定的與該用戶相關的其它信息。

本發(fā)明解決其技術問題的所采用的技術方案之三是：

基于目光連接的聲音命令下達方法，包括：

步驟11，捕捉攝制可視空間內(nèi)的圖像以獲第一視頻數(shù)據(jù)；

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于陳飛;鮑可捷，未經(jīng)陳飛;鮑可捷許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410461030.2/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。