[發(fā)明專利]用于提供聲源信息的方法和裝置及增強現(xiàn)實眼鏡在審
| 申請?zhí)枺?/td> | 201810596747.6 | 申請日: | 2018-06-11 |
| 公開(公告)號: | CN109032545A | 公開(公告)日: | 2018-12-18 |
| 發(fā)明(設(shè)計)人: | 張志揚;蘇進;蘇卓然;李琦;楊莉 | 申請(專利權(quán))人: | 北京佳珥醫(yī)學(xué)科技有限公司 |
| 主分類號: | G06F3/14 | 分類號: | G06F3/14;G06F3/16;G10L15/26 |
| 代理公司: | 北京潤平知識產(chǎn)權(quán)代理有限公司 11283 | 代理人: | 陳瀟瀟;肖冰濱 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲源 語音 方法和裝置 聲源信息 聽障人士 增強現(xiàn)實 眼鏡 語音接收模塊 增強現(xiàn)實技術(shù) 語音轉(zhuǎn)化 基準點 直觀 轉(zhuǎn)化 | ||
本發(fā)明實施例提供一種用于提供聲源信息的方法和裝置及增強現(xiàn)實眼鏡,屬于增強現(xiàn)實技術(shù)領(lǐng)域。該方法包括:接收至少一個聲源的語音;基于接收的所述至少一個聲源中的每一聲源的語音,確定所述至少一個聲源中的每一聲源的方位,其中所述方位以接收至少一個聲源的語音的語音接收模塊為基準點;識別所述至少一個聲源中的每一聲源的語音,以將所述至少一個聲源中的每一聲源的語音轉(zhuǎn)化成文字;以及顯示所述至少一個聲源中的每一聲源的方位及語音所轉(zhuǎn)化的文字。藉此,實現(xiàn)了使得聽障人士可以明白聲源發(fā)出的語音的內(nèi)容的同時能夠清楚、直觀的了解聲源的方位,從而使得聽障人士能更好的把握聲源發(fā)出的語音的內(nèi)容。
技術(shù)領(lǐng)域
本發(fā)明涉及增強現(xiàn)實技術(shù)領(lǐng)域,具體地涉及用于提供聲源信息的方法和裝置及增強現(xiàn)實眼鏡。
背景技術(shù)
增強現(xiàn)實(Augmented Reality,AR)技術(shù),是一種通過實時計算影像的位置及角度,在影像上疊加相應(yīng)的圖像、視頻、3D模型,進而對虛擬世界與現(xiàn)實世界進行融合的技術(shù)。AR客戶端可以結(jié)合直接存儲在其本地的圖片識別物料,對用戶的線下環(huán)境進行實時的圖像識別,并在識別出的特定的線下目標在真實場景中的位置上,按照預(yù)配置的展示效果增強顯示相應(yīng)的展示數(shù)據(jù)。隨著技術(shù)的發(fā)展,增強現(xiàn)實技術(shù)的應(yīng)用很廣泛,但對于聽障人士而言,增強現(xiàn)實技術(shù)卻沒有很好的幫助到他們。
當前,聽障人士與健聽人溝通主要通過以下兩種途徑:手語翻譯員或佩戴助聽器。但是,這兩種溝通途徑都不能很好的使得聽障人士了解聲源的位置,影響聽障人士把握從聲源發(fā)出的語音的內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于提供聲源信息的方法和裝置及增強現(xiàn)實眼鏡,其可實現(xiàn)在使得聽障人士明白聲源發(fā)出的語音的內(nèi)容的同時能夠了解聲源的方位。
為了實現(xiàn)上述目的,本發(fā)明的一個方面提供一種用于提供聲源信息的方法,該方法包括:接收至少一個聲源的語音;基于接收的所述至少一個聲源中的每一聲源的語音,確定所述至少一個聲源中的每一聲源的方位,其中所述方位以接收至少一個聲源的語音的語音接收模塊為基準點;識別所述至少一個聲源中的每一聲源的語音,以將所述至少一個聲源中的每一聲源的語音轉(zhuǎn)化成文字;以及顯示所述至少一個聲源中的每一聲源的方位及語音所轉(zhuǎn)化的文字。
可選地,所述方位包括方向和/或距離。
可選地,所述方向被采用箭頭表示,所述箭頭位于一圓周劃定的區(qū)域內(nèi),所述箭頭偏離穿過該圓周的縱軸一角度。
相應(yīng)地,本發(fā)明的另一方面提供一種用于提供聲源信息的裝置,該裝置包括:語音接收模塊,用于接收至少一個聲源的語音;確定模塊,用于基于接收的所述至少一個聲源中的每一聲源的語音,確定所述至少一個聲源中的每一聲源的方位,其中所述方位以所述語音接收模塊為基準點;語音識別模塊,用于識別所述至少一個聲源中的每一聲源的語音,以將所述至少一個聲源中的每一聲源的語音轉(zhuǎn)化成文字;以及顯示模塊,用于顯示所述至少一個聲源中的每一聲源的方位及語音所轉(zhuǎn)化的文字。
可選地,所述方位包括方向和/或距離。
可選地,所述方向被采用箭頭表示,所述箭頭位于一圓周劃定的區(qū)域內(nèi),所述箭頭偏離穿過該圓周的縱軸一角度。
可選地,所述顯示模塊為近眼顯示器。
可選地,所述近眼顯示器為透視式近眼顯示器。
此外,本發(fā)明的另一方面還提供一種增強現(xiàn)實眼鏡,該增強現(xiàn)實眼鏡包括上述的裝置。
另外,本發(fā)明的另一方面還提供一種機器可讀存儲介質(zhì),該機器可讀存儲介質(zhì)上存儲有指令,該指令用于使得機器執(zhí)行上述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京佳珥醫(yī)學(xué)科技有限公司,未經(jīng)北京佳珥醫(yī)學(xué)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810596747.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





