[發(fā)明專利]語音聊天協(xié)同處理方法及裝置在審
| 申請?zhí)枺?/td> | 202010588474.8 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111754990A | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設計)人: | 楊文龍 | 申請(專利權)人: | 楊文龍 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/183;G10L15/22;G10L15/26;G10L21/0208;G10L21/0216;H04N7/15;G06F40/30;G06K9/00 |
| 代理公司: | 北京酷愛智慧知識產(chǎn)權代理有限公司 11514 | 代理人: | 向霞 |
| 地址: | 201611 上海市松*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 聊天 協(xié)同 處理 方法 裝置 | ||
本發(fā)明實施例公開了一種語音聊天協(xié)同處理方法及裝置。方法包括:在會議過程中,實時獲取外界語音及圖像數(shù)據(jù);采用自然語言處理模型對所述外界語音數(shù)據(jù)進行處理,以獲取對話文本數(shù)據(jù);將所述對話文本數(shù)據(jù)和語音轉文字的歷史對話文本數(shù)據(jù)進行相關性比較,以得到比較結果;根據(jù)所述比較結果對所述外界語音數(shù)據(jù)進行過濾處理或調低音量處理。本發(fā)明實施例,可以根據(jù)輸入聲音及圖像的語義信息進行判斷,如果是相關的信息則通過,不相關的信息就自動濾除,提高用戶體驗,相當于有一個智能的主持人,可以根據(jù)發(fā)言者發(fā)言是否相關而自動調大或者調小對應人員的音量,甚至靜音關掉不相關的發(fā)言。
技術領域
本發(fā)明涉及計算機軟件技術領域,具體涉及一種語音聊天協(xié)同處理方法及裝置。
背景技術
目前的多人語音聊天系統(tǒng)中,如果出現(xiàn)多人同時說話的場景,會導致一片嘈雜,什么都聽不清楚;可能的場景及現(xiàn)有方案舉例如下:
(1)在公司或者商務的遠程多人語音會議時,一般有自覺的參與者在不需要說話時會自己靜音,或者主持人在發(fā)言時會把其他人靜音;
缺點:這種解決方案需要參與者對電腦操作比較熟悉,適合商務人士及年輕人,不適合小孩子及老人;且針對環(huán)境中的雜音或者偶然的人員闖入等聲音無法濾除;
(2)在一些需要遠程教育的場合,比如幼兒園老師跟小孩子做網(wǎng)上的視頻交流時,由于小孩子發(fā)言比較不規(guī)范且不定時,很難要求他們自己靜音或者按時發(fā)言的操作,影響溝通的效率;
缺點:孩子時不時發(fā)言,聲音嘈雜,無法溝通,影響用戶體驗;
(3)公司會議室里面的視頻會議系統(tǒng),攝像頭會探知聲音,然后改變朝向發(fā)出聲音的人或者位置:
缺點:針對環(huán)境中的雜音或者偶然的人員闖入等聲音無法濾除,容易產(chǎn)生誤判,進而導致攝像頭朝向雜音的產(chǎn)生地,影響用戶體驗。
發(fā)明內容
本發(fā)明實施例的目的在于提供一種語音聊天協(xié)同處理方法及裝置,主要解決現(xiàn)有的多人語音系統(tǒng)中,環(huán)境偶發(fā)(無意義的)噪音無法濾除、多人發(fā)言嘈雜無法自動過濾的問題。
為實現(xiàn)上述目的,第一方面,本發(fā)明實施例提供了一種語音聊天協(xié)同處理方法,包括:
在會議過程中,實時獲取外界語音數(shù)據(jù);
采用對話系統(tǒng)模型對所述外界語音數(shù)據(jù)進行處理,以獲取對話文本數(shù)據(jù);
將所述對話文本數(shù)據(jù)和語音轉文字的歷史對話文本數(shù)據(jù)進行相關性比較,以得到比較結果;
根據(jù)所述比較結果對所述外界語音數(shù)據(jù)進行過濾處理或調低音量處理,并將對所述外界語音數(shù)據(jù)過濾或調低音量的處理結果顯示于用戶界面。
作為本申請的一種具體實施方式,實時獲取外界語音數(shù)據(jù)之前,所述方法還包括:
獲取用戶語音輸入數(shù)據(jù)和用戶圖像數(shù)據(jù);
將所述用戶語音輸入數(shù)據(jù)送入語音識別模塊進行識別;
根據(jù)所述用戶圖像數(shù)據(jù)判斷用戶當前是否為發(fā)言狀態(tài);
若用戶當前不為發(fā)言狀態(tài),則得出所述用戶語音輸入數(shù)據(jù)為背景雜音,采用自動降噪法自動過濾所述用戶語音數(shù)據(jù);所述背景雜音包括咳嗽聲、貓狗叫聲和打噴嚏聲;
若用戶當前為發(fā)言狀態(tài),且判斷所述用戶語音輸入數(shù)據(jù)是否為自然語言;
若為自然語音,則實時獲取外界語音數(shù)據(jù);
若不為自然語言,但通過語義場景模塊檢測判斷出所述用戶語音輸入數(shù)據(jù)與當前對話有關聯(lián)(笑聲、歌聲等),則實時獲取外界語音數(shù)據(jù);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于楊文龍,未經(jīng)楊文龍許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010588474.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 移動通信終端的協(xié)同方法及其界面系統(tǒng)
- 業(yè)務協(xié)同流程配置、業(yè)務協(xié)同方法及裝置
- 一種基于健康檔案共享平臺的跨醫(yī)院協(xié)同檢查信息系統(tǒng)
- 一種協(xié)同控制方法、協(xié)同控制系統(tǒng)及變頻器
- 基于協(xié)同網(wǎng)關的跨域協(xié)同交互方法
- 一種生產(chǎn)協(xié)同管理方法及系統(tǒng)
- 云邊協(xié)同方法、裝置、系統(tǒng)、設備和介質
- 一種智能辦公協(xié)同操作方法及系統(tǒng)
- 一種用于無人裝備的時間協(xié)同航跡規(guī)劃方法
- 基于大數(shù)據(jù)的智慧辦公協(xié)同方法及系統(tǒng)





