[發(fā)明專利]口頭通信的轉(zhuǎn)錄有效
| 申請(qǐng)?zhí)枺?/td> | 201680053989.X | 申請(qǐng)日: | 2016-09-09 |
| 公開(kāi)(公告)號(hào): | CN108028042B | 公開(kāi)(公告)日: | 2022-02-11 |
| 發(fā)明(設(shè)計(jì))人: | N·阿布凱羅夫 | 申請(qǐng)(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G06F3/01 |
| 代理公司: | 永新專利商標(biāo)代理有限公司 72002 | 代理人: | 劉瑜;王英 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 口頭 通信 轉(zhuǎn)錄 | ||
捕獲來(lái)自近端用戶語(yǔ)音的部分。近端用戶終端通過(guò)網(wǎng)絡(luò)在近端用戶與一個(gè)或多個(gè)遠(yuǎn)端用戶之間進(jìn)行通信會(huì)話,會(huì)話包括發(fā)送至一個(gè)或多個(gè)遠(yuǎn)端用戶的消息。經(jīng)由近端用戶終端的觸摸屏用戶界面提供審查機(jī)制,以允許近端用戶在語(yǔ)音的部分的估計(jì)的轉(zhuǎn)錄在消息中被發(fā)送至一個(gè)或多個(gè)遠(yuǎn)端用戶之前對(duì)估計(jì)的轉(zhuǎn)錄進(jìn)行審查。根據(jù)審查機(jī)制:(i)由近端用戶通過(guò)觸摸屏用戶界面執(zhí)行的第一手勢(shì)接受估計(jì)的轉(zhuǎn)錄以預(yù)先確定的角色被包括在被發(fā)送的消息中;而(ii)由近端用戶通過(guò)觸摸屏用戶界面執(zhí)行的一個(gè)或多個(gè)第二手勢(shì),每個(gè)第二手勢(shì)拒絕在消息中發(fā)送估計(jì)的轉(zhuǎn)錄。
背景技術(shù)
包括口頭音頻成分的通信,諸如電視廣播、互聯(lián)網(wǎng)電視組播、或者諸如VoIP呼叫之類的話音或視頻呼叫,經(jīng)常包括對(duì)音頻語(yǔ)音中出現(xiàn)的語(yǔ)音的文本轉(zhuǎn)錄(texttranscription)。這可以有利于聽(tīng)力有困難的接收用戶,或者在其中不適合將音頻打開(kāi)或者調(diào)高至清晰可聽(tīng)到的等級(jí)的環(huán)境中(例如,存在其它人的非常公共的場(chǎng)所)的接收端處消費(fèi)通信的情況下。替代地或者額外地,轉(zhuǎn)錄的理由可以是因?yàn)榘l(fā)送用戶可能僅偏好口述而非打字來(lái)作為發(fā)送文本消息的方式。
已知用于將語(yǔ)音轉(zhuǎn)換為文本作為單向或雙向通信會(huì)話的部分的不同技術(shù),包括快速并且甚至是實(shí)時(shí)地進(jìn)行這樣的轉(zhuǎn)換的技術(shù)。實(shí)時(shí)意味著動(dòng)態(tài)地、隨著且當(dāng)音頻正被發(fā)送時(shí)。即,當(dāng)音頻流的前面部分還在接收端處播放出的同時(shí),相同的流的部分還正在發(fā)送端處被轉(zhuǎn)錄。這可以是因?yàn)閷?shí)時(shí)流是實(shí)況的并且因此不可能事先對(duì)實(shí)時(shí)流進(jìn)行轉(zhuǎn)錄(當(dāng)音頻流的當(dāng)前部分正在被轉(zhuǎn)錄時(shí),流中的要被轉(zhuǎn)錄的未來(lái)事件尚未發(fā)生),或者僅僅因?yàn)闆](méi)有足夠的時(shí)間,或者事先轉(zhuǎn)錄不具有時(shí)效性(例如,事先轉(zhuǎn)錄要求準(zhǔn)備、存儲(chǔ)、取回轉(zhuǎn)錄并且然后將轉(zhuǎn)錄與播放同步)。
例如,在單向電視廣播的情況中,可以由技術(shù)熟練的人類速記員使用專用的速記員鍵盤(速記打字機(jī)機(jī)器)實(shí)時(shí)地執(zhí)行轉(zhuǎn)錄。僅有一小段延遲則可以將經(jīng)轉(zhuǎn)錄的文本包括在廣播中以伴隨經(jīng)轉(zhuǎn)錄的文本從其轉(zhuǎn)錄的相對(duì)應(yīng)的音頻。
在VoIP呼叫的情況中,已知在VoIP服務(wù)器處包括話音識(shí)別算法。當(dāng)發(fā)送用戶說(shuō)話以使得將音頻語(yǔ)音信號(hào)經(jīng)由服務(wù)器發(fā)送至發(fā)送端時(shí),算法自動(dòng)地對(duì)語(yǔ)音進(jìn)行轉(zhuǎn)錄,并且將此包括在發(fā)送至接收端的消息中。作為另一示例,用戶可以使用話音識(shí)別軟件來(lái)聽(tīng)寫(xiě)書(shū)面筆記并且然后將筆記附于諸如電子郵件或IM(即時(shí)消息)聊天消息之類的非音頻通信中。
發(fā)明內(nèi)容
然而,當(dāng)初始轉(zhuǎn)錄不是非常好或者至少不是口頭內(nèi)容的可接受的表示時(shí)則會(huì)出現(xiàn)問(wèn)題,但是在通信的時(shí)間尺度上快速地校正轉(zhuǎn)錄并不容易。甚至本身不是實(shí)況或?qū)崟r(shí)的通信會(huì)話仍可能是快節(jié)奏的。例如,考慮如下的視頻消息傳送會(huì)話,其中用戶非常類似IM消息地交換短視頻片段。如果發(fā)送(近端)客戶端應(yīng)用自動(dòng)地使用語(yǔ)音識(shí)別算法來(lái)包括對(duì)視頻消息中的語(yǔ)音的文本轉(zhuǎn)錄,則算法很可能偶爾產(chǎn)生錯(cuò)誤(因?yàn)檫@樣的算法不是完美的,和/或因?yàn)橛脩艨赡苷f(shuō)得不清晰,和/或因?yàn)椴东@的音頻可能質(zhì)量差)。發(fā)送(近端)用戶可以看到轉(zhuǎn)錄是錯(cuò)誤的,但是他或她會(huì)花費(fèi)相對(duì)長(zhǎng)的時(shí)間來(lái)校正轉(zhuǎn)錄,例如,想象用戶不得不使用鼠標(biāo)來(lái)突出顯示不正確的部分然后使用鍵盤重新打字。到這時(shí),預(yù)期的接收者(遠(yuǎn)端用戶)可能已進(jìn)行到新的話題,或者在對(duì)近端用戶要發(fā)送的消息不知情的情況下發(fā)送另一消息。
速記員鍵盤允許快速編輯,但是除大多數(shù)用戶不具有所要求的技能的事實(shí)之外,將這樣的設(shè)備包括在諸如智能電話或平板之類的正常的每天通用的(并且經(jīng)常是移動(dòng)的)用戶終端中是不實(shí)際的。大多數(shù)正常的用戶終端確實(shí)包括機(jī)械或者虛擬的QUERTYUIOP鍵盤,但是這對(duì)于嘗試執(zhí)行快節(jié)奏的、即時(shí)編輯是繁瑣的方法。因此,現(xiàn)有的文本編輯方法不適合諸如視頻消息傳送應(yīng)用、IM應(yīng)用或者甚至實(shí)況話音或視頻呼叫應(yīng)用之類的相對(duì)快節(jié)奏的會(huì)話。
為了解決這些和/或其它問(wèn)題,根據(jù)本文中公開(kāi)的一個(gè)方面,提供了包括以下特征的諸如智能電話或者平板之類的用戶終端。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680053989.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 通信裝置、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信方法、通信電路、通信系統(tǒng)
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信終端、通信系統(tǒng)、通信方法以及通信程序
- 通信終端、通信方法、通信裝備和通信系統(tǒng)
- 通信裝置、通信程序、通信方法以及通信系統(tǒng)
- 通信裝置、通信系統(tǒng)、通信方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 磁轉(zhuǎn)錄方法及磁轉(zhuǎn)錄裝置
- 媒體轉(zhuǎn)錄控制方法及使用上述方法的嵌入式系統(tǒng)
- 使用轉(zhuǎn)錄門戶組件隨需轉(zhuǎn)錄語(yǔ)音的方法和系統(tǒng)
- 應(yīng)用順式作用核酶對(duì)轉(zhuǎn)錄進(jìn)行調(diào)節(jié)
- 用于基因治療的載體
- 簡(jiǎn)化聽(tīng)寫(xiě)式語(yǔ)音文本系統(tǒng)的轉(zhuǎn)錄的復(fù)制粘貼的方法和系統(tǒng)
- 一種RNA反轉(zhuǎn)錄擴(kuò)增方法
- 基于人工智能的跨語(yǔ)種語(yǔ)音轉(zhuǎn)錄方法、設(shè)備及可讀介質(zhì)
- 一種mRNA的制備方法及其在腫瘤治療中的應(yīng)用
- 前列腺癌細(xì)胞LNCaP的FASN基因長(zhǎng)短不同轉(zhuǎn)錄本的獲取及定量方法





