[發明專利]語音識別語言模型有效
| 申請號: | 201180052260.8 | 申請日: | 2011-08-09 |
| 公開(公告)號: | CN103262156A | 公開(公告)日: | 2013-08-21 |
| 發明(設計)人: | 阿舒拓史·A·馬勒高恩卡;甘努·薩蒂施·庫瑪;蓋德·K·M·喬爾特 | 申請(專利權)人: | 思科技術公司 |
| 主分類號: | G10L15/07 | 分類號: | G10L15/07;G10L15/183;H04M3/42;H04M3/56 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 李曉冬 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 語言 模型 | ||
1.一種方法,包括:
監視來自多個用戶的網絡流量,所述多個用戶包括第一用戶和第二用戶;
從所述網絡流量提取詞;
為所述多個用戶中的每個用戶構建個人詞表;以及
利用至少部分地基于所述第二用戶的個人詞表的語言模型,將所述第一用戶的音頻轉換成文本。
2.如權利要求1所述的方法,其中所述語言模型至少部分地基于所述第一用戶的個人詞表。
3.如權利要求1所述的方法,還包括:
識別所述第一用戶與所述第二用戶之間的聯系,其中所述語言模型是通過所述聯系來定義的。
4.如權利要求3所述的方法,其中所述聯系是根據觸發而建立的,所述觸發選自包括以下各項的組:從所述第一用戶向所述第二用戶發送的電子郵件、從所述第二用戶向所述第一用戶發送的電子郵件、列出所述第一用戶和所述第二用戶作為接收人的電子郵件、列出所述第一用戶和所述第二用戶中的一者作為接收人并且在電子郵件正文中列出所述第一用戶和所述第二用戶中的另一者的來自第三用戶的電子郵件、以及在電子郵件正文中列出所述第一用戶和所述第二用戶的電子郵件。
5.如權利要求3所述的方法,其中所述聯系是通過所述第一用戶與所述第二用戶之間在社交網絡服務中的互動來定義的。
6.如權利要求3所述的方法,其中所述聯系是通過所述第一用戶與所述第二用戶之間的互聯網協議語音(VoIP)電話通話來定義的。
7.如權利要求1所述的方法,其中所述第一用戶的音頻來源于上傳的視頻、電話會議或視頻會議。
8.如權利要求1所述的方法,還包括:
將所述文本保存在一可搜索的數據庫中。
9.如權利要求1所述的方法,還包括:
基于所述文本而發展一分眾分類法系統。
10.一種設備,包括:
收集器接口,被配置為監視來自包括第一用戶和第二用戶在內的多個用戶的網絡流量,并從所述網絡流量提取n元語法;
存儲器,被配置為存儲所述多個用戶中的每個用戶的個人詞表;以及
控制器,被配置為利用至少部分地基于所述第二用戶的個人詞表的語言模型,將所述第一用戶的音頻轉換成文本。
11.如權利要求10所述的設備,其中所述語言模型至少部分地基于所述第一用戶的個人詞表。
12.如權利要求10所述的設備,其中所述控制器被配置成識別所述第一用戶與所述第二用戶之間的聯系,其中所述語言模型由所述聯系定義。
13.如權利要求12所述的設備,其中所述聯系是根據觸發而建立的,所述觸發選自包括以下各項的組:從所述第一用戶向所述第二用戶發送的電子郵件、從所述第二用戶向所述第一用戶發送的電子郵件、列出所述第一用戶和所述第二用戶作為接收人的電子郵件、列出所述第一用戶和所述第二用戶中的一者作為接收人并且在電子郵件正文中列出所述第一用戶和所述第二用戶中的另一者的來自第三用戶的電子郵件、在電子郵件正文中列出所述第一用戶和所述第二用戶的電子郵件、在社交網絡服務中所述第一用戶與所述第二用戶之間的互動、以及所述第一用戶與所述第二用戶之間的互聯網協議語音(VoIP)電話通話。
14.如權利要求10所述的設備,其中所述第一用戶的音頻來源于上傳的視頻、電話會議或視頻會議。
15.如權利要求10所述的設備,還包括:
數據庫,被配置為以可搜索的格式存儲所述文本。
16.如權利要求10所述的設備,其中所述n元語法是具有n個詞、音節、音素或者音子的序列,其中n作為整數是可配置的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思科技術公司,未經思科技術公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201180052260.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種攝像肩扛支架
- 下一篇:搓面機構及具有該搓面機構的機器人





