[發明專利]一種數據處理方法及系統在審

申請號：	201810001123.5	申請日：	2018-01-02
公開（公告）號：	CN108231064A	公開（公告）日：	2018-06-29
發明（設計）人：	許博涵	申請（專利權）人：	聯想（北京）有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/26
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	古利蘭;王寶筠
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音數據文本數據數據處理數據處理系統場景人工智能文本轉換用戶體驗預設規則采集學習記錄
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種數據處理方法，方法包括：采集多人談話場景中的語音數據，對語音數據進行文本轉換，生成與語音數據對應的文本數據，基于預設規則對文本數據進行學習，生成與語音數據對應的第一紀要內容。本發明通過采用人工智能等技術對談話場景中的語音數據進行自主學習，有效提高了記錄紀要內容的準確性以及效率，進而提升了用戶體驗。本發明還公開了一種數據處理系統。

技術領域

本發明涉及電子技術領域，尤其涉及一種數據處理方法及系統。

背景技術

在各個行業都會出現召開會議的情況，尤其在某些行業或企業召開會議相當頻繁，在每次召開會議時需要針對每個會議記錄完整的會議紀要。

目前，在記錄會議紀要時，主要采用人工手動記錄的方式。現有的人工手動記錄的方式，容易受記錄人員知識、經驗以及表達風格差異的影響，導致對會議觀點理解的不同，從而造成會議紀要記錄的誤差。并且，由于采用人工手動記錄的方式，記錄效率較低。

因此，如何提高紀要記錄的準確性以及記錄效率是一項亟待解決的問題。

發明內容

有鑒于此，本發明提供一種數據處理方法，能夠在多人談話場景中記錄紀要時，有效的提高記錄的準確性和效率。

本發明提供了一種數據處理方法，其特征在于，所述方法包括：

采集多人談話場景中的語音數據；

對所述語音數據進行文本轉換，生成與所述語音數據對應的文本數據；

基于預設規則對所述文本數據進行學習，生成與所述語音數據對應的第一紀要內容。

優選地，所述基于預設規則對所述文本數據進行學習，生成與所述語音數據對應的第一紀要內容，包括：

基于所述預設規則，在所述文本數據中挑選若干重要的要素，按照預定格式填入對應的文檔，構建生成所述第一紀要內容；

或者

識別所述文本數據的涵義，基于所述預設規則，產生與所述文本數據相關聯的第一新要素，構建生成所述第一紀要內容。

優選地，所述對所述語音數據進行文本轉換，生成與所述語音數據對應的文本數據包括：

根據多人語音數據中各發言人的語音音頻特征，識別不同發言人及其對應的語音數據，生成與不同發言人的語音數據對應的文本數據。

優選地，所述對所述語音數據進行文本轉換，生成與所述語音數據對應的文本數據還包括：

根據所述語音數據中發言人的語音音頻特性，確定與文本數據關聯的第一新要素，用于理解所述文本數據或用于在所述文本數據的基礎上增補。

優選地，所述方法，其特征在于，還包括：

發送所述第一紀要內容至若干發言人的/或與發言人關聯的文件接收系統。

優選地，所述方法還包括：

編輯接收到的所述第一紀要內容，生成第二紀要內容；

反饋所述第二紀要內容至分類器；

在所述分類器中，基于所述第二紀要內容訓練改進預設規則。

一種數據處理系統，包括：

存儲器，用于存儲應用程序與應用程序運行所產生的數據；

采集裝置，用于采集多人談話場景中的語音數據；

處理器，用于運行所述應用程序以對所述語音數據進行文本轉換，生成與所述語音數據對應的文本數據；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于聯想（北京）有限公司，未經聯想（北京）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810001123.5/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】