[發明專利]一種數據處理方法及系統在審
| 申請號: | 201810001123.5 | 申請日: | 2018-01-02 |
| 公開(公告)號: | CN108231064A | 公開(公告)日: | 2018-06-29 |
| 發明(設計)人: | 許博涵 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/26 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 古利蘭;王寶筠 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音數據 文本數據 數據處理 數據處理系統 場景 人工智能 文本轉換 用戶體驗 預設規則 采集 學習 記錄 | ||
本發明公開了一種數據處理方法,方法包括:采集多人談話場景中的語音數據,對語音數據進行文本轉換,生成與語音數據對應的文本數據,基于預設規則對文本數據進行學習,生成與語音數據對應的第一紀要內容。本發明通過采用人工智能等技術對談話場景中的語音數據進行自主學習,有效提高了記錄紀要內容的準確性以及效率,進而提升了用戶體驗。本發明還公開了一種數據處理系統。
技術領域
本發明涉及電子技術領域,尤其涉及一種數據處理方法及系統。
背景技術
在各個行業都會出現召開會議的情況,尤其在某些行業或企業召開會議相當頻繁,在每次召開會議時需要針對每個會議記錄完整的會議紀要。
目前,在記錄會議紀要時,主要采用人工手動記錄的方式。現有的人工手動記錄的方式,容易受記錄人員知識、經驗以及表達風格差異的影響,導致對會議觀點理解的不同,從而造成會議紀要記錄的誤差。并且,由于采用人工手動記錄的方式,記錄效率較低。
因此,如何提高紀要記錄的準確性以及記錄效率是一項亟待解決的問題。
發明內容
有鑒于此,本發明提供一種數據處理方法,能夠在多人談話場景中記錄紀要時,有效的提高記錄的準確性和效率。
本發明提供了一種數據處理方法,其特征在于,所述方法包括:
采集多人談話場景中的語音數據;
對所述語音數據進行文本轉換,生成與所述語音數據對應的文本數據;
基于預設規則對所述文本數據進行學習,生成與所述語音數據對應的第一紀要內容。
優選地,所述基于預設規則對所述文本數據進行學習,生成與所述語音數據對應的第一紀要內容,包括:
基于所述預設規則,在所述文本數據中挑選若干重要的要素,按照預定格式填入對應的文檔,構建生成所述第一紀要內容;
或者
識別所述文本數據的涵義,基于所述預設規則,產生與所述文本數據相關聯的第一新要素,構建生成所述第一紀要內容。
優選地,所述對所述語音數據進行文本轉換,生成與所述語音數據對應的文本數據包括:
根據多人語音數據中各發言人的語音音頻特征,識別不同發言人及其對應的語音數據,生成與不同發言人的語音數據對應的文本數據。
優選地,所述對所述語音數據進行文本轉換,生成與所述語音數據對應的文本數據還包括:
根據所述語音數據中發言人的語音音頻特性,確定與文本數據關聯的第一新要素,用于理解所述文本數據或用于在所述文本數據的基礎上增補。
優選地,所述方法,其特征在于,還包括:
發送所述第一紀要內容至若干發言人的/或與發言人關聯的文件接收系統。
優選地,所述方法還包括:
編輯接收到的所述第一紀要內容,生成第二紀要內容;
反饋所述第二紀要內容至分類器;
在所述分類器中,基于所述第二紀要內容訓練改進預設規則。
一種數據處理系統,包括:
存儲器,用于存儲應用程序與應用程序運行所產生的數據;
采集裝置,用于采集多人談話場景中的語音數據;
處理器,用于運行所述應用程序以對所述語音數據進行文本轉換,生成與所述語音數據對應的文本數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810001123.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語音控制指令的識別方法及裝置
- 下一篇:多語者語音識別校正系統





