[發明專利]一種基于主題生成模型的會議紀要生成方法在審
| 申請號: | 202111423932.3 | 申請日: | 2021-11-26 |
| 公開(公告)號: | CN114254103A | 公開(公告)日: | 2022-03-29 |
| 發明(設計)人: | 賴蔚蔚;吳廣財;鄭穎龍;周昉昉;葉杭;陳穎璇;鄭杰生;李凱;黃愷彤;馮志鵬;吳穹;張樂然;黃宏恩 | 申請(專利權)人: | 廣東電力信息科技有限公司 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F40/289;G06F40/216 |
| 代理公司: | 深圳市智圈知識產權代理事務所(普通合伙) 44351 | 代理人: | 林炮勤 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主題 生成 模型 會議紀要 方法 | ||
1.一種基于主題生成模型的會議紀要生成方法,其特征在于,包括:
獲取待處理的發言文本;
將所述發言文本劃分為多個字節片段;
獲取每個所述字節片段在所述發言文本內的出現頻率;
基于多個所述字節片段序列的出現頻率得到多個關鍵字節片段;
基于多個所述關鍵字節片段獲取所述發言文本對應的會議紀要。
2.根據權利要求1所述的方法,其特征在于,所述將所述發言文本劃分為多個字節片段,包括:
通過n元模型將所述發言文本按照字節進行大小為n的滑動窗口操作,得到長度為n的多個字節片段。
3.根據權利要求1所述的方法,其特征在于,所述基于多個所述字節片段序列的出現頻率得到多個關鍵字節片段,包括:
從多個所述字節片段序列中,查找出現頻率大于預設閾值的字節片段,以得到多個關鍵字節片段。
4.根據權利要求1所述的方法,其特征在于,所述基于多個所述關鍵字節片段獲取所述發言文本對應的會議紀要,包括:
將多個所述關鍵字節片段輸入預先建立的神經主題模型,得到多個主題,以及每個所述主題對應的關鍵字節片段,所述神經主題模型預先基于被標記有主題標簽的文本樣本訓練得到;
基于每個所述主題以及每個所述主題對應的關鍵字節片段,得到所述發言文本對應的會議紀要。
5.根據權利要求4所述的方法,其特征在于,所述神經主題模型為多層次神經主題模型,所述主題包括M級主題,M為大于或等于1的整數,所述將多個所述關鍵字節片段輸入預先建立的神經主題模型,得到多個主題,以及每個所述主題對應的關鍵字節片段,包括:
將多個所述關鍵字節片段輸入所述多層次神經主題模型,得到每一級主題,以后最后一級主題對應的關鍵字節片段。
6.根據權利要求4所述的方法,其特征在于,所述基于每個所述主題以及每個所述主題對應的關鍵字節片段,得到所述發言文本對應的會議紀要,包括:
統計每個所述主題中所包含的所述關鍵字節片段出現的頻率,獲得所述關鍵詞片段的權重;
基于每個所述主題、每個所述主題對應的關鍵字節片段以及所述關鍵詞片段的權重,獲得會議紀要。
7.根據權利要求1所述的方法,其特征在于,所述獲取待處理的發言文本,包括:
識別用戶的所述發言語音文本獲取初始的發言文本;
對所述初始的發言文本預處理,得到待處理的發言文本,所述預處理包括去除無意義的符號空格、去除分詞以及去除停頓用詞的至少一種。
8.根據權利要求1所述的方法,其特征在于,所述將所述發言文本劃分為多個字節片段,包括:
將所述發言文本分詞,得到多個詞組;
由多個詞組中確定一個詞組作為目標詞組,基于該目標詞組選擇與該目標詞組連續的n-1個詞組,n為大于1的正整數;
將所述目標詞組與所述n-1個詞組組成一個n元詞組,所述n元詞組與所述目標詞組對應,所述n元詞組為所述字節片段;
由多個詞組中確定新的目標詞組,并返回執行獲取新的目標詞組對應的n元詞組的操作,直至確定每個詞組對應的n元詞組。
9.根據權利要求8所述的方法,其特征在于,多個詞組構成詞組序列,該詞組序列內的多個詞組的排序與各個詞組在發言文本內的排序相同,所述基于該目標詞組選擇與該目標詞組連續的n-1個詞組,包括:
基于所述詞組序列,選擇該目標詞組之后的連續n-1個詞組,作為與該目標詞組連續的n-1個詞組。
10.根據權利要求1所述的方法,其特征在于,所述基于多個所述關鍵字節片段獲取所述發言文本對應的會議紀要,包括:
將所有的關鍵字節片段按照語句的詞語構成規律,構成完整的語句,以得到會議紀要。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電力信息科技有限公司,未經廣東電力信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111423932.3/1.html,轉載請聲明來源鉆瓜專利網。





