[發明專利]基于會議記錄構建知識圖譜的方法、裝置及處理器在審
| 申請號: | 202011232612.5 | 申請日: | 2020-11-06 |
| 公開(公告)號: | CN112487197A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 黃躍峰;周陽;周志忠;霍斌 | 申請(專利權)人: | 中科云谷科技有限公司;中聯重科股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/289;G06F40/211;G06F40/253;G06F40/30;G06K9/62 |
| 代理公司: | 北京潤平知識產權代理有限公司 11283 | 代理人: | 肖冰濱;王曉曉 |
| 地址: | 201306 上海市浦東*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 會議記錄 構建 知識 圖譜 方法 裝置 處理器 | ||
1.一種基于會議記錄構建知識圖譜的方法,其特征在于,所述方法包括:
獲取會議記錄文本,所述會議記錄文本通過語音會議記錄轉換得到;
通過語言模型對所述會議記錄文本進行預處理,所述語言模型是根據預設專業領域的語料數據進行訓練得到的;
提取出預處理后的會議記錄文本中的實體及實體之間的關系;
根據所述實體及實體之間的關系建立對應的知識圖譜。
2.根據權利要求1所述的方法,其特征在于,所述通過語言模型對所述會議記錄文本進行預處理包括:
將所述會議記錄文本輸入至所述語言模型,通過所述語言模型確定所述會議記錄文本中包含的指代詞和主語;
對所述指代詞和所述主語進行分類,確定所述指代詞對應的替代主語;
將所述會議記錄文本中的指代詞替換為與所述替代主語,得到預處理后的會議記錄文本。
3.根據權利要求2所述的方法,其特征在于,所述對所述指代詞和所述主語進行分類,確定所述指代詞對應的替代主語包括:
確定每個指代詞對應的候選詞;
將所述候選詞轉換為特征向量;
確定每個特征向量對應的置信度;
將置信度最高的特征向量對應的候選詞作為所述指代詞對應的替代主語。
4.根據權利要求1所述的方法,其特征在于,所述提取出預處理后的會議記錄文本中的實體及實體之間的關系包括:
通過所述語言模型確定所述預處理后的會議記錄文本中的實體;
確定所述實體對應的專業領域;
根據所述專業領域確定所述實體對應的類別;
根據所述實體以及所述實體對應的類別確定所述實體及實體之間的關系。
5.根據權利要求1所述的方法,其特征在于,所述提取出預處理后的會議記錄文本中的實體及實體之間的關系包括:
提取出所述會議記錄文本中的動詞及動詞短語;
將所述動詞及所述動詞短語作為實體關系組的謂詞,并將所述動詞及所述動詞短語作為根節點遍歷與之相關的名詞短語;
根據預設的語言規則確定所述動詞和所述動詞短語以及所述名詞短語的關系。
6.根據權利要求1所述的方法,其特征在于,還包括:
在所述提取出預處理后的會議記錄文本中的實體及實體之間的關系之后,將任意確定相同的實體與實體之間的關系的兩組進行去重合并;
對確定為語義近似的兩組實體進行聚類;
根據進行聚類后的實體及實體之間的關系構建對應的知識圖譜。
7.根據權利要求1所述的方法,其特征在于,還包括:
在獲取會議記錄文本之后,獲取所述會議記錄文本對應的會議主題;
根據所述會議主題獲取相對應的專業詞匯包;
根據所述專業詞匯包對所述會議記錄文本中包含的專業詞匯進行糾正。
8.根據權利要求1所述的方法,其特征在于,還包括:
在所述根據所述實體及實體之間的關系建立對應的知識圖譜之后,將所述知識圖譜發送至關聯的顯示屏上進行展示。
9.一種處理器,其特征在于,所述處理器被配置成執行根據權利要求1至8中任一項所述的基于會議記錄構建知識圖譜的方法。
10.一種基于會議記錄構建知識圖譜的裝置,其特征在于,包括根據權利要求9所述的處理器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科云谷科技有限公司;中聯重科股份有限公司,未經中科云谷科技有限公司;中聯重科股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011232612.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電量顯示裝置和電子設備
- 下一篇:一種用于輥型設計的軋機裝置及其方法





