[發明專利]一種知識圖譜構建方法及系統在審
| 申請號: | 202110179910.0 | 申請日: | 2021-02-07 |
| 公開(公告)號: | CN112966493A | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 段怡;李健;梁照宇;張屹;劉念;黃律 | 申請(專利權)人: | 重慶惠統智慧科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/30;G06Q50/20;G10L15/26 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 401120 重慶市*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 圖譜 構建 方法 系統 | ||
本申請涉及一種知識圖譜構建方法及系統,方法包括響應于獲取到的音頻流或者視頻流,將音頻流或者視頻流轉化為語句;對語句的組成進行分解,分解的內容包括定語、主語、狀語、謂語、賓語和補語;根據分解結果,解析語句的含義并定位其中的識別信息,識別信息的數量為多個,識別信息包括主語和/或賓語;解析語句的含義并定位其中的關聯信息,關聯信息包括定語、狀語、謂語和補語;根據關聯信息建立各識別信息之間的連接關系以及根據識別信息及各識別信息之間的連接關系建立知識圖譜;其中,對于相同的識別信息,進行合并處理。本申請可以對視頻或者錄音的內容進行梳理,將其重點內容和各部分之間的聯系以圖譜的形式體現出來。
技術領域
本申請涉及數據處理技術領域,尤其是涉及一種知識圖譜構建方法及系統。
背景技術
老師在講課過程中,可以對講課內容進行錄音或者錄像,方便學生進行課下再學習,但是這些音頻或者視頻缺乏整體性的概括,無法體現講課的重點內容和各部分之間的聯系。
發明內容
本申請提供一種知識圖譜構建方法及系統,可以對視頻或者錄音的內容進行梳理,將其重點內容和各部分之間的聯系以圖譜的形式體現出來。
第一方面,本申請提供了一種知識圖譜構建方法,包括:
響應于獲取到的音頻流或者視頻流,將音頻流或者視頻流轉化為語句;
對語句的組成進行分解,分解的內容包括定語、主語、狀語、謂語、賓語和補語;
根據分解結果,解析語句的含義并定位其中的識別信息,識別信息的數量為多個,識別信息包括主語和/或賓語;
解析語句的含義并定位其中的關聯信息,關聯信息包括定語、狀語、謂語和補語;
根據關聯信息建立各識別信息之間的連接關系;以及
根據識別信息及各識別信息之間的連接關系建立知識圖譜;
其中,對于相同的識別信息,進行合并處理。
通過采用上述技術方案,可以將音頻或者視頻的主要內容及各部分之間的聯系篩選出來,并以知識圖譜的方式體現出來,通過這個知識圖譜,可以快速了解音頻或者視頻的組成,方便學生進行針對性的復習,也方便老師進行總結。
在第一方面的一種可能的實現方式中,所述音頻流或者視頻流的數量為多個;
對于出現在不同的音頻流或者視頻流中的相同的識別信息,進行合并處理。
通過采用上述技術方案,可以將多個音頻流或者視頻流進行整理,方便學生進行針對性的復習,也方便老師進行總結。
在第一方面的一種可能的實現方式中,所述連接關系包括平行關系和層級關系,在平行關系中,識別信息間不存在直接的連接關系,在層級關系中,識別信息間存在直接的連接關系。
通過采用上述技術方案,限制了連接關系的種類,能夠使知識圖譜的組成更加簡潔。
在第一方面的一種可能的實現方式中,還包括:
對獲取到的音頻流或者視頻流進行編號;
記錄每個識別信息的地址,地址包括該識別信息出現的音頻流或者視頻流的編號及其在音頻流或者視頻流中出現的時間;以及
將地址關聯到知識圖譜中與之對應的識別信息上。
通過采用上述技術方案,可以通過識別信息找到對應的音頻流或者視頻流,方便用戶進行快速定位。
第二方面,本申請提供了一種知識圖譜構建裝置,包括:
第一處理單元,用于響應于獲取到的音頻流或者視頻流,將音頻流或者視頻流轉化為語句;
第二處理單元,用于對語句的組成進行分解,分解的內容包括定語、主語、狀語、謂語、賓語和補語;
第一解析單元,用于根據分解結果,解析語句的含義并定位其中的識別信息,識別信息的數量為多個,識別信息包括主語和/或賓語;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶惠統智慧科技有限公司,未經重慶惠統智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110179910.0/2.html,轉載請聲明來源鉆瓜專利網。





