[發明專利]一種基于知識圖譜的電影問答查詢系統及其方法在審
| 申請號: | 202011149477.8 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112199487A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 李波;柴劍平;王琛;張文靜;胡莘靈 | 申請(專利權)人: | 中國傳媒大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/338;G06F16/36;G06F16/951;G06F40/279;G06N3/04 |
| 代理公司: | 北京慕達星云知識產權代理事務所(特殊普通合伙) 11465 | 代理人: | 符繼超 |
| 地址: | 100000 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 電影 問答 查詢 系統 及其 方法 | ||
1.一種基于知識圖譜的電影問答查詢系統,其特征在于,包括:知識圖譜構建模塊、文本輸入模塊、意圖解析模塊、電影查詢模塊和結果展示模塊;
所述知識圖譜構建模塊,用于根據電影文本數據獲取相應的電影知識圖譜;
所述文本輸入模塊,用于實現查詢文本的輸入,并將所獲取到的所述查詢文本發送至所述意圖解析模塊;
所述意圖解析模塊,用于接收所述查詢文本,并通過基于增強卷積神經網絡的意圖識別模型對所述查詢文本進行解析,獲取解析結果,并將所述解析結果發送至所述電影查詢模塊;
所述電影查詢模塊,用于根據所述解析結果和所述電影知識圖譜進行相關電影查詢,獲取電影查詢結果并發送至所述結果展示模塊;
所述結果展示模塊,用于對所述電影查詢結果進行顯示。
2.根據權利要求1所述的一種基于知識圖譜的電影問答查詢系統,其特征在于,所述知識圖譜構建模塊包括電影本體庫、電影文本數據爬取單元、電影文本數據融合單元和電影文本數據存儲單元;
所述電影本體庫,用于構建基本框架,明確電影本體的類別、屬性和關系;
所述電影文本數據爬取單元,用于在網頁上對電影文本數據進行爬取,并傳遞至電影文本數據融合單元;
所述電影文本數據融合單元,用于從所述電影文本數據爬取單元所獲取到的電影文本數據的網站來源中選取一個作為對齊標準,將其他網站獲取的電影文本數據與對齊標準所對應的電影文本數據進行實體對齊,完成數據融合;
所述電影文本數據存儲單元,用于將融合后的數據導入電影本體庫中進行存儲,生成電影知識圖譜。
3.根據權利要求2所述的一種基于知識圖譜的電影問答查詢系統,其特征在于,所述知識圖譜構建模塊還包括電影文本數據預處理單元,所述電影文本數據預處理單元將所述電影文本數據爬取單元所爬取到的電影文本數據進行預處理。
4.根據權利要求1所述的一種基于知識圖譜的電影問答查詢系統,其特征在于,所述意圖解析模塊包括字典樹構建單元、基于增強卷積神經網絡的意圖識別模型、信息匹配單元和信息融合單元;
所述字典樹構建單元,用于將知識圖譜中的實體、屬性以及收集到的電影專業用詞構造成字典樹;
所述信息匹配單元,用于通過意圖識別模型,將查詢文本中的字與所述字典樹中的電影專業用詞進行匹配,將匹配到的電影專業用詞作為詞信息序列;
所述信息融合單元,用于融合匹配到的所有電影專業用詞,形成解析結果。
5.根據權利要求1所述的一種基于知識圖譜的電影問答查詢系統,其特征在于,還包括系統測試優化模塊,用于對系統的功能、性能和兼容性進行測試和優化。
6.一種基于知識圖譜的電影問答查詢方法,其特征在于,包括以下步驟:
S1.獲取用戶輸入的查詢文本;
S2.采用基于增強卷積神經網絡的意圖識別模型對所述查詢文本進行解析,獲取解析結果;
S3.根據所述解析結果和預先構建的電影知識圖譜進行相關電影查詢,獲取電影查詢結果;
S4.對所述電影查詢結果進行顯示。
7.根據權利要求6所述的一種基于知識圖譜的電影問答查詢方法,其特征在于,S3中構建電影知識圖譜的具體步驟為:
(1)構建電影本體庫作為基本框架,明確電影本體的類別、屬性和關系;
(2)在網頁上對電影文本數據進行爬取;
(3)從所獲取到的電影文本數據的網站來源中選取一個作為對齊標準,將其他網站獲取的電影文本數據與對齊標準所對應的電影文本數據進行實體對齊,完成數據融合;
(4)將融合后的數據導入電影本體庫中進行存儲,生成電影知識圖譜。
8.根據權利要求7所述的一種基于知識圖譜的電影問答查詢方法,其特征在于,步驟(2)中還包括將所爬取到的電影文本數據進行預處理,其中,對電影文本數據中的半結構化數據和非結構化數據進行分詞處理和詞性標注,采用情感詞典的方法進行情感分析,準備情感詞典和否定詞詞庫,實現電影文本數據的預處理。
9.根據權利要求6所述的一種基于知識圖譜的電影問答查詢方法,其特征在于,S2的具體內容包括:
S21.將知識圖譜中的實體、屬性以及收集到的電影專業用詞構造成字典樹;
S22.通過意圖識別模型,將查詢文本中的字與所述字典樹中的電影專業用詞進行匹配,將匹配到的電影專業用詞作為詞信息序列;
S23.融合匹配到的所有電影專業用詞,形成解析結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國傳媒大學,未經中國傳媒大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011149477.8/1.html,轉載請聲明來源鉆瓜專利網。





