[發(fā)明專利]一種中文旅游領域知識圖譜構(gòu)建方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201611241944.3 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106777274B | 公開(公告)日: | 2018-05-29 |
| 發(fā)明(設計)人: | 張春霞;徐溥;彭飛;武嘉玉;王樹良 | 申請(專利權(quán))人: | 北京理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京理工正陽知識產(chǎn)權(quán)代理事務所(普通合伙) 11639 | 代理人: | 唐華 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 旅游領域 實體屬性 圖譜構(gòu)建 可信度 融合子 構(gòu)建 融合 知識庫 智能信息處理 多值屬性 模式匹配 搜索引擎 非固定 固定型 結(jié)構(gòu)化 算法 排序 圖譜 詞匯 學習 中文 應用 監(jiān)督 | ||
本發(fā)明涉及一種旅游領域知識圖譜的構(gòu)建方法及系統(tǒng),屬于Web挖掘和智能信息處理領域。旅游領域知識圖譜構(gòu)建任務包括實體屬性知識擴充子任務和實體屬性值融合子任務。本發(fā)明采用一種混合式的實體屬性知識擴充方法,集成了基于詞匯場、監(jiān)督學習、模式匹配,以及搜索引擎問答的實體屬性知識擴充算法。對于實體屬性值融合子任務,采用一種基于來源可信度的多值屬性的屬性值融合方法、一種基于內(nèi)容可信度的固定型單值屬性的屬性值融合方法,以及一種基于學習排序的非固定型單值屬性的屬性值融合方法。本發(fā)明構(gòu)建了結(jié)構(gòu)化的旅游領域?qū)嶓w知識庫,準確地表達了旅游領域?qū)嶓w的屬性和屬性值知識,提高了用戶獲取旅游領域知識的效率,具有廣闊的應用前景。
技術(shù)領域
本發(fā)明涉及Web挖掘和智能信息處理技術(shù)領域,涉及一種中文旅游領域知識圖譜構(gòu)建方法及系統(tǒng),本發(fā)明在信息檢索、信息推薦、自動問答等領域具有廣闊的應用前景。
背景技術(shù)
知識圖譜(Knowledge Graph)是利用可視化技術(shù)或結(jié)構(gòu)化方式來描述實體和實體關系知識,為搜索引擎用戶提供高質(zhì)量的知識檢索服務。知識圖譜是構(gòu)建下一代搜索引擎的雛形,使得搜索更加語義化和智能化。目前,通用知識圖譜包括谷歌的Knowledge Graph、微軟的Satori、百度的知心,以及搜狗的知立方等。
相對于通用知識圖譜,專業(yè)領域知識圖譜構(gòu)建研究較少。Lv Qingjie等在文獻《Research on domain knowledge graph based on the large scale online knowledgefragment》(IEEE Workshop on Advanced Research and Technology in IndustryApplications,2014)中,首先從在線百科網(wǎng)站和酒類垂直網(wǎng)站中獲取實體和關系,然后基于多維圖模型抽取實體關系,由此構(gòu)建了酒類專業(yè)領域知識圖譜。周藍珺在文獻《音樂領域中文實體關系抽取研究》(哈爾濱工業(yè)大學碩士學位論文2009)中,采用基于序列模式挖掘的方法、基于最大熵和支持向量機的方法從新浪網(wǎng)音樂領域網(wǎng)頁提取實體之間的關系。另外,Patrick Ernst等在文獻《KnowLife:a Knowledge Graph for Health and LifeSciences》(IEEE 30th International Conference on Data Engineering,2014)中,研發(fā)了健康和生命科學領域知識圖譜系統(tǒng)Knowlife,從專業(yè)醫(yī)學網(wǎng)站和科技文獻中抽取疾病、癥狀、病因、藥品和治療等關聯(lián)關系。
現(xiàn)有中文專業(yè)領域知識圖譜構(gòu)建方法主要存在如下問題:英文專業(yè)領域知識圖譜構(gòu)建方法不能完全適用于中文專業(yè)領域知識圖譜構(gòu)建;現(xiàn)有專業(yè)領域知識圖譜構(gòu)建方法難以兼顧獲取知識的規(guī)模和準確率,也難以融合從多種數(shù)據(jù)源中獲取的領域知識。
針對中文專業(yè)領域知識圖譜構(gòu)建方法存在的上述問題和中文旅游領域知識圖譜知識量較少的問題,為提供高效的中文旅游知識服務,迫切需要中文旅游領域圖譜構(gòu)建技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的是為了解決中文專業(yè)領域知識圖譜和中文旅游領域知識圖譜構(gòu)建中存在的上述問題提供一種中文旅游領域知識圖譜的構(gòu)建方法。中文旅游領域知識圖譜構(gòu)建任務包括旅游領域?qū)嶓w屬性知識擴充和旅游領域?qū)嶓w屬性值融合;實體屬性知識擴充任務是指提取實體的給定屬性的屬性值,實體屬性值融合任務是指融合通過多種方法或多種來源提取的實體同一屬性的屬性值。相應地,中文旅游領域知識圖譜的構(gòu)建方法包括一種混合式的實體屬性知識擴充方法和一種基于學習排序的實體屬性值融合方法。
本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的。
一種旅游領域知識圖譜的構(gòu)建方法,包括如下步驟:
步驟1,獲取旅游領域知識圖譜構(gòu)建的語料
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京理工大學,未經(jīng)北京理工大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611241944.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種地圖圍欄匹配方法
- 下一篇:基于多粒度語義塊的實體屬性和屬性值提取方法
- 一種面向法律領域的動態(tài)法律事件圖譜構(gòu)建方法
- 一種基于深度學習技術(shù)的知識圖譜自適應構(gòu)建方法
- 多模態(tài)知識圖譜構(gòu)建方法、裝置、服務器以及存儲介質(zhì)
- 醫(yī)學知識圖譜構(gòu)建方法及裝置、存儲介質(zhì)和電子設備
- 知識圖譜的構(gòu)建方法及裝置
- 針對特定醫(yī)療領域的知識圖譜構(gòu)建方法及裝置
- 知識圖譜構(gòu)建方法、裝置、網(wǎng)絡設備及存儲介質(zhì)
- 知識圖譜的構(gòu)建方法、裝置、可讀存儲介質(zhì)及電子設備
- 一種面向特定疾病領域的醫(yī)療健康知識圖譜系統(tǒng)
- 知識圖譜構(gòu)建方法及裝置、計算機設備和存儲介質(zhì)





