[發(fā)明專利]一種面向金融知識(shí)圖譜發(fā)現(xiàn)的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810897485.7 | 申請(qǐng)日: | 2018-08-08 |
| 公開(公告)號(hào): | CN109241199B | 公開(公告)日: | 2022-09-23 |
| 發(fā)明(設(shè)計(jì))人: | 龍世增;蔡瑞初;畢輝;李楠 | 申請(qǐng)(專利權(quán))人: | 上海旭榮網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | G06F16/28 | 分類號(hào): | G06F16/28;G06F16/36;G06F40/242;G06F40/284 |
| 代理公司: | 上海領(lǐng)譽(yù)知識(shí)產(chǎn)權(quán)代理有限公司 31383 | 代理人: | 車超平 |
| 地址: | 201899 上海市嘉定區(qū)*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 金融 知識(shí) 圖譜 發(fā)現(xiàn) 方法 | ||
本發(fā)明公布了一種面向金融知識(shí)圖譜的分析方法。面向金融知識(shí)圖譜的分析系統(tǒng)包括:文本預(yù)處理模塊、協(xié)方差模塊、深度學(xué)習(xí)模塊、關(guān)系矩陣模塊、Deep?Lasso模塊、用戶反饋模塊、系統(tǒng)管理模塊。用戶可以通過該系統(tǒng)存儲(chǔ)和管理各種金融領(lǐng)域的訓(xùn)練樣本,并對(duì)之進(jìn)行分句、分詞、詞性標(biāo)注和句法分析等處理。用戶還可以添加自定義實(shí)體對(duì)處理好的文本信息進(jìn)行特征抽取和向量化,然后用訓(xùn)練的模型計(jì)算文本中實(shí)體的相關(guān)關(guān)系,進(jìn)而用于金融知識(shí)圖譜發(fā)現(xiàn),以及對(duì)系統(tǒng)的實(shí)體預(yù)測(cè)結(jié)果進(jìn)行反饋,并傳遞給管理員進(jìn)行審核,進(jìn)一步提高知識(shí)圖譜的可靠性。
技術(shù)領(lǐng)域
本發(fā)明屬于網(wǎng)絡(luò)信息處理技術(shù)領(lǐng)域,具體涉及一種面向金融知識(shí)圖譜發(fā)現(xiàn)的方法。
背景技術(shù)
在人工智能興起的大背景下,知識(shí)圖譜作為一種全面的表達(dá)方式已經(jīng)得到越來(lái)越多的關(guān)注,越來(lái)越多的研究者投入到了知識(shí)圖譜的研究中。
福爾摩斯說(shuō)過:“一個(gè)邏輯學(xué)家,不需要親眼見過,或聽過大西洋和尼亞加拉大瀑布,他從一滴水中就能推測(cè)出它們。知識(shí)圖譜就像福爾摩斯破案一樣,首先需要采集散布在各個(gè)角落的碎片化信息和數(shù)據(jù),然后把它按標(biāo)準(zhǔn)化思考方式整理,再將各個(gè)看似不相關(guān)但背后有著共同聯(lián)系的信息關(guān)聯(lián)起來(lái)挖掘背后的規(guī)律,據(jù)此做深入的推理。
2012年,Google率先在自己的搜索引擎中加入了知識(shí)圖譜,當(dāng)用戶查詢關(guān)鍵詞的時(shí)候,不僅能夠得到相關(guān)網(wǎng)頁(yè),還可以得到更多與查詢?cè)~相關(guān)的其他信息。從技術(shù)的角度來(lái)說(shuō),知識(shí)圖譜是一個(gè)由數(shù)據(jù)到信息再到知識(shí),最后轉(zhuǎn)化為智慧的過程。
知識(shí)圖譜技術(shù)包括以下三個(gè)方面的研究?jī)?nèi)容:
1.知識(shí)表示:研究客觀世界知識(shí)的建模,以方便機(jī)器識(shí)別和理解,既要考慮知識(shí)的表示與存儲(chǔ),又要考慮知識(shí)的使用和計(jì)算;
2.知識(shí)圖譜構(gòu)建:解決如何建立計(jì)算機(jī)算法從客觀世界或者互聯(lián)網(wǎng)的各種數(shù)據(jù)資源中獲取客觀世界的知識(shí),主要研究使用何種數(shù)據(jù)和方法抽取何種知識(shí);
3.知識(shí)圖譜應(yīng)用:主要研究如何利用知識(shí)圖譜建立基于知識(shí)的智能服務(wù)系統(tǒng),更好地解決實(shí)際應(yīng)用問題。
知識(shí)圖譜為互聯(lián)網(wǎng)上海量、異構(gòu)、動(dòng)態(tài)的大數(shù)據(jù)表達(dá)、組織、管理以及利用提供了一種更為有效的方式,使得網(wǎng)絡(luò)的智能化水平更高,更加接近于人類的認(rèn)知思維。在關(guān)注到知識(shí)圖譜在自然語(yǔ)言處理、人工智能等領(lǐng)域展現(xiàn)巨大潛力的同時(shí),也不難發(fā)現(xiàn)知識(shí)圖譜中的知識(shí)獲取、知識(shí)表示、知識(shí)推理等技術(shù)依然面臨著一些困難與挑戰(zhàn),很多重要的開放問題急待學(xué)術(shù)界與工業(yè)界協(xié)力來(lái)解決。知識(shí)圖譜的主要挑戰(zhàn)問題主要包括:1.知識(shí)的自動(dòng)獲取;2.多源知識(shí)的自動(dòng)融合;3.面向知識(shí)的表示學(xué)習(xí);4.知識(shí)推理與應(yīng)用等。在開放源的文本中,如何提取實(shí)體和實(shí)體之間的關(guān)系,一直是知識(shí)圖譜領(lǐng)域中一個(gè)比較棘手的問題。圍繞這方面研究主要是entity和relation extraction。雖然NLP領(lǐng)域也對(duì)這個(gè)問題研究了很多年,但是在開放信息源中的效果并不是很理想。在未來(lái)的幾年時(shí)間內(nèi),知識(shí)圖譜仍將是大數(shù)據(jù)智能的前沿研究問題。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明提出了一種面向金融知識(shí)圖譜的分析方法。本發(fā)明有效避免了Graph Lasso在關(guān)系抽取中過擬合的問題,能很好的應(yīng)對(duì)錯(cuò)分類和遺漏新關(guān)系的情況,且有效提高了在小樣本數(shù)據(jù)上的準(zhǔn)確性。
本發(fā)明面向金融知識(shí)圖譜的分析方法,其中面向金融知識(shí)圖譜的分析系統(tǒng)包括如下模塊:
文本預(yù)處理模塊,對(duì)輸入的文本進(jìn)行清洗,并進(jìn)行分詞、詞性標(biāo)注和停用詞處理等操作;預(yù)處理的數(shù)據(jù)要用作模型的輸入,因此去除冗余的數(shù)據(jù)是必要的,此外由于金融領(lǐng)域的特殊性,需要去除一些非領(lǐng)域內(nèi)的常用詞;
協(xié)方差模塊:抽取實(shí)體間與文本間從屬關(guān)系的協(xié)方差矩陣,從樣本數(shù)據(jù)庫(kù)中提取文本集,對(duì)每一篇文章,若實(shí)體出現(xiàn)在了文章中,則標(biāo)記為1,否則記為0,得到一個(gè)實(shí)體和文章間的共現(xiàn)矩陣,在此基礎(chǔ)上加入實(shí)體重要性后求出協(xié)方差矩陣;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海旭榮網(wǎng)絡(luò)科技有限公司,未經(jīng)上海旭榮網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810897485.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種金融服務(wù)系統(tǒng)、金融服務(wù)平臺(tái)及其方法
- 一種移動(dòng)終端搭載金融支付終端的方法及金融支付系統(tǒng)
- 一種基于微信小程序及金融開放平臺(tái)的金融能力輸出模式
- 金融產(chǎn)品推薦方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于三維坐標(biāo)定位的金融憑證智能存放系統(tǒng)及其裝置
- 基于云計(jì)算和區(qū)塊鏈的金融信息管理系統(tǒng)
- 基于數(shù)據(jù)倉(cāng)庫(kù)的金融數(shù)據(jù)自動(dòng)化測(cè)試與監(jiān)控系統(tǒng)
- 基于金融應(yīng)用的風(fēng)險(xiǎn)監(jiān)測(cè)方法及系統(tǒng)
- 金融數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 金融憑證智能存放裝置
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法





