[發(fā)明專利]基于股票評(píng)論數(shù)據(jù)的數(shù)據(jù)挖掘方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201810942719.5 | 申請(qǐng)日: | 2018-08-17 |
| 公開(kāi)(公告)號(hào): | CN109300031A | 公開(kāi)(公告)日: | 2019-02-01 |
| 發(fā)明(設(shè)計(jì))人: | 王浩;張晨;龐旭林;杜長(zhǎng)營(yíng);楊康 | 申請(qǐng)(專利權(quán))人: | 北京奇虎科技有限公司 |
| 主分類號(hào): | G06Q40/04 | 分類號(hào): | G06Q40/04;G06F16/2458;G06F16/28;G06K9/62 |
| 代理公司: | 北京市隆安律師事務(wù)所 11323 | 代理人: | 權(quán)鮮枝;何立春 |
| 地址: | 100088 北京市西城區(qū)新*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 股票 評(píng)論數(shù)據(jù) 方法和裝置 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘技術(shù) 可靠性度量 異構(gòu)信息源 時(shí)序 多源異構(gòu) 分布信息 股票價(jià)格 股評(píng)文本 關(guān)鍵特征 海量信息 極性分布 歷史行為 市場(chǎng)走勢(shì) 挖掘 大數(shù)據(jù) 精選 融合 幫助 分析 | ||
本發(fā)明公開(kāi)了一種基于股票評(píng)論數(shù)據(jù)的數(shù)據(jù)挖掘方法和裝置,該方法包括:獲取股票評(píng)論數(shù)據(jù);其中,一條股票評(píng)論數(shù)據(jù)是指單個(gè)股票評(píng)論員對(duì)單個(gè)股票的單次評(píng)論數(shù)據(jù);基于所獲取的股票評(píng)論數(shù)據(jù),挖掘股票評(píng)論員的觀點(diǎn)極性分布信息;以及,基于所獲取的股票評(píng)論數(shù)據(jù),挖掘股票評(píng)論員的觀點(diǎn)可靠性分布信息。本發(fā)明融合了多種異構(gòu)信息源,例如股票價(jià)格時(shí)序、股評(píng)文本內(nèi)容以及發(fā)表股評(píng)的股票評(píng)論員的歷史行為,基于該多源異構(gòu)大數(shù)據(jù),借助數(shù)據(jù)挖掘技術(shù)深入分析并提取關(guān)鍵特征,利用這些特征進(jìn)行股評(píng)可靠性度量,從而從海量信息中精選出優(yōu)質(zhì)股票,能夠幫助投資者更加準(zhǔn)確地理解市場(chǎng)走勢(shì)以及股票動(dòng)態(tài),供投資者或股市分析員使用。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能和大數(shù)據(jù)領(lǐng)域,具體涉及一種基于股票評(píng)論數(shù)據(jù)的數(shù)據(jù)挖掘方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
投資者通常會(huì)利用搜索引擎尋找相關(guān)價(jià)值信息幫助其最終決策,而這些決策過(guò)程大部分是依靠人的分析判斷以及經(jīng)驗(yàn)。事實(shí)上,互聯(lián)網(wǎng)中的股票評(píng)論數(shù)據(jù)包含了豐富且有價(jià)值的語(yǔ)義信息,能夠幫助投資者理解市場(chǎng)走勢(shì)以及股票動(dòng)態(tài)。已有的股評(píng)分析方法通常僅僅聚焦在捕獲股評(píng)的情感極性,從而理解股評(píng)對(duì)于市場(chǎng)走勢(shì)的宏觀作用。然而,互聯(lián)網(wǎng)中的股評(píng)往往包含了大量的噪聲,如水軍以及個(gè)人主觀傾向從眾心理等,從而嚴(yán)重地影響投資者的判斷。因此利用人工智能技術(shù)對(duì)股評(píng)信息進(jìn)行細(xì)粒度權(quán)威性分析,進(jìn)而自動(dòng)地為股民和股票分析師從海量信息中精選優(yōu)質(zhì)股票是非常有意義的。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的基于股票評(píng)論數(shù)據(jù)的數(shù)據(jù)挖掘方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
依據(jù)本發(fā)明的一個(gè)方面,提供了一種基于股票評(píng)論數(shù)據(jù)的數(shù)據(jù)挖掘方法,該方法包括:
獲取股票評(píng)論數(shù)據(jù);其中,一條股票評(píng)論數(shù)據(jù)是指單個(gè)股票評(píng)論員對(duì)單個(gè)股票的單次評(píng)論數(shù)據(jù);
基于所獲取的股票評(píng)論數(shù)據(jù),挖掘股票評(píng)論員的觀點(diǎn)極性分布信息;
以及,基于所獲取的股票評(píng)論數(shù)據(jù),挖掘股票評(píng)論員的觀點(diǎn)可靠性分布信息。
可選地,該方法在獲取股票評(píng)論數(shù)據(jù)的步驟之后還包括股票評(píng)論數(shù)據(jù)清洗的步驟,具體包括:
刪除觀點(diǎn)極性為中立的股票評(píng)論數(shù)據(jù);
和/或,
刪除長(zhǎng)度小于預(yù)設(shè)閾值的股票評(píng)論序列所對(duì)應(yīng)的股票評(píng)論數(shù)據(jù);其中,股票評(píng)論序列是指同一評(píng)論員在不同時(shí)間對(duì)同一股票進(jìn)行評(píng)論的股票評(píng)論數(shù)據(jù)的組合。
可選地,一條股票評(píng)論數(shù)據(jù)包括:
股票評(píng)論員標(biāo)識(shí)、評(píng)論時(shí)間、目標(biāo)股票、包含觀點(diǎn)極性的內(nèi)容。
可選地,所述基于所獲取的股票評(píng)論數(shù)據(jù),挖掘股票評(píng)論員的觀點(diǎn)極性分布信息包括如下中的一種或多種:
基于所獲取的股票評(píng)論數(shù)據(jù)中的同一股票評(píng)論員針對(duì)同一股票的所有歷史股票評(píng)論數(shù)據(jù),確定該股票評(píng)論員針對(duì)該股票發(fā)布看漲的股票評(píng)論數(shù)據(jù)的概率,以及確定該股票評(píng)論員針對(duì)該股票發(fā)布看跌的股票評(píng)論數(shù)據(jù)的概率;
基于所獲取的股票評(píng)論數(shù)據(jù)中的同一股票評(píng)論員針對(duì)不同股票的所有歷史股票評(píng)論數(shù)據(jù),確定該股票評(píng)論員發(fā)布看漲的股票評(píng)論數(shù)據(jù)的概率,以及確定該股票評(píng)論員發(fā)布看跌的股票評(píng)論數(shù)據(jù)的概率;
基于所獲取的股票評(píng)論數(shù)據(jù)中的不同股票評(píng)論員針對(duì)同一股票的所有歷史股票評(píng)論數(shù)據(jù),確定股票評(píng)論員針對(duì)該股票發(fā)布看漲的股票評(píng)論數(shù)據(jù)的概率,以及確定股票評(píng)論員針對(duì)該股票發(fā)布看跌的股票評(píng)論數(shù)據(jù)的概率;
基于所獲取的股票評(píng)論數(shù)據(jù)中的不同股票評(píng)論員針對(duì)不同股票的所有歷史股票評(píng)論數(shù)據(jù),確定發(fā)布看漲的股票評(píng)論數(shù)據(jù)的概率,以及確定發(fā)布看跌的股票評(píng)論數(shù)據(jù)的概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司,未經(jīng)北京奇虎科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810942719.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險(xiǎn);稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計(jì)算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險(xiǎn),例如,風(fēng)險(xiǎn)分析或養(yǎng)老金
- 一種股票選股方法及系統(tǒng)
- 一種股票趨勢(shì)信息展現(xiàn)方法和裝置
- 一種股票自動(dòng)交易的方法及裝置
- 一種股票選擇方法及裝置
- 一種確定股票投資配比的方法、終端設(shè)備及介質(zhì)
- 一種股票走勢(shì)預(yù)測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 股票分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種基于時(shí)空?qǐng)D注意力機(jī)制的股價(jià)預(yù)測(cè)方法
- 股票交易委托大單的判定及顯示方法、裝置及存儲(chǔ)介質(zhì)
- 股票押品估值方法及裝置
- 特定主題的評(píng)論數(shù)據(jù)的采集方法和裝置
- 一種顯示物品評(píng)論的方法及裝置
- 評(píng)論數(shù)據(jù)的處理方法和裝置
- 一種酒店特色點(diǎn)評(píng)抽取的方法
- 一種數(shù)據(jù)分析方法及裝置
- 評(píng)論數(shù)據(jù)處理方法、裝置及設(shè)備
- 用戶數(shù)據(jù)的分析方法及裝置
- 客戶端的評(píng)論數(shù)據(jù)的處理方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 評(píng)論數(shù)據(jù)的提供、顯示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 評(píng)論數(shù)據(jù)的質(zhì)量標(biāo)注方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)挖掘方法及設(shè)備
- 數(shù)據(jù)挖掘算法動(dòng)態(tài)插入到數(shù)據(jù)挖掘平臺(tái)的方法及系統(tǒng)
- 基于MPP的并行數(shù)據(jù)挖掘系統(tǒng)及其實(shí)現(xiàn)方法
- 數(shù)據(jù)挖掘方法和裝置
- 一種解耦WEB客戶端與大數(shù)據(jù)挖掘分析的數(shù)據(jù)挖掘平臺(tái)及實(shí)現(xiàn)方法
- 大數(shù)據(jù)挖掘方法、裝置及數(shù)據(jù)挖掘服務(wù)器
- 一種數(shù)據(jù)挖掘系統(tǒng)及方法
- 一種大數(shù)據(jù)挖掘系統(tǒng)
- 一種基于數(shù)據(jù)庫(kù)的雙向數(shù)據(jù)挖掘方法和裝置
- 一種數(shù)據(jù)挖掘方法和裝置





