[發(fā)明專利]一種基于互聯(lián)網(wǎng)數(shù)據(jù)采集的情緒指數(shù)構(gòu)建方法在審
| 申請(qǐng)?zhí)枺?/td> | 201611030961.2 | 申請(qǐng)日: | 2016-11-16 |
| 公開(kāi)(公告)號(hào): | CN106780036A | 公開(kāi)(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計(jì))人: | 都科 | 申請(qǐng)(專利權(quán))人: | 碩橙(廈門)科技有限公司 |
| 主分類號(hào): | G06Q40/06 | 分類號(hào): | G06Q40/06;G06F17/30 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 361000 福建省廈門市集美*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 互聯(lián)網(wǎng) 數(shù)據(jù) 采集 情緒 指數(shù) 構(gòu)建 方法 | ||
1.一種基于互聯(lián)網(wǎng)數(shù)據(jù)采集的情緒指數(shù)構(gòu)建方法,其特征在于包括如下步驟:
步驟1,獲取互聯(lián)網(wǎng)數(shù)據(jù)中針對(duì)某項(xiàng)投資的關(guān)注程度;
步驟2,構(gòu)建正負(fù)情緒指標(biāo);
步驟3,從公開(kāi)市場(chǎng)獲取當(dāng)月IPO數(shù)量和當(dāng)日股票價(jià)格波動(dòng)兩項(xiàng)指標(biāo);
步驟4,根據(jù)如下公式計(jì)算市場(chǎng)投資者情緒指數(shù):
市場(chǎng)投資者情緒指數(shù)=[A/(A+B+C+D)]*關(guān)注程度+[B/(A+B+C+D)]*正負(fù)情緒指標(biāo)+[C/(A+B+C+D)]*當(dāng)月IPO數(shù)量+[D/(A+B+C+D)]*當(dāng)日股票價(jià)格波動(dòng)
其中,A,B,C,D分別為關(guān)注程度、正負(fù)情緒指標(biāo)、當(dāng)月IPO數(shù)量、當(dāng)日股票價(jià)格波動(dòng)的權(quán)重。
2.如權(quán)利要求1所述的一種基于互聯(lián)網(wǎng)數(shù)據(jù)采集的情緒指數(shù)構(gòu)建方法,其特征在于:所述步驟1的詳細(xì)內(nèi)容是:根據(jù)上市公司總部所在地對(duì)應(yīng)的IP所發(fā)表的關(guān)鍵字進(jìn)行檢索,針對(duì)某項(xiàng)投資,以固定時(shí)間段為單位收集相關(guān)指數(shù),來(lái)作為關(guān)注程度,所述相關(guān)指數(shù)是指在固定時(shí)間段內(nèi)關(guān)鍵字出現(xiàn)次數(shù)的總和。
3.如權(quán)利要求2所述的一種基于互聯(lián)網(wǎng)數(shù)據(jù)采集的情緒指數(shù)構(gòu)建方法,其特征在于:所述固定時(shí)間段為每月、每周、每天、每小時(shí)或每分鐘。
4.如權(quán)利要求1所述的一種基于互聯(lián)網(wǎng)數(shù)據(jù)采集的情緒指數(shù)構(gòu)建方法,其特征在于所述步驟2的詳細(xì)內(nèi)容是:
步驟21,采用ORACLE關(guān)系型數(shù)據(jù)庫(kù),包括表guba,表authors,表articles和表comments,通過(guò)如下步驟構(gòu)建數(shù)據(jù)庫(kù):
1)發(fā)送HTTP請(qǐng)求至股吧主頁(yè)URL,獲取HTML內(nèi)容并解析,記錄page=1;
2)查找新標(biāo)簽,遍歷子節(jié)點(diǎn);
i.將帖子的標(biāo)題、作者、股吧賬號(hào)、發(fā)表日期、最后更新日期存入表articles;
ii.訪問(wèn)帖子URL,獲取細(xì)覽頁(yè)HTML內(nèi)容并解析,將內(nèi)容、閱讀數(shù)、評(píng)論數(shù)存入表comments;
iii.訪問(wèn)作者URL,獲取作者頁(yè)HTML內(nèi)容并解析,將作者信息存入表authors;
iv.訪問(wèn)帖子股吧URL,將股吧信息存入表guba;
3)獲取帖子總數(shù)和每頁(yè)帖子數(shù),判斷當(dāng)前是否為最后一頁(yè),如果不是最后一頁(yè),則訪問(wèn)下一頁(yè),記錄page=page+1,重復(fù)步驟2);
步驟22,基于網(wǎng)頁(yè)得到的語(yǔ)義數(shù)據(jù),通過(guò)語(yǔ)義分析領(lǐng)域通用的中文情感極性詞詞典使用SOSA算法進(jìn)行分析,SOSA算法持續(xù)多次隨機(jī)輪詢節(jié)點(diǎn),并根據(jù)以上方式進(jìn)行狀態(tài)改變;然后,逐漸將溫度下降,重復(fù)下一輪操作;
步驟23,當(dāng)輪詢次數(shù)達(dá)到預(yù)設(shè),或滿足停止準(zhǔn)則時(shí),結(jié)束重復(fù)過(guò)程,以當(dāng)前結(jié)果作為正負(fù)情緒指標(biāo)。
5.如權(quán)利要求1所述的一種基于互聯(lián)網(wǎng)數(shù)據(jù)采集的情緒指數(shù)構(gòu)建方法,其特征在于:所述步驟4中,權(quán)重的計(jì)算方法是:查詢股票實(shí)時(shí)收益,同時(shí)將步驟1-3得到的關(guān)注程度、正負(fù)情緒指標(biāo)、當(dāng)月IPO數(shù)量、當(dāng)日股票價(jià)格波動(dòng)代入下式,
股票實(shí)時(shí)收益=A*關(guān)注程度+B*正負(fù)情緒指標(biāo)+C*當(dāng)月IPO數(shù)量+D*當(dāng)日股票價(jià)格波動(dòng)+殘差
假設(shè)殘差符合正態(tài)分布,應(yīng)用多元線性回歸得出A,B,C,D的值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于碩橙(廈門)科技有限公司,未經(jīng)碩橙(廈門)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611030961.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:單邊賬規(guī)模控制方法及系統(tǒng)
- 下一篇:提示方法及裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險(xiǎn);稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計(jì)算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險(xiǎn),例如,風(fēng)險(xiǎn)分析或養(yǎng)老金
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實(shí)現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問(wèn)互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動(dòng)攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問(wèn)互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點(diǎn)中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





