
Python數(shù)據(jù)分析:股價(jià)相關(guān)性
為什么要分析股價(jià)相關(guān)度呢,我們來(lái)引入一個(gè)概念——配對(duì)交易
所謂的配對(duì)交易,是基于統(tǒng)計(jì)套利的配對(duì)交易策略是一種市場(chǎng)中性策略,具體的說(shuō),是指從市場(chǎng)上找出歷史股價(jià)走勢(shì)相近的股票進(jìn)行配對(duì),當(dāng)配對(duì)的股票價(jià)格差偏離歷史均值時(shí),則做空股價(jià)較高的股票同時(shí)買(mǎi)進(jìn)股價(jià)較低的股票,等待他們回歸到長(zhǎng)期均衡關(guān)系,由此賺取兩股票價(jià)格收斂的報(bào)酬。
接下來(lái)開(kāi)始我們的股價(jià)相關(guān)度分析,首先我們選兩個(gè)股票~
感覺(jué)全聚德和光明乳業(yè)都很好吃的樣子,我們就選它們了吧!= ̄ω ̄=
1、導(dǎo)入數(shù)據(jù)包
簡(jiǎn)單介紹一下要用到的數(shù)據(jù)包
matplotlib.pyplot:繪圖庫(kù),其中pyplot子包提供一個(gè)類MATLAB的繪圖框架
numpy:科學(xué)計(jì)算庫(kù),支持高級(jí)大量的維度數(shù)組與矩陣運(yùn)算
pandas:納入了大量庫(kù)和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供高效地操作大型數(shù)據(jù)集所需的工具
tushare:財(cái)經(jīng)數(shù)據(jù)接口包
[python] view plain copy
<span style="font-size:18px;">import matplotlib.pyplot as plt </span>
<span style="font-size:18px;">import numpy as np</span>
<span style="font-size:18px;">import pandas as pd</span>
<span style="font-size:18px;">import tushare as ts
</span>
2、根據(jù)全聚德和光明乳業(yè)的股票代碼獲取數(shù)據(jù),這里獲取的是2016年一整年的收盤(pán)價(jià),獲取完后合并,因?yàn)橥E频拇嬖?,用前一天的價(jià)格去填寫(xiě)缺失數(shù)據(jù),最終以CSV格式保存數(shù)據(jù)
[python] view plain copy
<span style="font-size:18px;">s_qjd = '002186' #全聚德</span>
<span style="font-size:18px;">s_gm = '600597' #光明乳業(yè)</span>
<span style="font-size:18px;">sdate = '2016-01-01'#起止日期</span>
<span style="font-size:18px;">edate = '2016-12-31'</span>
<span style="font-size:18px;">df_qjd = ts.get_h_data(s_qjd,
start = sdate, end = edate).sort_index(axis =
0,ascending=True)#獲取歷史數(shù)據(jù)</span>
<span
style="font-size:18px;">df_gm = ts.get_h_data(s_gm, start = sdate,
end = edate).sort_index(axis = 0,ascending=True)</span>
<span style="font-size:18px;">df =
pd.concat([df_qjd.close,df_gm.close], axis = 1, keys=['qjd_close',
'gm_close'])#合并</span>
<span style="font-size:18px;">df.ffill(axis=0, inplace=True)#填充缺失數(shù)據(jù)</span>
<span style="font-size:18px;">df.to_csv('qjd_gm.csv')
</span>
3、用pearson相關(guān)系數(shù)計(jì)算相關(guān)度(Pearson相關(guān)系數(shù)是用來(lái)衡量?jī)蓚€(gè)數(shù)據(jù)集合是否在一條線上面,它用來(lái)衡量定距變量間的線性關(guān)系。),再打印出來(lái)看一眼
[python] view plain copy
<span style="font-size:18px;">corr = df.corr(method = 'pearson', min_periods = 1)#pearson方法計(jì)算相關(guān)性</span>
<span style="font-size:18px;">print(corr)</span>
算出來(lái)有0.81,超過(guò)0.8,按值域等級(jí)來(lái)說(shuō)屬于極強(qiáng)相關(guān),不過(guò)話說(shuō)一個(gè)賣烤鴨的為什么會(huì)和賣牛奶的相關(guān)度那么高。。。。難道大家吃烤鴨的時(shí)候都喜歡喝牛奶嗎。。。
4、繪制圖像出來(lái)喵一眼,看看趨勢(shì)上來(lái)說(shuō)什么時(shí)候可以有機(jī)會(huì)做配對(duì)交易
[python] view plain copy
<span style="font-size:18px;">df.plot(figsize = (20,12))</span>
<span style="font-size:18px;">plt.savefig('qjd_gm.jpg')</span>
<span style="font-size:18px;">plt.close()</span>
5、按分析日期的第一天的股價(jià)為基準(zhǔn)做歸一化處理,打印圖像
[python] view plain copy
<span style="font-size:18px;">df['qjd_one'] = df.qjd_close / float(df.qjd_close[0])*100</span>
<span style="font-size:18px;">df['gm_one'] = df.gm_close / float(df.gm_close[0])*100</span>
<span style="font-size:18px;">df.qjd_one.plot(figsize = (20,12))</span>
<span style="font-size:18px;">df.gm_one.plot(figsize = (20,12))</span>
<span style="font-size:18px;">plt.savefig('qjd_gm_one.jpg')</span>
<span style="font-size:18px;">
</span>
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03