数据的高级处理——pandas模块进阶——使用Python进行数据分析
由于新版的tushare需要权限,本人只是学习,看一下方法得了,必要再开开权限。这部分一笔带过,由于本人没有验证,不能够保证正确,因此不做笔记。
##############################
##作者:白雪公主的后妈
##时间:2024年1月2日
##主题:数据的高级处理——pandas模块进阶——使用Python进行数据分析
##主要内容:本章主要完成几类基础数据分析,如相关性分析、假设检验、描述性统计分析、线性回归分析等
##############################
#1、相关性分析
'''
相关性分析是指对多个可能具备相关关系的变量进行分析,从而衡量变量之间的相关程度或密切成都。
本章通过计算皮尔逊相关系数,判断两只股票数据的相关程度。
'''
#1.1获取股价数据
#1.1.1获取日k线级别的股票数据 新旧版本的tushare有些区别,我这里是新版的使用方法
import tushare as ts
ts.set_token('0af26dd037a2c9dadc01c8dc6046d02a84c757e85a65a48aeef6a9ae')
pro = ts.pro_api()
data=pro.daily(ts_code='000061.SZ', start_date='20180101', end_date='20190101') #ts_code新版的股票代号,start_date起始日期,end_date结束日期
print(data.head(10))
'''
运行结果:
ts_code trade_date open high ... change pct_chg vol amount
0 000061.SZ 20181228 4.83 4.88 ... 0.04 0.8316 36631.84 17756.246
1 000061.SZ 20181227 4.99 5.02 ... -0.10 -2.0367 59757.01 29316.285
2 000061.SZ 20181226 5.02 5.02 ... -0.12 -2.3857 73012.65 35955.318
3 000061.SZ 20181225 5.13 5.15 ... -0.16 -3.0829 93694.17 46780.731
4 000061.SZ 20181224 4.98 5.22 ... 0.23 4.6371 118030.68 60755.546
5 000061.SZ 20181221 5.14 5.16 ... -0.18 -3.5019 97390.22 48878.281
6 000061.SZ 20181220 5.17 5.22 ... -0.01 -0.1942 79767.97 41141.726
7 000061.SZ 20181219 5.35 5.35 ... -0.18 -3.3771 118225.75 61738.698
8 000061.SZ 20181218 5.48 5.48 ... -0.23 -4.1367 187031.06 99994.758
9 000061.SZ 20181217 5.20 5.64 ... 0.43 8.3821 304727.05 166908.688
[10 rows x 11 columns]
'''
#上述使用Pytharm使用print()函数打印数据不全,使用以下爱代码强制显示所有列
import pandas as pd
pd.set_option('display.max_columns', None)
print(data.head(10))
'''
运行结果:
ts_code trade_date open high low close pre_close change pct_chg \
0 000061.SZ 20181228 4.83 4.88 4.81 4.85 4.81 0.04 0.8316
1 000061.SZ 20181227 4.99 5.02 4.80 4.81 4.91 -0.10 -2.0367
2 000061.SZ 20181226 5.02 5.02 4.87 4.91 5.03 -0.12 -2.3857
3 000061.SZ 20181225 5.13 5.15 4.81 5.03 5.19 -0.16 -3.0829
4 000061.SZ 20181224 4.98 5.22 4.96 5.19 4.96 0.23 4.6371
5 000061.SZ 20181221 5.14 5.16 4.93 4.96 5.14 -0.18 -3.5019
6 000061.SZ 20181220 5.17 5.22 5.10 5.14 5.15 -0.01 -0.1942
7 000061.SZ 20181219 5.35 5.35 5.15 5.15 5.33 -0.18 -3.3771
8 000061.SZ 20181218 5.48 5.48 5.23 5.33 5.56 -0.23 -4.1367
9 000061.SZ 20181217 5.20 5.64 5.19 5.56 5.13 0.43 8.3821
vol amount
0 36631.84 17756.246
1 59757.01 29316.285
2 73012.65 35955.318
3 93694.17 46780.731
4 118030.68 60755.546
5 97390.22 48878.281
6 79767.97 41141.726
7 118225.75 61738.698
8 187031.06 99994.758
9 304727.05 166908.688
'''
#1.1.2获取分钟级别的股价数据 注意新版的不是免费,如果需要大量的需要开权限,链接https://tushare.pro/document/1?doc_id=234
data = ts.pro_bar(ts_code='000061.SZ',freq='5min',start_date='2020-05-18 14:15:00',end_date='2020-05-18 15:00:00')
print(data)
#################第六章到此为止,没有权限的花钱,以后在研究,或者换一种第三方软件库