Pandas for python是为Python编程软件设计的一款数据分析包,软件拥有快速、灵活和表现力的数据结构,由数据面板和数据分析工具组成,让关系和标记数据变得更简单,是目前比较常用的一款Python包,需要的朋友可以来本站下载Pandas for python!
Pandas for python安装方法
Python安装wheel文件
1、以管理员身份运行cmd
2、转到Python的Scripts目录下:
cd C:\Program Files\Python36\Scripts
3、pip install wheel
4、pip install 路径\文件名.whl:
pip install C:\Users\0AQZ0\Downloads\matplotlib-2.1.2-cp27-cp27m-win_amd64.whl
使用说明
pandas数据结构
Series:一维数组。类型Numpy的一维数组,强大在可以存储任意类型数据
Time-Series:以时间维索引的Series
DataFrame: 二位的表格数据结构,===升级版矩阵
它含有一组有序的列,每列可以是不同的值类型(数值,字符串,)
pandas的数据类型
导入pandas
import pandas as pd
读取csv文件,数据类型就是DataFrame二维矩阵
a = pd.read_csv(path)type(a)
属性和方法
类型 type(a)
维度 a.ndim
形状 a.shape
大小 a.size
数据类型 a.dtypes
帮助 help(pd)
索引操作
前n行:head(n)
后n行:tail(n)
第n行: df.loc[n]
第3-7行: df.loc[2:8]
取任意行: df.loc[[2,3,5]]
取某列: df['列名'] df.列名
取任意列:df[['列1',‘列2’,。。。]]
案例 取出所有g为结尾的列
a = df.columns.tolist()bb = []for x in a: if x.endswith('(g)') or x.endswith('(mg)'): bb.append(x) df[bb]
简单统计
数据统计
摘要描述/简介:df.describe()
一维。value_counts()统计以为矩阵中数组出现的次数 : 比如统计成绩
最大: df['列名'].max()
最小 :min
平均值:mean
标准差 std
案例分析2成绩分析
# 案例-成绩分析chengji = pd.read_excel('D:\\1804C数据分析第一次周考.xlsx')chengji['成绩'].describe()chengji['成绩'].value_counts()a = chengji['成绩']a[a<80]
更新日志
1、包括许多API更改、新特性、增强和性能改进,以及大量bug修复。
2、删除Python 2支持
3、使用重新标记的Groupby聚合
4、更好的多指标报告
5、更好的截断repr的系列和数据aframe
∨ 展开