pandas教程
pandas教程
阅读该教程,您需要python基础和numpy的预备知识
表格基础
1 |
|
1 |
|
shape获取表格长度,返回元组(行数,列数)
日期序列
1 |
|
1 |
|
DataFrame生成表格
利用index和columns设置表头
1 |
|
1 |
|
采用默认的表头
1 |
|
1 |
|
使用字典建立表格
1 |
|
1 |
|
选择数据
1 |
|
1 |
|
loc: select by label
1 |
|
1 |
|
iloc: select by position
1 |
|
1 |
|
bool判断
1 |
|
1 |
|
修改指定位置的值
1 |
|
1 |
|
修改符合条件的表格元素
1 |
|
1 |
|
修改符合条件的行
1 |
|
1 |
|
1 |
|
1 |
|
插入新的列
1 |
|
1 |
|
处理丢失的数据
dropna删除丢失的数据行列
axis=0
时删除含有nan的行
axis=1
时删除含有nan的列
how=‘any’
表示只要有nan就删除
how=‘all’
表示删除所有都是nan的行/列
1 |
|
1 |
|
fillna给nan赋值 isnull返回对应布尔矩阵
1 |
|
1 |
|
读写文件
读文件:
read_csv
read_excel
read_hdf
read_sql
read_json
read_msgpack (experimental)
read_html
read_gbq (experimental)
read_stata
read_sas
read_clipboard
read_pickle
写文件:
to_csv
to_excel
to_hdf
to_sql
to_json
to_msgpack (experimental)
to_html
to_gbq (experimental)
to_stata
to_clipboard
to_pickle
测试文件下载:
读取csv
1 |
|
1 |
|
读取excel
1 |
|
1 |
|
输出excel
1 |
|
示例一:
示例文件students.xlsx
1 |
|
concat拼接
1 |
|
1 |
|
如果不写ignore_index=True
,即默认ignore_index=False
, 拼接的结果为
1 |
|
拼接表头不同的列
如果拼接表头不同的列,如下例子所示
axis=0时对列操作,在列的方向上拼接;axis=1时对行操作,在行的方向上拼接
join=inner时,会去除因为拼接错位而产生的含有NaN的行/列
1 |
|
1 |
|
merge拼接
1 |
|
1 |
|
考虑多个key
how = [‘left’, ‘right’, ‘outer’, ‘inner’]
inner:必须所有key相同才保留
outer:不要求所有key相同,可能会产生含有NaN的行
left和right是使用到的两组数据名,可以以被选择的数据作为模板进行合并
1 |
|
1 |
|
使用indicator
1 |
|
1 |
|
left_index和right_index合并
合并行index
1 |
|
1 |
|
suffixes处理会重复的列
1 |
|
1 |
|
pandas教程
https://blog.algorithmpark.xyz/2023/09/02/language/pandas/index/