pandas教程
pandas教程
阅读该教程,您需要python基础和numpy的预备知识
表格基础
| 1 |  | 
| 1 |  | 
shape获取表格长度,返回元组(行数,列数)
日期序列
| 1 |  | 
| 1 |  | 
DataFrame生成表格
利用index和columns设置表头
| 1 |  | 
| 1 |  | 
采用默认的表头
| 1 |  | 
| 1 |  | 
使用字典建立表格
| 1 |  | 
| 1 |  | 
选择数据
| 1 |  | 
| 1 |  | 
loc: select by label
| 1 |  | 
| 1 |  | 
iloc: select by position
| 1 |  | 
| 1 |  | 
bool判断
| 1 |  | 
| 1 |  | 
修改指定位置的值
| 1 |  | 
| 1 |  | 
修改符合条件的表格元素
| 1 |  | 
| 1 |  | 
修改符合条件的行
| 1 |  | 
| 1 |  | 
| 1 |  | 
| 1 |  | 
插入新的列
| 1 |  | 
| 1 |  | 
处理丢失的数据
dropna删除丢失的数据行列
axis=0时删除含有nan的行
axis=1时删除含有nan的列
how=‘any’表示只要有nan就删除
how=‘all’表示删除所有都是nan的行/列
| 1 |  | 
| 1 |  | 
fillna给nan赋值 isnull返回对应布尔矩阵
| 1 |  | 
| 1 |  | 
读写文件
读文件:
read_csv
read_excel
read_hdf
read_sql
read_json
read_msgpack (experimental)
read_html
read_gbq (experimental)
read_stata
read_sas
read_clipboard
read_pickle
写文件:
to_csv
to_excel
to_hdf
to_sql
to_json
to_msgpack (experimental)
to_html
to_gbq (experimental)
to_stata
to_clipboard
to_pickle
测试文件下载:
读取csv
| 1 |  | 
| 1 |  | 
读取excel
| 1 |  | 
| 1 |  | 
输出excel
| 1 |  | 
示例一:
示例文件students.xlsx
| 1 |  | 
concat拼接
| 1 |  | 
| 1 |  | 
如果不写ignore_index=True,即默认ignore_index=False, 拼接的结果为
| 1 |  | 
拼接表头不同的列
如果拼接表头不同的列,如下例子所示
axis=0时对列操作,在列的方向上拼接;axis=1时对行操作,在行的方向上拼接
join=inner时,会去除因为拼接错位而产生的含有NaN的行/列
| 1 |  | 
| 1 |  | 
merge拼接
| 1 |  | 
| 1 |  | 
考虑多个key
how = [‘left’, ‘right’, ‘outer’, ‘inner’]
inner:必须所有key相同才保留
outer:不要求所有key相同,可能会产生含有NaN的行
left和right是使用到的两组数据名,可以以被选择的数据作为模板进行合并
| 1 |  | 
| 1 |  | 
使用indicator
| 1 |  | 
| 1 |  | 
left_index和right_index合并
合并行index
| 1 |  | 
| 1 |  | 
suffixes处理会重复的列
| 1 |  | 
| 1 |  | 
pandas教程
      https://blog.algorithmpark.xyz/2023/09/02/language/pandas/index/