博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas
阅读量:6112 次
发布时间:2019-06-21

本文共 814 字,大约阅读时间需要 2 分钟。

1.pandas数据读取和预处理

简述:pandas在numpy的基础上又封装了一些操作,相当于把函数做了一些简化。pandas不做可视化,主要是在预处理方面。

文件读取

pandas.read_csv('文件名')   其中文件要以逗号为分隔符对象.head(3)   查看表/文件的前3行,正向取对象.tail(3)      看后三行,从后往前数。对象.columns     列 的名字   ,如 表头对象.loc[0]    拿第一行数据,  如:[3:6],4到6行数据,[2,5,6]拿2,5,6号数据对象['列名']    拿到这一列的数据    对象['列名1',‘列名2’]  拿两列

numpy的数据格式为ndarray, pandas为DataFrame(数据流)

pandas的dtype: int,float,object

2.预处理    (+ — *  /)

对象['列名']/100   这一列的数据都除以100,其他同理对象.sort_values('列名')    按这一列的数据大小排序pandas.isnull(age)    age为一行/列的数据列表,查看是否有空数据对象['Age'].mean()   求均值对象.dropna(axios=0,subset=['Age','Sex'])     去掉Age,Sex这一列对象.apply(value)         写一个自定义函数,return给f函数,value就是这个函数   (def  value():  xxxxxx  return  xxxxx)

3.Pandas-Series结构

Series(collection  of   values)

DataFrame(collection  of Series objects)

转载于:https://www.cnblogs.com/Bin-y/p/10712072.html

你可能感兴趣的文章
Directx11教程(61) tessellation学习(3)
查看>>
几种不同方式将用户照片导入到AD
查看>>
Microsoft 技术路线发展的思考
查看>>
Minesweeper(暴力,注意特判)
查看>>
WPF 顺序选择按钮
查看>>
HDU 4268 Alice and Bob (set)
查看>>
HDU 4292 Food 第37届ACM/ICPC 成都赛区网络赛1005题 (最大流)
查看>>
Knotter 0.7.0 发布,交错图案设计工具
查看>>
Javascript判断页面刷新或关闭的方法(转)
查看>>
对 makefile 中 .EXPORT_ALL_VARIABLES 的学习体会
查看>>
99个精美的免费登录注册界面PSD设计
查看>>
将远程调试的控制台信息输出至Eclipse
查看>>
Windows2008之IIS安装
查看>>
Linux下python升级步骤
查看>>
EBS 发运管理操作实例9——发运例外处理(Ship Exceptions)
查看>>
一键去除 UC浏览器 论坛模式 内置的广告
查看>>
谈谈个人关于程序开发中,“零配置”和“有配置”的看法
查看>>
Go fmt包
查看>>
Java邮件开发-----java邮件开发(一)
查看>>
常用自动化测试工具介绍(支持B/S、C/S)
查看>>