Pandas 介绍
为什么要学习 pandas ?
那么问题来了:
numpy 已经能够帮助我们处理数据,能够结合 matplotlib 解决我们数据分析的问题,那么 pandas 学习的目的在什么地方呢?
numpy 能够帮我们处理处理数值型数据,但是这还不够, 很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等
比如:我们通过爬虫获取到了存储在数据库中的数据
所以,pandas 出现了。
什么是 Pandas?
Pandas 的名称来自于面板数据(panel data)
Pandas 是一个强大的分析结构化数据的工具集,基于 NumPy 构建,提供了高级数据结构和数据操作工具,它是使 Python 成为强大而高效的数据分析环境的重要因素之一。
- 一个强大的分析和操作大型结构化数据集所需的工具集
- 基础是 NumPy,提供了高性能矩阵的运算
- 提供了大量能够快速便捷地处理数据的函数和方法
- 应用于数据挖掘,数据分析
- 提供数据清洗功能
增强图表可读性
回忆我们在 numpy 当中创建学生成绩表样式:
返回结果:
pythonarray([[92, 55, 78, 50, 50], [71, 76, 50, 48, 96], [45, 84, 78, 51, 68], [81, 91, 56, 54, 76], [86, 66, 77, 67, 95], [46, 86, 56, 61, 99], [46, 95, 44, 46, 56], [80, 50, 45, 65, 57], [41, 93, 90, 41, 97], [65, 83, 57, 57, 40]])
如果数据展示为这样,可读性就会更友好: