Skip to content

Pandas 介绍

官网:http://pandas.pydata.org/

为什么要学习 pandas ?

那么问题来了

numpy 已经能够帮助我们处理数据,能够结合 matplotlib 解决我们数据分析的问题,那么 pandas 学习的目的在什么地方呢?

numpy 能够帮我们处理处理数值型数据,但是这还不够, 很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等

比如:我们通过爬虫获取到了存储在数据库中的数据

所以,pandas 出现了。

什么是 Pandas?

Pandas 的名称来自于面板数据(panel data)

Pandas 是一个强大的分析结构化数据的工具集,基于 NumPy 构建,提供了高级数据结构数据操作工具,它是使 Python 成为强大而高效的数据分析环境的重要因素之一。

  • 一个强大的分析和操作大型结构化数据集所需的工具集
  • 基础是 NumPy,提供了高性能矩阵的运算
  • 提供了大量能够快速便捷地处理数据的函数和方法
  • 应用于数据挖掘,数据分析
  • 提供数据清洗功能

增强图表可读性

  • 回忆我们在 numpy 当中创建学生成绩表样式:

  • 返回结果:

    python
    array([[92, 55, 78, 50, 50],
           [71, 76, 50, 48, 96],
           [45, 84, 78, 51, 68],
           [81, 91, 56, 54, 76],
           [86, 66, 77, 67, 95],
           [46, 86, 56, 61, 99],
           [46, 95, 44, 46, 56],
           [80, 50, 45, 65, 57],
           [41, 93, 90, 41, 97],
           [65, 83, 57, 57, 40]])

    如果数据展示为这样,可读性就会更友好:

    image-20190624090345499