Python 数据分析之 Pandas 介绍

Python 数据分析之 Pandas 介绍

Pandas 是 Python 中的一个数据分析库,是为了解决数据分析任务而创建的。Pandas 提供了大量能使我们快速便捷地处理数据的函数和方法,它是使 Python 成为强大而高效的数据分析编程语言的重要因素之一。

具体的 Pandas 使用方法可以查看官方文档:10 Minutes to pandas http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html

由于 Python 语言的一些特点,Pandas 在处理数据的时候只能使用单核,在大数据量的情况会出现处理较慢的情况,通过项目 「modin」只需简单的改动一行代码就能提升处理速度。

读取一个 700MB 的文件就会有几倍的加速效果。

Modin is a DataFrame designed for datasets from 1KB to 1TB+.

项目地址:https://github.com/modin-project/modin


更多精彩请扫码关注如下公众号。

Written on January 1, 2020