python : pandas库的后继者polars库

polars库是python的又一dataframe库，显然，在pandas库的光芒下，要上位是不容易的，必须有过硬的功夫。一、用法基本一致从介绍上看，两者有孪生相，用法和接口基本无二。至少大部分非常非常相似。估计很多只需要在import 这行改一行，估计就能用上了。安装：pip install polars也可以通过镜像，这样快一些。二、速度polars优势明显import timeimport

songroom

5283人浏览 · 2021-12-14 19:35:27

songroom · 2021-12-14 19:35:27 发布

polars库是python的又一dataframe库，显然，在pandas库的光芒下，要上位是不容易的，必须有过硬的功夫。

一、用法基本一致

从长相上看，两者有孪生相，用法和接口基本无二。至少大部分非常非常相似。估计很多只需要在import 这行改一行，估计就能用上了。
安装：

pip install polars

也可以通过镜像，这样快一些。

二、速度polars优势明显

import time 
import polars as pl
import pandas as pd
file = r"C:\Users\songroom\Desktop\test_csv.csv"
t0 = time.time()
df_1 = pd.read_csv(file,encoding="gbk")
t1 =time.time() 
df_2 = pl.read_csv(file,encodeing ="gbk")
t2 = time.time()
print(f"pandas read_csv  cost time :{t1-t0}  polars read_csv cost time :{t2-t1}")
print(f"df_1 shape :{df_1.shape} df_2 shape : {df_2.shape}")
t3 = time.time()
for row in df_1.itertuples():
    v0 = row[1]
    v2 = row[2]
t4 = time.time()
for row in df_2.rows():
    v0 = row[1]
    v2 = row[2]

t5 = time.time()

print(f"pandas iterate  cost time :{t4-t3}  polars iterate cost time :{t5-t4}")

pandas read_csv cost time :1.3020009994506836 polars read_csv cost time :0.10900020599365234
df_1 shape :(589680, 14) df_2 shape : (589680, 14)
pandas iterate cost time :1.0449976921081543 polars iterate cost time :1.1010003089904785

总体上看，polars库在io上优势很明显，快太多了。就单个循还而言，其polar的rows()和pandas的itertuples()差不多。
polars库是通过Rust编写的一个库，Polars的内存模型是基于Apache Arrow。python只是一个前端的封装。

关于polars更多的资料，见polars的github上的源：

https://github.com/pola-rs/polars

关于polars的性能，见：

https://h2oai.github.io/db-benchmark/

三、生态polars还处于初期

显然，pandas是成千上万人N年如一日打磨的产品，是一个非常成熟大叔了，但polars相其相比，还是一个年青小伙子，但是基本上常见的功能已经够用了。特别是你感觉pandas不够快的话。
目前，Polars 是基于arrow1的，目前正准备向arrow2迁移，arrow2的速度将更快，这样有理由相信Polars值得我们期待！

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

自动化提示词生成工具盘点

腾讯云开发者社区

腾讯云架构师技术沙龙 · 长沙站圆满落幕，共话AI驱动下的技术架构与前沿应用

人工智能已成为推动技术创新与产业变革的重要引擎，开发者正身处一场前所未有的技术变革之中。通过本次腾讯云架构师技术沙龙，各位专家深入分享前沿技术洞察，探讨 AI 落地的应用路径与实践经验，为架构师的职业发展指明方向。腾讯云架构师长沙同盟和腾讯云架构师技术同盟长沙地区理事会正式成立。未来，腾讯云架构师长沙同盟将凝心聚力，打造属于本地架构师的学习与成长的家园，助力中国架构的蓬勃发展。未来已来，让我们携手

腾讯云开发者社区

通用Agent都快被骂废了，MiniMax突然搞了个能打的

效果也比我预计中要好很多，是一个比较标准的产品展示页，或者博客类型的页面，顶端栏划分了不同的信息，顶端和底部都保留了大量跟Hailuo 02的相关项，每一个页面都能交互，包含的信息量非常大，几乎完美的匹配了我的需求，你看到提示语中我说到的东西几乎都实现了。直接把生成的结果和我给的提示语对照一下，可以看到我给出的要求基本都做出来了，每一屏需要的景色背景图、数据表、地图、语音播放全都完成，编程考了，多