您的位置:首页 > 国内新闻

盘点Python:Pandas1.0的主要功能

时间:2020-02-21

熊猫的第一个主要新版本包括许多重要功能:更完整的数据帧自动摘要、更全面的输出格式、新的数据类型和文档站点。作者:核心阅读

注:熊猫1.0.0rc于1月9日发布,之前的版本是0.25。

完整的发布说明可以在新的文档网站上找到,但是肖鑫认为低技术的概述也是有帮助的。

用户可以用pip升级熊猫来使用它的新版本。在撰写本文时,Pandas1.0仍是候选版本,这意味着要安装Pandas1.0,需要明确指定其版本。

pipinstall-upgrade熊猫==1.0.0rc0

当然,更新可能会破坏一些代码,因为这是一个主要版本,所以要小心!这个版本的熊猫不再支持Python 2。运行熊猫1.0至少需要python 3.6,所以一定要使用pip和python的适当版本。

$ PIP-VERSION PIP 19 . 3 . 1 FROM/USR/LOCAL/LIB/PYTHON 3.7/SITE-PACKETS/PIP(PYTHON 3.7)$ PYTHON-VERSION PYTHON 3 . 7 . 5

用户可以确认一切正常,熊猫使用的是正确的版本。

importpandashdpd。_ version _ _ 1.0.0rc0

使用DataFrame.info进行更好的自动摘要

作者最喜欢的新功能是优化的DataFrame.info方法。现在,它使用了更易读的格式,使得数据探索过程更容易。

df=pd。数据框架({. '[1,2,3 ','B':['再见','残酷','世界'], ' C ' :假,真,假]. })df . info()rangeindex :3 entries,0to 2 datacolumns(total 3 columns): # ColumnNon-NullCountDtype-0a3Non-NullObject2C 3 non-nullObjectDtypes 3360 int 64(1),Object(2)memory的输出格式:200.0bytes

Markdown table

其次,作者最喜欢的功能是使用新的数据帧to_markdown方法

df . to _ markdown()| | a | b | c | |-: |-: | :-| :-| | 0 | 1 |再见|假| | 1 | 2 |残酷|真| | 2 | 3 |世界|假|

这样,通过github gists在诸如“中”等位置显示表格就更容易了。新数据类型

of

布尔值和字符串来源:Pexels

Pandas1.0还介绍了布尔值和字符串的实验数据类型。

因为这些变化是实验性的,数据类型的API可能会稍有变化,所以应该谨慎使用。然而,熊猫建议在合理的地方使用这些数据类型,未来的版本将提高特定类型的操作性能,如正则表达式匹配。

默认情况下,熊猫不会自动将数据转换为这些类型。然而,如果熊猫得到明确指示,它们仍然可以被使用。

B=pd。系列(['再见','残酷','世界'],数据类型='字符串')C=pd。系列([假,真,假),数据类型='布尔')df。B=B,df。c=Cdf . info()RangeIndex :3 Entries,0 to 2 DataColumns(total 3 columns): # Column non-NullCountDtype-0 a3 non-null int 641 B3 non-null string 2 C3 non-nullbooldtypes : int 64(1),object (1),string(1)memory page :200.0 bytes

注意,dtype列现在如何反映新类型的字符串和bool。

新字符串数据类型最实用的优点是字符串列可以从数据框中选择。这样,只有数据集的文本成分可以被更快地分析。在

df . select _ dt types(' string ')之前,

您只能通过显式使用字符串列的名称来选择字符串列。

从今天开始,掌握熊猫1.0的主要功能,并开始使用它进行新的优化~

yy4080影视觉影院青苹果-青青草在在观免费福利线观看-青青草在线

  • 友情链接:
  • 佛山新闻网 版权所有© www.vetcao.com 技术支持:佛山新闻网| 网站地图