pandas技巧之 DataFrame中的排序与汇总方法-Python教程

资源魔 48 0

相干学习保举:python教程

明天是pandas数据解决专题的第六篇文章,咱们来聊聊DataFrame的排序与汇总运算。

正在上一篇文章傍边咱们次要引见了DataFrame傍边的apply办法,若何正在一个DataFrame对每一一行或许是每一一列进行播送运算,使患上咱们能够正在很短的工夫内解决整份数据。明天咱们来聊聊若何对一个DataFrame依据咱们的需求进行排序和一些汇总运算的应用办法。

排序

排序是咱们一个十分根本的需要,正在pandas傍边将这个需要进一步细分,细分红了依据索引排序和依据值排序。咱们先来看看Series傍边的排序办法。

Series傍边的排序办法有两个,一个是sort_index,望文生义依据Series中的索引对这些值进行排序。另外一个是sort_values,依据Series中的值来排序。这两个办法城市前往一个新的Series:

索引排序

关于DataFrame来讲也是同样,一样有依据值排序和依据索引排序这两个性能。然而因为DataFrame是一个二维的数据,以是正在应用上会有些没有同。最简略的差异是正在于Series只有一列,咱们明白的晓得排序的工具,然而DataFrame没有是,它傍边的索引就分为两种,辨别是行索引和列索引。以是咱们正在排序的时分需求指定咱们想要排序的轴,也就是axis。

默许的状况咱们是依据行索引进行排序,假如咱们要指定依据列索引进行排序,需求传入参数axis=1。

咱们还能够传入ascending这个参数,用来指定咱们想要的排序程序是正序仍是倒序

值排序

DataFrame的值排序有所没有同,咱们不克不及对前进行排序,只能针对列。咱们经过by参数传入咱们心愿排序参照的列,能够是一列也能够是多列。

排名

有的时分咱们心愿失去元素的排名,咱们会心愿晓得以后元素正在全体傍边排第几,pandas傍边也提供了这个性能,它就是rank办法。

咱们能够发现咱们顺手输出的一串数字傍边,蕴含两个7,7是Series傍边最年夜的数字,然而它们的排名为何是6.5呢?

其实很简略,由于7呈现了两次,辨别是第6位以及第7位,这里对它一切呈现的排名取了均匀,以是是6.5。假如咱们没有心愿它取均匀,而是依据呈现的前后程序给出排名的话,咱们能够用method参数指定咱们心愿的成果。

method的非法参数其实不止first这一种,另有一些其余略微冷门一些的用法,咱们一并列出。

假如是DataFrame的话,默许是以行为单元,较量争论每一一行中元素占全体的排名。咱们也能够经过axis参数指定以列为单元较量争论:

汇总运算

最初咱们来引见一下DataFrame傍边的汇总运算,汇总运算也就是聚合运算,比方咱们最多见的sum办法,对一批数据进行聚合乞降。DataFrame傍边一样有相似的办法,咱们一个一个来看。

起首是sum,咱们能够应用sum来对DataFrame进行乞降,假如没有传任何参数,默许是对每一一前进行乞降。

除了了sum以外,另外一个罕用的就是mean,能够针对一行或许是一列求均匀。

因为DataFrame傍边经常会无为NA的元素,以是咱们能够经过skipna这个参数扫除掉缺失值之后再较量争论均匀值。

另外一个我集体感觉很好用的办法是descirbe,能够前往DataFrame傍边的全体信息。比方每一一列的均值、样本数目、规范差、最小值、最年夜值等等。是一个罕用的统计办法,能够用来理解DataFrame傍边数据的散布状况。

除了了引见的这些办法以外,DataFrame傍边另有不少相似的汇总运算办法,比方idxmax,idxmin,var,std等等,各人感兴味能够去查阅相干文档,然而依据我的经历普通用没有到。

想理解更多编程学习,敬请存眷php培训栏目!

以上就是pandas技术之 DataFrame中的排序与汇总办法的具体内容,更多请存眷资源魔其它相干文章!

标签: Python python教程 python编程 python使用问题 pandas DataFrame

抱歉,评论功能暂时关闭!