接下来我们来看一下如何使用pandas快速的在这个数据里面找出哪部电影是时长最长的电影。
·首先我们来导入一下pandas,然后读取一下Excel文件,假设一个变量叫df,想要找出时长最长的电影,那么我们肯定先要知道哪部电影它的时长是最长的。这个怎么搞?很简单,df,然后先把时长这一列搞出来,因为我们针对的是时长。
·然后点argmax,这个是什么东西?我们打印一下就知道了,运行,打出来一个6。这个6是什么意思?很简单,其实就是下标的意思,也就是说时长最长的数据在整个DataFrame里面它的下标是6。
·既然是6,那我们数一下这个表头是不算的,先从第一行数据开始,我们知道下标一般都是从零开始,所以这个是零,一二三四五六,你看6代表的是这行数据乱世佳人,然后你看这个时长二百三十八好像遥遥领先,仿佛是最大的值。
·那么我们验证一下,怎么验证?很简单,再打一下,同样的是对时长这一列进行操作,然后点Max,这个很明显了,就是把时长这一列里面最大值打印出来,我们来看一下,你看二百三十八是不是它?所以说这个argmax其实就是把最大的那个值所在的行的下标给出来。
·既然能找最大值,能不能找最小值?那肯定可以,我们搞一下,无非就是把这个Max改成min,最小的来看一下,不看不知道,一看吓一跳,居然有38分钟的电影,我估计这是微电影。
回过头来找到是最长的,现在已经知道了最长的那部电影对的那个行的下标是6,是不是可以根据这个下标来拿到那行数据?肯定是可以的。怎么搞?这样子,首先df.iloc,loc是location的缩写,就是定位的意思。前面有个i,就是接下来要定位就是根据这个行和列的下标来知道。
这个玩意不是小括号了,而是中括号,这里有讲究了,一个逗号隔开逗号,左边又说到底要去找第几行到第几行的下标,是这个6,所以其实写一个6就可以了。右边就是第几列到第几列,这个肯定是所有,可以这样子,一个冒号就跟做切片是一样的。
再来打印一下,看出来了吧,乱世佳人对不对?虽然结果出来了,但是这个代码写的不太好,因为这里这个6是写死的,应该是这个argmax,结果是一样的。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved