简单的编程|[话说NBA]pandas文本数据方法str.startswith()函数
在上一篇文章中,介绍了pandas分割函数str.split()的用法,并且使用该方法计算了NBA著名球星勒布朗詹姆斯2020-2021赛季常规赛的投篮命中率。很多小伙伴看过上篇文章后,咨询我如何计算詹姆斯某个月份的得分、篮板、助攻等数据。其实,计算单月数据的方法比较简单,需要用到pandas文本数据方法str.startswith()函数。
Series.str.startswith(pat, na=nan):查看元素是否以pat开头str.endswith()函数的用法类似:
pat:要搜索的字符串。
na:用于设置序列中的值为NULL时应显示的内容。
返回类型:布尔序列,其中元素以pat开头则为True,否则为False
Series.str.endswith(pat, na=nan):查看元素是否以pat结尾1、常规赛数据格式勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:
pat:要搜索的字符串。
na:用于设置序列中的值为NULL时应显示的内容。
返回类型:布尔序列,其中元素以pat结尾则为True,否则为False
日期 | 对手 | 比分 | 时间 | 投篮 | ... |
05/17 | 鹈鹕 | 110-98(胜) | 27 | 11-22 | ... |
05/16 | 步行者 | 122-115(胜) | 28 | 11-22 | ... |
... | ... | ... | ... | ... | ... |
import numpy as np
import pandas an pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df02 = df[df['日期'].str.startswith('02')]
DataFrame表df02即为詹姆斯2月份的数据:
日期 | 对手 | 比分 | 时间 | 投篮 | ... |
02/27 | 开拓者 | 93-102(胜) | 36 | 11-21 | ... |
02/25 | 爵士 | 89-114(败) | 28 | 7-13 | ... |
... | ... | ... | ... | ... | ... |
scores = df02['得分'].mean()
rebounds = df02['篮板'].mean()
assists = df02['助攻'].mean()
【简单的编程|[话说NBA]pandas文本数据方法str.startswith()函数】通过计算得到,詹姆斯2020年2月份的平均得分为26.38分,平均篮板为8.85个,平均助攻为8.69个,非常全面的数据。
推荐阅读
- 热闹中的孤独
- JAVA(抽象类与接口的区别&重载与重写&内存泄漏)
- 放屁有这三个特征的,请注意啦!这说明你的身体毒素太多
- 一个人的旅行,三亚
- 布丽吉特,人生绝对的赢家
- 慢慢的美丽
- 尽力
- 一个小故事,我的思考。
- 家乡的那条小河
- 《真与假的困惑》???|《真与假的困惑》??? ——致良知是一种伟大的力量