关山初度尘未洗,策马扬鞭再奋蹄!这篇文章主要讲述# yyds干货盘点 # 实战篇:盘点Pandas中的factorize()函数妙用相关的知识,希望能为你提供帮助。
大家好,我是皮皮。
一、前言
前几天在python白银交流群有个叫【蛋蛋】的粉丝问了一个Pandas处理的问题,这里拿出来给大家分享下,一起学习下。
一开始我都没理解她的意思,以为只是简单的替换而已,之前【月神】给了一个代码,当时也写文章记录了,代码如下:
df[col2] = df[col1].map(1:"开心", 2:"悲伤", 3:"难过", 4:"泪目")
df
二、解决过程
这里【月神】给出了解答,使用??pd.factorize(data[a])[0]?
?完美地解决了这个问题。
这个类似于??onehot?
?编码,对类型进行了数字编码,如果想要把??nan?
?也编码,加一个参数??na_sentinel=None?
?。
这样一来,就完美地解决了问题。
关于??pd.factorize()?
?函数的定义如下:
pandas.factorize(values, sort=False, order=None, na_sentinel=-1, size_hint=None) Encode input values as an enumerated type or categorical variable
简单来说,它可以实现将字符串特征转化为数字特征。
【# yyds干货盘点 # 实战篇(盘点Pandas中的factorize()函数妙用)】
三、总结
大家好,我是皮皮。这篇文章主要分享了Pandas中数据处理的问题,主要讲解了??pd.factorize()?
?函数的应用,它可以实现将字符串特征转化为数字特征,针对该问题给出了具体的解析和代码演示,帮助粉丝顺利解决了问题。
最后感谢粉丝【蛋蛋】提问,感谢【月神】和【皮皮】给出的具体解析和代码演示,感谢【dcpeng】、【冫马讠成】等人参与学习交流。
小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。
推荐阅读
- 准时下班系列!Access合集之第5集—闭环的Access系统开发流程演示
- RouterOS 重置密码
- 二叉树面试题(前中序求后序中后序求前序)
- 一文了解 Python 中的生成器#私藏项目实操分享#
- 五分钟后,你将真正理解MySQL事务隔离级别!
- Kubernetes------YAML
- Django模版与vue.js渲染冲突问题
- 《OpenHarmony 3GPP协议开发深度剖析》之--PLMN业务源码解读
- [OpenCV实战]1 基于深度学习识别人脸性别和年龄