python-机器学习-数据标签转化 _机器学习

知识的领域是无限的,我们的学习也是无限期的。这篇文章主要讲述python-机器学习-数据标签转化相关的知识，希望能为你提供帮助。
目的：一般情况下，我们拿到的数据有自变量部分和因变量部分，而因变量部分有时候不是有数字形式表示，而是有字符串表示，比如身高的因变量为lowest，lower，low，high，higher，highest。
这是在进行机器学习模型训练时，需要将其转化为数字形式，共有以下两种操作可以实现。
【python-机器学习-数据标签转化】方法1：利用pandas的Categorical方法的codes属性
方法2：利用sklearn包的preprocessing模块的LabelEncoder类
代码实现如下：

# -*- coding:utf-8 -*-
import pandas as pd
import numpy as np
import sys, os, re
from sklearn.preprocessing import LabelEncoder

labels= ["LUSC", "LUAD", "Normal"] * 10
samples= np.random.randn(len(labels), 4)

data = https://www.songbingjia.com/android/pd.DataFrame(data = samples, columns = ["feature1", "feature2", "feature3", "feature4"])
data["label"] = labels
print("原始数据\\n", data.head())
y1 = pd.Categorical(data.label).codes # 方法1：
y2 = LabelEncoder().fit_transform(data.label)# 方法2：
print("pandas的Categorical方法的codes属性：\\n", y1)
print("sklearn.preprocessing的LabelEncoder类: \\n", y2)
data.label = y1 # data.label = y2
print("转换字符标签为数字标签后的数据：\\n", data.head())

Categorical

python-机器学习-数据标签转化

推荐阅读

社区走访残疾人简报慰问残疾人

大便不成形治疗方法三十年大便不成形严重吗

北京移动营业厅网站官网，北京移动手机营业厅官网

CAD2019关于曲线式对象

Word2019怎么字数统计的方法

汽车胎压报警标志胎压警示灯标志

明知不可为,而为之是什么意思明之不可为而为之是什么意思

多肉黑斑病怎么治

这年头，不多看几本书，电视剧都看不懂

ff14生产代练 ff14如何代工，ff14谁代理的

刚怀孕的时候有些腰痛，现在才5个月，腰还是痛，要怎么预防孕期腰痛啊！

Windows Search搜索网页预览不可用怎么办？

办公室白领预防背痛7妙招，办公室后背疼

富士|必买：便宜还好用照片打印机我就选这几款

襄城县招教真题襄城县招教公告

藏历新年,人们见面时都要说“扎西德勒”是什么意思？

Win7系统LOL登录时遇到了一个预期之外的错误如何解决？

Win8系统下防火墙显示“0x80070422出错”的多种处理技巧

在 vue 中动态绑定 v-model

抖音女博士相宜为什么会遭到那么多质疑？