python信息熵函数 python 熵值法( 四 )


第4章 常用科学计算模块快速入门
4.1 Pandas科学计算库4.1.1 初识Pandas4.1.2 Pandas基本操作4.2 Matplotlib可视化图库4.2.1 初识Matplotlib4.2.2 Matplotlib基本操作4.2.3 Matplotlib绘图案例4.3 SciPy科学计算库4.3.1 初识SciPy4.3.2 SciPy基本操作4.3.3 SciPy图像处理案例第5章 Python网络爬虫5.1 爬虫基础5.1.1 初识爬虫5.1.2 网络爬虫的算法5.2 爬虫入门实战5.2.1 调用API5.2.2 爬虫实战5.3 爬虫进阶—高效率爬虫5.3.1 多进程5.3.2 多线程5.3.3 协程5.3.4 小结
第6章 Python数据存储
6.1 关系型数据库MySQL6.1.1 初识MySQL6.1.2 Python操作MySQL6.2 NoSQL之MongoDB6.2.1 初识NoSQL6.2.2 Python操作MongoDB6.3 本章小结6.3.1 数据库基本理论6.3.2 数据库结合6.3.3 结束语
第7章 Python数据分析
7.1 数据获取7.1.1 从键盘获取数据7.1.2 文件的读取与写入7.1.3 Pandas读写操作7.2 数据分析案例7.2.1 普查数据统计分析案例7.2.2 小结
第8章 自然语言处理
8.1 Jieba分词基础8.1.1 Jieba中文分词8.1.2 Jieba分词的3种模式8.1.3 标注词性与添加定义词8.2 关键词提取8.2.1 TF-IDF关键词提取8.2.2 TextRank关键词提取8.3 word2vec介绍8.3.1 word2vec基础原理简介8.3.2 word2vec训练模型8.3.3 基于gensim的word2vec实战
第9章 从回归分析到算法基础
9.1 回归分析简介9.1.1 “回归”一词的来源9.1.2 回归与相关9.1.3 回归模型的划分与应用9.2 线性回归分析实战9.2.1 线性回归的建立与求解9.2.2 Python求解回归模型案例9.2.3 检验、预测与控制
第10章 从K-Means聚类看算法调参
10.1 K-Means基本概述10.1.1 K-Means简介10.1.2 目标函数10.1.3 算法流程10.1.4 算法优缺点分析10.2 K-Means实战
第11章 从决策树看算法升级
11.1 决策树基本简介11.2 经典算法介绍11.2.1 信息熵11.2.2 信息增益11.2.3 信息增益率11.2.4 基尼系数11.2.5 小结11.3 决策树实战11.3.1 决策树回归11.3.2 决策树的分类
第12章 从朴素贝叶斯看算法多变 193
12.1 朴素贝叶斯简介12.1.1 认识朴素贝叶斯12.1.2 朴素贝叶斯分类的工作过程12.1.3 朴素贝叶斯算法的优缺点12.2 3种朴素贝叶斯实战
第13章 从推荐系统看算法场景
13.1 推荐系统简介13.1.1 推荐系统的发展13.1.2 协同过滤13.2 基于文本的推荐13.2.1 标签与知识图谱推荐案例13.2.2 小结
第14章 从TensorFlow开启深度学习之旅
14.1 初识TensorFlow14.1.1 什么是TensorFlow14.1.2 安装TensorFlow14.1.3 TensorFlow基本概念与原理14.2 TensorFlow数据结构14.2.1 阶14.2.2 形状14.2.3 数据类型14.3 生成数据十二法14.3.1 生成Tensor14.3.2 生成序列14.3.3 生成随机数14.4 TensorFlow实战
希望对你有帮助?。。?
贵在坚持,自己掌握一些,在工作中不断打磨 , 高薪不是梦?。?
用python实现红酒数据集的ID3,C4.5和CART算法?ID3算法介绍
ID3算法全称为迭代二叉树3代算法(Iterative Dichotomiser 3)
该算法要先进行特征选择 , 再生成决策树,其中特征选择是基于“信息增益”最大的原则进行的 。
但由于决策树完全基于训练集生成的,有可能对训练集过于“依赖”,即产生过拟合现象 。因此在生成决策树后,需要对决策树进行剪枝 。剪枝有两种形式 , 分别为前剪枝(Pre-Pruning)和后剪枝(Post-Pruning),一般采用后剪枝 。
信息熵、条件熵和信息增益
信息熵:来自于香农定理,表示信息集合所含信息的平均不确定性 。信息熵越大 , 表示不确定性越大,所含的信息量也就越大 。
设x 1 , x 2 , x 3 , . . . x n {x_1, x_2, x_3, ...x_n}x

推荐阅读