机器学习简介

简介

机器学习基本概念,原理,历史,未来趋势,常见算法
语音识别
ocr工具(图像转文本)、 tts(文本转语音)、ASR_APP(语音转文本)
图像检测
机器翻译
风格迁移
NLP(自然语言处理)
搜索引擎
。。。。
算法模型 训练集 测试集 验证集
5W2H how machines learning works: 1. select data (training data, validation data,test data) -> 训练集 测试集 验证集 2. Model data(训练集构建相关特征的model) -> 3. Validate Model -> 4. test model -> 5. use the model -> 6.Tune model Machines can 'learn' by analyzing large amounts of data. 它通过数据分析获得数据规律,并将这些规律应用于预测或判定其他未知数据 数据科学Work Flow: 获取(数据存在不同的格式) -> 检查和探索 -> 清理和准备 -> 建模 -> 评估 -> 最后的部署

数据科学的工作流程
  1. 获取:
    不同的数据源,不同的数据格式
  2. 检查和探索:
    合理地检查数据
    检查最极端的情况
    统计测试,并将数据可视化
    数据是否缺失或者不完整
    Jupyter pandas matplotlib
    Seaborn = 专门为统计可视化创建的库
  3. 清理和准备
    转换为适合于模型使用的格式
    过滤 - 聚集 输入 - 转化
  4. 建模
    选择适当的算法,并在数据上训练出一个模型
    将数据分割为训练 测试和验证的集合
  5. 评估
    模型构建完成并开始进行预测
    实际值与评估之间的距离测量
  6. 部署
    一个定制的Web应用程序,甚至是一个简单的cron作业
常见机器学习算法
  1. 决策树(Decision Tree)
NLP
nlu 自然语言理解包括三块: 1. 领域识别 2. 意图识别 3. 槽填充

【机器学习简介】参考链接: http://www.cyzone.cn/article/159742.html
https://easyai.tech/ai-definition/machine-learning/

    推荐阅读