ApacheCN 数据科学译文集 20211109 更新数据科学

计算与推断思维
- 一、数据科学
- 二、因果和实验
- 三、Python 编程
- 四、数据类型
- 五、表格
- 六、可视化
- 七、函数和表格
- 八、随机性
- 九、经验分布
- 十、假设检验
- 十一、估计
- 十二、为什么均值重要
- 十三、预测
- 十四、回归的推断
- 十五、分类
- 十六、比较两个样本
- 十七、更新预测
利用 Python 进行数据分析 · 第 2 版
- 第 1 章准备工作
- 第 2 章 Python 语法基础，IPython 和 Jupyter 笔记本
- 第 3 章 Python 的数据结构、函数和文件
- 第 4 章 NumPy 基础：数组和向量计算
- 第 5 章 pandas 入门
- 第 6 章数据加载、存储与文件格式
- 第 7 章数据清洗和准备
- 第 8 章数据规整：聚合、合并和重塑
- 第 9 章绘图和可视化
- 第 10 章数据聚合与分组运算
- 第 11 章时间序列
- 第 12 章 pandas 高级应用
- 第 13 章 Python 建模库介绍
- 第 14 章数据分析案例
- 附录 A NumPy 高级应用
- 附录 B 更多关于 IPython 的内容
Python 自然语言处理第二版
- 前言
- 1 语言处理与 Python
- 2 获得文本语料和词汇资源
- 3 处理原始文本
- 4 编写结构化程序
- 5 分类和标注词汇
- 6 学习分类文本
- 7 从文本提取信息
- 8 分析句子结构
- 9 构建基于特征的语法
- 10 分析句子的意思
- 11 语言学数据管理
- 后记：语言的挑战
- 索引
复杂性思维中文第二版
- 一、复杂性科学
- 二、图
- 三、小世界图
- 四、无标度网络
- 五、细胞自动机
- 六、生命游戏
- 七、物理建模
- 八、自组织临界
- 九、基于智能体的模型
- 十、兽群、鸟群和交通堵塞
- 十一、进化
- 十二、合作进化
- 附录 A、算法分析
- 附录 B、阅读列表
数据可视化的基础知识
- 欢迎
- 前言
- 1 简介
- 2 可视化数据：将数据映射到美学上
- 3 坐标系和轴
- 4 颜色刻度
- 5 可视化的目录
- 6 可视化数量
- 7 可视化分布：直方图和密度图
- 8 可视化分布：经验累积分布函数和 q-q 图
- 9 一次可视化多个分布
- 10 可视化比例
- 11 可视化嵌套比例
- 12 可视化两个或多个定量变量之间的关联
- 13 可视化自变量的时间序列和其他函数
- 14 可视化趋势
- 15 可视化地理空间数据
- 16 可视化不确定性
- 17 比例墨水原理
- 18 处理重叠点
- 19 颜色使用的常见缺陷
- 20 冗余编码
- 21 多面板图形
- 22 标题，说明和表格
- 23 平衡数据和上下文
- 24 使用较大的轴标签
- 25 避免线条图
- 26 不要走向 3D
- 27 了解最常用的图像文件格式
- 28 选择合适的可视化软件
- 29 讲述一个故事并提出一个观点
- 30 带注解的参考书目
- 技术注解
- 参考
TutorialsPoint NumPy 教程
NumPy 秘籍中文第二版
- 零、前言
- 一、使用 IPython
- 二、高级索引和数组概念
- 三、掌握常用函数
- 四、将 NumPy 与世界的其他地方连接
- 五、音频和图像处理
- 六、特殊数组和通用函数
- 七、性能分析和调试
- 八、质量保证
- 九、使用 Cython 加速代码
- 十、Scikits 的乐趣
- 十一、最新最强的 NumPy
- 十二、使用 NumPy 进行探索性和预测性数据分析
NumPy 初学者指南中文第三版
- 零、前言
- 一、NumPy 快速入门
- 二、从 NumPy 基本原理开始
- 三、熟悉常用函数
- 四、为您带来便利的便利函数
- 五、使用矩阵和 ufunc
- 六、深入探索 NumPy 模块
- 七、了解特殊例程
- 八、通过测试确保质量
- 九、matplotlib 绘图
- 十、当 NumPy 不够用时 - SciPy 及更多
- 十一、玩转 Pygame
- 附录 A：小测验答案
- 附录 B：其他在线资源
- 附录 C：NumPy 函数的参考
NumPy 基础知识
- 零、前言
- 一、NumPy 简介
- 二、NumPy ndarray对象
- 三、使用 NumPy 数组
- 四、NumPy 核心和子模块
- 五、NumPy 中的线性代数
- 六、NumPy 中的傅立叶分析
- 七、构建和分发 NumPy 代码
- 八、使用 Cython 加速 NumPy
- 九、NumPy C-API 简介
- 十、扩展阅读
精通 NumPy 数值分析
- 零、前言
- 一、使用 NumPy 数组
- 二、NumPy 线性代数
- 三、使用 NumPy 统计函数对波士顿住房数据进行探索性数据分析
- 四、使用线性回归预测房价
- 五、使用 NumPy 对批发分销商的客户进行聚类
- 六、NumPy，SciPy，Pandas 和 Scikit-Learn
- 七、高级 NumPy
- 八、高性能数值计算库概述
- 九、性能基准
NumPy 数组学习手册
- 零、前言
- 一、NumPy 入门
- 二、NumPy 基础
- 三、使用 NumPy 的基本数据分析
- 四、使用 NumPy 的简单预测性分析
- 五、信号处理技术
- 六、性能分析，调试和测试
- 七、Python 科学生态系统
精通 SciPy
- 零、前言
- 一、数值线性代数
- 二、插值和近似
- 三、微分与积分
- 四、非线性方程式和最优化
- 五、常微分方程的初值问题
- 六、计算几何
- 七、描述性统计
- 八、推断和数据分析
- 九、数字图像处理
Pandas 秘籍
- 零、前言
- 一、Pandas 基础
- 二、数据帧基本操作
- 三、开始数据分析
- 四、选择数据子集
- 五、布尔索引
- 六、索引对齐
- 七、分组以进行汇总，过滤和转换
- 八、将数据重组为整齐的表格
- 九、组合 Pandas 对象
- 十、时间序列分析
- 十一、Pandas，Matplotlib 和 Seaborn 的可视化
Pandas 学习手册中文第二版
- 零、前言
- 一、Pandas 与数据分析
- 二、启动和运行 Pandas
- 三、用序列表示单变量数据
- 四、用数据帧表示表格和多元数据
- 五、数据帧的结构操作
- 六、索引数据
- 七、类别数据
- 八、数值统计方法
- 九、存取数据
- 十、整理数据
- 十一、合并，连接和重塑数据
- 十二、数据聚合
- 十三、时间序列建模
- 十四、可视化
- 十五、历史股价分析
精通 Pandas
- 零、前言
- 一、Pandas 和数据分析简介
- 二、Pandas 安装和支持软件
- 三、Pandas 数据结构
- 四、Pandas 的操作，第一部分 -- 索引和选择
- 五、Pandas 的操作，第二部分 -- 数据的分组，合并和重塑
- 六、处理缺失数据，时间序列和 Matplotlib 绘图
- 七、统计之旅 -- 经典方法
- 八、贝叶斯统计简介
- 九、Pandas 库体系结构
- 十、R 与 Pandas 的比较
- 十一、机器学习简介
NumPy 和 Pandas 数据分析实用指南
- 零、前言
- 一、配置 Python 数据分析环境
- 二、探索 NumPy
- 三、NumPy 数组上的运算
- 四、Pandas 很有趣！什么是 Pandas？
- 五、Pandas 的算术，函数应用以及映射
- 六、排序，索引和绘图
【ApacheCN 数据科学译文集 20211109 更新】精通 Pandas 探索性分析
- 零、前言
- 一、处理不同种类的数据集
- 二、数据选择
- 三、处理，转换和重塑数据
- 四、像专业人士一样可视化数据
Matplotlib 3.0 秘籍
- 零、前言
- 一、Matplotlib 的剖析
- 二、基本绘图入门
- 三、绘制多个图表和子图
- 四、开发可视化来提高发布质量
- 五、使用高级功能的绘图
- 六、嵌入文本和表达式
- 七、以不同格式保存图形
- 八、开发交互式绘图
- 九、在图形用户界面中嵌入绘图
- 十、使用mplot3d工具包绘制 3D 图形
- 十一、使用axisartist工具包
- 十二、使用axes_grid1工具包
- 十三、使用 Cartopy 工具包绘制地理地图
- 十四、使用 Seaborn 工具包的探索性数据分析
Matplotlib 绘图秘籍
- 零、前言
- 一、第一步
- 二、自定义颜色和样式
- 三、处理标注
- 四、处理图形
- 五、文件输出
- 六、处理地图
- 七、处理 3D 图形
- 八、用户界面
UCSD COGS108 数据科学实战中文笔记
- 零、数据科学实战
- 一、Jupyter 笔记本
- 二、数据分析
- 三、Python
- 四、Python 中的数据科学
- 五、数据收集
- 六、数据整理
- 七、数据清理
- 八、数据隐私和匿名化
- 九、使用 Python 进行数据可视化
- 十、分布
- 十一、检验分布
- 十三、普通最小二乘
- 十四、线性模型
- 十五、聚类
- 十六、降维
- 十七、分类
- 十八、自然语言处理
- 附录一、有用的 Python 数据科学包
- 附录二、git/Github 版本控制工具
USF MSDS501 计算数据科学中文讲义
- 一、起步
  - 1.1 一些动机（音频处理）
  - 1.2 Python 工具的初次尝试
  - 1.3 播放声音
- 二、设计和构建程序
  - 2.1 编程导论
  - 2.2 在内存中表示数据
  - 2.3 计算模型
  - 2.4 Python 中的编程模式
  - 2.5 数据别名
  - 2.6 使用函数组织你的代码
  - 2.7 如何阅读代码
  - 2.8 面向对象编程
- 三、关键编程模式
  - 3.1 加载文件
  - 3.2 数据帧
  - 3.3 操纵和可视化数据
- 四、用于计算和优化的迭代式方法
  - 4.1 生成均匀的随机数
  - 4.2 近似平方根
  - 4.3 单变量梯度下降
- 五、常见编程工具
  - 5.1 使用 bash 走向胜利
  - 5.2 使用 git 版本控制工具
  - 5.3 在 Amazon Web Services 上启动虚拟机
- 六、可选
  - 6.1 链表
fast.ai 数值线性代数讲义中文版 v2
- 一、我们为什么在这里
- 二、SVD 背景消除
- 三、使用 NMF 和 SVD 的主题建模
- 四、随机化 SVD
- 五、LU 分解
- 六、使用鲁棒回归的 CT 扫描的压缩感知
- 七、线性回归和健康结果
- 八、如何实现线性回归
- 九、PageRank 和特征值分解
- 十、实现 QR 分解
社交媒体挖掘
- 第一部分数据挖掘
  - 1 应了解的编程语言
  - 2 从哪里获取数据
  - 3 用代码获取数据
  - 4 收集自己的 FACEBOOK 数据
  - 5 抓取实时站点
- 第二部分数据分析
  - 6 数据分析导论
  - 7 数据可视化
  - 8 数据分析的高级工具
  - 9 在 REDDIT 数据中寻找趋势
  - 10 测量公众人物的 Twitter 活动
  - 11 何去何从
- 附录
  - 1 编写程序通过 API 获取网站的信息
  - 2 通过解析网页直接获取哔哩某播主的详细信息
  - 3 在离线表格软件中打开和处理 csv 文件
数据科学和人工智能技术笔记
- 一、向量、矩阵和数组
- 二、数据准备
- 三、数据预处理
- 四、图像预处理
- 五、文本预处理
- 六、日期时间预处理
- 七、特征工程
- 八、特征选择
- 九、模型验证
- 十、模型选择
- 十一、线性回归
- 十二、逻辑回归
- 十三、树和森林
- 十四、K 最近邻
- 十五、支持向量机
- 十六、朴素贝叶斯
- 十七、聚类
- 十八、Keras
- 十九、数据整理（上）
- 十九、数据整理（下）
- 二十、数据可视化
- 二十一、统计学
Python 和 Jupyter 机器学习入门
- 零、前言
- 一、Jupyter 基础知识
- 二、数据清理和高级机器学习
- 三、Web 爬取和交互式可视化
Python 数据科学和机器学习实践指南
- 零、前言
- 一、入门
- 二、统计和概率回顾和 Python 实践
- 三、Matplotlib 和高级概率概念
- 四、预测模型
- 五、Python 机器学习
- 六、推荐系统
- 七、更多数据挖掘和机器学习技术
- 八、处理真实数据
- 九、Apache Spark-大数据机器学习
- 十、测试与实验设计
精通 Python 数据科学
- 零、前言
- 一、原始数据入门
- 二、推断统计
- 三、大海捞针
- 四、通过高级可视化感知数据
- 五、发现机器学习
- 六、使用线性回归执行预测
- 七、估计事件的可能性
- 八、使用协同过滤生成建议
- 九、使用集成模型扩展边界
- 十、通过 K 均值聚类应用细分
- 十一、通过文本挖掘分析非结构化数据
- 十二、在大数据世界中利用 Python
Python 数据科学本质论
- 零、前言
- 一、第一步
- 二、数据整理
- 三、数据管道
- 四、机器学习
- 五、可视化，见解和结果
- 六、社交网络分析
- 七、超越基础的深度学习
- 八、大数据和 Spark
- 九、加强您的 Python 基础
数据科学思想
- 零、前言
- 一、开发人员对数据科学的看法
- 二、使用 Jupyter 笔记本和 PixieDust 的大规模数据科学
- 三、PixieApp 深入了解
- 四、使用 PixieGateway 服务器将 PixieApp 部署到 Web
- 五、最佳实践和高级 PixieDust 概念
- 六、TensorFlow 图像识别
- 七、大数据和 Twitter 情感分析
- 八、金融时间序列分析和预测
- 九、使用图的美国国内航班数据分析
- 十、最终思想
- 十一、附录 A：PixieApp 快速参考
Python 仿真建模实用指南
- 序言
- 第一部分：数值仿真入门
  - 一、仿真模型简介
  - 二、理解随机性和随机数
  - 三、概率和数据生成过程
- 第二部分：仿真建模算法与技术
  - 四、探索蒙特卡罗仿真
  - 五、基于仿真的马尔可夫决策过程
  - 六、重采样方法
  - 七、利用仿真改进和优化系统
- 第三部分：实际应用
  - 八、将仿真模型用于金融工程
  - 九、使用神经网络仿真物理现象
  - 十、项目管理建模与仿真
  - 十一、下一步是什么？