ApacheCN 数据科学译文集 20211109 更新

  • 计算与推断思维
    • 一、数据科学
    • 二、因果和实验
    • 三、Python 编程
    • 四、数据类型
    • 五、表格
    • 六、可视化
    • 七、函数和表格
    • 八、随机性
    • 九、经验分布
    • 十、假设检验
    • 十一、估计
    • 十二、为什么均值重要
    • 十三、预测
    • 十四、回归的推断
    • 十五、分类
    • 十六、比较两个样本
    • 十七、更新预测
  • 利用 Python 进行数据分析 · 第 2 版
    • 第 1 章 准备工作
    • 第 2 章 Python 语法基础,IPython 和 Jupyter 笔记本
    • 第 3 章 Python 的数据结构、函数和文件
    • 第 4 章 NumPy 基础:数组和向量计算
    • 第 5 章 pandas 入门
    • 第 6 章 数据加载、存储与文件格式
    • 第 7 章 数据清洗和准备
    • 第 8 章 数据规整:聚合、合并和重塑
    • 第 9 章 绘图和可视化
    • 第 10 章 数据聚合与分组运算
    • 第 11 章 时间序列
    • 第 12 章 pandas 高级应用
    • 第 13 章 Python 建模库介绍
    • 第 14 章 数据分析案例
    • 附录 A NumPy 高级应用
    • 附录 B 更多关于 IPython 的内容
  • Python 自然语言处理 第二版
    • 前言
    • 1 语言处理与 Python
    • 2 获得文本语料和词汇资源
    • 3 处理原始文本
    • 4 编写结构化程序
    • 5 分类和标注词汇
    • 6 学习分类文本
    • 7 从文本提取信息
    • 8 分析句子结构
    • 9 构建基于特征的语法
    • 10 分析句子的意思
    • 11 语言学数据管理
    • 后记:语言的挑战
    • 索引
  • 复杂性思维 中文第二版
    • 一、复杂性科学
    • 二、图
    • 三、小世界图
    • 四、无标度网络
    • 五、细胞自动机
    • 六、生命游戏
    • 七、物理建模
    • 八、自组织临界
    • 九、基于智能体的模型
    • 十、兽群、鸟群和交通堵塞
    • 十一、进化
    • 十二、合作进化
    • 附录 A、算法分析
    • 附录 B、阅读列表
  • 数据可视化的基础知识
    • 欢迎
    • 前言
    • 1 简介
    • 2 可视化数据:将数据映射到美学上
    • 3 坐标系和轴
    • 4 颜色刻度
    • 5 可视化的目录
    • 6 可视化数量
    • 7 可视化分布:直方图和密度图
    • 8 可视化分布:经验累积分布函数和 q-q 图
    • 9 一次可视化多个分布
    • 10 可视化比例
    • 11 可视化嵌套比例
    • 12 可视化两个或多个定量变量之间的关联
    • 13 可视化自变量的时间序列和其他函数
    • 14 可视化趋势
    • 15 可视化地理空间数据
    • 16 可视化不确定性
    • 17 比例墨水原理
    • 18 处理重叠点
    • 19 颜色使用的常见缺陷
    • 20 冗余编码
    • 21 多面板图形
    • 22 标题,说明和表格
    • 23 平衡数据和上下文
    • 24 使用较大的轴标签
    • 25 避免线条图
    • 26 不要走向 3D
    • 27 了解最常用的图像文件格式
    • 28 选择合适的可视化软件
    • 29 讲述一个故事并提出一个观点
    • 30 带注解的参考书目
    • 技术注解
    • 参考
  • TutorialsPoint NumPy 教程
  • NumPy 秘籍中文第二版
    • 零、前言
    • 一、使用 IPython
    • 二、高级索引和数组概念
    • 三、掌握常用函数
    • 四、将 NumPy 与世界的其他地方连接
    • 五、音频和图像处理
    • 六、特殊数组和通用函数
    • 七、性能分析和调试
    • 八、质量保证
    • 九、使用 Cython 加速代码
    • 十、Scikits 的乐趣
    • 十一、最新最强的 NumPy
    • 十二、使用 NumPy 进行探索性和预测性数据分析
  • NumPy 初学者指南中文第三版
    • 零、前言
    • 一、NumPy 快速入门
    • 二、从 NumPy 基本原理开始
    • 三、熟悉常用函数
    • 四、为您带来便利的便利函数
    • 五、使用矩阵和 ufunc
    • 六、深入探索 NumPy 模块
    • 七、了解特殊例程
    • 八、通过测试确保质量
    • 九、matplotlib 绘图
    • 十、当 NumPy 不够用时 - SciPy 及更多
    • 十一、玩转 Pygame
    • 附录 A:小测验答案
    • 附录 B:其他在线资源
    • 附录 C:NumPy 函数的参考
  • NumPy 基础知识
    • 零、前言
    • 一、NumPy 简介
    • 二、NumPy ndarray对象
    • 三、使用 NumPy 数组
    • 四、NumPy 核心和子模块
    • 五、NumPy 中的线性代数
    • 六、NumPy 中的傅立叶分析
    • 七、构建和分发 NumPy 代码
    • 八、使用 Cython 加速 NumPy
    • 九、NumPy C-API 简介
    • 十、扩展阅读
  • 精通 NumPy 数值分析
    • 零、前言
    • 一、使用 NumPy 数组
    • 二、NumPy 线性代数
    • 三、使用 NumPy 统计函数对波士顿住房数据进行探索性数据分析
    • 四、使用线性回归预测房价
    • 五、使用 NumPy 对批发分销商的客户进行聚类
    • 六、NumPy,SciPy,Pandas 和 Scikit-Learn
    • 七、高级 NumPy
    • 八、高性能数值计算库概述
    • 九、性能基准
  • NumPy 数组学习手册
    • 零、前言
    • 一、NumPy 入门
    • 二、NumPy 基础
    • 三、使用 NumPy 的基本数据分析
    • 四、使用 NumPy 的简单预测性分析
    • 五、信号处理技术
    • 六、性能分析,调试和测试
    • 七、Python 科学生态系统
  • 精通 SciPy
    • 零、前言
    • 一、数值线性代数
    • 二、插值和近似
    • 三、微分与积分
    • 四、非线性方程式和最优化
    • 五、常微分方程的初值问题
    • 六、计算几何
    • 七、描述性统计
    • 八、推断和数据分析
    • 九、数字图像处理
  • Pandas 秘籍
    • 零、前言
    • 一、Pandas 基础
    • 二、数据帧基本操作
    • 三、开始数据分析
    • 四、选择数据子集
    • 五、布尔索引
    • 六、索引对齐
    • 七、分组以进行汇总,过滤和转换
    • 八、将数据重组为整齐的表格
    • 九、组合 Pandas 对象
    • 十、时间序列分析
    • 十一、Pandas,Matplotlib 和 Seaborn 的可视化
  • Pandas 学习手册中文第二版
    • 零、前言
    • 一、Pandas 与数据分析
    • 二、启动和运行 Pandas
    • 三、用序列表示单变量数据
    • 四、用数据帧表示表格和多元数据
    • 五、数据帧的结构操作
    • 六、索引数据
    • 七、类别数据
    • 八、数值统计方法
    • 九、存取数据
    • 十、整理数据
    • 十一、合并,连接和重塑数据
    • 十二、数据聚合
    • 十三、时间序列建模
    • 十四、可视化
    • 十五、历史股价分析
  • 精通 Pandas
    • 零、前言
    • 一、Pandas 和数据分析简介
    • 二、Pandas 安装和支持软件
    • 三、Pandas 数据结构
    • 四、Pandas 的操作,第一部分 -- 索引和选择
    • 五、Pandas 的操作,第二部分 -- 数据的分组,合并和重塑
    • 六、处理缺失数据,时间序列和 Matplotlib 绘图
    • 七、统计之旅 -- 经典方法
    • 八、贝叶斯统计简介
    • 九、Pandas 库体系结构
    • 十、R 与 Pandas 的比较
    • 十一、机器学习简介
  • NumPy 和 Pandas 数据分析实用指南
    • 零、前言
    • 一、配置 Python 数据分析环境
    • 二、探索 NumPy
    • 三、NumPy 数组上的运算
    • 四、Pandas 很有趣! 什么是 Pandas?
    • 五、Pandas 的算术,函数应用以及映射
    • 六、排序,索引和绘图
  • 【ApacheCN 数据科学译文集 20211109 更新】精通 Pandas 探索性分析
    • 零、前言
    • 一、处理不同种类的数据集
    • 二、数据选择
    • 三、处理,转换和重塑数据
    • 四、像专业人士一样可视化数据
  • Matplotlib 3.0 秘籍
    • 零、前言
    • 一、Matplotlib 的剖析
    • 二、基本绘图入门
    • 三、绘制多个图表和子图
    • 四、开发可视化来提高发布质量
    • 五、使用高级功能的绘图
    • 六、嵌入文本和表达式
    • 七、以不同格式保存图形
    • 八、开发交互式绘图
    • 九、在图形用户界面中嵌入绘图
    • 十、使用mplot3d工具包绘制 3D 图形
    • 十一、使用axisartist工具包
    • 十二、使用axes_grid1工具包
    • 十三、使用 Cartopy 工具包绘制地理地图
    • 十四、使用 Seaborn 工具包的探索性数据分析
  • Matplotlib 绘图秘籍
    • 零、前言
    • 一、第一步
    • 二、自定义颜色和样式
    • 三、处理标注
    • 四、处理图形
    • 五、文件输出
    • 六、处理地图
    • 七、处理 3D 图形
    • 八、用户界面
  • UCSD COGS108 数据科学实战中文笔记
    • 零、数据科学实战
    • 一、Jupyter 笔记本
    • 二、数据分析
    • 三、Python
    • 四、Python 中的数据科学
    • 五、数据收集
    • 六、数据整理
    • 七、数据清理
    • 八、数据隐私和匿名化
    • 九、使用 Python 进行数据可视化
    • 十、分布
    • 十一、检验分布
    • 十三、普通最小二乘
    • 十四、线性模型
    • 十五、聚类
    • 十六、降维
    • 十七、分类
    • 十八、自然语言处理
    • 附录一、有用的 Python 数据科学包
    • 附录二、git/Github 版本控制工具
  • USF MSDS501 计算数据科学中文讲义
    • 一、起步
      • 1.1 一些动机(音频处理)
      • 1.2 Python 工具的初次尝试
      • 1.3 播放声音
    • 二、设计和构建程序
      • 2.1 编程导论
      • 2.2 在内存中表示数据
      • 2.3 计算模型
      • 2.4 Python 中的编程模式
      • 2.5 数据别名
      • 2.6 使用函数组织你的代码
      • 2.7 如何阅读代码
      • 2.8 面向对象编程
    • 三、关键编程模式
      • 3.1 加载文件
      • 3.2 数据帧
      • 3.3 操纵和可视化数据
    • 四、用于计算和优化的迭代式方法
      • 4.1 生成均匀的随机数
      • 4.2 近似平方根
      • 4.3 单变量梯度下降
    • 五、常见编程工具
      • 5.1 使用 bash 走向胜利
      • 5.2 使用 git 版本控制工具
      • 5.3 在 Amazon Web Services 上启动虚拟机
    • 六、可选
      • 6.1 链表
  • fast.ai 数值线性代数讲义中文版 v2
    • 一、我们为什么在这里
    • 二、SVD 背景消除
    • 三、使用 NMF 和 SVD 的主题建模
    • 四、随机化 SVD
    • 五、LU 分解
    • 六、使用鲁棒回归的 CT 扫描的压缩感知
    • 七、线性回归和健康结果
    • 八、如何实现线性回归
    • 九、PageRank 和特征值分解
    • 十、实现 QR 分解
  • 社交媒体挖掘
    • 第一部分 数据挖掘
      • 1 应了解的编程语言
      • 2 从哪里获取数据
      • 3 用代码获取数据
      • 4 收集自己的 FACEBOOK 数据
      • 5 抓取实时站点
    • 第二部分 数据分析
      • 6 数据分析导论
      • 7 数据可视化
      • 8 数据分析的高级工具
      • 9 在 REDDIT 数据中寻找趋势
      • 10 测量公众人物的 Twitter 活动
      • 11 何去何从
    • 附录
      • 1 编写程序通过 API 获取网站的信息
      • 2 通过解析网页直接获取哔哩某播主的详细信息
      • 3 在离线表格软件中打开和处理 csv 文件
  • 数据科学和人工智能技术笔记
    • 一、向量、矩阵和数组
    • 二、数据准备
    • 三、数据预处理
    • 四、图像预处理
    • 五、文本预处理
    • 六、日期时间预处理
    • 七、特征工程
    • 八、特征选择
    • 九、模型验证
    • 十、模型选择
    • 十一、线性回归
    • 十二、逻辑回归
    • 十三、树和森林
    • 十四、K 最近邻
    • 十五、支持向量机
    • 十六、朴素贝叶斯
    • 十七、聚类
    • 十八、Keras
    • 十九、数据整理(上)
    • 十九、数据整理(下)
    • 二十、数据可视化
    • 二十一、统计学
  • Python 和 Jupyter 机器学习入门
    • 零、前言
    • 一、Jupyter 基础知识
    • 二、数据清理和高级机器学习
    • 三、Web 爬取和交互式可视化
  • Python 数据科学和机器学习实践指南
    • 零、前言
    • 一、入门
    • 二、统计和概率回顾和 Python 实践
    • 三、Matplotlib 和高级概率概念
    • 四、预测模型
    • 五、Python 机器学习
    • 六、推荐系统
    • 七、更多数据挖掘和机器学习技术
    • 八、处理真实数据
    • 九、Apache Spark-大数据机器学习
    • 十、测试与实验设计
  • 精通 Python 数据科学
    • 零、前言
    • 一、原始数据入门
    • 二、推断统计
    • 三、大海捞针
    • 四、通过高级可视化感知数据
    • 五、发现机器学习
    • 六、使用线性回归执行预测
    • 七、估计事件的可能性
    • 八、使用协同过滤生成建议
    • 九、使用集成模型扩展边界
    • 十、通过 K 均值聚类应用细分
    • 十一、通过文本挖掘分析非结构化数据
    • 十二、在大数据世界中利用 Python
  • Python 数据科学本质论
    • 零、前言
    • 一、第一步
    • 二、数据整理
    • 三、数据管道
    • 四、机器学习
    • 五、可视化,见解和结果
    • 六、社交网络分析
    • 七、超越基础的深度学习
    • 八、大数据和 Spark
    • 九、加强您的 Python 基础
  • 数据科学思想
    • 零、前言
    • 一、开发人员对数据科学的看法
    • 二、使用 Jupyter 笔记本和 PixieDust 的大规模数据科学
    • 三、PixieApp 深入了解
    • 四、使用 PixieGateway 服务器将 PixieApp 部署到 Web
    • 五、最佳实践和高级 PixieDust 概念
    • 六、TensorFlow 图像识别
    • 七、大数据和 Twitter 情感分析
    • 八、金融时间序列分析和预测
    • 九、使用图的美国国内航班数据分析
    • 十、最终思想
    • 十一、附录 A:PixieApp 快速参考
  • Python 仿真建模实用指南
    • 序言
    • 第一部分:数值仿真入门
      • 一、仿真模型简介
      • 二、理解随机性和随机数
      • 三、概率和数据生成过程
    • 第二部分:仿真建模算法与技术
      • 四、探索蒙特卡罗仿真
      • 五、基于仿真的马尔可夫决策过程
      • 六、重采样方法
      • 七、利用仿真改进和优化系统
    • 第三部分:实际应用
      • 八、将仿真模型用于金融工程
      • 九、使用神经网络仿真物理现象
      • 十、项目管理建模与仿真
      • 十一、下一步是什么?
下载 Docker
docker pull apachecn0/apachecn-ds-zh docker run -tid -p :80 apachecn0/apachecn-ds-zh # 访问 http://localhost:{port}

PYPI
pip install apachecn-ds-zh apachecn-ds-zh # 访问 http://localhost:{port}

NPM
npm install -g apachecn-ds-zh apachecn-ds-zh # 访问 http://localhost:{port}

贡献指南 本项目需要校对,欢迎大家提交 Pull Request。
请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)
组织介绍 访问我们的主页。
赞助我们 通过平台自带的打赏功能,或点击这里。

    推荐阅读