ApacheCN 数据科学译文集 20211109 更新
- 计算与推断思维
- 一、数据科学
- 二、因果和实验
- 三、Python 编程
- 四、数据类型
- 五、表格
- 六、可视化
- 七、函数和表格
- 八、随机性
- 九、经验分布
- 十、假设检验
- 十一、估计
- 十二、为什么均值重要
- 十三、预测
- 十四、回归的推断
- 十五、分类
- 十六、比较两个样本
- 十七、更新预测
- 利用 Python 进行数据分析 · 第 2 版
- 第 1 章 准备工作
- 第 2 章 Python 语法基础,IPython 和 Jupyter 笔记本
- 第 3 章 Python 的数据结构、函数和文件
- 第 4 章 NumPy 基础:数组和向量计算
- 第 5 章 pandas 入门
- 第 6 章 数据加载、存储与文件格式
- 第 7 章 数据清洗和准备
- 第 8 章 数据规整:聚合、合并和重塑
- 第 9 章 绘图和可视化
- 第 10 章 数据聚合与分组运算
- 第 11 章 时间序列
- 第 12 章 pandas 高级应用
- 第 13 章 Python 建模库介绍
- 第 14 章 数据分析案例
- 附录 A NumPy 高级应用
- 附录 B 更多关于 IPython 的内容
- Python 自然语言处理 第二版
- 前言
- 1 语言处理与 Python
- 2 获得文本语料和词汇资源
- 3 处理原始文本
- 4 编写结构化程序
- 5 分类和标注词汇
- 6 学习分类文本
- 7 从文本提取信息
- 8 分析句子结构
- 9 构建基于特征的语法
- 10 分析句子的意思
- 11 语言学数据管理
- 后记:语言的挑战
- 索引
- 复杂性思维 中文第二版
- 一、复杂性科学
- 二、图
- 三、小世界图
- 四、无标度网络
- 五、细胞自动机
- 六、生命游戏
- 七、物理建模
- 八、自组织临界
- 九、基于智能体的模型
- 十、兽群、鸟群和交通堵塞
- 十一、进化
- 十二、合作进化
- 附录 A、算法分析
- 附录 B、阅读列表
- 数据可视化的基础知识
- 欢迎
- 前言
- 1 简介
- 2 可视化数据:将数据映射到美学上
- 3 坐标系和轴
- 4 颜色刻度
- 5 可视化的目录
- 6 可视化数量
- 7 可视化分布:直方图和密度图
- 8 可视化分布:经验累积分布函数和 q-q 图
- 9 一次可视化多个分布
- 10 可视化比例
- 11 可视化嵌套比例
- 12 可视化两个或多个定量变量之间的关联
- 13 可视化自变量的时间序列和其他函数
- 14 可视化趋势
- 15 可视化地理空间数据
- 16 可视化不确定性
- 17 比例墨水原理
- 18 处理重叠点
- 19 颜色使用的常见缺陷
- 20 冗余编码
- 21 多面板图形
- 22 标题,说明和表格
- 23 平衡数据和上下文
- 24 使用较大的轴标签
- 25 避免线条图
- 26 不要走向 3D
- 27 了解最常用的图像文件格式
- 28 选择合适的可视化软件
- 29 讲述一个故事并提出一个观点
- 30 带注解的参考书目
- 技术注解
- 参考
- TutorialsPoint NumPy 教程
- NumPy 秘籍中文第二版
- 零、前言
- 一、使用 IPython
- 二、高级索引和数组概念
- 三、掌握常用函数
- 四、将 NumPy 与世界的其他地方连接
- 五、音频和图像处理
- 六、特殊数组和通用函数
- 七、性能分析和调试
- 八、质量保证
- 九、使用 Cython 加速代码
- 十、Scikits 的乐趣
- 十一、最新最强的 NumPy
- 十二、使用 NumPy 进行探索性和预测性数据分析
- NumPy 初学者指南中文第三版
- 零、前言
- 一、NumPy 快速入门
- 二、从 NumPy 基本原理开始
- 三、熟悉常用函数
- 四、为您带来便利的便利函数
- 五、使用矩阵和 ufunc
- 六、深入探索 NumPy 模块
- 七、了解特殊例程
- 八、通过测试确保质量
- 九、matplotlib 绘图
- 十、当 NumPy 不够用时 - SciPy 及更多
- 十一、玩转 Pygame
- 附录 A:小测验答案
- 附录 B:其他在线资源
- 附录 C:NumPy 函数的参考
- NumPy 基础知识
- 零、前言
- 一、NumPy 简介
- 二、NumPy
ndarray
对象 - 三、使用 NumPy 数组
- 四、NumPy 核心和子模块
- 五、NumPy 中的线性代数
- 六、NumPy 中的傅立叶分析
- 七、构建和分发 NumPy 代码
- 八、使用 Cython 加速 NumPy
- 九、NumPy C-API 简介
- 十、扩展阅读
- 精通 NumPy 数值分析
- 零、前言
- 一、使用 NumPy 数组
- 二、NumPy 线性代数
- 三、使用 NumPy 统计函数对波士顿住房数据进行探索性数据分析
- 四、使用线性回归预测房价
- 五、使用 NumPy 对批发分销商的客户进行聚类
- 六、NumPy,SciPy,Pandas 和 Scikit-Learn
- 七、高级 NumPy
- 八、高性能数值计算库概述
- 九、性能基准
- NumPy 数组学习手册
- 零、前言
- 一、NumPy 入门
- 二、NumPy 基础
- 三、使用 NumPy 的基本数据分析
- 四、使用 NumPy 的简单预测性分析
- 五、信号处理技术
- 六、性能分析,调试和测试
- 七、Python 科学生态系统
- 精通 SciPy
- 零、前言
- 一、数值线性代数
- 二、插值和近似
- 三、微分与积分
- 四、非线性方程式和最优化
- 五、常微分方程的初值问题
- 六、计算几何
- 七、描述性统计
- 八、推断和数据分析
- 九、数字图像处理
- Pandas 秘籍
- 零、前言
- 一、Pandas 基础
- 二、数据帧基本操作
- 三、开始数据分析
- 四、选择数据子集
- 五、布尔索引
- 六、索引对齐
- 七、分组以进行汇总,过滤和转换
- 八、将数据重组为整齐的表格
- 九、组合 Pandas 对象
- 十、时间序列分析
- 十一、Pandas,Matplotlib 和 Seaborn 的可视化
- Pandas 学习手册中文第二版
- 零、前言
- 一、Pandas 与数据分析
- 二、启动和运行 Pandas
- 三、用序列表示单变量数据
- 四、用数据帧表示表格和多元数据
- 五、数据帧的结构操作
- 六、索引数据
- 七、类别数据
- 八、数值统计方法
- 九、存取数据
- 十、整理数据
- 十一、合并,连接和重塑数据
- 十二、数据聚合
- 十三、时间序列建模
- 十四、可视化
- 十五、历史股价分析
- 精通 Pandas
- 零、前言
- 一、Pandas 和数据分析简介
- 二、Pandas 安装和支持软件
- 三、Pandas 数据结构
- 四、Pandas 的操作,第一部分 -- 索引和选择
- 五、Pandas 的操作,第二部分 -- 数据的分组,合并和重塑
- 六、处理缺失数据,时间序列和 Matplotlib 绘图
- 七、统计之旅 -- 经典方法
- 八、贝叶斯统计简介
- 九、Pandas 库体系结构
- 十、R 与 Pandas 的比较
- 十一、机器学习简介
- NumPy 和 Pandas 数据分析实用指南
- 零、前言
- 一、配置 Python 数据分析环境
- 二、探索 NumPy
- 三、NumPy 数组上的运算
- 四、Pandas 很有趣! 什么是 Pandas?
- 五、Pandas 的算术,函数应用以及映射
- 六、排序,索引和绘图
- 【ApacheCN 数据科学译文集 20211109 更新】精通 Pandas 探索性分析
- 零、前言
- 一、处理不同种类的数据集
- 二、数据选择
- 三、处理,转换和重塑数据
- 四、像专业人士一样可视化数据
- Matplotlib 3.0 秘籍
- 零、前言
- 一、Matplotlib 的剖析
- 二、基本绘图入门
- 三、绘制多个图表和子图
- 四、开发可视化来提高发布质量
- 五、使用高级功能的绘图
- 六、嵌入文本和表达式
- 七、以不同格式保存图形
- 八、开发交互式绘图
- 九、在图形用户界面中嵌入绘图
- 十、使用
mplot3d
工具包绘制 3D 图形 - 十一、使用
axisartist
工具包 - 十二、使用
axes_grid1
工具包 - 十三、使用 Cartopy 工具包绘制地理地图
- 十四、使用 Seaborn 工具包的探索性数据分析
- Matplotlib 绘图秘籍
- 零、前言
- 一、第一步
- 二、自定义颜色和样式
- 三、处理标注
- 四、处理图形
- 五、文件输出
- 六、处理地图
- 七、处理 3D 图形
- 八、用户界面
- UCSD COGS108 数据科学实战中文笔记
- 零、数据科学实战
- 一、Jupyter 笔记本
- 二、数据分析
- 三、Python
- 四、Python 中的数据科学
- 五、数据收集
- 六、数据整理
- 七、数据清理
- 八、数据隐私和匿名化
- 九、使用 Python 进行数据可视化
- 十、分布
- 十一、检验分布
- 十三、普通最小二乘
- 十四、线性模型
- 十五、聚类
- 十六、降维
- 十七、分类
- 十八、自然语言处理
- 附录一、有用的 Python 数据科学包
- 附录二、git/Github 版本控制工具
- USF MSDS501 计算数据科学中文讲义
- 一、起步
- 1.1 一些动机(音频处理)
- 1.2 Python 工具的初次尝试
- 1.3 播放声音
- 二、设计和构建程序
- 2.1 编程导论
- 2.2 在内存中表示数据
- 2.3 计算模型
- 2.4 Python 中的编程模式
- 2.5 数据别名
- 2.6 使用函数组织你的代码
- 2.7 如何阅读代码
- 2.8 面向对象编程
- 三、关键编程模式
- 3.1 加载文件
- 3.2 数据帧
- 3.3 操纵和可视化数据
- 四、用于计算和优化的迭代式方法
- 4.1 生成均匀的随机数
- 4.2 近似平方根
- 4.3 单变量梯度下降
- 五、常见编程工具
- 5.1 使用 bash 走向胜利
- 5.2 使用 git 版本控制工具
- 5.3 在 Amazon Web Services 上启动虚拟机
- 六、可选
- 6.1 链表
- 一、起步
- fast.ai 数值线性代数讲义中文版 v2
- 一、我们为什么在这里
- 二、SVD 背景消除
- 三、使用 NMF 和 SVD 的主题建模
- 四、随机化 SVD
- 五、LU 分解
- 六、使用鲁棒回归的 CT 扫描的压缩感知
- 七、线性回归和健康结果
- 八、如何实现线性回归
- 九、PageRank 和特征值分解
- 十、实现 QR 分解
- 社交媒体挖掘
- 第一部分 数据挖掘
- 1 应了解的编程语言
- 2 从哪里获取数据
- 3 用代码获取数据
- 4 收集自己的 FACEBOOK 数据
- 5 抓取实时站点
- 第二部分 数据分析
- 6 数据分析导论
- 7 数据可视化
- 8 数据分析的高级工具
- 9 在 REDDIT 数据中寻找趋势
- 10 测量公众人物的 Twitter 活动
- 11 何去何从
- 附录
- 1 编写程序通过 API 获取网站的信息
- 2 通过解析网页直接获取哔哩某播主的详细信息
- 3 在离线表格软件中打开和处理 csv 文件
- 第一部分 数据挖掘
- 数据科学和人工智能技术笔记
- 一、向量、矩阵和数组
- 二、数据准备
- 三、数据预处理
- 四、图像预处理
- 五、文本预处理
- 六、日期时间预处理
- 七、特征工程
- 八、特征选择
- 九、模型验证
- 十、模型选择
- 十一、线性回归
- 十二、逻辑回归
- 十三、树和森林
- 十四、K 最近邻
- 十五、支持向量机
- 十六、朴素贝叶斯
- 十七、聚类
- 十八、Keras
- 十九、数据整理(上)
- 十九、数据整理(下)
- 二十、数据可视化
- 二十一、统计学
- Python 和 Jupyter 机器学习入门
- 零、前言
- 一、Jupyter 基础知识
- 二、数据清理和高级机器学习
- 三、Web 爬取和交互式可视化
- Python 数据科学和机器学习实践指南
- 零、前言
- 一、入门
- 二、统计和概率回顾和 Python 实践
- 三、Matplotlib 和高级概率概念
- 四、预测模型
- 五、Python 机器学习
- 六、推荐系统
- 七、更多数据挖掘和机器学习技术
- 八、处理真实数据
- 九、Apache Spark-大数据机器学习
- 十、测试与实验设计
- 精通 Python 数据科学
- 零、前言
- 一、原始数据入门
- 二、推断统计
- 三、大海捞针
- 四、通过高级可视化感知数据
- 五、发现机器学习
- 六、使用线性回归执行预测
- 七、估计事件的可能性
- 八、使用协同过滤生成建议
- 九、使用集成模型扩展边界
- 十、通过 K 均值聚类应用细分
- 十一、通过文本挖掘分析非结构化数据
- 十二、在大数据世界中利用 Python
- Python 数据科学本质论
- 零、前言
- 一、第一步
- 二、数据整理
- 三、数据管道
- 四、机器学习
- 五、可视化,见解和结果
- 六、社交网络分析
- 七、超越基础的深度学习
- 八、大数据和 Spark
- 九、加强您的 Python 基础
- 数据科学思想
- 零、前言
- 一、开发人员对数据科学的看法
- 二、使用 Jupyter 笔记本和 PixieDust 的大规模数据科学
- 三、PixieApp 深入了解
- 四、使用 PixieGateway 服务器将 PixieApp 部署到 Web
- 五、最佳实践和高级 PixieDust 概念
- 六、TensorFlow 图像识别
- 七、大数据和 Twitter 情感分析
- 八、金融时间序列分析和预测
- 九、使用图的美国国内航班数据分析
- 十、最终思想
- 十一、附录 A:PixieApp 快速参考
- Python 仿真建模实用指南
- 序言
- 第一部分:数值仿真入门
- 一、仿真模型简介
- 二、理解随机性和随机数
- 三、概率和数据生成过程
- 第二部分:仿真建模算法与技术
- 四、探索蒙特卡罗仿真
- 五、基于仿真的马尔可夫决策过程
- 六、重采样方法
- 七、利用仿真改进和优化系统
- 第三部分:实际应用
- 八、将仿真模型用于金融工程
- 九、使用神经网络仿真物理现象
- 十、项目管理建模与仿真
- 十一、下一步是什么?
docker pull apachecn0/apachecn-ds-zh
docker run -tid -p :80 apachecn0/apachecn-ds-zh
# 访问 http://localhost:{port}
PYPI
pip install apachecn-ds-zh
apachecn-ds-zh # 访问 http://localhost:{port}
NPM
npm install -g apachecn-ds-zh
apachecn-ds-zh # 访问 http://localhost:{port}
贡献指南 本项目需要校对,欢迎大家提交 Pull Request。
请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)组织介绍 访问我们的主页。
赞助我们 通过平台自带的打赏功能,或点击这里。
推荐阅读
- Docker应用:容器间通信与Mariadb数据库主从复制
- 开学第一天(下)
- 科学养胃,别被忽悠,其实真的很简单
- 你不可不知的真相系列之科学
- 使用协程爬取网页,计算网页数据大小
- Java|Java基础——数组
- Python数据分析(一)(Matplotlib使用)
- Jsr303做前端数据校验
- ACSL|ACSL 美国计算机科学联赛 2016-2017 R4 摩天大楼-Skyscraper 题解
- Spark|Spark 数据倾斜及其解决方案