医学生数据科学之路-Ⅰ(基础篇)
The data science roadmap for medical students
开学后智能医学社已经进行了几次练习,但学生的完成情况并不理想,今天我准备为医学生做一下课程的体系构建,这样能让想学习的同学提前学习,落后的同学,知道自己在哪个阶段,哪个步骤了。
医学生并不是专业的coder或者engineer,所以类似的Roadmap并不太适用。
【医学生数据科学之路-Ⅰ(基础篇)】医学生想要步入数据科学,以下几点必须注意:
- 弱化数学及统计学
- 短期速成,容易掌握
- 启发思维为主,主张代码复用
- 符合医学思维和医药数据需求
- 实践为王,解决医学科学问题
文章图片
我们采用的程序语言是python和R,至于为什么,根本无需解释了。我更喜欢R,双条腿走路,不吃亏。整个学习体系,大部分以现有的优秀教程为主,实在不行,我就自己做教程,一步一步带你到达巅峰。最后警告大家一句:高处不胜寒!
Week 1 / Git、R、python 基础,小热身 本周,通过一些小练习和一些基础教程,来学习一些简单的编程语法和版本控制(git)。
- Python 新手入门课,该课程包含了git的部分内容
- git/github采用token进行认证访问,解决部分git中的问题
- 20节R视频课程,零基础学习R! - 专栏课程 - 医咖会 (mediecogroup.com),经典入门课,只看到2章即可
- 必备工具
- Python 数据科学环境搭建(jupyter-lab)
- R环境搭建R&Rstudio安装与配置
- 数据科学本地环境搭建Python&R(jupyter lab | Rstudio)视频
所有工具,都建议采用英文界面,所有工具的安装目录都不得出现中文Week 3 / 扫盲科普 数据科学必须了解的概念:机器学习,深度学习,神经网络,机器学习经典模型(算法)
每个视频都不长。算是入门科普。
是什么系列
https://www.bilibili.com/vide...
https://www.bilibili.com/vide...
https://www.bilibili.com/vide...
https://www.bilibili.com/vide...
https://www.bilibili.com/vide...
经典算法5分钟
https://space.bilibili.com/10...
文章图片
文章图片
Data!Data!Data!
编程语言数据类型
文章图片
统计学数据类型
- Numeric
Data that are expressed on a numeric scale.
- Continuous
Data that can take on any value in an interval. (Synonyms: interval, float, numeric) - Discrete
Data that can take on only integer values, such as counts. (Synonyms: integer, count)
- Continuous
- Categorical
Data that can take on only a specific set of values representing a set of possible categories. (Synonyms: enums, enumerated, factors, nominal)
- Binary
A special case of categorical data with just two categories of values, e.g., 0/1, true/false. (Synonyms: dichotomous, logical, indicator, boolean) - Ordinal
Categorical data that has an explicit ordering. (Synonym: ordered factor)
- Binary
文章图片
Rectangular Data The typical frame of reference for an analysis in data science is a rectangular data object, like a spreadsheet or database table.
xml,json,csv.....Data frame
Rectangular data (like a spreadsheet) is the basic data structure for statistical and machine learning models.Feature A column within a table is commonly referred to as a feature.
attribute, input, predictor, (independent) variable, regressors, covariatesOutcome measurement Y Many data science projects involve predicting an outcome Y
dependent variable, response, target, output
- In the regression problem, Y is
quantitative
(e.g price, blood pressure). - In the
classification problem
, Y takes values in a finite, unordered set (survived/died, digit 0-9, cancer class of tissue sample).
case, example, instance, observation, pattern, sample
推荐阅读
- Docker应用:容器间通信与Mariadb数据库主从复制
- 参保人员因患病来不及到指定的医疗机构就医,能否报销医疗费用()
- 每日一话(49)——一位清华教授在朋友圈给大学生的9条建议
- 为什么985/211的学生能胜任工作获得老板的青睐。
- 【教育故事】|【教育故事】 一个“问题学生”的蜕变
- 使用协程爬取网页,计算网页数据大小
- 试论化院的学生自组织
- 【学生作品】温暖的记忆
- 肇事司机有义务垫付医疗费吗()
- 做学生的良师益友