一、进阿里巴巴工作对学历有什么要求?
这要求很高 。但事实并非如此 。1.如果你面试的是技术岗位 , 这个学历加工作经验基本是不可能的 。除非你业余时间做点牛逼的事 , 比如自己开发个软件什么的;赞美诗阿里有外包工 , 有机会成为正式工 , 但是机会很少 。而且阿里最近精简了销售团队 , 原来负责卖诚信和沟通的都调到其他岗位了 , 机会少了;2.如果面试的是攻克之类的非技术性工作 , 主要是个人方面:1 。价值观和阿里一致吗?具体什么六脉神剑数值 , 要学习;2.个人性格 , 工作经历等 。3.学历不是决定性因素 , 但确实是很重要的因素 。阿里对外宣传的是人才不限任何格局 , 但实际上 , 即使是非211本科毕业的学生 , 面试成功率也比211、985毕业的学生低 , 或者要多经历一些测试步骤 。3.阿里很注重新鲜血液 , 所以喜欢招一些应届毕业生 , 因为他们愿意工作 , 没有固定的思维 。社会招聘的人很少 , 大部分主要靠猎头和推荐 。Ps如果你觉得自己够强 , 就在网上发帖求助 , 请阿里内部人员为你推荐 。成功的几率会更高 。4.阿里并不像外面看起来那么轻松 。加班文化很强 。而且是自愿加班 。不过各种福利和工作环境都不错 。
文章插图
二、数据挖掘工程师一般都做什么?
数据挖掘工程师是做什么的?数据挖掘 , 从字面上看 , 就是在数据中发现有用的东西 , 什么有用取决于具体的业务目标 。最简单的就是统计应用 , 比如电商数据 。比如淘宝统计过哪个省买泳衣最多 , 哪个省女生文胸最多等等 。进一步可以推断出用户的年龄、性别、购买力、爱好等 。可以根据用户的浏览、点击、收藏、购买行为来表征一个人的画像 , 相当于用这些挖掘出来的属性来刻画一个人 。这些还是最简单的东西 , 更深层次的比如预测(股票数据挖掘往往离不开机器学习 。如分类、聚类、关联规则挖掘、个性化推荐、预测、神经网络、深度学习等 。
数据挖掘=商业知识 。自然语言处理技术(NLP)、计算机视觉技术(CV)、机器学习/深度学习(ML/DL)( 1)其中商业知识具体指个性化推荐、计算广告、搜索、互联网金融等 。NLP和CV分别是处理文本、图像和视频数据的领域技术 , 可以理解为提取非结构化数据并转换为结构化数据;最后的ml/dl技术属于模型学习理论;(2)在选择职位的时候 , 每个公司都没有一套标准的职称 , 但做的无非是两个大方向 。一种是主要学习某一领域的技术 , 比如自然语言处理工程师、计算机视觉工程师、机器学习工程师等 。一种是将各种领域技术应用到业务场景中 , 解决业务需求 , 比如数据挖掘工程师、推荐系统工程师 。具体地址不重要 , 重要的是平时的工作内容;PS:在互联网行业 , 数据挖掘相关技术的成功应用主要是在推荐和计算广告领域 , 涉及的数据主要是文本 , 所以NLP技术比较重要 。至于CV技术 , 主要应用在人工智能领域(无人车、人脸识别等 。) , 所以我的知识有限 , 相关的描述会比较少;数据挖掘岗位需要的三个基本能力1 。工程能力(1)编程基础:需要掌握一大一小两种语言 , 大的指C或Java , 小的指Python或shell脚本;需要掌握基本的数据库语言;建议:MySQLPythonC;语言只是工具 , 看语法就行;推荐书籍《C++ primerplus》 (2)开发平台:Linux建议:掌握常用命令和Linux下源代码编译的原理;推荐书籍《Linux私房菜》 (3)数据结构与算法分析基础:掌握常用的数据结构与操作(线性表、队列、列、字符串、树、图等 。) , 并掌握常用的计算机算法(排序算法、搜索算法、动态规划、递归等 。);建议:多敲代码 , 多刷OJ平台的题;推荐书籍《大话数据结构》 《剑指 offer》 (4)海量数据处理平台:Hadoop(mr计算模型 , java开发)或Spark(rdd计算模型 , scala开发) , 重点是后者;建议:可以用为主 。有精力的话可以看看源代码了解一下集群调度机制之类的;推荐书籍《大数据 spark企业级实战》 2 。算法能力(1)数学基础:概率论、数理统计、线性代数、随机过程、最优化理论建议:这些一定要懂 。即使不能做到基础扎实 , 至少也要掌握各个学科的理论体系 。涉及到相应的知识点 , 通过查阅资料就能无障碍理解;(2)机器学习/深度学习:掌握常用的机器学习模型(线性回归、逻辑回归、SVM、感知器;决策树 , 随机森林 , GBDT , XGBoost贝叶斯、KNN、K均值、EM等 。);掌握常见的机器学习理论(过拟合、交叉验证、模型选择、模型融合等 。);掌握常见的深度学习模型(CNN , RNN等 。);建议:这里的精通是指熟悉推导公式 , 知道模型的适用场景;推荐书籍《统计学习方法》 《机器学习》 《机器学习实战》 《UFLDL》(3)自然语言处理:掌握常用方法(tf-idf、word2vec、LDA);3.业务经验(1)广告的推荐和计算知识;推荐书籍:推荐系统
实践》《计算广告》( 2 )通过参加数据挖掘竞赛熟悉相关业务场景 , 常见的比赛有 Kaggle , 阿里天池 , datacastle 等 。想要学习数据挖掘的话可以看一下这篇文章《AI时代就业指南:数据挖掘入门与求职》
【阿里图像算法工程师面经 阿里电商算法工程师做什么工作,阿里算法工程师p6待遇】三、如何成为一个数据分析师?需要具备哪些技能学习数据分析师之前 , 你必须清楚自己想要达成什么目标 。也就是说 , 你想通过这门技术来解决哪些问题或实现什么计划 。有了这个目标 , 你才能清晰地开展自己的学习规划 , 并且明确它的知识体系 。只有明确的目标导向 , 学习必备也是最有用的那部分 , 才能避免无效信息降低学习效率 。1、明确知识框架和学习路径数据分析这件事 , 如果你要成为数据分析师 , 那么你可以去招聘网站看看 , 对应的职位的需求是什么 , 一般来说你就会对应该掌握的知识架构有初步的了解 。你可以去看看数据分析师职位 , 企业对技能需求可总结如下:SQL数据库的基本操作 , 会基本的数据管理;会用Excel/SQL做基本的数据提取、分析和展示;会用脚本语言进行数据分析 , Python or R;有获取外部数据的能力加分 , 如爬虫或熟悉公开数据集;会基本的数据可视化技能 , 能撰写数据报告;熟悉常用的数据挖掘算法:回归分析、决策树、分类、聚类方法;高效的学习路径是什么?就是数据分析的流程 。一般大致可以按“数据获取-数据存储与提取-数据预处理-数据建模与分析-数据可视化”这样的步骤来实现一个数据分析师的学成之旅 。按这样的顺序循序渐进 , 你会知道每个部分需要完成的目标是什么 , 需要学习哪些知识点 , 哪些知识是暂时不必要的 。然后每学习一个部分 , 你就能够有一些实际的成果输出 , 有正向的反馈和成就感 , 你才会愿意花更多的时间投入进去 。以解决问题为目标 , 效率自然不会低 。按照上面的流程 , 我们分需要获取外部数据和不需要获取外部数据两类分析师 , 总结学习路径如下:1.需要获取外部数据分析师:python基础知识python爬虫SQL语言python科学计算包:pandas、numpy、scipy、scikit-learn统计学基础回归分析方法数据挖掘基本算法:分类、聚类模型优化:特征提取数据可视化:seaborn、matplotlib2.不需要获取外部数据分析师:SQL语言python基础知识python科学计算包:pandas、numpy、scipy、scikit-learn统计学基础回归分析方法数据挖掘基本算法:分类、聚类模型优化:特征提取数据可视化:seaborn、matplotlib接下来我们分别从每一个部分讲讲具体应该学什么、怎么学 。数据获取:公开数据、Python爬虫如果接触的只是企业数据库里的数据 , 不需要要获取外部数据的 , 这个部分可以忽略 。外部数据的获取方式主要有以下两种 。第一种是获取外部的公开数据集 , 一些科研机构、企业、政府会开放一些数据 , 你需要到特定的网站去下载这些数据 。这些数据集通常比较完善、质量相对较高 。另一种获取外部数据费的方式就是爬虫 。比如你可以通过爬虫获取招聘网站某一职位的招聘信息 , 爬取租房网站上某城市的租房信息 , 爬取豆瓣评分评分最高的电影列表 , 获取知乎点赞排行、网易云音乐评论排行列表 。基于互联网爬取的数据 , 你可以对某个行业、某种人群进行分析 。在爬虫之前你需要先了解一些 Python 的基础知识:元素(列表、字典、元组等)、变量、循环、函数(链接的菜鸟教程非常好)……以及如何用成熟的 Python 库(urllib、BeautifulSoup、requests、scrapy)实现网页爬虫 。如果是初学 , 建议从 urllib 和 BeautifulSoup 开始 。(PS:后续的数据分析也需要 Python 的知识 , 以后遇到的问题也可以在这个教程查看)网上的爬虫教程不要太多 , 爬虫上手推荐豆瓣的网页爬取 , 一方面是网页结构比较简单 , 二是豆瓣对爬虫相对比较友好 。掌握基础的爬虫之后 , 你还需要一些高级技巧 , 比如正则表达式、模拟用户登录、使用代理、设置爬取频率、使用cookie信息等等 , 来应对不同网站的反爬虫限制 。除此之外 , 常用的的电商网站、问答网站、点评网站、二手交易网站、婚恋网站、招聘网站的数据 , 都是很好的练手方式 。这些网站可以获得很有分析意义的数据 , 最关键的是 , 有很多成熟的代码 , 可以参考 。数据存取:SQL语言你可能有一个疑惑 , 为什么没有讲到Excel 。在应对万以内的数据的时候 , Excel对于一般的分析没有问题 , 一旦数据量大 , 就会力不从心 , 数据库就能够很好地解决这个问题 。而且大多数的企业 , 都会以SQL的形式来存储数据 , 如果你是一个分析师 , 也需要懂得SQL的操作 , 能够查询、提取数据 。SQL作为最经典的数据库工具 , 为海量数据的存储与管理提供可能 , 并且使数据的提取的效率大大提升 。你需要掌握以下技能:提取特定情况下的数据:企业数据库里的数据一定是大而繁复的 , 你需要提取你需要的那一部分 。比如你可以根据你的需要提取2018年所有的销售数据、提取今年销量最大的50件商品的数据、提取上海、广东地区用户的消费数据…… , SQL可以通过简单的命令帮你完成这些工作 。数据库的增、删、查、改:这些是数据库最基本的操作 , 但只要用简单的命令就能够实现 , 所以你只需要记住命令就好 。数据的分组聚合、如何建立多个表之间的联系:这个部分是SQL的进阶操作 , 多个表之间的关联 , 在你处理多维度、多个数据集的时候非常有用 , 这也让你可以去处理更复杂的数据 。数据预处理:Python(pandas)很多时候我们拿到的数据是不干净的 , 数据的重复、缺失、异常值等等 , 这时候就需要进行数据的清洗 , 把这些影响分析的数据处理好 , 才能获得更加精确地分析结果 。比如空气质量的数据 , 其中有很多天的数据由于设备的原因是没有监测到的 , 有一些数据是记录重复的 , 还有一些数据是设备故障时监测无效的 。比如用户行为数据 , 有很多无效的操作对分析没有意义 , 就需要进行删除 。那么我们需要用相应的方法去处理 , 比如残缺数据 , 我们是直接去掉这条数据 , 还是用临近的值去补全 , 这些都是需要考虑的问题 。对于数据预处理 , 学会 pandas 的用法 , 应对一般的数据清洗就完全没问题了 。需要掌握的知识点如下:选择:数据访问(标签、特定值、布尔索引等)缺失值处理:对缺失数据行进行删除或填充重复值处理:重复值的判断与删除空格和异常值处理:清楚不必要的空格和极端、异常数据相关操作:描述性统计、Apply、直方图等合并:符合各种逻辑关系的合并操作分组:数据划分、分别执行函数、数据重组Reshaping:快速生成数据透视表概率论及统计学知识数据整体分布是怎样的?什么是总体和样本?中位数、众数、均值、方差等基本的统计量如何应用?如果有时间维度的话随着时间的变化是怎样的?如何在不同的场景中做假设检验?数据分析方法大多源于统计学的概念 , 所以统计学的知识也是必不可少的 。需要掌握的知识点如下:基本统计量:均值、中位数、众数、百分位数、极值等其他描述性统计量:偏度、方差、标准差、显著性等其他统计知识:总体和样本、参数和统计量、ErrorBar概率分布与假设检验:各种分布、假设检验流程其他概率论知识:条件概率、贝叶斯等有了统计学的基本知识 , 你就可以用这些统计量做基本的分析了 。通过可视化的方式来描述数据的指标 , 其实可以得出很多结论了 , 比如排名前100的是哪些 , 平均水平是怎样的 , 近几年的变化趋势如何……你可以使用python的包 Seaborn(python包)在做这些可视化的分析 , 你会轻松地画出各种可视化图形 , 并得出具有指导意义的结果 。了解假设检验之后 , 可以对样本指标与假设的总体指标之间是否存在差别作出判断 , 已验证结果是否在可接受的范围 。python数据分析如果你有一些了解的话 , 就知道目前市面上其实有很多 Python 数据分析的书籍 , 但每一本都很厚 , 学习阻力非常大 。但其实真正最有用的那部分信息 , 只是这些书里很少的一部分 。比如用 Python 实现不同案例的假设检验 , 其实你就可以对数据进行很好的验证 。比如掌握回归分析的方法 , 通过线性回归和逻辑回归 , 其实你就可以对大多数的数据进行回归分析 , 并得出相对精确地结论 。比如DataCastle的训练竞赛“房价预测”和“职位预测” , 都可以通过回归分析实现 。这部分需要掌握的知识点如下:回归分析:线性回归、逻辑回归基本的分类算法:决策树、随机森林……基本的聚类算法:k-means……特征工程基础:如何用特征选择优化模型调参方法:如何调节参数优化模型Python 数据分析包:scipy、numpy、scikit-learn等在数据分析的这个阶段 , 重点了解回归分析的方法 , 大多数的问题可以得以解决 , 利用描述性的统计分析和回归分析 , 你完全可以得到一个不错的分析结论 。当然 , 随着你实践量的增多 , 可能会遇到一些复杂的问题 , 你就可能需要去了解一些更高级的算法:分类、聚类 , 然后你会知道面对不同类型的问题的时候更适合用哪种算法模型 , 对于模型的优化 , 你需要去学习如何通过特征提取、参数调节来提升预测的精度 。这就有点数据挖掘和机器学习的味道了 , 其实一个好的数据分析师 , 应该算是一个初级的数据挖掘工程师了 。系统实战这个时候 , 你就已经具备了数据分析的基本能力了 。但是还要根据不同的案例、不同的业务场景进行实战 。能够独立完成分析任务 , 那么你就已经打败市面上大部分的数据分析师了 。如何进行实战呢?上面提到的公开数据集 , 可以找一些自己感兴趣的方向的数据 , 尝试从不同的角度来分析 , 看看能够得到哪些有价值的结论 。另一个角度是 , 你可以从生活、工作中去发现一些可用于分析的问题 , 比如上面说到的电商、招聘、社交等平台等方向都有着很多可以挖掘的问题 。开始的时候 , 你可能考虑的问题不是很周全 , 但随着你经验的积累 , 慢慢就会找到分析的方向 , 有哪些一般分析的维度 , 比如top榜单、平均水平、区域分布、年龄分布、相关性分析、未来趋势预测等等 。随着经验的增加 , 你会有一些自己对于数据的感觉 , 这就是我们通常说的数据思维了 。你也可以看看行业的分析报告 , 看看优秀的分析师看待问题的角度和分析问题的维度 , 其实这并不是一件困难的事情 。在掌握了初级的分析方法之后 , 也可以尝试做一些数据分析的竞赛 , 比如 DataCastle 为数据分析师专门定制的三个竞赛 , 提交答案即可获取评分和排名:员工离职预测训练赛美国King County房价预测训练赛北京PM2.5浓度分析训练赛种一棵树最好的时间是十年前 , 其次是现在 。现在就去 , 找一个数据集开始吧!!
文章插图
四、大数据工程师是干什么的?大数据工程师做什么?需要具备什么能力?大数据是眼下非常时髦的技术名词 , 与此同时自然也催生出了一些与大数据处理相关的职业 , 通过对数据的挖掘分析来影响企业的商业决策 。这群人在国外被叫做数据科学家(Data Scientist) , 这个头衔最早由D.J.Pati和Jeff Hammerbacher于2008年提出 , 他们后来分别成为了领英(LinkedIn)和Facebook数据科学团队的负责人 。而数据科学家这个职位目前也已经在美国传统的电信、零售、金融、制造、物流、医疗、教育等行业里开始创造价值 。不过在国内 , 大数据的应用才刚刚萌芽 , 人才市场还不那么成熟 , “你很难期望有一个全才来完成整个链条上的所有环节 。更多公司会根据自己已有的资源和短板 , 招聘能和现有团队互补的人才 。”领英(LinkedIn)中国商务分析及战略总监王昱尧对《第一财经周刊》说 。于是每家公司对大数据工作的要求不尽相同:有的强调数据库编程、有的突出应用数学和统计学知识、有的则要求有咨询公司或投行相关的经验、有些是希望能找到懂得产品和市场的应用型人才 。正因为如此 , 很多公司会针对自己的业务类型和团队分工 , 给这群与大数据打交道的人一些新的头衔和定义:数据挖掘工程师、大数据专家、数据研究员、用户分析专家等都是经常在国内公司里出现的Title , 我们将其统称为“大数据工程师” 。王昱尧认为 , 在一个成熟的数据驱动型公司 , “大数据工程师”往往是一个团队 , 它意味着从数据的收集、整理展现、分析和商业洞察、以至于市场转化的全过程 。这个团队中可能包括数据工程师、分析师、产品专员、市场专员和商业决策者等角色 , 共同完成从原始数据到商业价值的转换—概括来讲 , 这是一个支持企业做出商业决策、发掘商业模式的重要群体 。由于国内的大数据工作还处在一个有待开发的阶段 , 因此能从其中挖掘出多少价值完全取决于工程师的个人能力 。已经身处这个行业的专家给出了一些人才需求的大体框架 , 包括要有计算机编码能力、数学及统计学相关背景 , 当然如果能对一些特定领域或行业有比较深入的了解 , 对于其快速判断并抓准关键因素则更有帮助 。虽然对于一些大公司来说 , 拥有硕博学历的公司人是比较好的选择 , 不过阿里巴巴集团研究员薛贵荣强调 , 学历并不是最主要的因素 , 能有大规模处理数据的经验并且有喜欢在数据海洋中寻宝的好奇心会更适合这个工作 。除此之外 , 一个优秀的大数据工程师要具备一定的逻辑分析能力 , 并能迅速定位某个商业问题的关键属性和决定因素 。“他得知道什么是相关的 , 哪个是重要的 , 使用什么样的数据是最有价值的 , 如何快速找到每个业务最核心的需求 。”联合国百度大数据联合实验室数据科学家沈志勇说 。学习能力能帮助大数据工程师快速适应不同的项目 , 并在短时间内成为这个领域的数据专家;沟通能力则能让他们的工作开展地更顺利 , 因为大数据工程师的工作主要分为两种方式:由市场部驱动和由数据分析部门驱动 , 前者需要常常向产品经理了解开发需求 , 后者则需要找运营部了解数据模型实际转化的情况 。你可以将以上这些要求看做是成为大数据工程师的努力方向 , 因为根据万宝瑞华管理合伙人颜莉萍的观察 , 这是一个很大的人才缺口 。目前国内的大数据应用多集中在互联网领域 , 有超过56%的企业在筹备发展大数据研究 , “未来5年 , 94%的公司都会需要数据科学家 。”颜莉萍说 。因此她也建议一些原本从事与数据工作相关的公司人可以考虑转型 。本期《第一财经周刊》采访了BAT这3家国内互联网公司 , 以及相关领域的人力资源专家 , 他们从职场角度为我们解读如何成为大数据工程师以及这类岗位的职场现状 。A 大数据工程师做什么?用阿里巴巴集团研究员薛贵荣的话来说 , 大数据工程师就是一群“玩数据”的人 , 玩出数据的商业价值 , 让数据变成生产力 。大数据和传统数据的最大区别在于 , 它是在线的、实时的 , 规模海量且形式不规整 , 无章法可循 , 因此“会玩”这些数据的人就很重要 。沈志勇认为如果把大数据想象成一座不停累积的矿山 , 那么大数据工程师的工作就是 , “第一步 , 定位并抽取信息所在的数据集 , 相当于探矿和采矿 。第二步 , 把它变成直接可以做判断的信息 , 相当于冶炼 。最后是应用 , 把数据可视化等 。”因此分析历史、预测未来、优化选择 , 这是大数据工程师在“玩数据”时最重要的三大任务 。通过这三个工作方向 , 他们帮助企业做出更好的商业决策 。找出过去事件的特征大数据工程师一个很重要的工作 , 就是通过分析数据来找出过去事件的特征 。比如 , 腾讯的数据团队正在搭建一个数据仓库 , 把公司所有网络平台上数量庞大、不规整的数据信息进行梳理 , 总结出可供查询的特征 , 来支持公司各类业务对数据的需求 , 包括广告投放、游戏开发、社交网络等 。找出过去事件的特征 , 最大的作用是可以帮助企业更好地认识消费者 。通过分析用户以往的行为轨迹 , 就能够了解这个人 , 并预测他的行为 。“你可以知道他是什么样的人、他的年纪、兴趣爱好 , 是不是互联网付费用户、喜欢玩什么类型的游戏 , 平常喜欢在网上做什么事情 。”腾讯云计算有限公司北京研发中心总经理郑立峰对《第一财经周刊》说 。下一步到了业务层面 , 就可以针对各类人群推荐相关服务 , 比如手游 , 或是基于不同特征和需求衍生出新的业务模式 , 比如微信的电影票业务 。预测未来可能发生的事情通过引入关键因素 , 大数据工程师可以预测未来的消费趋势 。在阿里妈妈的营销平台上 , 工程师正试图通过引入气象数据来帮助淘宝卖家做生意 。“比如今年夏天不热 , 很可能某些产品就没有去年畅销 , 除了空调、电扇 , 背心、游泳衣等都可能会受其影响 。那么我们就会建立气象数据和销售数据之间的关系 , 找到与之相关的品类 , 提前警示卖家周转库存 。”薛贵荣说 。在百度 , 沈志勇支持“百度预测”部分产品的模型研发 , 试图用大数据为更广泛的人群服务 。已经上线的包括世界杯预测、高考预测、景点预测等 。以百度景点预测为例 , 大数据工程师需要收集所有可能影响一段时间内景点人流量的关键因素进行预测 , 并为全国各个景点未来的拥挤度分级—在接下来的若干天时间里 , 它究竟是畅通、拥挤 , 还是一般拥挤?找出最优化的结果根据不同企业的业务性质 , 大数据工程师可以通过数据分析来达到不同的目的 。以腾讯来说 , 郑立峰认为能反映大数据工程师工作的最简单直接的例子就是选项测试(AB Test) , 即帮助产品经理在A、B两个备选方案中做出选择 。在过去 , 决策者只能依据经验进行判断 , 但如今大数据工程师可以通过大范围地实时测试—比如 , 在社交网络产品的例子中 , 让一半用户看到A界面 , 另一半使用B界面 , 观察统计一段时间内的点击率和转化率 , 以此帮助市场部做出最终选择 。作为电商的阿里巴巴 , 则希望通过大数据锁定精准的人群 , 帮助卖家做更好的营销 。“我们更期待的是你能找到这样一批人 , 比起现有的用户 , 这些人对产品更感兴趣 。”薛贵荣说 。一个淘宝的实例是 , 某人参卖家原来推广的目标人群是产妇 , 但工程师通过挖掘数据之间的关联性后发现 , 针对孕妇群体投放的营销转化率更高 。B 需要具备的能力数学及统计学相关的背景就我们采访过的BAT三家互联网大公司来说 , 对于大数据工程师的要求都是希望是统计学和数学背景的硕士或博士学历 。沈志勇认为 , 缺乏理论背景的数据工作者 , 更容易进入一个技能上的危险区域(Danger Zone)—一堆数字 , 按照不同的数据模型和算法总能捯饬出一些结果来 , 但如果你不知道那代表什么 , 就并不是真正有意义的结果 , 并且那样的结果还容易误导你 。“只有具备一定的理论知识 , 才能理解模型、复用模型甚至创新模型 , 来解决实际问题 。”沈志勇说 。计算机编码能力实际开发能力和大规模的数据处理能力是作为大数据工程师的一些必备要素 。“因为许多数据的价值来自于挖掘的过程 , 你必须亲自动手才能发现金子的价值 。”郑立峰说 。举例来说 , 现在人们在社交网络上所产生的许多记录都是非结构化的数据 , 如何从这些毫无头绪的文字、语音、图像甚至视频中攫取有意义的信息就需要大数据工程师亲自挖掘 。即使在某些团队中 , 大数据工程师的职责以商业分析为主 , 但也要熟悉计算机处理大数据的方式 。对特定应用领域或行业的知识在颜莉萍看来 , 大数据工程师这个角色很重要的一点是 , 不能脱离市场 , 因为大数据只有和特定领域的应用结合起来才能产生价值 。所以 , 在某个或多个垂直行业的经历能为应聘者积累对行业的认知 , 对于之后成为大数据工程师有很大帮助 , 因此这也是应聘这个岗位时较有说服力的加分项 。“他不能只是懂得数据 , 还要有商业头脑 , 不论对零售、医药、游戏还是旅游等行业 , 能就其中某些领域有一定的理解 , 最好还是与公司的业务方向一致的 , ”就此薛贵荣还打了个比方 , “过去我们说一些奢侈品店员势利 , 看人一眼就知道买得起买不起 , 但这群人恰恰是有敏锐度的 , 我们认为他们是这个行业的专家 。又比如对医疗行业了解的人 , 他在考虑医疗保险业务时 , 不仅会和人们医院看病的记录相关 , 也会考虑饮食数据 , 这些都是基于对该领域的了解 。”C 大数据工程师的职业发展如何成为大数据工程师由于目前大数据人才匮乏 , 对于公司来说 , 很难招聘到合适的人才—既要有高学历 , 同时最好还有大规模数据处理经验 。因此很多企业会通过内部挖掘 。今年8月 , 阿里巴巴举办了一个大数据竞赛 , 把天猫平台上的数据拿出来 , 去除敏感问题后 , 放到云计算平台上交予7000多支队伍进行比赛 , 比赛分为内部赛和外部赛 。“通过这个方式来激励内部员工 , 同时也发现外部人才 , 让各行业的大数据工程师涌现出来 。”颜莉萍建议 , 目前长期从事数据库管理、挖掘、编程工作的人 , 包括传统的量化分析师、Hadoop方面的工程师 , 以及任何在工作中需要通过数据来进行判断决策的管理者 , 比如某些领域的运营经理等 , 都可以尝试该职位 , 而各个领域的达人只要学会运用数据 , 也可以成为大数据工程师 。薪酬待遇作为IT类职业中的“大熊猫” , 大数据工程师的收入待遇可以说达到了同类的顶级 。根据颜莉萍的观察 , 国内IT、通讯、行业招聘中 , 有10%都是和大数据相关的 , 且比例还在上升 。颜莉萍表示 , “大数据时代的到来很突然 , 在国内发展势头激进 , 而人才却非常有限 , 现在完全是供不应求的状况 。”在美国 , 大数据工程师平均每年薪酬高达17.5万美元 , 而据了解 , 在国内顶尖互联网类公司 , 同一个级别大数据工程师的薪酬可能要比其他职位高20%至30% , 且颇受企业重视 。职业发展路径由于大数据人才数量较少 , 因此大多数公司的数据部门一般都是扁平化的层级模式 , 大致分为数据分析师、资深研究员、部门总监3个级别 。大公司可能按照应用领域的维度来划分不同团队 , 而在小公司则需要身兼数职 。有些特别强调大数据战略的互联网公司则会另设最高职位—如阿里巴巴的首席数据官 。“这个职位的大部分人会往研究方向发展 , 成为重要数据战略人才 。”颜莉萍说 。另一方面 , 大数据工程师对商业和产品的理解 , 并不亚于业务部门员工 , 因此也可转向产品部或市场部 , 乃至上升为公司的高级管理层 。
五、大数据培训出来能找到工作吗?学习大数据可以从事很多工作 , 比如说:hadoop 研发工程师、大数据研发工程师、大数据分析工程师、数据库工程师、hadoop运维工程师、大数据运维工程师、java大数据工程师、spark工程师等等都是我们可以从事的工作岗位!不同的岗位 , 所具备的技术知识也是不一样的 , 需要从各个方向学习 , 逐个击破!Hadoop开发工程师你就需要具备以下技术:a. 基于hadoop、hive等构建数据分析平台 , 进行数据平台架构设计、开发分布式计算业务;b. 应用大数据、数据挖掘、分析建模等技术 , 对海量数据进行挖掘 , 发现其潜在的关联规则;c. 对hadoop、hive、hbase、Map/Rece相关产品进行预研、开发;d. **Hadoop相关技术解决海量数据处理问题、大数据量的分析 。e. Hadoop相关业务脚本的性能优化与提升 , 不断提高系统运行效率;数据工程师职责:a. 分析各类用户不断变化的行为;b. 预测各类营销对用户的影响 , 定位精准市场投放;c. 帮助实现自动化监控平台 。Hadoop运维工程师你需要具备以下技术知识:a. 平台大数据环境的部署维护和技术支持;b. 应用故障的处理跟踪及统计汇总分析;c. 应用安全 , 数据的日常备份和应急恢复;数据挖掘分析师你需要具备以下技术:a.对优先考虑的账户进行统计分析 , 从而更大限度的成功化 。b.与主管或客户端沟通行动计划 , 并找出需要改进的地方 。c.执行战略数据分析和研究 , 以支持业务需求 。d.找准机会从而用复杂的统计建模提高生产率 。e.浏览数据来认准机会并提高业务成效 。f.指定业务流程 , 目标和战略的理解 , 以提供分析和解释 。g.针对内部讨论的理解 , 在适当情况下获得业务需求和必要的分析 。
文章插图
六、软件测试员主要工作是做什么?软件测试员的主要工作内容是根据测试计划和测试方案进行软件测试;能够针对软件需求开发测试模型 , 制定测试方案 , 安排测试计划 , 并对测试项目进行管理 。软件测试主要工作内容是验证(verification)和确认(validation) 。验证(verification)是保证软件正确地实现了一些特定功能的一系列活动 , 即保证软件以正确的方式来做了这个事件 。确认(validation)是一系列的活动和过程 , 目的是想证实在一个给定的外部环境中软件的逻辑正确性 。即保证软件做了你所期望的事情 。扩展资料:软件测试的专业优势:1、就业竞争小人才供不应求让软件测试人员的就业竞争压力明显小于同类其它职业 , 有利于从业者的身心健康 。另外 , 由于软件测试在我国起步较晚 , 独立设置测试部门、对测试人员有强烈需求的多为独具慧眼的大中型IT企业 。软件测试人才不需要在小企业积累经验就能获得知名企业的入门通行证 , 工作起点高于同类其它职业 。2、高薪刚入行的软件测试人员 , 起步的月薪就在7000-15000元左右 , 平均薪资8000/月以上 , 随着工作经验的丰富以及能力的提升 , 这份薪水将一路看涨 。3、就业质量高与其他IT职位相比 , 软件测试人员最大的优势就是发展方向太多了 。由于工作的特殊性 , 测试人员不但需要对软件的质量进行检测 , 而且对于软件项目的立项、管理、售前、售后等领域都要涉及 。在此过程中 , 测试人员不仅提升了专业的软件测试技能 , 还能接触到各行各业 , 从而为自己的多元化发展奠定了基础 。4、无性别歧视如果把软件开发领域比作“男子单打” , 那么 , 软件测试领域就是“混合双打” 。由于工作的特殊性 , 软件测试人员更要具有认真、耐心、细致、敏感等个性元素 , 而这在一定程度上与女性的个性气质相吻合 。据了解 , 很多IT企业中软件测试人员的比例更趋向男女平衡 , 甚至出现女性员工成主流的情况 。参考资料来源:百度百科-软件测试
推荐阅读
- 做电商运营需要学什么 电商储备运营是做什么的,电商运营推广怎么做
- hurry是什么意思 item是什么意思电商,exit是什么意思
- 微信营销推广有何模式 微信营销是电商的什么模式,微信营销案例
- 电商运营培训 电商运营的能力需要提升什么,电商运营知识
- 茶叶适合什么电商平台 电商平台上什么茶值得买,茶叶电商品牌
- 开跨境电商需要注册什么样的公司名称 开跨境电商需要注册什么样的公司,开跨境电商需要注册什么样的公司呢
- 武汉做跨境电商适合卖什么 武汉做跨境电商适合卖什么,武汉做跨境电商适合卖什么产品
- 绍兴跨境电商产业园 跨境电商产业园干什么,蚌埠跨境电商产业园
- 跨境电商的现状 美国跨境电商有什么好处,跨境电商怎么做