年薪10万的数据分析师与年薪60万的大数据分析师,区别究竟在哪里?发表时间:2020-02-12 10:32 年薪60万的大数据分析师万里挑一,年薪10万的数据分析师泯然众人矣。 网络很火的一个年薪约10万的分析师段子: 一位数据分析师,平时主要都用 Python 的 Pandas 处理分析数据,一天,老板甩来一个文件让其清洗好顺便提取些数据,下班前给到他。 数据分析师一看文件有几十个 GB 大,瞬间傻脸,习惯性的打开 Python,准备把数据导入 Pandas 中,结果发现死机了,排气扇嗡嗡地狂转,半天都没有反应,不甘心,重启电脑尝试了一遍依然没用,折腾了好一阵子,也快到了下班时间,开始手脚冒汗。 然而下班时间到了,老板问:弄好了么? 数据分析师吱吱呜呜地说了句:文件太大,我用 Python 处理不了。 老板:嗯?没做? 你:是,是的…… 老板笑道:我知道 数据分析师:啊? 老板:想让你知道,别一天到晚拿到数据就上 Python 搞,Pandas 处理几 GB 以内的小数据还搞的定,体验不到性能差异,但是像今天这么大的数据,Pandas 很难处理,内存吃光都不够用,电脑卡死,你只能干瞪眼。 数据分析师:那怎么处理这些大数据? 老板:其实这点数据不算大,顶多算 Large Data,要上到 Big Data 起码要到 TB 级别。由于算法和本地内存的限制,Pandas 在处理 Big Data 方面有自己的局限性。所以这么大的数据一般都用 Hadoop 或者 Spark 等工具来处理。 数据分析师:Hadoop 或者 Spark 是什么? 老板:去学点大数据分析吧。 上面的段子你可能觉得只是在说笑,大数据离你很远。其实,大数据早都渗透到你生活中了,在我们生活中,当你用微信聊天时你在制造缓存数据,当你用地图导航时你在制造GPS数据,当你用某宝、某网站购物时你在制造个人消费数据,你用打车软件,软件会迅速匹配到离你最近的司机。你用电脑的时候,你用iPad的时候......无时无刻不在制造数据。 而这些数据在“数据大师”的分析下,将会给我们的生活带来巨大变化,为企业带来更有前途的商机。如今90%的企业都在运用或者都想要利用大数据为其带来更便利的服务,从而大数据高端软件类人才可谓供不应求。 据LinKedln发布的《2017上半年中国互联网最热职位人才报告》显示,大数据分析师已成为当下中国互联网行业需求最高的六类人才职位之一。报告表明大数据分析人才供给指数仅为5%,属于高度稀缺。未来中国基础性大数据分析人才缺口将达到1400万。为什么大数据分析师的薪资越来越高,大概也有一部分这个原因吧。 随着大数据的运用,大数据这个行业可以说是「前景可期」,行业人才缺口大,很多高校都陆续开设这方面的专业,这些岗位也都会成为未来最吃香的职业,可能一些人一听到「吃香」就想去学,因为钱多啊。 如果你一直或者现在对「大数据分析师」很感兴趣,又不知如何去学它,师令职业技能培训学校愿意和你分享一下入门大数据分析的路径。 首先,年薪60万的大数据分析师并不是一步登天,在你什么都不懂的情况下,打好基础很重要,而大数据的基础包含以下十几个学习重点: 1、Bloom Filter过滤器数据分片与路由:挑一个典型的分区算法去学习,比如一致性哈希算法。 2、备份机制与一致性。 3、学习CAP理论。 4、幂等性:现在很多的分布式系统状态管理的基石。 5、各种一致性模型,例如:强一致性、弱一致性、最终一致。 6、备份机制:主从的叫法已经不怎么流行了,当前更cool的叫法。 7、共识协议:在咱们国家通常翻译成一致性协议。只要学习常见的几种就可以:Paxos或者Raft。 8、算法和数据结构。 9、LSM:学习和B+树的区别以及优势。 10、压缩算法:1,找一个主流的压缩算法进行了解,例如Snappy, LZ4。 11、Bloom Filter过滤器。 不止这些,还要学习统计学的至少八项知识: 集中趋势(Central Tendency) 2、变异性(Variability) 3、归一化(Standardizing) 4、正态分布(Normal Distributions) 5、抽样分布(Sampling Distributions) 6、估计(Estimation) 7、假设检验(Hypothesis testing) 8、T检验(T-test) 在掌握基础知识以后你就可以选择一个发展方向,大数据行业分为两大方向发展: 1、大数据分析 2、大数据工程 这两种角色相互产生交集又独立运作,如果没有大数据工程,大数据分析这个角色便无任何意义;没有大数据分析,大数据工程也没有存在的意义和理由。这就相当于结婚和恋爱,恋爱的最终是目标就是结婚,不以结婚为目的的恋爱就是是耍流氓,道理都一样。 当你想成为一名资深大数据分析师,以下就是必备技能: 1、数学功底:微积分是严格要掌握的。一元微积分是必须要熟练掌握并使用的。线性代数要精通,矩阵的运算、向量空间、秩等概念。 2、回顾同济版《高等数学》,有能力的可以去Coursea学习宾夕法尼亚大学的微积分课程。 3、推荐学习Strang的线性代数:《Introduction to Linear Algebra》。 4、数理统计:概率论和各种统计学方法要做到基本掌握,找一本《概率论》重新学习下。 5、交互式数据分析框架:这里指的是Apache Hive或Apache Kylin这样的分析交互框架,首先学习Hive,有时间的话了解一下Kylin以及背后的数据挖掘思想。 6、机器学习框架:我建议可以从机器学习算法的原理来进行学习,看到机器学习的框架,我觉得大家应该能想到很多种,比如TensorFlow、Caffe8、Keras9、CNTK10、Torch711等,这里领衔的是TensorFlow。建议大家选取其中的一个框架进行学习。 7、入门级的机器学习课程。 8、学习Python的scikit-learn。 基础知识+研究深入学习+多年从业经验=大数据分析师/大数据工程师 但是还不够达到年薪60万的标准。对数据分析师来说30W就是一个坎,当你的经验值达到了这个坎,很快就会跨越到60W第二个坎,这个经验值就是工龄。 你从事行业的时间越久,就会得到更多项目的锻炼,在这个基础上你还保持着不断学习的精神,其实就不止停留于60W这个坎了,所谓活到老学到老。 你要知道只有系统课程学习(培训)+自己的勤奋努力+前辈的指导+学习资源不断更新=年薪60万的数据分析师。 2021年的最后一个月,师令技能培训学校又搞大事情 看看你的购物车,除了衣服鞋子包包、iPhone13......你就没有点高尚的想法么???比如来个“大数据分析师课”,分分钟变学霸,几年换个好岗位,先挣他一个亿? 想要咨询更多就业课程,请拨打18124145585 |