第一:统计学常识。(保举学习:Python视频教程)
这是很年夜一局部年夜数据剖析师的短板。当然这里说的没有是简略的一些统计罢了。而是包罗均值、中位数、规范差、方差、几率、假定测验等等具备工夫、空间、数据自身。差没有多应该是理工科的初等数学的常识,乃至还高一点儿。要可以建模,要否则你剖析进去的后果离实际相差十万八千里的话,预计要没有了几天,你就会被炒鱿鱼走人了。当然,做个普通的年夜数据剖析师,就没有会触及到很深的初等数学常识了,但要做一个牛B的年夜数据剖析师,仍是要学习学习再学习。
第二:不少人想没有到的,你仍是把EXCEL玩相熟吧。
当然没有需求把握的矮小全,也患上要把握罕用的函数,比方重点包罗但没有限于sum,count,sumif,countif,find,if,left/right,工夫转换,透视表,各类图表做法等之类的。假如数据量没有算是特地年夜的话,Excel可以处理不少成绩。比方,挑选局部赃数据,排序,筛选餍足前提的数据等等。
第三:剖析思想的操练。
比方构造化思想、思想导图、或baidu脑图、麦肯锡式剖析,理解一些smart、5W2H、SWOT等等那就更好了。纷歧定要把握多深多全,但肯定要理解一些。
第四:数据库常识。
年夜数据年夜数据,就是数据量不少,Excel就处理没有了这么年夜数据量的时分,就患上应用数据库。假如是关系型数据库,比方Oracle、mysql、sqlserver等等,你还患上要学习应用SQL语句,挑选排序,汇总等等。非关系型数据库也患上要学习,比方:Cassandra、Mongodb、CouchDB、Redis、 Riak、Membase、Neo4j 以及 HBase等等,最少罕用的理解一两个,比方Hbase,Mongodb,redis等。
第五:营业学习。
其实关于年夜数据剖析师来讲,理解营业比理解数据更首要。关于行业营业是怎样走的关于数据的剖析有着十分首要的作用,没有理解营业,可能你剖析的后果没有是他人想要的。
第六:开发对象及环境。
比方:Linux OS、Hadoop(存储HDFS,较量争论Yarn)、Spark、或另一些两头件。今朝用患上多的开发对象python等等言语对象。
总之,要做一个初级或总监级的年夜数据剖析师那是相称的烧脑的。要学习理解的货色假如只是单纯的数据方面的话,那营业以及统计常识的学习是必不成少的。假如是适用型的年夜数据剖析师可能只把握某些局部就能够。年夜数据开发工程师的话,根本就是把握开发环境、开发言语和各类图表的使用,也是能够餍足的。究竟结果,一个公司要团队合作,一人懂一局部就能够搞出剖析产物进去了。认定一项事件就去干!越干越轻松,越干越牛B!
更多Python相干技巧文章,请拜访Python教程栏目进行学习!
以上就是python数据剖析师需求学甚么的具体内容,更多请存眷资源魔其它相干文章!
标签: Python python教程 python编程 python使用问题
抱歉,评论功能暂时关闭!