薪资在猎聘上截了几张图,具体你可以上智联、51job或猎聘上搜职位名称查看薪酬。我对大数据发展方向的建议:我朋友就是做猎头的,据他说目前最火的还是算法工程师,以前不起眼,现在随着5G的兴起,AI方向有更为广阔的发展空间,BAT玩命的招人。其次就是做技术开发类,做大数据平台的,这也是目前招聘人数最多的,如果做到大数据架构师,年薪百万不是问题。
数据分析类和数据管理类的一般是甲方企业,偏企业内部。最后是运维,相对发展前景最差。大数据的学习路线必须掌握的技能11条Java高级(虚拟机、并发)Linux 基本操作Hadoop(HDFS MapReduce Yarn )HBase(JavaAPI操作 Phoenix )Hive(Hql基本操作和原理理解)KafkaStorm/JStormScalaPythonSpark (Core sparksql Spark streaming )辅助小工具(Sqoop/Flume/Oozie/Hue等)高阶技能6条机器学习算法以及mahout库加MLlibR语言Lambda 架构Kappa架构KylinAlluxio面列出来的顺序只是个人建议,可以根据个人实际情况来调整顺序第一阶段(基础阶段)Linux学习(跟鸟哥学就ok了)—–20小时Linux操作系统介绍与安装。
Linux常用命令。Linux常用软件安装。Linux网络。防火墙。Shell编程等。官网:https://www.centos.org/download/Java 高级学习(《深入理解Java虚拟机》、《Java高并发实战》)—30小时掌握多线程。掌握并发包下的队列。了解JMS。掌握JVM技术。掌握反射和动态代理。
官网: https://www.java.com/zh_CN/中文社区:http://www.java-cn.com/index.htmlZookeeper学习Zookeeper分布式协调服务介绍。Zookeeper集群的安装部署。Zookeeper数据结构、命令。Zookeeper的原理以及选举机制。
官网: http://zookeeper.apache.org/中文社区:http://www.aboutyun.com/forum-149-1.html第二阶段(入门,攻坚阶段)Hadoop (《Hadoop 权威指南》)—80小时HDFSHDFS的概念和特性。HDFS的shell操作。HDFS的工作机制。
HDFS的Java应用开发。MapReduce运行WordCount示例程序。了解MapReduce内部的运行机制。MapReduce程序运行流程解析。MapTask并发数的决定机制。MapReduce中的combiner组件应用。MapReduce中的序列化框架及应用。MapReduce中的排序。MapReduce中的自定义分区实现。
MapReduce的shuffle机制。MapReduce利用数据压缩进行优化。MapReduce程序与YARN之间的关系。MapReduce参数优化。MapReduce的Java应用开发官网:http://hadoop.apache.org/中文文档:http://hadoop.apache.org/docs/r1.0.4/cn/Hive(《Hive开发指南》)–20小时Hive 基本概念Hive 应用场景。
Hive 与hadoop的关系。Hive 与传统数据库对比。Hive 的数据存储机制。Hive 基本操作Hive 中的DDL操作。在Hive 中如何实现高效的JOIN查询。Hive 的内置函数应用。Hive shell的高级使用方式。Hive 常用参数配置。Hive 自定义函数和Transform的使用技巧。
Hive UDF/UDAF开发实例。Hive 执行过程分析及优化策略官网:https://hive.apache.org/中文入门文档:http://www.aboutyun.com/thread-11873-1-1.htmlHBase(《HBase权威指南》)—20小时hbase简介。habse安装。
hbase数据模型。hbase命令。hbase开发。hbase原理。官网:http://hbase.apache.org/中文文档:http://abloz.com/hbase/book.htmlScala(《快学Scala》)–20小时Scala概述。Scala编译器安装。Scala基础。数组、映射、元组、集合。
类、对象、继承、特质。模式匹配和样例类。了解Scala Actor并发编程。理解Akka。理解Scala高阶函数。理解Scala隐式转换。官网:http://www.scala-lang.org/初级中文教程:http://www.runoob.com/scala/scala-tutorial.htmlSpark (《Spark 权威指南》)—60小时Spark coreSpark概述。
Spark集群安装。执行第一个Spark案例程序(求PI)。RDDRDD概述。创建RDD。RDD编程API(Transformation 和 Action Operations)。RDD的依赖关系RDD的缓存DAG(有向无环图)Spark SQL and DataFrame/DataSetSpark SQL概述。
DataFrames。DataFrame常用操作。编写Spark SQL查询程序。Spark Streamingpark Streaming概述。理解DStream。DStream相关操作(Transformations 和 Output Operations)。Structured Streaming其他(MLlib and GraphX )这个部分一般工作中如果不是数据挖掘,机器学习一般用不到,可以等到需要用到的时候再深入学习。
官网: http://spark.apache.org中文社区:http://www.aboutyun.com/forum-146-1.htmPython (推荐廖雪峰的博客—30小时)目前暂且列出来这么多吧,大数据目前还有很多比较好的技术框架,这个就需要等大家以后工作之后再去扩展了,大家在学习的时候,要专门挑一两个着重研究一下,最好针对,底层原理,优化,源码等部分有所涉猎,这么的话可以在面试过程中脱颖而出。
如何给Excel中每个数据加上同一个数值?
如何给Excel中的所有数据加一个数值?一种方法是使用公式,另一种方法是使用自定义粘贴。具体操作如下。添加一个辅助公式列,选择数据列,在编辑字段中输入公式“=B3 $C$3”,使用“Ctrl Enter”组合键确认填充。自定义粘贴1、准备单元格中需要的数据内容,包括要统一添加的数值和原始数据;2.复制要添加的数据,选择数据列,点击【粘贴】-【选择性粘贴】;3.勾选弹出框中的[添加]并确认。此时,单元格数据统一加500。