欢迎来到it培训的黄埔军校——智游教育!

第四阶段-永利国际

于2016-03-30 18:25:26 发表在大数据知识库
  1、hive体系结构介绍,数据仓库基础知识,hive在实际中的应用情况、安装、配置、命令,hive集群

  2、hive和传统关系数据库的比较,hiveql、hive的数据类型,hive函数以及分区,hive的存贮格式
 
  3、hive表的修改、废弃以及查询中的排序和聚集函数应用,数据导入
 
  4、hive中的连接,mapreduce脚本,hive中视图的应用、自定义函数,hive总结及开发实例
 
  5、hbase数据模型及系统架构分析,hbase上的mapreduce,hbase编辑视图
 
  6、hbase的物理存储(htable、hregion、store、hfile、hlog),hbase的系统架构,hbase流程及算法,hbase源码解读以及hbase优化,spark/spark sql/spark scala架构介绍及集群搭建
 
  7、数据分析及抽取工具sqoop,数据挖掘常用算法分析(回归分析、分类、聚类等)、mahout分析
 
  8、项目实战:电信业日志分析系统、用户行为分析系统(基站日志分析、能力指标分析、用户行为分析、精准营销系统实现)