@lilianyuan
大隐隐于市 暂无简介
拷贝的kaka的拷贝的kaka的拷贝的kaka的
电商流量分析系统。基于docker环境。使学生了解大数据离线技术全套开发流程,具体环节包括基础环境搭建、高可用环境搭建、数据源埋点、数据采集、数据存储、数据仓库建模分析、数据计算、数据导出、数据可视化。 学习过程采用Docker、Idea、maven等流行系统环境、开发环境。
flume直接发送数据到hdfs,内置hadoop安装包,并配置好,可直接运行的flume服务器
基于docker的三个节点的hadoop集群,并配置了hive和sqoop。 将创建镜像和创建容器的命令以及内部运行节点的命令封装了脚本,
上传了一个工作流的案例代码