淘宝双11大数据分析（环境篇）案例分析

83 阅读 0 评论 55 点赞

我是靠谱客的博主朴素音响，这篇文章主要介绍淘宝双11大数据分析（环境篇）案例分析，现在分享给大家，希望可以做个参考。

文章目录

案例分析
- 前言
- 数据分析流程
- 环境准备
- - 软件要求
  - 硬件要求
  - 环境搭建

案例分析

前言

通过本案例，你可以：

熟悉在 Linux 系统中安装 Hadoop 集群、安装 Mysql 数据库，安装 Sqoop 数据迁移工具，安装 Spark ，安装 Hive 数据仓库。
在 HDFS 分布式文件系统中创建文件夹、上传文件。
在 Hive 中建立表，使用 Hive 对 HDFS 中的文件进行操作，使用 HQL 进行业务查询。
使用 Sqoop 将 Hive 中的数据迁移到 Mysql 中。
了解 Spark 的 MLlib自带的工具，使用 Spark-Shell 编程。使用 Spark 读取 csv 文件，并分析数据。
Web 项目整合 ECharts，可视化展示数据分析结果。

数据分析流程

在这里插入图片描述

环境准备

软件要求

软件/插件/编程语言等	版本
Linux 系统	CentOS 7
JDK	1.8.0_161
MySQL	5.7.26
Hadoop	2.7.7
Scala	2.11
Spark	2.4.4
Hive	2.3.6
Sqoop	1.4.7
Idea	2018版
ECharts	3.4.0

硬件要求

本案例可以在单机上完成（即伪分布式环境），也可以在集群环境下完成。**由于硬件限制，我的所有操作均在伪分布式环境下完成。**单机的要求， 8 G 以上内存，500 G 磁盘存储。

环境搭建

安装 Linux 系统。（参考本人博客：VMware 安装 Linux 系统（CentOS 7 图文教程））
Linux 安装 JDK。（参考本人博客：Linux 安装 JDK(图文教程)）
Hadoop 伪分布式搭建。（参考本人博客：Hadoop 集群搭建详细步骤）另：本次使用的是仅主机模式，主机名为centos2020（使用命令：hostnamectl set-hostname centos2020）。
MySQL 安装。（参考本人博客：Linux 安装 MySQL）
Linux 安装 Hive 。（参考本人博客：Linux 安装 Hive）
Linux 安装 Sqoop。（参考本人博客：Linux 安装 Sqoop）
Linux 安装 Spark（单机版，参考本人博客：Linux 安装 Spark）
echarts 下载

最后

以上就是朴素音响最近收集整理的关于淘宝双11大数据分析（环境篇）案例分析的全部内容，更多相关淘宝双11大数据分析（环境篇）案例分析内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(55)

本文分类：Spark
浏览次数：83 次浏览
发布日期：2024-01-17 10:05:50
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_23_ogf5_13__23__14_x.html

相关文章

淘宝网采用什么技术架构来实现网站高负载的淘宝网采用什么技术架构来实现网站高负载的

淘宝网采用什么技术架构来实现网站高负载的淘宝网采用什么技术架构来实现网站高负载的

淘宝双十一每秒并发量_“双十一”峰值时段保障顺利完成网络支付清算业务并发量创历史新高...

淘宝双十一每秒并发量_“双十一”峰值时段保障顺利完成网络支付清算业务并发量创历史新高...

教你制作类双十一的可视化大屏一、工欲善其事必先利其器二、连接数据三、大屏模板制作四、选择合适的可视化元素五、添砖加瓦，美化细节六、所谓大屏，要能酷炫，还要能动态刷新七、进阶大屏玩法，炫酷随心最后、数据大屏，不只是秀最后的最后，还没完事，做好的样式要投到大屏上啊！

教你制作类双十一的可视化大屏一、工欲善其事必先利其器二、连接数据三、大屏模板制作四、选择合适的可视化元素五、添砖加瓦，美化细节六、所谓大屏，要能酷炫，还要能动态刷新七、进阶大屏玩法，炫酷随心最后、数据大屏，不只是秀最后的最后，还没完事，做好的样式要投到大屏上啊！

每个人都在经历淘宝的“大数据杀熟”，这5个办法巧妙避开

每个人都在经历淘宝的“大数据杀熟”，这5个办法巧妙避开

淘宝双11大数据分析（环境篇）案例分析

淘宝双11大数据分析（环境篇）案例分析

淘宝双11大数据分析（数据准备篇）前言数据内容分析数据上传到Linux系统并解压数据集的预处理文件信息截取导入数据到Hive中

淘宝双11大数据分析（数据准备篇）前言数据内容分析数据上传到Linux系统并解压数据集的预处理文件信息截取导入数据到Hive中

淘宝双十一每秒并发量_淘宝双十一退款规则淘宝双十一退款规则介绍

淘宝双十一每秒并发量_淘宝双十一退款规则淘宝双十一退款规则介绍

大数据奇葩说：盘点10个有趣的大数据

大数据奇葩说：盘点10个有趣的大数据

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部