概述
01
从 Docker 镜像安装使用 Kylin
为了让用户方便地试用 Kylin, 蚂蚁金服的朱卫斌同学向社区贡献了「Kylin Docker Image」 。该镜像中,Kylin 依赖的各个服务均已正确的安装及部署,包括:Jdk 1.8
Hadoop 2.7.0
Hive 1.2.1
Hbase 1.1.2
Spark 2.3.1
Zookeeper 3.4.6
Kafka 1.1.1
Mysql
Maven 3.6.1
首先执行以下命令从 Docker 仓库 pull 镜像:
docker pull apachekylin/apache-kylin-standalone:3.0.1
此处的镜像包含的是 Kylin 最新版本 Kylin v3.0.1。由于该镜像中包含了所有 Kylin 依赖的大数据组件,所以拉取镜像需要的时间较长,请耐心等待。Pull 成功后显示如下:

docker run -d -m 8G -p 7070:7070 -p 8088:8088 -p 50070:50070 -p 8032:8032 -p 8042:8042 -p 16010:16010 apachekylin/apache-kylin-standalone:3.0.1
容器会很快启动,由于容器内指定端口已经映射到本机端口,可以直接在本机浏览器中打开各个服务的页面,如:
Kylin 页面:http://127.0.0.1:7070/kylin/
Hdfs NameNode 页面:http://127.0.0.1:50070
Yarn ResourceManager 页面:http://127.0.0.1:8088
HBase 页面:http://127.0.0.1:60010
NameNode, DataNode
ResourceManager, NodeManager
HBase
Kafka
Kylin
JAVA_HOME=/home/admin/jdk1.8.0_141
HADOOP_HOME=/home/admin/hadoop-2.7.0
KAFKA_HOME=/home/admin/kafka_2.11-1.1.1
SPARK_HOME=/home/admin/spark-2.3.1-bin-hadoop2.6
HBASE_HOME=/home/admin/hbase-1.1.2
HIVE_HOME=/home/admin/apache-hive-1.2.1-bin
KYLIN_HOME=/home/admin/apache-kylin-3.0.0-alpha2-bin-hbase1x
02
基于 Hadoop 环境安装使用 Kylin
对于已经有稳定 Hadoop 环境的用户,可以下载 Kylin 的二进制包将其部署安装在自己的 Hadoop 集群。安装之前请根据以下要求进行环境检查。 环境检查 (1)前置条件: Kylin 依赖于 Hadoop 集群处理大量的数据集。你需要准备一个配置好 HDFS,YARN,MapReduce,Hive, HBase,Zookeeper 和其他服务的 Hadoop 集群供 Kylin 运行。 Kylin 可以在 Hadoop 集群的任意节点上启动。方便起见,你可以在 master 节点上运行 Kylin。但为了更好的稳定性,我们建议你将 Kylin 部署在一个干净的 Hadoop client 节点上,该节点上 Hive,HBase,HDFS 等命令行已安装好且 client 配置(如 core-site.xml,hive-site.xml,hbase-site.xml及其他)也已经合理的配置且其可以自动和其它节点同步。 运行 Kylin 的 Linux 账户要有访问 Hadoop 集群的权限,包括创建/写入 HDFS 文件夹,Hive 表, HBase 表和提交 MapReduce 任务的权限。 (2)硬件要求: 运行 Kylin 的服务器建议最低配置为 4 core CPU,16 GB 内存和 100 GB 磁盘。 (3)操作系统要求: CentOS 6.5+ 或 Ubuntu 16.0.4+ (4)软件要求: Hadoop 2.7+,3.0-3.1 Hive 0.13+,1.2.1+ HBase 1.1+,2.0(从 Kylin 2.5 开始支持) JDK: 1.8+ 建议使用集成的 Hadoop 环境进行 Kylin 的安装与测试,比如 Hortonworks HDP 或 Cloudera CDH ,Kylin发布前在 Hortonworks HDP 2.2-2.6 and 3.0, Cloudera CDH 5.7-5.11 and 6.0,AWS EMR 5.7-5.10,Azure HDInsight 3.5-3.6 上测试通过。 安装使用当你的环境满足上述前置条件时 ,你可以开始安装使用 Kylin。
Step 1. 下载 Kylin 压缩包
从 https://kylin.apache.org/download/ 下载一个适用于你的 Hadoop 版本的二进制文件。目前最新版本是 Kylin 3.0.1和 Kylin 2.6.5,其中 3.0 版本支持实时摄入数据进行预计算的功能。如果你的 Hadoop 环境是 CDH 5.7,可以使用如下命令行下载 Kylin 3.0.0:
cd /usr/local/wget http://apache.website-solution.net/kylin/apache-kylin-3.0.0/apache-kylin-3.0.0-bin-cdh57.tar.gz
Step 2. 解压 Kylin
解压下载得到的 Kylin 压缩包,并配置环境变量 KYLIN_HOME 指向解压目录:
tar -zxvf apache-kylin-3.0.0-bin-cdh57.tar.gzcd apache-kylin-3.0.0-bin-cdh57export KYLIN_HOME=`pwd`
Step 3. 下载 Spark
由于 Kylin 启动时会对 Spark 环境进行检查,所以你需要设置 SPARK_HOME:
export SPARK_HOME=/path/to/spark
如果你没有已经下载好的 Spark 环境,也可以使用 Kylin 自带脚本下载 Spark:
$KYLIN_HOME/bin/download-spark.sh
脚本会将解压好的Spark放在 $KYLIN_HOME 目录下,如果系统中没有设置 SPARK_HOME,启动 Kylin 时会自动找到 $KYLIN_HOME 目录下的 Spark。
Step 4. 环境检查
Kylin 运行在 Hadoop 集群上,对各个组件的版本、访问权限及 CLASSPATH 等都有一定的要求,为了避免遇到各种环境问题,你可以运行 $KYLIN_HOME/bin/check-env.sh 脚本来进行环境检测,如果你的环境存在任何的问题,脚本将打印出详细报错信息。如果没有报错信息,代表你的环境适合 Kylin 运行。
Step 5. 启动 Kylin
运行 $KYLIN_HOME/bin/kylin.sh start 脚本来启动 Kylin,如果启动成功,命令行的末尾会输出如下内容:
A new Kylin instance is started by root. To stop it, run 'kylin.sh stop'Check the log at /usr/local/apache-kylin-3.0.0-bin-cdh57/logs/kylin.logWeb UI is at http://:7070/kylin
Kylin 启动的默认端口是 7070,可以使用 $KYLIN_HOME/bin/ kylin-port-replace-util.sh set number 来修改端口,修改后的端口是 7070+number。
Step 6. 访问 Kylin
Kylin 启动后,你可以通过浏览器 http://:port/kylin 进行访问。
其中 为具体的机器名、IP 地址或域名,port 为 Kylin 端口,默认为 7070。
初始用户名和密码是 ADMIN/KYLIN。
服务器启动后,可以通过查看 $KYLIN_HOME/logs/kylin.log 获得运行时日志。
Step 7. 创建 Sample Cube
Kylin 提供了一个创建样例 Cube 的脚本,以供用户快速体验 Kylin。
在命令行运行
$KYLIN_HOME/bin/sample.sh
完成后登陆 Kylin,点击 System->Configuration->Reload Metadata 来重载元数据。
元数据重载完成后,你可以在左上角的 Project 中看到一个名为 learn_kylin 的项目,它包含 kylin_sales_cube 和 kylin_streaming_cube, 它们分别为 batch cube 和 streaming cube。你可以直接对 kylin_sales_cube 进行构建,构建完成后就可以查询。对于 kylin_streaming_cube,需要设置 KAFKA_HOME,然后执行 ${KYLIN_HOME}/bin/sample-streaming.sh,该脚本会在 localhost:9092 broker 中创建名为 kylin_streaming_topic 的 Kafka Topic,它也会每秒随机发送 100 条 messages 到 kylin_streaming_topic,然后你可以对 kylin_streaming_cube 进行构建。
关于 sample cube,可以参考http://kylin.apache.org/cn/docs/tutorial/kylin_sample.html。
当然,你也可以根据下面的教程来尝试创建自己的 Cube。
Step 8. 创建 Project
登陆 kylin 后,点击左上角的 + 号来创建 Project。


















5000 字带你快速入门 Apache Kylin
Kylin 初入门系列课程
Kylin 新定位:分析型数据仓库
Apache Kylin 云原生架构的思考及规划
使用 DolphinScheduler 调度 Kylin 构建

最后
以上就是冷静身影为你收集整理的kylin版本_Kylin 初入门 | 从下载安装到体验查询的全部内容,希望文章能够帮你解决kylin版本_Kylin 初入门 | 从下载安装到体验查询所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复