我是靠谱客的博主 跳跃樱桃,最近开发中收集的这篇文章主要介绍hbase 修改表名_HBase个人总结,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

参考文档:

详解HBase架构原理 - Steven.Chow - 博客园

Hbase原理、基本概念、基本架构 - 飞鱼德蒙 - 博客园

05. HBase WAL解析

HBase学习之路 (七)HBase 原理

基本信息:HBase在Hadoop之上提供了类似于Bigtable的能力,实时读写的分布式数据库

HBase原理:

872f5f0a912ca79a1ad677febe839c0d.png

HBase内部组件:

client---客户端包含了访问Hbase的接口,同时在缓存中维护着已经访问过的Region的位置信息,用来加快后续数据访问的过程

zookeeper--1.Zookeeper可以帮助选举出一个master作为集群的总管,并保证在任何时刻总有唯一一个master在运行,这就避免master的“单点失效”问题;2.Zookeeper会实时监测每个Region服务端的状态,当某个Region服务器发生故障时,Zookeeper会通知Master;3.存储所有Region的寻址入口

master---1.Region server分配region;2.发现失效的Region server并重新分配其上的region;3.HDFS上的垃圾文件回收

分片服务器---1.Region服务器是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求;2.负责切分正在运行过程中变的过大的region;3.一个服务器上有多个分片

分片---1.table在行的方向上分隔为多个Region;2.不同的region可以分别在不同的Region Server上,但同一个Region是不会拆分到多个server上

Hlog---用来做灾难恢复使用,HLog记录数据的所有变更,一旦region server 宕机,就可以从log中进行恢复。

store---每一个region由一个或多个store组成

StoreFile--memStore内存中的数据写到文件后就是StoreFile,StoreFile底层是以HFile的格式保存

问题:

数据热点问题产生原因:在HBase中,表会被划分为1...n个Region,被托管在RegionServer中。

Region二个重要的属性:StartKey与EndKey表示这个Region维护的rowKey范围,当我们要读/写数据时,如果rowKey落在某个start-end key范围内,那么就会定位到目标region并且读/写到相关的数据

数据库表部分rowkey规则不合理,某个时间段的数据都被分配到同一个Region服务器,导致该服务器请求过大超过其负荷

Region规划不合理,表均加了32个盐导致Region数量过多,分片过多影响HBase读写效率

Hbase监听后台:Ambari

基本操作命令:put写 get读 delete删除 scan扫描

命令行进入案例:

参考:https://blog.csdn.net/m0_37809146/article/details/91128061

$klist---查看当前用户是否有操作HBase权限,如果没有使用kinit登录

$kinit ceshi_user

$klist--有权限治好进入HBase命令行

hbase(main)..>list ----查询所有表

hbase(main)..>desc ‘表名’---查看表基本信息

hbase(main)..>put ‘表名’, ‘行键’,‘列族:列’,‘值’---新增(修改)列值

hbase(main)..> get '表明','rowkey’ ---获取指定行中所有列的数据信息

最后

以上就是跳跃樱桃为你收集整理的hbase 修改表名_HBase个人总结的全部内容,希望文章能够帮你解决hbase 修改表名_HBase个人总结所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部