怎样正确理解大数据CAP理论

292 阅读 0 评论 193 点赞

我是靠谱客的博主勤劳香水，这篇文章主要介绍怎样正确理解大数据CAP理论，现在分享给大家，希望可以做个参考。

在大数据领域，被业界广泛谈及的CAP理论存在着一些关键性的认知误区，而只有全面地考察与剖析分布式环境中的种种场景，我们才能真正正确地理解它。
　　现在，CAP（Consistency一致性、Availability可用性、Partition-tolerance分区可容忍性）理论普遍被看成是大数据技术的理论基础。同时，凭据该理论，业界有一种极度流行、极度“专业”的认识，那就是：关系型数据库设计选择了C（一致性）与A（可用性），NoSQL数据库设计则差别。其中，HBase选择了C（一致性）与P（分区可容忍性），Cassandra选择了A（可用性）与P（分区可容忍性）。

在理论计算机科学中，CAP定理（CAP theorem），又被称作布鲁尔定理（Brewer's theorem），它指出对于一个分布式计算系统来说，不可能同时满足以下三点：

一致性（Consistency)：同一个数据在集群中的所有节点，同一时刻是否都是同样的值。
可用性（Availability）：集群中一部分节点故障后，集群整体是否还能处理客户端的更新请求。
分区容忍性（Partition tolerance）：是否允许数据的分区，分区的意思是指是否允许集群中的节点之间无法通信。

　　该说法现在似乎已经成为一种经典认知，无论是初学大数据技术，还是已经有了相当经验的技术人员，都将其奉为真理。大师或者是以为，从CAP这样着名的理论推导出来的结论，当然是权威而又正确的，最最少在形式上感觉是专业而又严肃的。有人甚至还将这种认知画成一个三角形图，三个极点分别是C、A、P，三条边分别是关系型数据库、HBase与Cassandra，这样一来，CAP理论就显然更加神圣了。
　　实际上，这种认识是不准确的，甚至是不正确的。暂且不说深入的剖析与研究，只要先从轮廓上简单剖析一下，你就能发现问题：岂非说从理论上讲Cassandra就一定比HBase的可用性更高吗？而要要彻底搞清楚这个问题，还得先从CAP理论自己开始研究。

常见的理解及剖析

附图 CAP理论示意图

更深入的探讨：两种主要的分布式场景

结论

转载请注明链接：http://www.68dl.com//research/2014/0907/4413.html

最后

以上就是勤劳香水最近收集整理的关于怎样正确理解大数据CAP理论的全部内容，更多相关怎样正确理解大数据CAP理论内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(193)

本文分类：架构设计

浏览次数：292 次浏览

发布日期：2023-06-22 18:48:04

相关文章

如何保证分布式系统数据一致性

eureka集群_分布式常见的集群选举机制(zookeepper,kafaka,redis,eureka)

Eureka简介及原理

分布式服务化系统一致性的“最佳实干”

怎样正确理解大数据CAP理论

Websocket(一)——原理及基本属性和方法

6小时精通springcloud第02讲：服务治理-Eureka

微服务实战SpringCloud之Eureka实现类似异地多活