发布者:上海IT外包来源:http://www.lanmon.net点击数:716
蓝盟IT小贴士,来喽!
我把这些大特性分成了四个类别
第一个是开源,这不需要讨论。 其馀三类七个特性是选言的核心纲要。
第二类是高可用性、容错性、可构成的一致性,这是围绕多节点冗馀数据的特性,换句话说就是Cassandra的数据,只要各行的数据只有一个拷贝,就不存在第二类的特征。
三是方差、脱中心化、可扩展性,这三个特征是数据库的分割性,各节点可以独立工作的能力。 仅仅安装单体的Cassandra并不存在这样的特征。
第四类是行存储,是在数据库的基础上存储数据的最基本的存储结构的特征,也是我切入的最初的特征。

低存储结构
数据库的设计和优化始终以核心事项——为中心进行优化。 查询始终是使用数据的核心需求。 为什么需要INSERT? 为了今后调查这个数据。 为什么是DELETE? 因为没有了查询,可以更快地查询其他数据。 为什么需要更新来使用实时查询。 无论是数据库存储结构、ORACLE段、区域、块的设计、辅助存储结构还是索引,最终都需要数据来进行更快速的检索。 Cassandra也不例外,通过了解其存储结构,您可以了解如何在此存储系统下提高查询性能。 即使是INSERT擅长的数据库。
在传统的原始存储数据库中,如果DDL定义了数据表中的列数。 此行中的数据必须包含所有列值。 即使此列没有值,应用程序也必须存储NULL值,或者应用程序必须存储空格或0以指示没有值。 与此列对应的存储器一定存在。 当然,数据库的varchar或压缩算法会尽可能减小此存储。
然而,Cassandra允许对于给定的任何行只包括其中的一些列。 并非一行的数据都需要所有的列。 当然,我们需要KEY列。 这样的列值存储的动态性在传统的原存储数据库中是不存在的。 这或许早期就有ColumnFamily概念的根源。
如前所述,凯西认为是列存储的数据库。 但是,我们认为这是一个不完整的列存储数据库,是一个有限的列存储数据库。 完全在哪里? 大多数列存储数据库都是针对OLAP而生成的,其优点在于,在一列中聚合的性能是无声的。
蓝盟专业服务18年
分享到: