数据库以行、列的二维表的形式存储数据。可是却以一维字符串的方式存储。比例如以下面的一个表:

EmpId Lastname Firstname Salary
1 Smith Joe 40000
2 Jones Mary 50000
3 Johnson Cathy 44000

这个简单的表包含员工代码(EmpId), 姓名字段(Lastname and Firstname)及工资(Salary).

这个表存储在电脑的内存(RAM)和存储(硬盘)中。尽管内存和硬盘在机制上不同,电脑的操作系统是以相同的方式存储的。数据库必须把这个二维表存储在一系列一维的“字节”中,由操作系统写到内存或硬盘中。

行式数据库把一行中的数据值串在一起存储起来,然后再存储下一行的数据。以此类推。

      1,Smith,Joe,40000;
      2,Jones,Mary,50000;
      3,Johnson,Cathy,44000;

列式数据库把一列中的数据值串在一起存储起来,然后再存储下一列的数据,以此类推。

      1,2,3;
      Smith,Jones,Johnson;
      Joe,Mary,Cathy;
      40000,50000,44000;

这仅仅是一个简化的说法。

在关系数据库领域,除传统的ORACLE、SQLSERVER、MYSQL等行式数据库外。眼下在数据仓库领域列式数据库越来越受到关注。

二  对照

1  行式更适合OLTP, 查询一个记录的全部列。


    列式更适合OLAP,很适合于在数据仓库领域发挥作用,比方数据分析、海量存储和商业智能。涉及不常常更新的数据。因为设计上的不同。列式数据库在并行查询处理和压缩上更有优势。并且数据是以列为单元存储,全然不用考虑数据建模或者说建模更简单了。要查询计算哪些列上的数据,直接读取列即可。




2  列式在存储方面占有非常大的优势,能有效提高数据压缩比,节省存储空间。