行式数据库和列式数据库，数据库列式存储和行式存储优缺点

欧气 2024年09月30日 05:19 3 0

本文目录导读：

行式存储
列式存储

《行式存储与列式存储：数据库存储方式的深度剖析》

行式存储

1、优点

数据写入高效

- 对于事务性操作频繁的场景，行式存储表现出色，例如在银行系统的转账操作中，每次转账涉及到对账户表中某一行数据（如账户余额、交易记录等多个列）的修改，行式存储可以方便地将整行数据一次性写入磁盘，因为相关的数据在物理上是相邻存储的，写入操作只需定位到该行数据的存储位置，然后更新整行数据即可，这种方式减少了写入操作的磁盘寻道次数，提高了写入效率。

- 在数据实时插入场景下，如电商平台的订单实时生成，新订单的各个属性（订单号、用户信息、商品信息、下单时间等）作为一行数据快速插入到订单表中，行式存储的结构能够快速定位到表的末尾，将新行数据连续存储，保证了数据插入的及时性和高效性。

事务处理方便

- 关系型数据库的事务通常是基于行操作的，以数据库的并发控制为例，当多个用户同时对数据库中的同一行数据进行操作时，行式存储能够更好地支持事务的原子性、一致性、隔离性和持久性（ACID）特性，比如在航空订票系统中，多个票务代理可能同时查询和预订同一航班的座位（同一行数据中的座位信息列），行式存储便于通过行锁机制来控制并发访问，确保在一个事务对该行数据进行操作时，其他事务只能等待或者根据隔离级别进行相应的操作，从而保证了数据的准确性和完整性。

适合OLTP系统

- 在线事务处理（OLTP）系统要求快速响应单个事务请求，例如在超市的收银系统中，每一笔交易（商品扫码、计算总价、更新库存等操作涉及到多个相关列的数据）都是一个独立的事务，行式存储能够快速定位到需要处理的行数据，在短时间内完成事务操作并返回结果，满足OLTP系统对实时性和并发处理能力的高要求。

2、缺点

数据分析效率低

- 当进行复杂的数据分析查询时，行式存储的劣势就显现出来了，例如在分析一家大型连锁超市的销售数据时，如果要计算每个地区的销售额总和（需要对多个行中的销售额列进行汇总），由于数据是按行存储的，要获取销售额列的数据，需要遍历每一行，跳过其他不需要的列，这会导致大量的磁盘I/O操作，尤其是当表中的列数较多，而查询只涉及少数列时，这种不必要的列数据读取会严重降低查询效率。

数据压缩效果差

- 行式存储的数据结构不利于数据压缩，因为一行数据中的各个列的数据类型和值的分布往往不同，例如在一个包含员工信息（姓名、年龄、工资、部门等列）的表中，姓名列是字符串类型，年龄列是整数类型，工资列可能是浮点数类型，对整行数据进行压缩时，由于数据类型的多样性，很难找到一种高效的压缩算法，导致数据压缩率较低，占用更多的存储空间。

列式存储

1、优点

数据分析性能高

- 在大数据分析场景下，列式存储优势明显，例如在分析互联网公司的用户行为日志时，日志表包含众多列（如用户ID、访问时间、访问页面、停留时长等），如果要分析用户在特定时间段内的访问页面分布情况，列式存储只需读取与访问页面相关的列数据，而不需要像行式存储那样遍历整行，这大大减少了磁盘I/O操作，提高了查询速度，由于同一列的数据类型相同，数据分布相对规律，便于采用针对性的压缩算法，进一步提升数据读取和处理效率。

数据压缩率高

- 以存储气象数据为例，气象观测站收集的数据包括温度、湿度、气压等列，这些列的数据类型相对单一（大多为数值类型），且在一定范围内有规律分布，列式存储可以针对每列的特点采用合适的压缩算法，如对于温度列，如果数据波动范围较小，可以采用差值编码等高效压缩算法，这样可以显著提高数据压缩率，减少存储空间的占用，降低存储成本。

适合OLAP系统

- 在线分析处理（OLAP）系统通常需要处理大量的数据进行复杂的分析查询，例如在企业的销售数据分析中，要从不同维度（如时间、地区、产品类型等）分析销售数据，列式存储能够快速提取相关列的数据进行聚合、分组等操作，满足OLAP系统对大规模数据分析和快速响应查询的需求。

2、缺点

数据写入相对复杂

- 当有新数据写入时，列式存储需要更多的操作，例如在向一个包含多列的列式存储表中插入一行新数据时，由于数据是按列存储的，需要将新数据的各个列分别插入到对应的列存储区域，这可能涉及到对多个列存储结构的调整，如在某些列式数据库中可能需要重新平衡列数据的存储分布，以保证查询性能，相比行式存储直接在表末尾追加一行数据要复杂得多。

事务支持有限

- 列式存储在事务处理方面存在一定的局限性，由于列式存储的结构特点，对行级别的事务操作（如对某一行数据的多个列同时进行更新操作）实现起来较为复杂，例如在金融交易系统中，如果要同时更新一个账户的余额、交易次数等多个列，行式存储可以方便地通过行锁来控制事务，而列式存储可能需要更复杂的机制来确保事务的ACID特性，目前的列式数据库在事务处理能力上普遍不如行式数据库成熟。

标签： #行式数据库 #列式数据库 #行式存储 #列式存储