《分布式金融架构课》阅读笔记2: 线性一致的分布式数据系统的实现过程

系统设计

说明

以下内容摘录自仁杰的技术专栏《分布式金融架构》，这是第二篇笔记，背景和基础知识见第一篇笔记：《分布式金融架构课》阅读笔记：单机并发/多机并发/多副本读写的正确行和一致性。

这里推演线性一致的分布式数据系统的实现，以分布式数据库为例。

什么是分布式数据系统

由多台机器组成的、提供数据存储/访问功能的系统，都算分布式数据系统，譬如以下系统：

由一主一从组成的 mysql 数据库集群
由一主多从组成的 redis 缓存集群
由多台机器组成的 kafka 消息队列
由多台机器组成的分布式存储、分布式数据库

分布式数据系统的正确性

无论是部分机器故障还是并发操作，都需要保证所有机器上的数据正确。

要保证数据正确，分布式系统需要实现「分布式事务」，见多机操作的正确性保证。

分布式数据系统的读写一致性

分布式系统中的数据存在多个备份，需要对数据的并发读写做出一致性承诺。

一致性分为很多种，见多机数据备份的一致性。

分布式数据库实现

分布式数据库是对正确性和一致性要求最高的分布式数据系统：

需要实现数据容灾
数据读写要满足线性一致性
需要支持分布式事务

分布式数据库：容灾与读写的线性一致性

用「事件溯源架构」+「分布式算法」实现数据读写的线性一致性：

多台机器通过 raft 算法，达成共识选出唯一主节点
主节点将事件队列全序广播到从节点（复制状态机），实现事件队列的线性化存储
线性一致性读取：查询请求发送到主节点，与写操作一起排序，主节点将查询结果返回
非线性一致性读：查询请求发送读节点（读写分离架构），读节点通过读模式状态机，计算出查询结果

如果要线性一致性读，查询请求要发送到主节点，下图未体现

数据读写的线性一致性实现

分布式数据库：分布式事务

分布式事务有 2pc 和 tcc 两种实现方式，详情见：多机操作的正确性。

无论是 2pc 还是 tcc 会引入新的角色——协调者，协调者本身不能是单点，也需要用多台机器实现容灾，又带来同样的「读写一致性」问题。

继续用「事件溯源架构+分布式算法」实现协调者的读写操作的线性一致性，最终架构如下：

                           +----------------+            +----------------+              
                           |                |    raft    |                |              
                           |     Master     |---------|> |      Salves    |   <-- 协调者集群
                           |                |            |                |              
                           +----------------+            +----------------+              
                                .    |                                                   
                               /_\   |  正确性（分布式事务）                                          
                                |   _|_                                                  
                                |   \ /                                                  
                                |    '                                                   
                     ********************************
+-------+                +-------------------+           +------------------+
|       |                |                   |   raft    |                  |
| User  |         +--|>  |   Data Master 1   | -------|> |   Data Salves    | <--- 数据集群
|       |         |      |                   |           |                  |
+-------+         |      +-------------------+           +------------------+
  |   +--------+  |                                                                  
  |   |        |  |      +-------------------+           +------------------+
  +-|>| router |--+      |                   |   raft    |                  |
      |        |  |      |   Data Master 2   | -------|> |   Data Salves    | <--- 数据集群
      +--------+  +---|> |                   |           |                  |
                         +-------------------+           +------------------+