《分布式技术原理与算法解析》学习笔记Day21

分布式数据存储三要素什么是分布式数据存储系统？

分布式存储系统的核心逻辑，就是将用户需要存储的数据根据某种规则存储到不同的机器上，当用户想要获取指定数据时，再按照规则到存储数据的机器中获取。

分布式存储系统的三要素：

数据生产者生产数据，将数据存储到分布式数据存储系统中，数据消费者是从分布式数据存储系统中获取数据进行消费；数据索引将访问数据的请求转发到数据所在的存储节点；存储设备用来存储数据。

分布式系统数据类型

分布式系统中存在大量不同类型的数据，根据数据的特征，我们可以将其分为三类：

数据分片与数据复制

数据分片技术，是指分布式存储系统按照一定的规则，将数据存储到相应的存储节点中，或者到相应的存储节点中获取想要的数据。这种技术一方面可以降低单个存储节点的存储和访问压力，另一方面可以通过规定好的规则快速找到数据所在的存储节点，从而大大降低搜索延迟，提高用户体验。

数据分片可以采取不同的方式，包括：

数据复制是指将数据进行备份，使得多个节点存储该数据。它可以通过主备方式存储的方式，提高分布式系统的可用性和可靠性。

在实际的分布式存储系统中，数据分片和数据复制通常是共存的：

数据存储

根据上述三种不同的数据类型，常采用的数据存储选型方案如下：

分布式数据库，通过表格来存储结构化数据，方便查找。常见的方案包括：MySQL Sharding、Microsoft SQL Azure、Google Spanner、Alibaba OceanBase等。
分布式键值系统，通过兼职对来存储半结构化数据。常见的方案包括：Redis、Memcache等。
分布式存储系统，通过文件、块、对象等来存储非结构化数据。常见的方案包括：Ceph、GFS、HDFS、Swift等。

详细的分布式数据库比较如下。

详细的分布式存储系统比较如下。

　　　　作者：李潘　　　　出处：http://wing011203.cnblogs.com/　　　　本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。

[网鼎杯 2018]Fakebook1