负载均衡

负载均衡是分布式可靠性中非常关键的一个问题,它在一定程度上反映了分布式系统对业务处理的能力。

什么是负载均衡?

负载均衡可以分为两种:

  1. 请求负载均衡,即将用户的请求均衡的分发到不同的服务器进行处理。
  2. 数据负载均衡,即将用户更新的数据分发到不同的存储服务器。

分布式系统中,服务请求的负载均衡是指当处理大量用户请求时,请求应该尽量均衡地分配到多台服务器上进行处理,每台服务器处理其中一部分而不是全部请求,这样才能完成高并发的请求处理,避免因为单机处理能力有限,导致系统崩溃而无法提供服务的问题。

服务请求负载均衡算法

我们主要讨论三种负载均衡算法:

  1. 轮询策略
  2. 随机策略
  3. 哈希和一致性哈希策略

轮询策略

轮询策略是一种实现简单、但却很常用的负载均衡策略,核心思想是让服务器轮流处理用户请求,以尽可能使得每个服务器处理的请求数相同。

轮询策略主要包括顺序轮询和加权轮询两种方式。

轮询策略的优点是实现简单,且对于请求所需开销差不多时,负载均衡效果比较明显,同时加权轮询策略还考虑了服务器节点的异构性,可以像性能更好的服务器有更高的优先级,处理更多的请求,这样请求分发更加合理。

轮询策略的缺点是每次请求到的目的节点不确定,不适用于有状态请求的场景,并且,轮询策略主要强调请求数的均衡性,不适用于处理请求所需开销不同的场景。

轮询策略适用于用户请求所需资源比较接近的场景。

随机策略

随机策略是指当用户请求到来时,会随机分发到某个服务节点进行处理,可以采用随机函数来实现节点选取的操作,它的作用是让请求尽可能的分散到不同节点,防止所有请求放到同一节点或者少量几个节点上。

这种方式的优点是实现简单,缺点是每次请求到达的目的节点不确定,不适合有状态的场景,而且没有考虑到处理请求所需要的开销。另外,随机策略没有考虑到服务器节点的异构性。

随机策略适用于集群中服务器节点处理能力相差不大,用户请求所需资源比较接近的场景。

哈希和一致性哈希策略

哈希和一致性哈希是数据负载均衡中常用的算法,数据分布算法的均匀性,一方面指数据的存储均匀,另一方面也指数据请求均匀。

哈希与一致性哈希的优点是哈希函数设置合理时,负载会比较均衡,而且相同key的请求会落在同一个服务节点上,适用于有状态请求的场景,另外,带虚拟接地啊的一致性哈希策略还可以解决服务器节点异构的问题。

哈希与一致性哈希的缺点在于当某个节点出现故障时,采用哈希策略会出现数据大规模迁移的情况,采用一致性哈希策略可能会造成一定的数据倾斜问题,同时,这种策略也没有考虑请求开销不同造成的不均衡问题。

下面是针对三种不同的负载均衡策略的详细比较。

    作者:李潘    出处:http://wing011203.cnblogs.com/    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。