wxiao个人技术分享 wxiao的技术分享

雪崩问题及其解决方案

⚠️ 本文最后更新于2024年06月11日,已经过了352天没有更新,若内容或图片失效,请留言反馈

一、什么是雪崩

微服务调用链路中的某个服务故障,引起整个链路中的所有微服务都不可用,这就是雪崩。

服务器支持的线程和并发数有限,请求一直阻塞,会导致服务器资源耗尽,从而导致所有其它服务都不可用,那么当前服务也就不可用了。

那么,依赖于当前服务的其它服务随着时间的推移,最终也都会变的不可用,形成级联失败,雪崩就发生了:
2024-06-11T03:13:08.png

解决方案

1.超时处理
设定超时时间,请求超过一定时间没有响应就返回错误信息,不会无休止等待
2024-06-11T03:15:15.png

2.仓壁模式
仓壁模式来源于船舱的设计:
2024-06-11T03:16:39.png
船舱都会被隔板分离为多个独立空间,当船体破损时,只会导致部分空间进入,将故障控制在一定范围内,避免整个船体都被淹没。

于此类似,我们可以限定每个业务能使用的线程数,避免耗尽整个tomcat的资源,因此也叫线程隔离。
2024-06-11T03:17:32.png
3.断路器
断路器模式:由断路器统计业务执行的异常比例,如果超出阈值则会熔断该业务,拦截访问该业务的一切请求。

断路器会统计访问某个服务的请求数量,异常比例:

2024-06-11T03:19:08.png

当发现访问服务D的请求异常比例过高时,认为服务D有导致雪崩的风险,会拦截访问服务D的一切请求,形成熔断:
2024-06-11T03:19:40.png

4.限流
流量控制:限制业务访问的QPS,避免服务因流量的突增而故障。
2024-06-11T03:20:35.png

可以认为:

限流是对服务的保护,避免因瞬间高并发流量而导致服务故障,进而避免雪崩。是一种预防措施。

超时处理、线程隔离、降级熔断是在部分服务故障时,将故障控制在一定范围,避免雪崩。是一种补救措施。

By xiao On