缓存与库应该先写谁


日常生产场景中,为了避免大量请求同时打在数据库上导致故障,数据库+缓存的方式已经成了日常标配。对于读取的部分,大家都很熟悉。但是对于写的部分,到底是先写库还是先写缓存,这点可能困扰着很多人。

【旁路缓存策略】

    提到这个有逼格的名词你可能不是很熟悉,但是说到它的使用方式,你肯定用过。这是一种最经典的缓存+数据库读写的模式,英文是这样 Cache Aside Pattern,可能你见过。这种模式对应的使用方式有两种情况,一读一写:

    ·    基本读取方式;

    ·    先更新数据库,后删除缓存。

1、基本读取方式

这部分相信大家已经轻车熟路:先读缓存,缓存中没有数据的话就去数据库读取,然后再存入缓存中,同时返回响应。

image.png

2、先更新数据库,后删除缓存

你可能会问,为什么不在更新完数据库后,采取更新缓存的方案,而是将其删除。原因有这么几点:

    ·    频繁更新浪费资源

    如果修改库中的某个字段,一段时间内频繁进行更新。那么你修改多少次,缓存也跟着更新多少次。

    但是这个缓存数据在这段时间内也就被偶尔使用了几次,是不是就会导致资源浪费了。

    ·    缓存数据计算复杂

    如果这个缓存的数据计算成本比较高。比如为了一个数据,要通过多张表来计算才能得到结果。

    那么每修改一次,为了更新缓存还要再查询多张表来算一次。。。

    ·    两种情况都具备

    这种情况最为致命,不但修改频繁,同时缓存数据还要经过复杂计算。既然更新缓存的方式不可行,那么我们换个思路,删除掉呢?

还是按照上边的步骤,先更新数据库,只是我们把更新缓存的操作换成了删除。

在这种情况下,读请求过来的时候,发现 Redis 中没有数据,就会去数据库里读取,然后写入缓存中。

这也是一种懒加载方式,只有缓存被需要的时候才会去计算。这样可以避免大量计算及频繁更新。

但是,这样会有什么隐患的问题?是不是看着没什么毛病。你想想,如果数据更新成功,但是删除缓存失败怎么办?

image.png

如图中所示,刚开始时(初始),数据库和缓存中的数据是一致的,但是在写请求过来后,数据库更新成功,而缓存删除失败。这就导致数据库中的数据是最新的,但缓存中却依然存着旧数据。

这时,如果读请求过来,就会直接读取缓存中的旧数据返回了。


【双写一致方案】

1、先删除缓存,后更新数据库

既然问题的原因是删除缓存失败了,那么我们先确保把缓存删除成功了,再去更新数据库。也就是说我们先删除缓存,后更新数据库。我们通过图来看下这种情况:

image.png

缓存删除成功后为空了,但是数据库却失败了,还是原来的旧数据。

如果这时候有请求过来的话,一看缓存中没有数据,于是就到数据库读取了旧数据更新到缓存中。

如果你的项目并发量很低的话,每天访问量就那么点,那这么用没毛病,很少情况下才会出现数据不一致的问题。

2、缓存延时双删策略

如果同时来了两个请求,一个写请求,一个读请求。

写请求先删除Redis中的数据,然后去数据库进行更新操作。读请求判断Redis中有没有数据,没有数据时去请求数据库,拿到数据后写入缓存中。但是写请求此时并没有更新成功,或者执行了一个事务还没有成功。这样的话,读请求拿到未修改的旧数据写入缓存。过了一会儿,写请求将数据库更新成功了,那么此时缓存与库中的数据就不一致了。

image.png

解决方案呢?延时双删策略:

image.png

写请求过来先把 Redis缓存删掉,等数据库更新成功后,异步等待一段时间再次把缓存删掉。

这种方案读取速度快,但是会出现短时间的脏数据。


【总结】

旁路缓存策略

    ·    读的时候,先读缓存,缓存没有的话,再去读数据库,然后取出来放入缓存中,同时返回响应。

    ·    更新的时候,先更新数据库,再删除缓存。

双写一致方案

    ·    先删除缓存,后更新数据库:

    解决了缓存删除失败导致库与缓存不一致的问题,适用于并发量不高的业务场景。

缓存延时双删策略:

    这种方案解决了高并发情况下,同时有读请求与写请求时导致的不一致问题。读取速度快,但是可能会出现短时间的脏数据。

    每种方案各有利弊,对于不同的业务来说没有通用的技术方案。在选择技术方案时需要根据业务自身来定。没有最好的,只有最合适的。


上一篇 下一篇
注:本文转载自IT界农民工,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权行为,请联系我们,我们会及时删除。

评论

登录后可发表评论