谨防 ActiveSupport::Cache::Store 缓存 nil 值

tunny 发布于2019-08-06 13:14 / 1382人阅读

摘要：这三行代码，则是在缓存命中时，直接读取缓存内容并且返回。通过上面的源码分析，我们可以知道，当缓存失效时，方法会直接将其代码块中的代码的返回值不加判断地写入缓存，并且返回该返回值。

Rails 中的 active_support 组件主要基于 Rails 需要提供了很多非常有用的基础工具以及对 Ruby 内置类进行扩展。其中的 cache 模块主要提供了 Rails 中底层缓存的定义以及简单实现。今天要跟大家探讨的是之前在使用此模块所遇到的一个坑，有兴趣学习其基本用法的可以点击以下两个链接：

Rails Guides: ActiveSupport::Cache::Store

Rails API: ActiveSupport::Cache::Store

从 ActiveSupport::Cache::Store#fetch 聊起

之前在实现一个需要从外部服务请求数据的功能时，处于性能考虑，我在代码中使用了缓存，并且设置缓存失效时间为 7 天，示例代码如下：

def read_external_service(params)
  # 这段代码稍微解释下：
  #   当缓存命中时，则直接读取缓存，如果无期待缓存，则通过 HTTP 向外请求结果，并且将结果
  #   缓存下来，这样子，当下次继续调用时，则可直接返回缓存内容，而无需重复向外请求
  #
  Rails.cache.fetch "example_cache_key_here", expires_in: 7.days do
    response = HTTParty.get "https://example.com/example/request/path"
    JSON.parse(response.body)["data"]
  end
end

上面的代码其实不复杂，核心代码就是使用了 ActiveSupport::Cache::Store#fetch 方法。

一切都很正常地运行着，直到有一天，线上系统不断报警，出错原因就是这段代码总是返回 nil ，而调用者又因为没有判断 nil 值，就会出现 undefined method "xxx" for nil:NilClass 错误。在 debug 时，我尝试了直接调用外部服务接口，发现请求都有正确返回数据，不可能返回 nil 啊，难道是缓存了 nil 值？下面就直接通过代码验证一下！

[1] pry(main)> require "active_support"
=> true
[2] pry(main)> cache = ActiveSupport::Cache::MemoryStore.new
=> <#ActiveSupport::Cache::MemoryStore entries=0, size=0, options={}>
[3] pry(main)> cache.read :nil_value
=> nil
[4] pry(main)> cache.exist? :nil_value
=> false
[5] pry(main)> cache.fetch :nil_value do
[5] pry(main)*   nil   # this `nil` value will be cached
[5] pry(main)* end
=> nil
[6] pry(main)> cache.read :nil_value
=> nil
[7] pry(main)> cache.exist? :nil_value
=> true

看吧， fetch 方法确实会缓存 nil 值（通过 exist? 方法可以判断是否缓存了指定的 key ），所以系统出错原因就清晰了：在某次代码执行中，我的缓存刚好失效了，所以系统向外部发送了请求，恰巧这时候外部系统因为故障或者其他可能原因，没有返回期待数据，导致代码中最终缓存了 nil 值，在接下来的时间里，虽然外部系统可能恢复了正确服务，可是这时候因为我们的系统已经缓存了 nil值，所以在每次调用时都返回缓存的 nil，而不是重新请求正确结果，导致最后不停的报错告警。

这里插播一句，通过后来仔细查阅文档，才发现文档里已经注明：

Nil values can be cached.

╮(╯▽╰)╭ 怪我咯~

解决方案

意识到这个问题之后，解决思路简单粗暴，就是在可能返回 nil 值的地方放弃写入缓存：

def read_external_service(params)
  cache_key = "example_cache_key_here"
  result = Rails.cache.read(cache_key)
  # 缓存命中，且内容不为 nil ，直接返回缓存内容
  return result if result.present?

  # 缓存失效，只能重新请求了~
  response = HTTParty.get "https://example.com/example/request/path"
  result = JSON.parse(response.body)["data"]

  # 请求结果正确，写入缓存；否则，放弃之~~~
  Rails.cache.write(cache_key, result, expires_in: 7.days) if result.present?
  result
end

呃~~~虽然解决问题了，可是，就为了告诉系统不要相信 nil，就写得这么繁琐，好么？好么？好么？

踏上阅读源码之路

我尝试搜索了 #fetch 方法是否有支持比如 reject_nil 这样的 option，可惜的是，没有！可是真的没有吗？我不信！看源码去！

首先还是拜访下 ActiveSupport::Cache::Store 这个类啦，它可是所有缓存实现类的抽象类，别问我抽象类是什么，就是它明明只说话不干活，但是其他干活的都得向它看齐！好啦，说人话，其实就是说，我们在调用 Rails.cache.read、Rails.cache.fetch 等读写方法时，这些方法都是在 ActiveSupport::Cache::Store 中定义的，但是它只定义逻辑，而实际底层的读写实现，则都是交由其各种子类实现的，比如前面的 ActiveSupport::Cache::MemoryStore。

首先让我们来看看 fetch方法的全部内容：

def fetch(name, options = nil)
  if block_given?
    options = merged_options(options)
    key = namespaced_key(name, options)

    instrument(:read, name, options) do |payload|
      cached_entry = read_entry(key, options) unless options[:force]
      payload[:super_operation] = :fetch if payload
      entry = handle_expired_entry(cached_entry, key, options)

      if entry
        payload[:hit] = true if payload
        get_entry_value(entry, name, options)
      else
        payload[:hit] = false if payload
        save_block_result_to_cache(name, options) { |_name| yield _name }
      end
    end
  else
    read(name, options)
  end

从代码中可以看到，当 #fetch 方法调用时没有传递 block 的话，它本质上就是 read 方法的别名而已。而当调用时传递了 block 的话，即如我前面的示例代码，让我们把代码分开看下：

cached_entry = read_entry(key, options) unless options[:force]
payload[:super_operation] = :fetch if payload
entry = handle_expired_entry(cached_entry, key, options)

它首先判断是否设置了 force 选项，如果有，则不读取缓存，由此模拟缓存强制失效；如果未设置 force 选项或者该选项不等于 true value，则尝试读取缓存，并且调用 handle_expired_entry判断缓存是否仍旧有效。

if entry
  payload[:hit] = true if payload
  get_entry_value(entry, name, options)

这三行代码，则是在缓存命中时，直接读取缓存内容并且返回。

else
  payload[:hit] = false if payload
  save_block_result_to_cache(name, options) { |_name| yield _name }
end

else 的代码则表示，在缓存无命中时， #fetch 代码直接调用 #save_block_result_to_cache 方法，并且向其传递了一个 block，这个 block 没有干别的事情，它只会执行我们传递给 #fetch 方法的 block，让我们接着往下看看相关的实现：

def save_block_result_to_cache(name, options)
  result = instrument(:generate, name, options) do |payload|
    yield(name)
  end

  write(name, result, options)
  result
end

可以看到，#save_block_result_to_cache 方法首先执行传递进来的代码块，实际上也就是我们期待在缓存失效时执行的代码，而在获得执行结果 result 后，方法通过调用 #write 方法将结果写入缓存，最后将 result 返回。

通过上面的源码分析，我们可以知道，当缓存失效时，#fetch 方法会直接将其代码块中的代码的返回值不加判断地写入缓存，并且返回该返回值。这里，或许我们可以做点什么，来实现我们想要支持 :reject_nil 的需求？

支持 :reject_nil option

为了支持 :reject_nil，我们只需要在写入缓存前判断是否真的需要 nil 值即可，于是我们只需要在 #save_block_result_to_cache 中加入 #write 的前置条件：

def save_block_result_to_cache(name, options)
  result = instrument(:generate, name, options) do |payload|
    yield(name)
  end

  # options[:reject_nil] && result.nil? 作为前置条件
  write(name, result, options) unless result.nil? && options[:reject_nil]

  result
end

话不多说，让我们来重新试验一番：

[1] pry(main)> require "active_support"
=> true
[2] pry(main)> cache = ActiveSupport::Cache::MemoryStore.new
=> <#ActiveSupport::Cache::MemoryStore entries=0, size=0, options={}>
[3] pry(main)> cache.fetch :nil_key1 do
[3] pry(main)*   nil
[3] pry(main)* end
=> nil
[4] pry(main)> cache.exist? :nil_key1
=> true
[5] pry(main)> cache.fetch :nil_key2, reject_nil: true do
[5] pry(main)*   nil
[5] pry(main)* end
=> nil
[6] pry(main)> cache.exist? :nil_key2
=> false

可以看到，当我们调用 #fetch 方法时，如果没有传递 reject_nil: true，则 #fetch 方法会默认缓存 nil 值；而如果我们设置 reject_nil: true 的话，则 #fetch 就会放弃写入 nil 值到缓存中。试验成功！！！

基于这样的实现，我的代码就又可以改为如下了：

def read_external_service(params)
  # 所有改动只是加了一个 `reject_nil: true`，多方便，妈妈再也不用担心我掉到坑里去了
  Rails.cache.fetch "example_cache_key_here", expires_in: 7.days, reject_nil: true do
    response = HTTParty.get "https://example.com/example/request/path"
    JSON.parse(response.body)["data"]
  end
end

待会去给 Rails 提交 Pull Request 去 O(∩_∩)O~~

总结

缓存是好个东西，用得好能够让应用性能表现突飞猛进

要注意缓存写入的边界条件，要注意避免缓存了空值，但也并非所有空值都不能缓存（比如有些接口确实就是有可能返回空值嘛），具体看业务，没有绝对的要与不要，反正 :reject_nil 给你了，看你要不要

云服务器 GPU云服务器配置值缓存 java nil 日期值时间值

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/61765.html

谨防云中断，数据中心冗余如何设计？

摘要：云计算提供商提供的云服务在出现中断时，行业厂商和用户似乎都在学习如何设计本地云冗余，管理人员希望将这些教训应用于传统的虚拟化数据中心冗余。云计算冗余并不完美，停机中断提供了经验教训高度冗余的系统不会免受性能下降的影响。很多公共云提供商在日常运营中通常不可避免地遭遇灾难性中断，而IT管理人员需要从云平台的故障和教训中学习，并将其应用到内部基础设施当中。云平台（尤其是大型公共云平台）具有多种冗余...

jayzou 2019-04-29 15:42 评论0 收藏0
谨防云计算监控的方法有哪些？

摘要：尤其是云计算监控，已经引起了人们的广泛关注。云计算监控具有很多应用，但作为一种单独的解决方案，它充满了危险。企业必须注意这些危险，而不是认为可以单独依靠云计算监控。数据中心和IT运营经理长期以来一直认为，仅从防火墙后面进行监控并不能了解最终用户是否享受快速可靠的数字体验。这是因为防火墙之外还有大量的外部元素——第三方服务、ISP、CDN等等，这可能会影响最终用户在最后一英里的最终体验。最终用...

dance 2019-04-29 15:43 评论0 收藏0
iOS 客户端基于 WebP 图片格式的流量优化（下）

摘要：在客户端基于图片格式的流量优化上这篇文章中，已经介绍了格式图片的下载使用，仅仅只有这样还远远不够，还需要对已经下载的图片数据进行缓存。二图片缓存关于的缓存，系统提供了一个类，。而且，既然是全局影响，肯定要用包起来，防止误伤其他缓存。在iOS 客户端基于 WebP 图片格式的流量优化（上）这篇文章中，已经介绍了WebP格式图片的下载使用，仅仅只有这样还远远不够，还需要对已经下载的图片数...

JiaXinYi 2019-08-06 13:16 评论0 收藏0
Derek解读Bytom源码-持久化存储LevelDB

摘要：函数总共操作有两步从缓存中查询值，如果查到则返回如果为从缓存中查询到则回调回调函数。回调函数会将从磁盘上获得到块信息存储到缓存中并返回该块的信息。回调函数实际上调取的是下的，它会从磁盘中获取信息并返回。作者：Derek 简介 Github地址：https://github.com/Bytom/bytom Gitee地址：https://gitee.com/BytomBlockc......

Eminjannn 2019-06-27 18:40 评论0 收藏0