缓存技术Cache

tags: Web

十个常见的缓存使用误区及建议

  • http://www.infoq.com/cn/news/2014/09/ten-cache-misunderstanding
  • 主要误区
    • 依赖默认的序列化方式
      • CPU性能不佳
      • 采用最合理、有效的序列化和反序列化方式
    • 在单一缓存中存储大对象数据
      • 大量占用CPU
      • 建议大家把大对象数据分成为较小的子对象,然后再各自进行缓存
    • 在不同线程间使用缓存共享对象
      • 在竞态条件(Race conditions)条件下,当写线程对缓存进行写入操作时,如果这是读线程刚好也要访问同一缓冲对象,就有可能读取脏数据,所以在实际开发中要根据实际情况采取外部锁机制,以保证缓存数据的正确读写。
      • Dirty Data
    • 认为存储数据操作后,数据即刻就能存储到缓存中
      • 刚进行写入缓存操作的数据并不一定能够马上写入缓存,这是因为当缓存空间不足时,刚写入的缓存有可能被刷新掉。所以在编写程序时,应该首先对获得缓存的值作空值检测。
      • NULL data
    • 使用嵌套对象存储整个集合
      • 如果将整个集合对象数据进行嵌套缓存的话,获得其中某个具体元素的性能将会严重受到影响,这是因为整个集合存储意味着对整个嵌套对象进行序列化。
      • 建议单独对每个元素进行缓存,这样就可以做到对每个对象分别更新和读取,以减少序列化的影响。
    • 对父子对象采取统一与单独混用的存储方式
      • 有时候一个对象可能拥有两个或更多的父对象,同一对象存储在不同地方,这样就会造成缓存的浪费。
      • 为了不让同一对象存储于不同地方,这就需要根据统一对象本身的键进行缓存,这样父对象就能够根据需要访问子对象。
    • 对配置信息进行缓存
      • 缓存数据的访问是有代价的,所以要尽可能把影响减到最低
      • 建议使用本地静态变量代替缓存对配置数据进行存储。
    • 对实时对象进行缓存
      • 如果对实时对象(例如:流、文件、注册信息或者网络情况)的引用进行缓存的话,当缓存数据被删除后,之前缓存的实时对象不被删除,这样会造成系统资源泄漏
      • 不要对实时对象进行存储
    • 使用多个键存储同一对象
      • 尽管使用多个键存储同一对象就使得使用一个键和索引号来进行访问时带来便利,但是当缓存是基于远程缓存的话,任何关于对象改变都是不可见的,这样会导致缓存数据同步问题的发生
      • 不建议使用多个键存储同一对象
    • 在连续存储中进行更新或删除后不及时更新相应缓存对象
      • 由于在一个远程缓存中,数据以拷贝方式存储,所以当更新对象时,缓存不会被同步更新。所以更新对象时,缓存必须被明确地进行更新。然而在基于内存的缓存中,当删除一个对象时,在缓存中不会被同步删除
      • 建议通过程序确保缓存对象被正确删除