cache是什么-睿知好学

很多人对 cache（缓存）这个词听得很多，但总觉得它是个高深的技术名词。其实 cache 的逻辑非常简单，它就是为了解决一个核心矛盾：处理速度快的东西，永远在等处理速度慢的东西。

在电脑或者手机里，CPU（中央处理器）是跑得最快的。它每秒钟可以进行几十亿次运算。但是，数据并不是长在 CPU 里的，数据储存在硬盘里。即便现在的 SSD（固态硬盘）已经很快了，但在 CPU 看来，去硬盘里读一次数据，就像你住在北京，却要跑去广州买一瓶水一样漫长。

为了不让 CPU 闲着，工程师在中间加了一层内存（RAM）。内存比硬盘快多了，但这还不够。CPU 的速度还是比内存快出几十倍甚至上百倍。于是，工程师又在 CPU 内部设计了一个更小、但速度极快的储存空间，这就是我们常说的 L1、L2、L3 缓存。

这就是 cache 的本质：它是一块临时的“快速中转站”。它把那些你经常要用的、或者马上就要用的数据，从慢速设备里提前拿出来，放在离你最近的地方。

你每天都在接触 cache。比如你用浏览器打开一个网页，第一次打开可能需要 3 秒。你关掉页面，马上再次打开，你会发现几乎是秒开。这是因为浏览器把网页里的图片、CSS 样式表、JavaScript 文件存到了你电脑的硬盘或者内存里。当你第二次访问时，浏览器发现这些文件没变，就直接从本地读取，不再去求助几千公里外的服务器了。你可以按一下 F12 打开开发者工具，看 Network 标签，很多资源后面会标注“from disk cache”或者“from memory cache”，这就是证据。

再看手机 App。为什么很多 App 第一次启动很慢，以后就快了？因为 App 把一些基础数据缓存到了手机本地。甚至你刷短视频，你看完一个视频，如果不关掉 App 往回翻，视频是瞬间播放的，这也是 cache 的功劳。

在后端开发或者架构设计里，cache 更是核心。如果一个电商网站有 1000 万人同时在看同一个商品，服务器如果每次都去数据库里查这个商品的价格、库存、描述，数据库瞬间就会崩溃。数据库要把数据从磁盘读取出来，涉及复杂的查询逻辑，性能是有上限的。

这时候我们会用 Redis 或者 Memcached 这种工具。它们把数据直接存在内存里。服务器先去问 Redis：“你有这个商品的信息吗？”如果有（这叫缓存命中，Cache Hit），直接拿走，耗时不到 1 毫秒。如果没有（这叫缓存穿透或缓存未命中，Cache Miss），再去查数据库，然后顺便把查到的结果往 Redis 里存一份，方便下一个人用。

但是，cache 并不是越多越好，也不是百利而无一害。它带来了一个计算机科学界公认的难题：数据一致性。

因为数据现在有了两份。一份在慢速的“真身”那里（比如数据库），一份在快速的“替身”这里（比如 cache）。如果数据库里的商品价格改了，从 100 块变成了 90 块，但 cache 里的数据还没更新，那用户看到的就是错的价格。

解决这个问题通常有几种办法。第一种是设置过期时间（TTL）。比如我告诉 cache，这数据你只准留 10 分钟，10 分钟后自动删掉，下次有人来，你再去数据库取新的。第二种是主动更新。数据库的数据一变，程序立刻去把对应的 cache 删掉或者更新掉。

这听起来简单，实际操作中坑很多。比如，如果你在同一时间删除了大量的 cache，导致海量的请求瞬间全部涌向数据库，这叫“缓存雪崩”。这时候数据库压力骤增，极容易宕机。

还有一种情况叫“缓存击穿”。某个热点新闻突然爆了，大家都在点，结果这时候这个新闻的缓存刚好过期了，所有的流量瞬间压到数据库上。

所以，用好 cache 需要非常严谨的逻辑。你得考虑什么时候该放进缓存，什么时候该让它失效，以及如果缓存挂了，你的系统能不能扛得住。

在硬件层面，cache 的设计更体现了成本和性能的平衡。L1 缓存非常快，但它很贵，而且占地方。如果你把 CPU 所有的空间都用来做缓存，那 CPU 的核心就没地方放了。所以 L1 缓存通常只有几十 KB，L2 有几 MB，L3 则有几十 MB。这形成了一个金字塔结构：越往上速度越快，容量越小，价格越贵；越往下速度越慢，容量越大，价格越便宜。

这种思路甚至可以延伸到现实生活。你书架上的书有很多，但你最近正在读的那两本，通常是放在书桌上或者是枕头边。书桌就是书架的 cache。你常用的手机 App 放在首屏，不常用的放在文件夹里或者最后一屏，首屏就是你手机功能的 cache。

理解了这一点，你就理解了为什么增加内存、更换 SSD 能让老电脑起死回生。因为你加大了缓存的带宽和容量，减少了 CPU 等待的时间。

如果你是一个开发者，在使用缓存时，要记住以下几个实操建议：

第一，不要什么都往缓存里塞。缓存空间是宝贵的，只放高频访问的数据。如果数据量特别大，但访问频率很低，放缓存反而浪费内存。

第二，必须处理缓存失效的情况。永远不要假设缓存一定能命中。你的代码逻辑必须是：先查缓存，没有的话查数据库，再回填缓存。

第三，注意缓存击穿和雪崩的防护。对于极热点的数据，过期时间可以设置得随机一些，不要让它们在同一秒钟失效。

第四，监控命中率。如果你的缓存命中率低于 80%，说明你的缓存策略有问题，或者缓存容量太小，导致数据被频繁剔除。

总的来说，cache 是一种用空间换时间的策略。它承认了硬件速度不匹配的事实，通过在中间架设桥梁来提高效率。它让原本由于物理限制而缓慢的过程，变得在用户感知层面非常流畅。虽然它带来了数据同步的复杂性，但在性能至上的互联网时代，它是不可或缺的基础设施。没有 cache，现在的互联网体验会慢得像回到拨号上网时代。

cache是什么

本站部分图片和内容来自网友上传和分享，版权归原作者所有，如有侵权，请联系删除！若转载，请注明出处：https://www.rzedutec.com/p/65753/

cache是什么

相关推荐

发表回复