快取系列：快取擊穿的解決思路

大家好，我是李哥。

上次我們討論了在分散式系統下的快取架構體系，從瀏覽器快取到客戶端快取，再到CDN快取，再到反向代理快取，再到本地快取，再到分散式快取。整個鏈路中有非常多的快取。

在整個快取鏈路，存在各種各樣的問題，常見的問題有快取穿透、快取擊穿、快取雪崩、快取資料一致性問題等。不常見的問題有快取傾斜、快取阻塞、快取慢查詢、快取主從一致性問題、快取高可用、快取故障發現與故障恢復、叢集擴容收縮、大Key熱Key等等。

今天我們就來聊聊：

快取擊穿

老規矩，先看一下本文大綱：

快取擊穿是什麼？

我們知道，快取的工作原理是先從快取中獲取資料，如果有資料則直接返回給使用者，如果沒有資料則從慢速裝置上讀取實際資料並且將資料放入快取。就像這樣：

很多情況下，快取是存在失效時間的，如果一個快取資料失效，那麼請求就會透過快取層，打到慢裝置層，如果此時這個快取資料的訪問量很大（熱點資料），那麼慢裝置就要承受這波流量轟炸，扛不住可能就宕機了。

就像這樣：

這，便是

快取擊穿

。

快取擊穿強調單個key資料過期 + 高併發

快取擊穿的痛點有哪些？

從上面的流程圖來看，我們已經知道，最大的痛點就是慢裝置宕機了，後面引發一系列的問題相當的嚴重（整個慢裝置宕機，也就是說如果是單庫的服務，整個服務幾乎不可用；如果是涉及到分庫分表的，宕機幾個庫則雜湊在這些庫的請求幾乎不可用）。

其次，服務QPS瞬間下降。假設從快取取資料需要0。01s，從資料庫取資料需要1s，那麼1個執行緒在1s內原本能處理100個請求，現在只能處理1個請求，再假設1個服務的tomcat執行緒數為200，那麼原本1臺機器的QPS=執行緒數 * 每秒處理請求數=200 * 100=20000，現在則變成1臺機器的QPS=執行緒數 * 每秒處理請求數=200 * 1=200。

當併發過大（實際QPS大於200），那麼執行緒數不夠用了，使用者只能排隊等待執行緒釋放，這就是使用者反饋的：“什麼垃圾網站，卡死了！”。

快取擊穿的解決思路？

一旦發生快取擊穿的問題，看似是慢裝置扛不住的問題，實際罪魁禍首的並不是慢裝置，為什麼這麼說呢？

發生這種現象，我認為架構設計是不合理而導致的。在我看來，分為幾個階段治理快取擊穿。

如果有必要，請隔離

保證熱點資料存在快取中

防止熱點資料在快取中沒有

如果有必要，請隔離