假设这个程序运行一遍要access memory 10billion times without cache, 再假设A0=60%, 也就意味着, 最好的cache使memory access降低到4 billion times。 在4 billion times memory access的过程中, CPU 依然在等待。依然在等待。内存墙依然存在。 Intel、IBM的专业人员不是傻子。 你试试告诉他们说,一个新的cache algorithm能提高hit rate接近理论值,他们会说,huh, interesting, at what cost? 你接着告诉他们说,这会解决内存墙问题,他们会很礼貌地告诉你, get lost, please.