AI API 缓存层设计降低重复请求成本