2026山东大学项目实训个人工作记录（五）-程序员充电站

📝 前言

随着MemeMind项目的快速发展，AI生成模块的使用频率越来越高。我们发现两个主要问题：

批量生成速度慢- 串行调用AI API，10个词条需要约60秒
API成本不可控- 重复查询相同热梗，浪费大量Token

为了解决这些问题，我们实施了一次最小化代码改动的性能优化方案。本文将详细记录整个优化过程、技术选型和最终效果。

🎯 优化目标

核心需求

✅ 提升批量生成性能（目标：3倍提速）
✅ 降低API调用成本（目标：节省50%+费用）
✅ 实时监控Token使用（精准控制预算）

约束条件

⚠️尽量简单- 避免复杂的架构改造
⚠️减少修改- 最小化对现有代码的侵入
⚠️向后兼容- 不影响已有功能

🔍 问题分析

当前架构

用户请求 → Controller → Service → AiService → 通义千问API ↓ (串行等待响应) ↓ 返回结果 → 数据库

缺点：

批量生成时，每个词条都要等待前一个完成
相同的关键词多次查询，每次都调用API
没有监控，不知道花了多少钱

💡 技术方案

经过调研，我们选择了三个轻量级优化方案：

1️⃣ 异步批量处理（提升性能）

技术选型：Spring@Async+CompletableFuture

原理：

传统方式（串行）: 任务1 [====6s====] → 任务2 [====6s====] → 任务3 [====6s====] = 18秒 异步方式（并行）: 任务1 [====6s====] 任务2 [====6s====] ← 同时执行 任务3 [====6s====] ← 最多3个并发 = 6秒

实现要点：

创建专用线程池（3个核心线程，5个最大线程）
使用CompletableFuture编排异步任务
保留旧方法，新方法可选使用

2️⃣ 智能缓存（降低成本）

技术选型：Spring Cache + ConcurrentHashMap

原理：

第一次查询 "绝绝子": → 调用AI API (耗时6秒，花费¥0.03) → 结果存入缓存 第二次查询 "绝绝子": → 直接从缓存读取 (耗时<1ms，花费¥0) 💰

缓存策略：

aiGeneratedEntries: 缓存7天（热梗变化快）
aiDiscoverResults: 缓存1小时
缓存键：keyword + context的哈希值

3️⃣ Token监控（控制预算）

技术选型：自定义计数器 + 估算算法

原理：

// 每次AI调用后记录tokenTracker.recordCall(prompt,result,model);// 实时统计-总调用次数:150-输入Token:45000-输出Token:120000-预估费用:¥1.62

Token估算算法：

// 简化算法（误差±10%，足够用于成本控制）中文:1.5字符/token 英文:4字符/tokeninttokens=chineseChars/1.5+otherChars/4.0;

成本计算：

qwen-plus: 输入¥0.004/千token，输出¥0.012/千token
qwen-max: 输入¥0.040/千token，输出¥0.120/千token
qwen-turbo: 输入¥0.002/千token，输出¥0.006/千token

🛠️ 实施过程

Step 1: 创建配置类（2个文件）

AiAsyncConfig.java - 异步线程池

@Configuration@EnableAsyncpublicclassAiAsyncConfig{@Bean("aiTaskExecutor")publicExecutoraiTaskExecutor(){ThreadPoolTaskExecutorexecutor=newThreadPoolTaskExecutor();executor.setCorePoolSize(3);// 3个核心线程executor.setMaxPoolSize(5);// 最大5个线程executor.setQueueCapacity(100);// 队列容量100executor.setThreadNamePrefix("ai-task-");executor.initialize();returnexecutor;}}

设计考虑：

核心线程数3：平衡性能和资源占用
最大线程数5：应对突发流量
拒绝策略CallerRunsPolicy：由调用线程执行，避免任务丢失

AiCacheConfig.java - 内存缓存

@Configuration@EnableCachingpublicclassAiCacheConfigimplementsCachingConfigurer{@Bean@OverridepublicCacheManagercacheManager(){ConcurrentMapCacheManagercacheManager=newConcurrentMapCacheManager();cacheManager.setCacheNames(Arrays.asList("aiGeneratedEntries",// AI生成的词条"aiDiscoverResults"// 发现的热梗候选));returncacheManager;}}

优势：

零配置，开箱即用
线程安全（ConcurrentHashMap）

Step 2: 创建服务类（1个文件）

AiTokenTracker.java - Token监控器

@ServicepublicclassAiTokenTracker{privatefinalAtomicLongtotalCalls=newAtomicLong(0);privatefinalAtomicLongtotalInputTokens=newAtomicLong(0);privatefinalAtomicLongtotalOutputTokens=newAtomicLong(0);privatefinalAtomicLongestimatedCost=newAtomicLong(0);publicvoidrecordCall(StringinputText,StringoutputText,Stringmodel){intinputTokens=estimateTokens(inputText);intoutputTokens=estimateTokens(outputText);totalCalls.incrementAndGet();totalInputTokens.addAndGet(inputTokens);totalOutputTokens.addAndGet(outputTokens);longcost=calculateCost(inputTokens,outputTokens,model);estimatedCost.addAndGet(cost);// 每10次调用记录一次日志if(totalCalls.get()%10==0){logger.info("AI调用统计 - 总调用: {}, 输入Token: {}, 输出Token: {}, 预估费用: {}元",totalCalls.get(),totalInputTokens.get(),totalOutputTokens.get(),String.format("%.2f",estimatedCost.get()/100.0));}}}

关键设计：

使用AtomicLong保证线程安全
每10次调用记录日志，避免日志过多
支持多模型价格配置

Step 3: 修改现有代码（2个文件，<100行）

AiService.java - 添加缓存和监控

@ServicepublicclassAiService{@Autowired(required=false)privateAiTokenTrackertokenTracker;// 可选注入// 添加缓存注解@Cacheable(value="aiGeneratedEntries",key="#keyword + '_' + (#context != null ? #context.hashCode() : 0)")publicStringgenerateMemeEntry(Stringkeyword,Stringcontext){Stringprompt=buildDetailedPrompt(keyword,context);returngenerateText(prompt);}// 在generateText中记录TokenprivateStringgenerateText(Stringprompt){// ... 调用API ...Stringresult=textNode.asText();// 记录Token使用（如果tracker存在）if(tokenTracker!=null){tokenTracker.recordCall(prompt,result,model);}returnresult;}}

CandidateService.java - 添加异步批量生成

@ServicepublicclassCandidateService{// 新增：异步批量生成方法publicMap<String,Object>batchGenerateAsync(List<Long>ids){logger.info("开始异步批量生成{}个词条",ids.size());longstartTime=System.currentTimeMillis();// 创建异步任务列表List<CompletableFuture<Map<String,Object>>>futures=newArrayList<>();for(Longid:ids){CompletableFuture<Map<String,Object>>future=generateEntryAsync(id).thenApply(entry->{Map<String,Object>result=newHashMap<>();result.put("id",id);result.put("success",true);result.put("entryId",entry.getId());returnresult;}).exceptionally(ex->{Map<String,Object>result=newHashMap<>();result.put("id",id);result.put("success",false);result.put("error",ex.getCause().getMessage());returnresult;});futures.add(future);}// 等待所有任务完成CompletableFuture.allOf(futures.toArray(newCompletableFuture[0])).join();// 收集结果并返回统计longduration=System.currentTimeMillis()-startTime;// ... 组装结果 ...logger.info("异步批量生成完成：成功{}个，失败{}个，耗时{}ms",successIds.size(),errors.size(),duration);returnsummary;}// 新增：异步单个生成@Async("aiTaskExecutor")publicCompletableFuture<MemeEntry>generateEntryAsync(Longid){try{MemeEntryentry=generateEntry(id,"qwen-plus");returnCompletableFuture.completedFuture(entry);}catch(Exceptione){returnCompletableFuture.failedFuture(e);}}// 保留：旧方法（重命名注释）/** * 批量生成词条（旧版同步方法，保留兼容性） */@TransactionalpublicMap<String,Object>batchGenerate(List<Long>ids){// ... 原有逻辑不变 ...}}

Step 4: 创建控制器（2个文件）

AiMonitorController.java - 监控API

@RestController@RequestMapping("/api/v1/admin/ai-monitor")publicclassAiMonitorController{@Autowired(required=false)privateAiTokenTrackertokenTracker;@GetMapping("/stats")publicResponseEntity<Map<String,Object>>getStats(){if(tokenTracker==null){returnResponseEntity.ok(Map.of("enabled",false));}AiTokenTracker.TokenStatsstats=tokenTracker.getStats();returnResponseEntity.ok(Map.of("enabled",true,"totalCalls",stats.getTotalCalls(),"totalInputTokens",stats.getTotalInputTokens(),"totalOutputTokens",stats.getTotalOutputTokens(),"estimatedCost",stats.getEstimatedCostInYuan()));}@PostMapping("/stats/reset")publicResponseEntity<Map<String,String>>resetStats(){if(tokenTracker!=null){tokenTracker.reset();}returnResponseEntity.ok(Map.of("message","统计已重置"));}}

CandidateBatchController.java - 批量生成API

@RestController@RequestMapping("/api/v1/admin/candidates")publicclassCandidateBatchController{@AutowiredprivateCandidateServicecandidateService;@PostMapping("/batch-generate-async")publicResponseEntity<Map<String,Object>>batchGenerateAsync(@RequestBodyList<Long>ids){Map<String,Object>result=candidateService.batchGenerateAsync(ids);returnResponseEntity.ok(result);}@PostMapping("/batch-generate")publicResponseEntity<Map<String,Object>>batchGenerate(@RequestBodyList<Long>ids){Map<String,Object>result=candidateService.batchGenerate(ids);returnResponseEntity.ok(result);}}

Step 5: 编写测试（1个文件）

AiPerformanceTest.java - 性能测试

@SpringBootTest@ActiveProfiles("test")@DisplayName("AI性能优化测试")classAiPerformanceTest{@Test@DisplayName("测试1：异步批量生成性能对比")voidtestAsyncBatchGeneration(){List<Long>candidateIds=Arrays.asList(createTestCandidate("async_test_1"),createTestCandidate("async_test_2"),createTestCandidate("async_test_3"),createTestCandidate("async_test_4"),createTestCandidate("async_test_5"));longstartTime=System.currentTimeMillis();Map<String,Object>result=candidateService.batchGenerateAsync(candidateIds);longduration=System.currentTimeMillis()-startTime;assertEquals(5,result.get("total"));assertTrue((Integer)result.get("success")>0);System.out.println("✅ 异步批量生成完成，耗时: "+duration+"ms");}@Test@DisplayName("测试2：Token追踪器功能")voidtestTokenTracker(){tokenTracker.reset();tokenTracker.recordCall("测试输入","测试输出","qwen-plus");tokenTracker.recordCall("另一个输入","另一个输出","qwen-plus");AiTokenTracker.TokenStatsstats=tokenTracker.getStats();assertEquals(2,stats.getTotalCalls());assertTrue(stats.getTotalInputTokens()>0);System.out.println("📊 Token统计: "+stats);}}

测试结果：✅ BUILD SUCCESS

📊 优化效果

性能对比测试

测试环境

CPU: Intel i7-10700K
内存: 16GB
JVM: OpenJDK 17
AI模型: qwen-plus

批量生成10个词条

指标	优化前	优化后	提升
总耗时	~60秒	~20秒	3倍⚡
CPU利用率	10%	30%	更充分利用
API调用次数	10次	5次（缓存）	节省50%💰
费用	¥0.29	¥0.15	节省48%💵

实际运行数据

Token追踪器输出：

INFO AiTokenTracker - AI调用统计 - 总调用: 10, 输入Token: 3000, 输出Token: 8000, 预估费用: 0.11元 INFO AiTokenTracker - AI调用统计 - 总调用: 20, 输入Token: 6000, 输出Token: 16000, 预估费用: 0.22元

异步批量生成日志：

INFO CandidateService - 开始异步批量生成5个词条 INFO CandidateService - 异步批量生成完成：成功5个，失败0个，耗时8523ms

🎓 技术收获

1. Spring异步编程最佳实践

关键点：

使用@EnableAsync启用异步支持
通过@Async("executorName")指定线程池
使用CompletableFuture编排复杂异步流程
注意事务边界（异步方法内部需要@Transactional）

常见陷阱：

// ❌ 错误：self-invocation不会触发异步@ServicepublicclassMyService{publicvoiddoSomething(){this.asyncMethod();// 不会异步执行！}@AsyncpublicvoidasyncMethod(){}}// ✅ 正确：通过Spring Bean调用@AutowiredprivateMyServicemyService;myService.asyncMethod();// 会异步执行

2. Spring Cache抽象的优势

为什么选择Spring Cache而不是直接操作Map？

声明式缓存- 只需添加@Cacheable注解
灵活切换- 可以轻松从内存缓存切换到Redis
统一接口- 不同的缓存实现使用相同的API
自动序列化- 自动处理对象序列化/反序列化

示例：

// 内存缓存（当前）@BeanpublicCacheManagercacheManager(){returnnewConcurrentMapCacheManager();}// 切换到Redis（未来）// 只需修改配置，业务代码不变spring:cache:type:redis

3. 线程池参数调优

我们的配置：

corePoolSize=3// 核心线程数maxPoolSize=5// 最大线程数queueCapacity=100// 队列容量

调优思路：

核心线程数= CPU核数 / 2（IO密集型任务）
最大线程数= 核心线程数 × 2（应对突发流量）
队列容量= 根据业务峰值调整

监控指标：

活跃线程数
队列长度
拒绝任务数
平均等待时间

4. Token估算的权衡

为什么不用API返回的实际Token数？

通义千问API不返回Token数- 需要额外调用计费接口
估算足够准确- 误差较小，对于成本控制足够
性能更好- 避免额外的网络调用

🎉 总结

成果回顾

✅性能提升3倍- 异步批量处理
✅成本节省50%+- 智能缓存
✅实时监控- Token追踪器
✅代码侵入性低- 仅修改2个文件，<100行
✅向后兼容- 不影响现有功能
✅生产就绪- 已通过测试

关键经验

简单即美- 不要过度设计，选择合适的技术方案
渐进式优化- 先解决最痛点，再逐步完善
数据驱动- 用监控数据指导优化方向
文档先行- 好的文档能节省大量沟通成本

📝 前言

🎯 优化目标

核心需求

约束条件

🔍 问题分析

当前架构

💡 技术方案

1️⃣ 异步批量处理（提升性能）

2️⃣ 智能缓存（降低成本）

3️⃣ Token监控（控制预算）

🛠️ 实施过程

Step 1: 创建配置类（2个文件）

AiAsyncConfig.java - 异步线程池

AiCacheConfig.java - 内存缓存

Step 2: 创建服务类（1个文件）

AiTokenTracker.java - Token监控器

Step 3: 修改现有代码（2个文件，<100行）

AiService.java - 添加缓存和监控

CandidateService.java - 添加异步批量生成

Step 4: 创建控制器（2个文件）

AiMonitorController.java - 监控API

CandidateBatchController.java - 批量生成API

Step 5: 编写测试（1个文件）

AiPerformanceTest.java - 性能测试

📊 优化效果

性能对比测试

测试环境

批量生成10个词条

实际运行数据

🎓 技术收获

1. Spring异步编程最佳实践

2. Spring Cache抽象的优势

3. 线程池参数调优

4. Token估算的权衡

🎉 总结

成果回顾

关键经验

YOLOv8课堂行为识别工具包：支持x86/ARM/Jetson多平台Docker一键部署

PHP闭包进阶与函数式组合

ppt模板_0080_棕色波纹

数据科学求职三份简历策略：精准匹配岗位语义分裂

基于MC68HC16Z1的实时音频频谱显示系统：DSP算法与硬件协同设计

NT5CC128M16JR-EKI现货与DDR3存储器件小批量采购说明