专注于AI算法与AI基础设施领域的工程实践与技术分享。
在深度学习、模型推理优化、GPU算力调度等方向有丰富的实战经验,热衷于将复杂的技术原理拆解为可落地的工程方案。
相信技术的价值在于传递,希望通过这个博客记录成长、分享经验,与更多技术同路人交流进步。
经历
2026 - 至今
AI Infra 实习
主攻大模型推理工程,搭建 vLLM/KsanaLLM 对比环境,完成 Qwen2.5-7B 全流程推理与性能优化,通过调度与缓存革新实现跨机通讯量降低 98.3%
2025 - 2026
AI 视觉算法实习
构建异构多模态乳腺肿瘤诊断框架,实现 AUC-ROC 0.92,指标提升 8%/6%,成果投稿二区 SCI。Kaggle 竞赛优化 YOLOv10 轻量检测头,结合稀疏采样与 TTA/WBF 策略,推理耗时缩短 95%、定位稳定性提升 30%,跻身前 9%
联系方式
494657111@qq.com
也欢迎通过 GitHub Issues 或文章评论区交流