专业技能
- 计算机语言:Python,C#,JavaScript
- 熟悉Stable Diffusion,DiT主流扩散生成模型架构
- 能够熟练进行本地模型Lora微调以及创新架构设计
- 熟练使用可灵,Pika,Luma,Liblib等在线AIGC工具
- 熟练使用ComfyUI进行本地AIGC工作流的搭建及自定义节点设计
- 熟悉Vue+Springboot前后端框架及Shiro权限管理系统
教育经历
学术背景与学习经历
上海大学 | 通信与信息系统 | 硕士
2023.09 - 2026.06- GPA:3.5/4.0
- 第十九届中国研究生电子设计竞赛(初赛二等奖)
- 华为杯第六届研究生人工智能大赛(三等奖)
上海大学 | 通信工程 | 本科
2019.09 - 2023.06- GPA:3.0/4.0
- 英语6级(550)
实习经历
行业实践与工作经历
项目经历
技术项目与实践经验
科研经历
学术研究与论文发表
AIGC赋能自动驾驶感知研究
2024.12 - 至今研究基于扩散模型的驾驶图像与鸟瞰图语义掩码联合生成,探索跨膜态,跨视角数据的联合生成范式。探索图像翻译,图像编辑,3D生成技术对传统计算机视觉算法的数据增强方法。
代表性成果:
- 胡文健, 等. (2025). "JointDiff: A Unified Diffusion Model for Joint Generation in Image and BEV Space." 已投稿至 WACV 2026 (第一作者).
生成式AI
自动驾驶
扩散模型
计算机视觉
条件人物图像生成研究
2023.09 - 2024.12通过融合交叉注意力机制和正则化操作构建姿态纹理融合模块,提升了人物姿态转移的精度与自然度。研究重点在于小波域中的注意力机制与归一化操作的渐进式整合方法。
代表性成果:
- Zhang, S., Li, M., Wang, J., 胡文健, 等. (2024). "AplusN: Progressively Integrating Attention and Normalization in Wavelet Domain for Pose Transfer." IEEE Transactions on Multimedia (第四作者).
人物图像生成
注意力机制
小波域
姿态转移