大模型训练调优实习生
职位描述
- 搭建并维护多模态大模型训练体系,覆盖语音、动作、视频等模态的预训练、微调、评估与部署流程;
- 负责训练 pipeline 的工程优化,包括多任务调度、多模态数据协同加载、多GPU资源调度与 DDP 分布式加速;
- 实现高效微调策略(如 LoRA、PEFT、Adapter 等),提升低资源条件下的模型定制效率;
- 分析训练稳定性、收敛性能与资源利用效率,设计可量化的训练质量评估与异常监控机制;
- 与算法团队深度协作,参与模型结构设计、系统瓶颈分析与底层训练策略联合优化;
- 持续跟进并引入大模型训练相关前沿技术,如混合精度、异构加速、编译优化等,提升训练系统性能上限。
职位要求
- 本科及以上学历,计算机、人工智能、电子、数学等相关专业;
- 出色的问题分析和解决能力,自主探索新解决方案的能力强
- 关注生成式 AI 和多模态交互技术,对推动人形机器人智能化有热情;
- 熟悉 Transformer 类大模型训练流程,具备完整的预训练 + 微调 + 推理部署经验;
- 熟练掌握 PyTorch、DeepSpeed 或 FSDP、LoRA/PEFT 等训练加速与参数高效微调工具;
加分项:
- 具备良好的工程能力,熟悉 CI/CD 流程、训练日志分析与调参监控;
- 有实际多模态模型训练经验(语音/动作/图文任一方向),熟悉多模态输入调度与训练过程控制;
- 在HCI、HRI、RSS、CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊上发表论文者;
- 具有优秀的代码能力和竞赛精神,ACM/ICPC、RoboMaster等比赛获奖者
投递