大模型训练调优实习生

上海、深圳

实习

职位描述

- 搭建并维护多模态大模型训练体系，覆盖语音、动作、视频等模态的预训练、微调、评估与部署流程； - 负责训练 pipeline 的工程优化，包括多任务调度、多模态数据协同加载、多GPU资源调度与 DDP 分布式加速； - 实现高效微调策略（如 LoRA、PEFT、Adapter 等），提升低资源条件下的模型定制效率； - 分析训练稳定性、收敛性能与资源利用效率，设计可量化的训练质量评估与异常监控机制； - 与算法团队深度协作，参与模型结构设计、系统瓶颈分析与底层训练策略联合优化； - 持续跟进并引入大模型训练相关前沿技术，如混合精度、异构加速、编译优化等，提升训练系统性能上限。

职位要求

- 本科及以上学历，计算机、人工智能、电子、数学等相关专业； - 出色的问题分析和解决能力，自主探索新解决方案的能力强 - 关注生成式 AI 和多模态交互技术，对推动人形机器人智能化有热情； - 熟悉 Transformer 类大模型训练流程，具备完整的预训练 + 微调 + 推理部署经验； - 熟练掌握 PyTorch、DeepSpeed 或 FSDP、LoRA/PEFT 等训练加速与参数高效微调工具；加分项： - 具备良好的工程能力，熟悉 CI/CD 流程、训练日志分析与调参监控； - 有实际多模态模型训练经验（语音/动作/图文任一方向），熟悉多模态输入调度与训练过程控制； - 在HCI、HRI、RSS、CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊上发表论文者； - 具有优秀的代码能力和竞赛精神，ACM/ICPC、RoboMaster等比赛获奖者

投递

大模型训练调优实习生

Key skills

About this role