大模型技术专家(Agent方向)
职位描述
探索大模型智能体研究的前沿技术,构建具备持续学习能力的通用 Agent,包括但不限于:
1、Agentic RL。面向长时序任务的强化学习;Agent 在交互环境中的探索与策略优化;多目标、多约束条件下大模型Agent的决策稳定性与泛化性;Test-time的数据高效Agentic RL;Agent reward model的系统性学习问题;大模型智能体的MARL。
2、Agentic Memory。短期 / 中期 / 长期记忆架构设计;可演化、可压缩、可检索的Memory 系统;经验、技能、失败案例的结构化沉淀;Memory 与 Planning / RL / Tool 之间的协同机制。
3、Agent Workflow。Task Decomposition / Planning / Re-planning;多 Agent 协作与角色分工;反思、自我修正、策略升级;工具集和技能库自演进;自适应和可学习的Agent 工作流。
4、Agent Application。GUI Agent:跨应用、多模态界面下的操作与理解;OS Agent:文件系统、进程、命令、自动化工作流;Deep Research Agent:复杂研究任务、信息整合、假设验证;通用 Agent :跨时间跨任务跨领域的自主学习Agent。
职位要求
1. 计算机相关方向硕士或博士;
2. 有大模型智能体相关研究和项目经历,发表过相关方向的顶会论文,或者参与过有影响力的开源项目;
3. 具有优秀的解决复杂问题和多人协作沟通的能力,能够独立思考并开展工作,具有强烈的好奇心和责任心。
投递