大模型技术专家（Agent方向）

北京

社招

全职

职位 ID：A55228

职位描述

探索大模型智能体研究的前沿技术，构建具备持续学习能力的通用 Agent，包括但不限于： 1、Agentic RL。面向长时序任务的强化学习；Agent 在交互环境中的探索与策略优化；多目标、多约束条件下大模型Agent的决策稳定性与泛化性；Test-time的数据高效Agentic RL；Agent reward model的系统性学习问题；大模型智能体的MARL。 2、Agentic Memory。短期 / 中期 / 长期记忆架构设计；可演化、可压缩、可检索的Memory 系统；经验、技能、失败案例的结构化沉淀；Memory 与 Planning / RL / Tool 之间的协同机制。 3、Agent Workflow。Task Decomposition / Planning / Re-planning；多 Agent 协作与角色分工；反思、自我修正、策略升级；工具集和技能库自演进；自适应和可学习的Agent 工作流。 4、Agent Application。GUI Agent：跨应用、多模态界面下的操作与理解；OS Agent：文件系统、进程、命令、自动化工作流；Deep Research Agent：复杂研究任务、信息整合、假设验证；通用 Agent ：跨时间跨任务跨领域的自主学习Agent。

职位要求

1. 计算机相关方向硕士或博士； 2. 有大模型智能体相关研究和项目经历，发表过相关方向的顶会论文，或者参与过有影响力的开源项目; 3. 具有优秀的解决复杂问题和多人协作沟通的能力，能够独立思考并开展工作，具有强烈的好奇心和责任心。

投递

大模型技术专家（Agent方向）

Key skills

About this role