大语言模型实习生

上海

实习

职位描述

1. 设计开发基于传统nlu(类似bert) + 大语言模型的混合系统，实现传统对话+multi-agent框架，实现各种交互技能，包含但不限于任务型对话、问答、开放域对话等； 2. 基于大语言模型的效果调优，包括不限于：prompt工程、SFT、rag等，基于开源模型自建垂域domain等； 3. 设计开发rag平台，流程化rag流程中的各个模块。包含改写，检索，调优等； 4. 收集、清洗数据，训练模型，迭代效果；定量、定性评估模型效果，横评不同基座模型效果；

职位要求

1. 计算机相关专业硕士学历以上，熟悉NLP、深度学习常用模型和方法； 2. 熟悉Python、Java、C++等常用编程开发语言，有云端工程开发经验； 4. 熟悉预训练语言模型训练相关技术，有微调、强化学习等相关经验者为佳； 5. 熟悉大语言模型应用开发流程，了解dify, coze, LangChain、AutoGPT、Autogen等框架，熟悉prompt工程、检索式生成、大模型工具调用。有实际应用开发经验者为佳。 6. 对ChatGPT、Claude、Copilot、国内大厂各产品等前沿大语言模型产品有浓厚兴趣，愿意自主调研和使用。

投递

大语言模型实习生

Key skills

About this role