大语言模型实习生
职位描述
1. 设计开发基于传统nlu(类似bert) + 大语言模型的混合系统,实现传统对话+multi-agent框架,实现各种交互技能,包含但不限于任务型对话、问答、开放域对话等;
2. 基于大语言模型的效果调优,包括不限于:prompt工程、SFT、rag等,基于开源模型自建垂域domain等;
3. 设计开发rag平台,流程化rag流程中的各个模块。包含改写,检索,调优等;
4. 收集、清洗数据,训练模型,迭代效果;定量、定性评估模型效果,横评不同基座模型效果;
职位要求
1. 计算机相关专业硕士学历以上,熟悉NLP、深度学习常用模型和方法;
2. 熟悉Python、Java、C++等常用编程开发语言,有云端工程开发经验;
4. 熟悉预训练语言模型训练相关技术,有微调、强化学习等相关经验者为佳;
5. 熟悉大语言模型应用开发流程,了解dify, coze, LangChain、AutoGPT、Autogen等框架,熟悉prompt工程、检索式生成、大模型工具调用。有实际应用开发经验者为佳。
6. 对ChatGPT、Claude、Copilot、国内大厂各产品等前沿大语言模型产品有浓厚兴趣,愿意自主调研和使用。
投递