首页
推荐
搜索
单位
简历
APP
双选会
海优 网页头部-理聘AI图标
理聘AI

理聘网-职位详情页,AI 大模型研发工程师(研究工程师)

AI 大模型研发工程师(研究工程师)
30-50K/月
投简历
聊一聊
地点图标 北京
工作经验图标 经验不限
教育经历图标 硕士
职位描述
Python编程
分布式训练系统
深度学习主流模型
算法与优化
岗位介绍: 我们正在招募软件智能大模型研发工程师,加入我们的前沿技术团队,专注于大规模预训练模型的训练、优化与部署。你将参与从模型设计、训练调优到系统优化、高效部署的全流程,推动大模型在实际业务场景中的落地与演进。团队兼重技术深度与工程落地,强调高效协作与持续创新,欢迎热衷 AI 技术、有扎实编程与系统基础的你加入共创。 你将获得: 1.探索大模型在真实业务中的落地机会; 2. 深入使用分布式训练与模型优化工具链(DeepSpeed、Colossal-AI 等); 3. 与算法专家、系统工程师协作,加速项目从 0 到1; 4. 全面参与数据、模型、系统、部署等完整研发流程。 岗位职责: 1.大模型训练:负责大型语言模型等深度学习模型的预训练与微调; 2.算法与优化:提升模型性能,包括算法改进、参数调节、混合精度等手段; 3.系统架构:构建并维护高效稳定的分布式训练系统,解决训练中系统瓶颈; 4. 模型部署:在真实业务中部署模型,并优化推理效率(压缩、蒸馏、量化等); 5.前沿探索:跟进大模型相关前沿技术,评估并引入适合团队的创新方法。 任职要求: 1. 研究生及以上学历,计算机科学、人工智能、软件工程等相关专业; 2.熟悉深度学习主流模型,如 Transformer,具备实际开发与调优经验; 3.熟练掌握 Python 编程,理解至少一门编译型语言(如 C/C++); 4. 熟练使用 PyTorch 等主流深度学习框架,在多机多卡上分布式训练过模型; 5.有扎实的工程能力、良好的代码风格和独立定位问题的能力; 6.具有团队协作精神,学习能力强,对 AI 技术有持续热情。 加分项: 1.有大模型项目经验,参与过聊天机器人、问答系统、RAG 等开发; 2.熟悉分布式训练技术(数据并行、模型并行、Pipeline 并行),使用过 DeepSpeed 等框架; 3.掌握模型部署与加速技术,如 TensorRT、模型蒸馏、量化、高效推理框架等; 4.有 Pretrain、SFT、RLHF、RLVR、多模态模型等实战经验或深入理解; 5.具有优秀的软件开发能力,熟悉操作系统、编译器、网络协议或计算机安全等技术; 6.在开源社区有活跃贡献,或在顶级学术会议/期刊发表论文; 7.算法竞赛、行业评测中成绩优异,具备较强的实战和创新能力。
工作地点
海淀大悦信息科技园C5号楼
北京中关村学院
地点图标地点圆形图片
相似职位
安全提示图标 理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报
下载app提示-背景图
理聘小程序
随时随地看职位
投递反馈秒知道
微信小程序-二维码图
北京中关村学院
其他事业单位
热招 24 个职位
单位主页
Ai入口图
猜你喜欢
更多