北京AI 大模型研发工程师（研究工程师）招聘 (北京中关村学院)

岗位介绍：我们正在招募软件智能大模型研发工程师，加入我们的前沿技术团队，专注于大规模预训练模型的训练、优化与部署。你将参与从模型设计、训练调优到系统优化、高效部署的全流程，推动大模型在实际业务场景中的落地与演进。团队兼重技术深度与工程落地，强调高效协作与持续创新，欢迎热衷 AI 技术、有扎实编程与系统基础的你加入共创。你将获得： 1.探索大模型在真实业务中的落地机会； 2. 深入使用分布式训练与模型优化工具链（DeepSpeed、Colossal-AI 等）； 3. 与算法专家、系统工程师协作，加速项目从 0 到1； 4. 全面参与数据、模型、系统、部署等完整研发流程。岗位职责： 1.大模型训练：负责大型语言模型等深度学习模型的预训练与微调； 2.算法与优化：提升模型性能，包括算法改进、参数调节、混合精度等手段； 3.系统架构：构建并维护高效稳定的分布式训练系统，解决训练中系统瓶颈； 4. 模型部署：在真实业务中部署模型，并优化推理效率（压缩、蒸馏、量化等）； 5.前沿探索：跟进大模型相关前沿技术，评估并引入适合团队的创新方法。任职要求： 1. 研究生及以上学历，计算机科学、人工智能、软件工程等相关专业； 2.熟悉深度学习主流模型，如 Transformer，具备实际开发与调优经验； 3.熟练掌握 Python 编程，理解至少一门编译型语言（如 C/C++）； 4. 熟练使用 PyTorch 等主流深度学习框架，在多机多卡上分布式训练过模型； 5.有扎实的工程能力、良好的代码风格和独立定位问题的能力； 6.具有团队协作精神，学习能力强，对 AI 技术有持续热情。加分项： 1.有大模型项目经验，参与过聊天机器人、问答系统、RAG 等开发； 2.熟悉分布式训练技术（数据并行、模型并行、Pipeline 并行），使用过 DeepSpeed 等框架； 3.掌握模型部署与加速技术，如 TensorRT、模型蒸馏、量化、高效推理框架等； 4.有 Pretrain、SFT、RLHF、RLVR、多模态模型等实战经验或深入理解； 5.具有优秀的软件开发能力，熟悉操作系统、编译器、网络协议或计算机安全等技术； 6.在开源社区有活跃贡献，或在顶级学术会议/期刊发表论文； 7.算法竞赛、行业评测中成绩优异，具备较强的实战和创新能力。

理聘网-职位详情页，AI 大模型研发工程师（研究工程师）