首页
推荐
搜索
单位
简历
APP
双选会

理聘网-职位详情页,大模型量化部署工程师

大模型量化部署工程师
30-35K/月
投简历
聊一聊
地点图标 杭州
工作经验图标 3-5年
教育经历图标 硕士
职位描述
大模型算法
职位描述 1. 负责大模型在边缘设备上的量化及在线部署,优化在线 inference 的吞吐量、资源利用率。 2. 研究并应用业界最新的量化、压缩和推理优化技术,持续提升大模型在边缘设备上的推理性能。 职位要求 1. 计算机、电子信息、自动化等相关专业; 2. 熟悉Python、C++等至少一门编程语言,具有较强的代码开发能力,熟练Linux工作环境; 3. 熟悉PyTorch框架,了解大模型基本原理; 4. 熟悉GPTQ,AWQ等大模型量化算法者优先; 5. 熟悉vLLM,SGLang等大模型推理框架者优先; 6. 具备良好的英文读写能力和数学基础。
工作地点
余杭区
杭州宇泛智能科技股份有限公司
地点图标地点圆形图片
相似职位
安全提示图标 理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报