大模型部署工程师
2.5-3.5万元/月
投递简历
广东-广州
3-5年
大模型 · rag · python
2025-12-16 17:38:29 更新
被浏览:111 次
中电金信软件有限公司
最近在线时间:2025-12-16 17:38:29
电话:187********
地址:北京市海淀区西小口路66号东升科技园C区4号楼401室
职位描述
岗位职责:
1.主导大模型项目(如企业私有化部署、行业大模型应用、RAG系统、多模态理解等)的技术方案设计与实施交付;
2.负责大模型推理部署(GPU资源调度、分布式推理、模型加速)、API服务封装及业务系统集成;
3.统筹算法、后端、数据、前端等团队协作,保障项目交付进度与质量;
4.编写并审核技术方案、部署文档、接口说明、POC报告等交付资料;
5.深入客户实际场景,参与需求分析、方案讲解与技术答疑,提升客户体验与满意度;
任职要求:
1.计算机、人工智能、软件工程等相关专业背景;
2.3年以上后端或AI项目开发经验,熟练掌握Python,具备大模型或分布式系统开发经历者优先;
3.掌握主流大模型架构与部署工具,如LLaMA/DeepSeek/Baichuan、vLLM、TGI、FastChat、Deepspeed、HuggingFaceTransformers等;
4.熟悉RAG检索增强生成、KVCache机制、推理优化、分布式训练/推理等核心技术;
5.具备项目交付实践经验,了解模型上线、评估、性能调优等环节者优先;
6.能够接受出差安排。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作