您当前的位置: 首页 > 职位列表 > 职位详情

大模型部署工程师

2.5-3.5万元/月
投递简历
广东-广州
3-5年 大模型 · rag · python
2025-12-16 17:38:29 更新 被浏览:111 次
中电金信软件有限公司
最近在线时间:2025-12-16 17:38:29
电话:187********
地址:北京市海淀区西小口路66号东升科技园C区4号楼401室
职位描述

岗位职责:
1.主导大模型项目(如企业私有化部署、行业大模型应用、RAG系统、多模态理解等)的技术方案设计与实施交付;
2.负责大模型推理部署(GPU资源调度、分布式推理、模型加速)、API服务封装及业务系统集成;
3.统筹算法、后端、数据、前端等团队协作,保障项目交付进度与质量;
4.编写并审核技术方案、部署文档、接口说明、POC报告等交付资料;
5.深入客户实际场景,参与需求分析、方案讲解与技术答疑,提升客户体验与满意度;

任职要求:
1.计算机、人工智能、软件工程等相关专业背景;
2.3年以上后端或AI项目开发经验,熟练掌握Python,具备大模型或分布式系统开发经历者优先;
3.掌握主流大模型架构与部署工具,如LLaMA/DeepSeek/Baichuan、vLLM、TGI、FastChat、Deepspeed、HuggingFaceTransformers等;
4.熟悉RAG检索增强生成、KVCache机制、推理优化、分布式训练/推理等核心技术;
5.具备项目交付实践经验,了解模型上线、评估、性能调优等环节者优先;
6.能够接受出差安排。

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
自动化测试
1-1.2万元/月
北京-海淀区
2025-12-17 02:07:39
投递简历
中级Java开发工程师
1.3-1.4万元/月
北京-丰台区
2025-12-17 02:06:21
投递简历
海淀区招聘前端开发工程师
1.2-1.4万元/月
北京-海淀区
2025-12-17 02:05:53
投递简历
中级前端开发工程师
1.3-1.5万元/月
北京-丰台区
2025-12-17 02:05:43
投递简历
产品技术支持
6000-8000元/月
北京-西城区
2025-12-17 02:05:29
投递简历
海淀区急聘技术支持
9000-11000元/月
北京-海淀区
2025-12-17 02:05:17
投递简历
java技术主管
1.8-2.5万元/月
北京-海淀区
2025-12-17 02:05:08
投递简历
python开发
1.2-1.7万元/月
广东-深圳
2025-12-17 02:04:38
投递简历
前端开发工程师
1.2-1.6万元/月
北京-西城区
2025-12-17 02:02:06
投递简历
JAVA开发工程师
1.6-1.8万元/月
北京-丰台区
2025-12-17 01:59:57
投递简历
您可能感兴趣的职位 搜索更多相似职位 >
推荐企业 职位专题
中电金信软件有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作