AI多模态算法专家
4-6.5万元/月岗位职责:
1设计与实施多模态数据构建方案:包含数据采集、清洗、标注、弱监督/自监督数据生成、数据质量评估与反馈闭环
2构建和维护训练/评测基准(benchmarks):覆盖视觉推理、视频理解等
3负责多模态大模型(VLM,Vision-LanguageModel)的优化,包括模型架构对接、训练策略、推理加速与效果评估。
4关注前沿技术并进行可行性验证(PoC),推动新算法或新数据策略到生产级落地
5撰写技术文档,沉淀最佳实践,指导初级工程师与标注团队
任职要求:
1计算机、电子信息、自动化、应用数学等相关专业本科及以上,5年以上机器学习/深度学习经验,或具备同等能力的开源/竞赛成果
2熟练使用Python,熟悉深度学习主流框架(PyTorch,TensorFlow)
3扎实的工程能力:熟悉Git、Docker、Linux,能够独立构建可复用的数据与训练管线
4熟悉大模型训练流程:数据准备、预训练、指令微调、评测与迭代;具备良好的问题定位与性能调优能力
5具备良好的沟通协作能力与自驱力,能够在不完全信息下推进项目
专业要求(VLM与数据构建):
1多模态模型与视觉表征
1.1熟悉以下至少两个领域:VQA、VideoCaptioning、VideoReasoning、ContentRetrieval、SaliencyDetection、BehavirorAnalysis、IntentionPrediction、Multi-ModalSensing&Understanding的相关技术
1.2熟悉视觉Backbone与Tokenizer:ViT/ConvNeXt/Swin、SAM、DINO、Q-Former、VQ-VAE等
2训练与对齐
2.1具备多模态对齐、跨模态检索、图文匹配、视觉问答任务的建模与评测经验
2.2掌握指令微调、偏好对齐(RLHF/RLAIF)、对比学习、知识蒸馏、混合专家(MoE)等
3数据构建与治理
3.1有音视频以及多传感器数据集构建经验,包括标签预处理、时空对齐、语义语料分析等。具备大规模数据采集、噪声过滤、去重(感知哈希/SimHash/MinHash)、质量评估(Heuristics/模型打分)、数据分层采样与混料(mixing)经验
3.2熟悉标注策略与工具链:人机协同标注、主动学习、弱监督/自监督数据生成、数据一致性与审计
3.3理解数据对齐与红队测试:安全、合规、偏见与毒性检测,视觉版权与隐私合规意识
4评测与产品化
4.1能构建多维评测集(准确性、鲁棒性、幻觉率、安全性、时延/吞吐)
4.2了解在线评测、能将数据-模型-评测迭代形成持续优化闭环