工作职责:
1、负责大模型(如LLaMA、Qwen、GPT等)的微调、部署与推理优化,包括但不限于指令微调、RLHF、模型压缩、量化推理等;
2、负责大模型在实际业务中的落地应用,包括但不限于知识库问答(RAG)、智能体(Agent)、文档理解等场景;
3、负责研究多模态大模型(LMM)及相关前沿技术,探索其在具身智能、视觉语言任务等方向的应用潜力;
4、负责与软件开发、硬件团队紧密配合,完成大模型相关算法模块的工程化集成、服务化封装与性能调优;
5、负责算法相关技术文档、技术专利、论文撰写和维护。
任职资格:
1、硕士或以上,计算机/软件/人工智能等相关专业,具有大模型相关算法研发经验,优秀应届生亦可;
2、熟悉大模型的基本原理与常见训练/推理框架(如Transformers、DeepSpeed、vLLM、llama.cpp等),有实际微调或部署经验;
3、熟悉C/C++/Python等开发语言,熟悉Linux操作系统,具备一定的工程化能力;
4、对大模型相关技术(如RAG、Agent、LoRA、量化推理、多模态等)有较为深刻的理解,具备较强的技术创新、开发与优化能力;
5、较强的学习能力,勤奋刻苦,富团队合作精神。