- 职位类别:实习生招聘
- 工作性质:实习
- 工作地址:北京市
- 薪酬范围:面议
- 招聘人数:若干
- 发布时间:2025-02-12
- 需求公司:
- 招聘类型:实习生招聘
工作职责:
1、参与分布式异构LLM推理系统的算法设计、开发与性能优化;
2、研究长序列的KV cache瓶颈问题,优化计算与通信效率;
3、研究类DeepSeek R1的复杂推理(Reasoning)系统实现方案。
任职资格:
1、对Transformer为代表的LLM原理有深入理解,并具有相关实际开发经验;
2、具有大模型推理框架(如vLLM等)和训练框架(如Megatron)的开发与优化经验者优先;
3、具有计算机、通信、人工智能等相关专业背景。