大模型算法开发助理(J10408) 加入收藏

工作职责:

1、参与分布式异构LLM推理系统的算法设计、开发与性能优化;
2、研究长序列的KV cache瓶颈问题,优化计算与通信效率;
3、研究类DeepSeek R1的复杂推理(Reasoning)系统实现方案。

任职资格:

1、对Transformer为代表的LLM原理有深入理解,并具有相关实际开发经验;
2、具有大模型推理框架(如vLLM等)和训练框架(如Megatron)的开发与优化经验者优先;
3、具有计算机、通信、人工智能等相关专业背景。
立即申请返回列表