AI/大模型网络研发工程师
杭州
研发 - 基础架构
职位 ID:A163886
职位描述
1、高速网络技术的设计和研发,满足AI/大模型业务在训练、推理、存储等多个场景对网络的需求; 2、支持大规模AI场景的高速网络平台系统研发,包括故障定位和性能分析等; 3、高性能AI通信框架,网络协议栈以及端网应用协同优化等核心技术的研发,在支持业务规模化扩展的同时,保证网络的高可靠性和高性能; 4、通过技术创新推动AI网络技术的持续演进,打造适合大规模AI场景的超低时延高速互联技术。
职位要求
1、精通计算机网络和网络编程; 2、精通至少一门主流编程语言,比如C/C++, Python, Go等; 3、熟悉当前高性能网络和系统领域的最新进展,包括RDMA,拥塞控制,AI网络优化等技术; 4、对AI网络故障定位和性能优化有经验者优先; 5、有高性能通信框架(如NCCL,MPI,各种RPC库等)开发经验者优先。