视频大模型算法工程师-ByteDance Research
北京
研发
职位 ID:A166478
职位描述
字节跳动ByteDance Research致力于人工智能领域的前沿技术研究,涵盖自然语言处理、计算机视觉、机器学习、机器人、AI for Science、Responsible AI等多个领域,同时将研究成果落地,为公司现有的产品和业务提供技术支持和服务。 1、建设大规模的视频生成基础模型,取得世界领先水平; 2、进行算法的设计和效果迭代,探索视频生成最优的模型架构和最佳的训练方法,不断提升生成能力上限。
职位要求
1、有视频生成、图片生成、多模态预训练、视频理解、图片理解,其中一个或者多个领域的研究经验,并对相关工作有深刻的理解; 2、优秀的代码能力,熟练掌握 pytorch,能在较短时间内独立实现论文算法,并且能有针对性地优化; 3、优秀的团队合作能力和持续学习能力,能在团队合作中高效推进项目进展; 4、深入理解 diffusion models、image/video tokenizers 、transformer scaling up 经验者优先;开发出相关领域中重要任务 SoTA 模型者优先。