多模态算法实习生-智能创作
深圳
实习
研发
ByteIntern
职位 ID:A120965
职位描述
ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了深度学习、计算机视觉、图形学、等技术领域,并以多种形式向公司内部各业务线提供业界最前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、深入研究和探索多模态算法、迭代、落地应用,包括但限于图像/视频的生成创作、图表理解/生成、逻辑推理等领域; 4、提出和实现前沿的算法,保持算法在工业界和学术界的领先。
职位要求
1、2025届硕士及以上学历在读,计算机、软件工程等相关专业优先; 2、扎实的数学和算法基础:识别、检索、多模态预训练、概率统计、数值优化等相关算法; 3、具有文本理解、文本缩略、文本改写、机器学习、图像分类和识别、图像视频理解、图像分割、目标检测、OCR、视觉创作、3D、多模态、计算机视觉、NLP、生成、AIGC等一个或多个方向研究与落地经验者优先; 4、较强的问题分析与学习能力,能快速跟进前沿技术, 并应用于实际问题解决; 5、有扎实的编程基础,熟悉c++/python等编程语言,具有快速复现前沿论文的能力; 6、熟悉caffe、tensorflow、mxnet、pytorch、keras等框架中的一种或以上; 7、良好的自驱意识及执行力,实践动手能力强。ACM、ICPC、NOI/IOI、top coder、Kaggle比赛获奖者优先; 8、作为主要作者发表过顶级论文者优先,CVPR/ICCV/ECCV/IEEE/ACL/EMNLP/NAACL/NIPS/ICML等; 9、每周出勤4天及以上,可以持续实习至少3个月,工作踏实优秀者有转正机会。

校园招聘