多模态算法实习生-豆包大模型
北京
实习
研发 - 算法
ByteIntern
职位 ID:A176987
职位描述
ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、深入研究和探索多模态算法、迭代、落地应用,包括但限于图像/视频的生成创作、图表理解/生成、逻辑推理等领域; 4、提出和实现前沿的算法,保持算法在工业界和学术界的领先。
职位要求
1、2025届硕士及以上学历在读,计算机、软件工程等相关专业优先,每周出勤4天及以上,可以持续实习至少3个月,工作踏实优秀者有转正机会; 2、扎实的数学和算法基础:识别、检索、多模态预训练、概率统计、数值优化等相关算法; 3、具有文本理解、文本缩略、文本改写、机器学习、图像分类和识别、图像视频理解、图像分割、目标检测、OCR、视觉创作、3D、多模态、计算机视觉、NLP、生成、AIGC等一个或多个方向研究与落地经验者优先; 4、较强的问题分析与学习能力,能快速跟进前沿技术, 并应用于实际问题解决; 5、有扎实的编程基础,熟悉c++/python等编程语言,具有快速复现前沿论文的能力; 6、熟悉caffe、tensorflow、mxnet、pytorch、keras等框架中的一种或以上; 7、良好的自驱意识及执行力,实践动手能力强。ACM、ICPC、NOI/IOI、top coder、Kaggle比赛获奖者优先; 8、作为主要作者发表过顶级论文者优先,CVPR/ICCV/ECCV/IEEE/ACL/EMNLP/NAACL/NIPS/ICML等。

校园招聘