岗位职责:
1.跟进 VLA(视觉-语言-动作) 多模态领域的前沿技术,调研并复现顶会论文(如 CVPR、ICCV、NeurIPS、ICLR等),探索创新性的 VLA 算法与应用;
2.参与 VLA 大模型的数据构建,包括多模态标注(视觉、语言、动作序列)、对齐及预处理;
3.负责 VLA 模型的训练、微调和评测,探索在机器人操作、智能体决策等场景中的落地应用;
4.研究并实现 VLA 模型的运动控制与部署方案,支持实际业务场景(如机器人、自动化设备)的应用需求。
岗位要求:
1.计算机、人工智能、机器人学、自动化等相关专业的硕士或博士研究生,研究方向涉及多模态学习、机器人学习或大模型优先;
2.熟悉多模态学习 / 表示学习 / 机器人控制 / 强化学习等基础理论和常用方法;
3.熟练掌握 Python / C++ 及 PyTorch 等主流深度学习框架,具备良好的工程实现能力;
4.熟悉 ROS/Isaac Sim 等机器人仿真平台;
5.拥有良好的团队沟通与协作能力,责任心强,自驱力强。
广州市天河区黄埔大道西平云路163号
广州数字科技集团是一家以人工智能和数字经济为核心业务的国有企业集团,总部位于广州珠江新城CBD,历史前身可追溯至1956年成立的国营广州无线电装修厂,1995年组建的广州无线电集团。集团深耕电子信息领域近70年,连续38年入选中国电子信息行业百强,是广州市首家国有资本投资公司,广州人工智能、软件和信创产业“双链主”单位。2018年至今,集团持续入选国务院国资委国企改革“双百行动”名单,2024年获评最高“标杆”等级。