岗位职责:
1.跟进 VLA(视觉-语言-动作) 多模态领域的前沿技术,调研并复现顶会论文(如 CVPR、ICCV、NeurIPS、ICLR等),探索创新性的 VLA 算法与应用;
2.参与 VLA 大模型的数据构建,包括多模态标注(视觉、语言、动作序列)、对齐及预处理;
3.负责 VLA 模型的训练、微调和评测,探索在机器人操作、智能体决策等场景中的落地应用;
4.研究并实现 VLA 模型的运动控制与部署方案,支持实际业务场景(如机器人、自动化设备)的应用需求。
岗位要求:
1.计算机、人工智能、机器人学、自动化等相关专业的硕士或博士研究生,研究方向涉及多模态学习、机器人学习或大模型优先;
2.熟悉多模态学习 / 表示学习 / 机器人控制 / 强化学习等基础理论和常用方法;
3.熟练掌握 Python / C++ 及 PyTorch 等主流深度学习框架,具备良好的工程实现能力;
4.熟悉 ROS/Isaac Sim 等机器人仿真平台;
5.拥有良好的团队沟通与协作能力,责任心强,自驱力强。
基本信息:成立于1999年,是国有控股的高科技上市公司,国内领先的金融智能自助设备供应商和服务商。
业务范围:主要业务包括金融设备、交通设备、智能安防、智能政务、智能便民等领域。
研发实力:拥有国家级企业技术中心、博士后科研工作站等创新平台,专利申请总量居国内金融设备行业前列。
市场地位:连续多年入围“中国软件业务收入前百家企业”“中国金融自助服务设备行业十大品牌”


