本报讯(记者 张伟) 2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的视频生成模型阶跃Step-Video-T2V和语音交互大模型阶跃Step-Audio两款Step系列多模态大模型向全球开发者开源,即日起可在跃问APP内体验。这是继DeepSeek后又有两款大模型向开发者开源。
阶跃星辰是吉利汽车集团的科技生态战略合作伙伴。在两款大模型的研发过程中,双方展开了深度合作,在算力算法、场景训练等领域优势互补,显著增强了多模态大模型的性能表现。此次联合开源的行动,旨在促进大模型技术的共享与创新,推动人工智能的普惠发展。这一举措也将为开源世界贡献多模态大模型能力,形成大模型开源世界的又一股中国力量。
吉利汽车集团CEO淦家阅表示,早在2021年,吉利就围绕芯片、软件操作系统、数据和卫星网搭建了端到端的自研体系和生态联盟,构建了完善的“智能吉利科技生态网”,驱动用户在智能驾驶、智能座舱上的体验不断进化。目前,吉利全栈自研的星睿AI大模型已经与阶跃Step-Video-T2V、Step-Audio等大模型完成了深度融合,将为用户带来更智能、更高阶的座舱交互与智驾出行体验,推动AI在智能汽车领域的普及。
据悉,阶跃Step-Video-T2V 模型的参数量达到300亿,可以直接生成204帧、540P 分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性;阶跃Step-Audio语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能与用户自然高质量对话。