
8 月 13 日,昆仑万维正式开源「Skywork UniPic 2.0」模型。
官方介绍,Skywork UniPic 2.0 拥有面向统一多模态建模的高效训练和推理框架,围绕生成和编辑模块轻量化、连接多模态理解模型进行联合训练,构建了理解、生图、编辑一体化的核心能力,是一款旨在实现「高效、高质、统一」的多模态生成模型。
具体来看,升级后的「Skywork UniPic 2.0」具备以下核心优势:
- 生成模块基于 2B 参数的 SD3.5-Medium 架构训练,生图和编辑指标超越生成模块具有 7B 参数的 bagel、4B 参数的 OmniGen2、12B 参数的 UniWorld-V1 和 Flux-kontext 模型;
- 基于 Flow-GRPO 首创渐进式双任务强化策略,有效提升模型对复杂指令的理解能力与图像生成和编辑的一致性,两大任务协同优化、互不干扰;
- 将生图编辑的 Kontext 模型与多模态模型端到端整合,微调轻量连接器,即可快速构建统一理解-生成-编辑模型,并且生图和编辑的性能进一步提升。
当前,Skywork UniPic 2.0 及其系列模型已全面开源,涵盖模型权重、推理代码、强化策略等。
|