3秒生成仿真级画作…Kakao发布AI艺术家“Calo 2.0”

by Choi Yuri

Published 10 Jul.2023 09:10(KST)

Kakao Brain于10日公开了可在3秒内绘制出极具真实感图像的超大规模人工智能（AI）图像生成模型“Karlo 2.0”。

Karlo 2.0是一款学习了约3亿张文本—图像数据集的超大规模AI艺术家。该模型基于全球顶级水准的语言理解能力，具备生成高完成度画作的性能。例如，即便输入“拥有明亮蓝色瞳孔的猫”这类复杂的提示词（指令），也能将其准确绘制出来。

Kakao Brain于10日发布了超大规模人工智能图像生成模型“Karlo 2.0”。 Kakao Brain供图

分辨率最高支持2048×2048。生成图像的分辨率越高，可使用的图像尺寸越多样，用户就能以更多细节表现出自己想要呈现的画面。

图像中的空间感、立体感以及动物毛发等纹理的细节表现能力得到强化，可以生成接近实拍照片的高质量图像，并可实现包括现代艺术在内的多种画风。图像生成速度也较既有模型Karlo 1.4进一步提升，用户在3秒内即可获得所需图像。

Kakao Brain为推动国内AI生态发展，已在Kakao Developers上公开了Karlo 2.0开放应用程序接口（API）。这是将原本基于Karlo 1.4模型提供的开放API升级为Karlo 2.0模型。与Karlo 1.4相比，Karlo 2.0可以生成更多尺寸和比例的图像，并在较高提示词理解度的基础上，通过负面提示词（Negative Prompt）功能，预先控制图像生成过程中需要排除的表达或关键词。此外，将此前最多可免费生成500张图像的额度，大幅提升至每月最多60万张。