Kakao Brain于10日公开了可在3秒内绘制出极具真实感图像的超大规模人工智能(AI)图像生成模型“Karlo 2.0”。
Karlo 2.0是一款学习了约3亿张文本—图像数据集的超大规模AI艺术家。该模型基于全球顶级水准的语言理解能力,具备生成高完成度画作的性能。例如,即便输入“拥有明亮蓝色瞳孔的猫”这类复杂的提示词(指令),也能将其准确绘制出来。
分辨率最高支持2048×2048。生成图像的分辨率越高,可使用的图像尺寸越多样,用户就能以更多细节表现出自己想要呈现的画面。
图像中的空间感、立体感以及动物毛发等纹理的细节表现能力得到强化,可以生成接近实拍照片的高质量图像,并可实现包括现代艺术在内的多种画风。图像生成速度也较既有模型Karlo 1.4进一步提升,用户在3秒内即可获得所需图像。
Kakao Brain为推动国内AI生态发展,已在Kakao Developers上公开了Karlo 2.0开放应用程序接口(API)。这是将原本基于Karlo 1.4模型提供的开放API升级为Karlo 2.0模型。与Karlo 1.4相比,Karlo 2.0可以生成更多尺寸和比例的图像,并在较高提示词理解度的基础上,通过负面提示词(Negative Prompt)功能,预先控制图像生成过程中需要排除的表达或关键词。此外,将此前最多可免费生成500张图像的额度,大幅提升至每月最多60万张。
Kakao Brain联席代表Kim Ildu表示:“通过对人体比例与构图、表现空间感和立体感的透视图等各类图像数据的学习以及技术高度化,我们推出了Karlo 2.0。今后将继续让模型学习更多数据和用户反馈,在实现实拍水准图像生成的同时,进一步发展为能够反映更多元用户需求的图像生成模型。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。