Kakao一口气发布10种AI模型：“为服务深度优化的LLM”

by Choi Yuri

Published 23 Oct.2024 11:06(KST)

Updated 23 Oct.2024 13:19(KST)

open/close

自研模型“Kanana Family”发布
“以高效模型为用户创造价值”
多模态、图像与视频生成模型同步亮相
用摄像头对准物体即可与AI实时对话

在人工智能（AI）技术竞争中一度略显落后的Kakao公开了其自主研发的10种AI模型。从不同规模的巨型语言模型（LLM）到图像·视频生成模型，形成了多样化产品线。Kakao提出的战略不是一味追求压倒性的模型规模和性能，而是将针对Kakao服务进行优化的模型加以应用，从而提升成本效率和用户满意度。

Kakana AI 模型产品线 [图片由 Kakao 提供]

Kakao于23日在京畿道龙仁AI校园举行的开发者大会“If kakao 2024”第二天活动上公布了上述计划。

Kakao还将全新的AI品牌“Kanana”用于自研AI模型的命名。“Kanana家族”共由10种模型构成，包括▲3种LLM ▲3种多模态语言模型 ▲2种图像·视频生成模型 ▲2种语音模型。所谓多模态，是指能够理解文本、图像等多种类型数据的模型。

LLM按照规模和性能分为▲超轻量级“Kanana Nano” ▲优化型“Kanana Essence” ▲旗舰型“Kanana Flag”。核心模型Kanana Essence主打高性能与高成本效率。据介绍，与体量相近的全球模型相比，其整体性能不落下风，而在韩语处理能力方面则展现出明显优势。

这些模型的特点被概括为“服务优化”。当天发表主题演讲的Kanana Alpha成果负责人Kim Byeonghak表示：“LLM必须同时具备优良性能、成本效率以及解决服务问题的能力。我们正以Kanana模型为基础，推进能够为用户提供直接帮助的AI服务化。”

Kang Byunghak Kanana Alpha 业绩负责人于23日出席在京畿道龙仁 AI 校区举行的开发者活动“if kakao 2024”第二天的主题演讲。 [照片由 Kakao 提供]

Kanana模型将被应用于包括前一天公开的对话式超个性化AI助手“Kanana”在内的多种AI服务。不过，Kakao计划根据不同服务，将Kanana模型与开源模型等外部模型进行组合应用。具体做法是，在推理、理解、数学等各个要素上组合表现最优的模型，或者在性能相同的模型中选择成本更低的一方。前一日，Kakao代表Jeong Shina强调：“在以数十万亿韩元资本为单位展开的竞争中，我们既不能在模型竞争上落后，又要通过最务实的解决方案，将用户体验最大化。”

Kakao还介绍了多模态语言模型“Kanana-o”。Kanana-o的特点在于，摆脱了以往将文本识别、语音识别等各模型以模块化方式组合使用的结构，能够对多种数据进行一体化处理。由于可以快速理解多种形态的数据，无论面对何种问题，平均都能在1.6秒内输出回答。凭借这一响应速度优势，Kakao计划将其发展为用户用手机摄像头对准感兴趣的物体，即可与AI进行实时对话的形态。