Kakao一口气发布10种AI模型:“为服务深度优化的LLM”
自研模型“Kanana Family”发布
“以高效模型为用户创造价值”
多模态、图像与视频生成模型同步亮相
用摄像头对准物体即可与AI实时对话
在人工智能(AI)技术竞争中一度略显落后的Kakao公开了其自主研发的10种AI模型。从不同规模的巨型语言模型(LLM)到图像·视频生成模型,形成了多样化产品线。Kakao提出的战略不是一味追求压倒性的模型规模和性能,而是将针对Kakao服务进行优化的模型加以应用,从而提升成本效率和用户满意度。
Kakao于23日在京畿道龙仁AI校园举行的开发者大会“If kakao 2024”第二天活动上公布了上述计划。
Kakao还将全新的AI品牌“Kanana”用于自研AI模型的命名。“Kanana家族”共由10种模型构成,包括▲3种LLM ▲3种多模态语言模型 ▲2种图像·视频生成模型 ▲2种语音模型。所谓多模态,是指能够理解文本、图像等多种类型数据的模型。
LLM按照规模和性能分为▲超轻量级“Kanana Nano” ▲优化型“Kanana Essence” ▲旗舰型“Kanana Flag”。核心模型Kanana Essence主打高性能与高成本效率。据介绍,与体量相近的全球模型相比,其整体性能不落下风,而在韩语处理能力方面则展现出明显优势。
这些模型的特点被概括为“服务优化”。当天发表主题演讲的Kanana Alpha成果负责人Kim Byeonghak表示:“LLM必须同时具备优良性能、成本效率以及解决服务问题的能力。我们正以Kanana模型为基础,推进能够为用户提供直接帮助的AI服务化。”
Kang Byunghak Kanana Alpha 业绩负责人于23日出席在京畿道龙仁 AI 校区举行的开发者活动“if kakao 2024”第二天的主题演讲。 [照片由 Kakao 提供]
View original imageKanana模型将被应用于包括前一天公开的对话式超个性化AI助手“Kanana”在内的多种AI服务。不过,Kakao计划根据不同服务,将Kanana模型与开源模型等外部模型进行组合应用。具体做法是,在推理、理解、数学等各个要素上组合表现最优的模型,或者在性能相同的模型中选择成本更低的一方。前一日,Kakao代表Jeong Shina强调:“在以数十万亿韩元资本为单位展开的竞争中,我们既不能在模型竞争上落后,又要通过最务实的解决方案,将用户体验最大化。”
Kakao还介绍了多模态语言模型“Kanana-o”。Kanana-o的特点在于,摆脱了以往将文本识别、语音识别等各模型以模块化方式组合使用的结构,能够对多种数据进行一体化处理。由于可以快速理解多种形态的数据,无论面对何种问题,平均都能在1.6秒内输出回答。凭借这一响应速度优势,Kakao计划将其发展为用户用手机摄像头对准感兴趣的物体,即可与AI进行实时对话的形态。
具备图像和视频生成能力的两种模型正在以可处理从文本、图像到个人头像照片等多样输入的形式进行开发。不仅可以基于输入图像生成视频,还能通过简单的鼠标操作控制角色动作,从而制作出内容更加丰富的视频作品。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。