人工智能软件专业企业Konan Technology股价走强。集成了推理模式的Konan大型语言模型(LLM)新模型“ENT-11”在基准测试中超越DeepSeek的消息,被认为正在对股价产生影响。
26日上午10时43分,Konan Technology股价报2.515万韩元,较前一交易日上涨24.5%。
Konan Technology介绍称,将通用模式和推理模式整合到同一引擎,是该新模型最大的特点。作为单一模型,不仅可以进行一般问答,还能通过模式切换,为需要复杂推理的任务提供最优答案。与他家将通用模型和推理模型分开提供的方案相比,该模型在更低的图形处理器(GPU)成本下,也能实现高性能人工智能服务,形成差异化优势。
具备针对韩语进行优化的结构也是一大强项。与Qwen、LLaMA、Gemma、DeepSeek等模型相比,该模型在预训练阶段包含了更多韩语词元,在处理基于韩语的提问时,无论是准确度还是响应速度都大幅领先。
公司还通过上市前进行的自有基准测试进行了验证。ENT-11模型的参数规模为320亿个,仅约为中国DeepSeek大型语言模型“R1”(6710亿个)的5%。在衡量多轮对话与指令遵从能力的“MT-Bench”评估中,该模型在▲写作 ▲角色扮演 ▲推理 ▲数学 ▲编程 ▲信息抽取 ▲STEM(科学·技术·工程·数学) ▲人文学科等8个项目上,与DeepSeek R1取得了相当的分数,其中编程性能大幅领先。与参数同为320亿的DeepSeek R1模型相比,ENT-11模型的平均性能高出4.75个百分点。
Konan Technology通过对MT-Bench进行直接翻译、审核和校正,构建了自有评测体系“Konan MT-Bench”,以提高评测结果的准确性并减少误差,反复评估新模型的性能。结果显示,“ENT-11”模型在与同规模的DeepSeek R1比较时,平均性能高出5.38个百分点,尤其在复杂推理和数学领域均处于领先。这表明,尽管模型体量紧凑,但通过高效而精细的设计,最大化了推理性能。“ENT-11”模型的通用模式性能也较前代“ENT-10”提升了4.5个百分点。
模型性能的提升还体现在上下文处理能力上。此前ENT-10模型最多支持1.6万词元的上下文,而ENT-11已扩展至最多12.8万词元的长上下文。以韩语词元计算,相当于128页A4纸的篇幅;以英语词元计算,则相当于320页。
首席执行官Kim Youngseom表示:“随着大型语言模型数量不断增加,其评估方式也在多元化,对于那些只在特定评测指标上过度拟合、仅在部分评估中表现较好的模型,有必要提高区分度。”
他接着表示:“虽然我们的模型仅为DeepSeek R1的二十分之一大小,但已证明具备更优异的推理性能。今后将继续以高质量韩语数据和开发基础设施为优势,努力让Konan Technology打造的大型语言模型技术,成为衡量韩国国内生成式人工智能性能的标杆。”
新模型将于本月末正式发布。凭借在多轮对话基准测试中得到验证的优异性能和将资源消耗降至最低的高效性,该模型在日益精细化、专业化的人工智能代理环境中,预计将拥有较高的应用价值。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。