AI 비드래프트, 환각 줄이는 추론 미들웨어 MARL 전 세계 동시 공개
AD
원본보기 아이콘

서울 AI허브 입주 AI 스타트업 비드래프트(VIDRAFT)가 대규모 언어모델(LLM)의 환각(hallucination)을 줄이고 자기 교정 능력을 강화하는 AI 추론 미들웨어 'MARL(Model-Agnostic Runtime Middleware for LLMs)'을 공개했다. 이번 기술은 Hugging Face, GitHub, PyPI, 그리고 26만 명 이상의 개발자 커뮤니티를 보유한 AI 에이전트 플랫폼 OpenClaw의 스킬 마켓플레이스 'ClawHub'를 통해 동시에 공개됐다.


MARL은 모델 재학습(파인튜닝) 없이 런타임 환경에서 다단계 자기 검증 파이프라인을 자동으로 실행해 LLM의 환각을 줄이는 미들웨어다. 기존 코드 한 줄만 수정하면 GPT-5.4, Claude, Gemini, DeepSeek, Grok, Llama 등 OpenAI API 형식을 지원하는 대부분의 LLM에 즉시 적용할 수 있다. 핵심 추론 엔진은 컴파일된 바이너리 형태로 보호하면서 테스트와 통합에 필요한 인터페이스는 공개했다.

메타인지(metacognition)는 AI가 자신의 답변이 틀렸을 가능성을 인식하고 스스로 수정하는 능력을 의미한다. 그러나 현재 LLM에는 두 가지 구조적 한계가 존재한다.


첫째는 메타인지 격차다. 비드래프트가 공개한 AI 메타인지 벤치마크 'FINAL Bench'에서 GPT-5.2, Claude Opus 4.6, Gemini 3 Pro 등 최신 모델 9종을 대상으로 총 1,800건을 평가한 결과, '틀릴 수 있음을 인식하는 능력(MA=0.694)'과 '실제로 오류를 수정하는 능력(ER=0.302)' 사이에 큰 격차가 확인됐다.

둘째는 자기 부정의 구조적 한계다. LLM은 자기회귀(autoregressive) 구조를 기반으로 작동하기 때문에 답변 생성이 시작되면 중간에 방향을 수정하기 어렵다. 초기 가정이 잘못되면 그 방향으로 계속 추론을 진행하며, 이 과정에서 환각이 높은 확신과 함께 생성되는 문제가 발생한다.


MARL은 이러한 문제를 해결하기 위해 하나의 LLM 호출을 여러 전문가 역할로 분화하는 구조를 적용했다. 기획자가 접근 방식을 설계하고 실행자가 초안을 작성한 뒤 검증자가 오류를 지적하고 통합자가 피드백을 반영해 새로운 최종 답변을 생성하는 방식이다. 사용자에게는 정제된 최종 결과만 제공되며, 다단계 추론 과정은 단계별로 기록돼 필요할 경우 확인할 수 있다.


이 구조는 단일 모델에서 나타나지 않는 새로운 관점을 다단계 상호작용을 통해 도출하고, 적대적 검증 단계를 통해 초안의 오류를 재검토한 뒤 새로운 최종 답변을 생성한다. FINAL Bench 연구에서는 메타인지 구조 적용 시 최상위 난이도 문제에서 성능이 70% 이상 향상됐으며, 그 효과의 94.8%가 자기 교정 능력에서 비롯된 것으로 나타났다.


MARL은 기본 추론 강화 기능 외에도 신약 개발, 창작, 법률 등 9개 분야의 전문 창발 엔진을 내장해 도메인 특화 아이디어 생성에도 활용할 수 있다.


일반적으로 파인튜닝은 수천만 원의 비용과 수주 이상의 시간이 필요하며, RAG는 외부 지식 보강에 초점을 맞추기 때문에 추론 오류 자체를 교정하기 어렵다. 반면 MARL은 모델 가중치를 변경하지 않고 런타임에서 추론 구조 자체를 바꾸는 방식으로 작동한다. 모델을 변경하더라도 MARL 레이어는 그대로 유지할 수 있어 멀티 LLM 전략을 사용하는 기업에도 일관된 품질 관리 수단을 제공한다.


또한 MARL은 GitHub 스타 26만 개를 돌파한 AI 에이전트 플랫폼 OpenClaw의 마켓플레이스 ClawHub에 공식 등록됐다. 3,200개 이상의 스킬 가운데 '추론 강화' 카테고리의 첫 번째 미들웨어로, AI 에이전트가 행동하기 전에 충분히 사고하도록 돕는 구조를 제공한다. OpenClaw 에이전트가 실행 중심 역할을 수행한다면 MARL은 메타인지를 강화하는 두뇌 역할을 담당한다는 설명이다.


비드래프트 관계자는 "FINAL Bench 연구를 통해 현존 최고 수준의 AI조차 '자신이 모르는 것을 인식하는 능력'이 크게 부족하다는 사실을 확인했다"며 "MARL은 모델을 바꾸는 것이 아니라 AI의 사고 방식 자체를 바꾸는 기술로, AI가 스스로 의심하고 수정하는 과정을 투명하게 보여주는 것이 신뢰의 출발점이라고 생각한다"고 말했다.


비드래프트는 2026년 상반기 엔터프라이즈 에디션을 출시하고, FINAL Bench 기반 효과 검증 결과를 국제 학술지에 투고할 계획이다. 또한 미국 시장 진출을 위한 현지 기업 PoC를 마치고 현재 로컬라이제이션 작업을 진행 중이다.


한편 비드래프트는 2030년 이내 True-AGI 개발을 목표로 2024년 설립된 서울 AI허브 입주 스타트업이다. AI 메타인지 벤치마크 'FINAL Bench'를 개발해 Hugging Face 데이터셋 글로벌 인기 5위와 리더보드 '금주의 스페이스'에 선정된 바 있으며, 최근 글로벌 방송용 모니터 제조사 웨어큐브와 공동 연구개발 계약을 체결했다.

AD

또한 Google DeepMind의 FACTS Grounding Leaderboard 의료 AI 분야 세계 2위(CNRS 검증), Hugging Face 히트맵 리더보드 글로벌 4위, STAR AI TOP 12(2024, 한국 유일) 등 다양한 성과를 기록하고 있다. 현재 월간 활성 이용자 200만 명, 누적 방문자 3,000만 명, 공개 AI 모델 1,500개 이상을 확보하고 있다.


lshb01@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 보면 좋은 기사

새로보기

내 안의 인사이트 깨우기

취향저격 맞춤뉴스

많이 본 뉴스

당신을 위한 추천 콘텐츠