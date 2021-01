인공지능(AI) 자연어 처리능력, 지난해 급격한 향상 성과

작문 프로그램 'GPT-3' 고차원 주제 대화도 가능

2016년 3월 인간 최고의 지적 게임이라고 할 수 있는 바둑에서 알파고가 이긴 후 획기적인 인공지능 기술을 선정하라면 무엇을 꼽을 수 있을까? 이미 우리가 일상적으로 사용하는 많은 제품과 서비스에는 인공지능 기술이 활용되고 있다. 동영상 서비스에는 인공지능 추천 알고리즘이 작동하고 있고, 스마트폰에서 문자를 입력할 때 단어나 문장의 자동추천도 인공지능 기술을 기반으로 하고 있다. 개와 고양이 사진을 구분하던 기술은 사진에서 나와 친구의 얼굴을 찾아 분류해주고 있다. 자율주행차는 아직 상용화되지 않았지만, 빠르게 발전하고 있다. 첨단 제품과 서비스의 80%에서 인공지능 기술이 사용되고 있다. 다양한 분야에서 발전하고 있는 인공지능 기술 중에서 게임 체인저가 될 수 있는 기술이 등장하고 있다.

작년에 괄목할 만한 성과를 남긴 기술 중에서 필자는 자연어 처리 능력의 급격한 향상에 주목하고 있다. 특히 획기적인 성과를 보여준 인공지능은 OpenAI에서 개발한 GPT-3 작문 프로그램이다. GPT-3는 인간과 같은 작문 실력을 보여주어 화제가 됐다. 3천만명이 사용하는 채팅사이트에서 GPT-3 봇은 1주일 동안 수백 개의 글을 올렸지만, 인공지능이 작성했다고 의심받지 않았다. 봇이 작성한 댓글 대부분은 편향되지도 해롭지도 않았다. 자살을 주제로 한 한 글에는 자기를 지지해 준 부모를 생각하면 자살을 포기하게 된다는 다음과 같은 글을 남기기도 했다. “제게 가장 도움이 된 것은 아마도 부모님이었을 것입니다. 나는 무모님과 아주 좋은 관계를 가지고 있으며, 무슨 일이 있어도 무모님은 항상 나를 지지해 주셨습니다. 내 인생에서 자살하고 싶은 생각이 많이 들었지만 그런 부모님 때문에 한 번도 시도해본 적이 없습니다.” 일상 대화뿐 아니라 신의 존재와 인류의 운명 등 고차원적인 주제에 대한 대화도 이어갔다.

비즈니스·작문 분야서 활용되는 AI 언어프로그램, 꾸준히 영역 확대

GPT-3는 시작 문장과 주제를 주면 장문의 글도 작성한다. 가디언지는 GPT-3가 작성한 장문의 기사를 게재하기도 했다. GPT-3가 이러한 윤리적인 문제를 포함하여 인간과 비슷한 작문 실력을 보여주고 있지만, 아직 공식적인 서비스를 시작하지 않고 여전히 개발 중에 있다. 현재 GPT-3는 무려 1,750억 개의 매개 변수를 처리하는 능력을 가지고 있다. 메모리만해도 350GB에 달한다. 2019년 GPT-2 버전은 15억 개의 매개 변수를 처리했는데, 올해 GPT-4는 조 개의 매개 변수를 처리할 것으로 전망된다. GPT-3는 막대한 하드웨어 성능을 요구하고 있고, 오남용 우려 때문에 제한적인 라이선스를 주는 방식으로 서비스를 시작할 것으로 보인다.

GPT-3는 한글 버전도 개발 중이라고 한다. 우리나라에서도 오래 동안 자연어 처리 프로그램을 개발해 왔고, 장학퀴즈에서 우승을 하는 정도의 실력을 갖추고 있다. 그러나 아직 GPT-3에 비할 정도는 못 된다는 평가를 받고 있다. 한글 언어처리 기술력이 뒤쳐지면 한글 작문 프로그램을 외국이 주도할 수 있다. 한글 번역에서도 외국 프로그램이 앞섰다는 평가가 나오고 있다. 사회는 언어에 기반하고 있다. 한글 언어 처리 기술에 대한 정부와 기업체의 더 많은 협력과 투자가 요구된다.

인공지능 언어 프로그램은 이미 비즈니스 영역에서 활용되고 있다. 인간 언어의 많은 뉘앙스가 걸림돌이 되고 있지만, 인공지능 챗봇은 이미 고객 상담 서비스에서 만족할 만한 성과를 보이고 있다. 최근에는 복잡한 조사 보고서를 요약하고, 재무 문서, 전화 마케팅, 콜센터 기록 등을 분석하는 영역으로 확대되고 있다.

그러나 인공지능 작문 프로그램은 아직 넘어야 할 산이 많다. 최근 인공지능 챗봇 ‘이루다’가 성희롱, 소수자 차별, 편견 논란에 휩싸여 3주만에 서비스를 중단했듯이 인공지능이 건전한 상식, 윤리적인 의식을 갖고 인간과 같이 언어를 구사하는 것은 쉽지 않은 문제이다. 현재 인공지능 자연어 처리 기술은 사람이 남긴 방대한 문서를 학습하는 딥러닝 방식이다. 인간이 작성한 문장에서 가장 많이 사용되는 패턴을 따라서 단어와 문장을 배치하는 방식이다. 이렇게 학습된 알고리즘은 다른 영역에 적용하기 어렵고, 추론 및 지식이 불투명하여 왜 그런 문장을 작성했는지 설명하기도 어렵다. 사람의 문장을 모방하지만, 사람과 같은 지식과 상식, 추론 능력을 가지고 있지는 않다. 앞으로 이런 능력을 어떻게 갖추게 할 것인가가 자연어 처리에서의 과제이다.

의식적 사고 영역 전환 단계 접어든 AI, 인간-인공지능 협력 대비해야

일반적으로 우리 인간의 사고는 ‘시스템 1’ 사고와 ‘시스템 2’ 사고로 구분된다. 노벨 경제학상을 수상한 대니얼 카너먼은 시스템 1 사고는 직관적이고 빠르며 자동적인 사고라고 했다. 고양이와 개의 구분, 지나가는 광고판의 단어 인식, “로미오와 00”의 문구 완성 등이 의식적인 처리가 거의 필요하지 않은 시스템 1 사고 영역이다. 사람들이 1초 미만의 생각으로 처리할 수 있는 많은 일들의 영역에서 인공지능 프로그램들이 뛰어난 성과를 보여주고 있다. 시스템 2 사고는 더 느리고 분석적이고 깊은 의식적인 사고이다. 추상적인 문제를 해결하거나 새로운 상황을 다루기 위해 추론이 필요할 때 시스템 2 사고를 사용한다. 복잡한 수수께끼를 풀거나, 새로운 개념을 제시하거나 계획을 세우고, 인과적 관계를 이해하고, 사회적 환경에서 특정 행동의 적절성을 결정하는 것이 포함된다. 우리가 세상을 이해하고, 더 좋은 세상을 만들기 위해 사고하고, 새로운 지식을 얻기 위한 노력 등은 시스템 2 사고 영역이다.

현재 인공지능 언어처리는 시스템 1 사고에서 시스템 2 사고로 넘어가기 위해 시도하는 단계라고 할 수 있다. 시스템 1 사고를 갖도록 하기 위해 인공지능은 잘 짜인 데이터 세트를 주고 인공지능을 학습시키는 지도학습 방법을 사용했다. 최근에는 개방형 탐색 및 추론을 통해 인간이 세상에 대해 배우는 방식을 따라 하는 비지도 학습 모델이 개발되고 있다. 인공지능이 시스템 2 사고가 가능하기까지는 몇 년이 걸릴지, 올해가 될지 모른다. 알파고가 갑자기 우리에게 충격을 주었듯이, 인공지능이 인간과 같은 사고를 하기 시작할 때, 우리는 이를 어떻게 받아들이고 사용할 것인지에 대한 준비가 필요하다. 단순 반복적인 업무를 처리하는 시스템 1 사고 인공지능에 대해서도 우리는 인간의 일자리가 사라지는 것이 아닌가하는 두려움을 가졌다. 새로운 충격이 오기 전에 진정한 인간의 능력은 무엇인지, 인간과 인공지능은 어떻게 협력할 것인지에 대한 대비가 필요하다.

이명호 (재)여시재 기획위원