bar_progress

아시아경제 최신 기획이슈

[과학을읽다]AI, 빅데이터·딥러닝 없어도 된다?

최종수정 2020.05.07 06:30 기사입력 2020.05.07 06:30

댓글쓰기

AI는 '먹다'와 '만찬(저녁)'을 어떻게 구분할까요? 지금까지는 방대한 데이터와 딥러닝을 통한 학습으로 구분했다면, 앞으로는  학습 경험이 없어도 이미 저장된 데이터를 변형하고 해석해 학습했던 문제와 학습하지 않았던 문제 간의 특징을 분석해 구분해낼 수 있게 됩니다. [사진=유튜브 화면캡처]

AI는 '먹다'와 '만찬(저녁)'을 어떻게 구분할까요? 지금까지는 방대한 데이터와 딥러닝을 통한 학습으로 구분했다면, 앞으로는 학습 경험이 없어도 이미 저장된 데이터를 변형하고 해석해 학습했던 문제와 학습하지 않았던 문제 간의 특징을 분석해 구분해낼 수 있게 됩니다. [사진=유튜브 화면캡처]


[아시아경제 김종화 기자]인공지능(AI)이 우리 일상을 장악한지는 오랩니다. AI가 프로바둑 기사를 이긴 사실은 인류의 역사의 이정표가 될 정도로 무거운 사안이 될 정도입니다. AI의 이런 성장은 수많은 시간과 비용이 투입해 축적한 데이터 등을 오래도록 학습한 결과라고 할 수 있습니다.


AI는 인간에 의해 만들어져 인간과 유사한 지능을 갖춘 컴퓨터 시스템이라고 할 수 있습니다. AI는 학습을 통해 데이터에 포함된 패턴과 규칙 등을 컴퓨터 프로그램 속의 알고리즘으로 분석해 행동의 결과를 추론하는 것입니다. AI를 만드는 대표적인 방식이 기계학습과 딥러닝입니다.

기계학습은 인간이 각 문제에 대한 규칙과 해답을 제공해 학습시키는 방식이고, 딥러닝은 인간의 뇌와 유사한 인공신경망을 이용해 기계가 스스로 학습하게 하는 방식입니다. 그런데 최근 이런 학습의 과정이 필요없는 AI가 등장해 주목받고 있습니다.


인간과 AI의 가장 큰 차이점은 무엇일까요? 가령 자동차 중 소나타가 세단이라는 판단을 할 경우 AI는 카테고리별로 구분된 사전 데이터가 있어야 객체를 식별할 수 있습니다. 자동차가 무엇이며, 어떻게 생겼고, 어떠한 종류들이 있다는 빅데이터를 학습하거나 검색해야 가능하지요.


반면, 인간은 굳이 데이터를 검색하지 않아도 됩니다. 몇 가지 정보 만으로 직관적으로 소타나는 세단이라고 판단합니다. 물론 이 경우에도 자동차에 대한 기초적인 상식이 있어야 하겠지만, AI처럼 광범위한 정보 데이터를 필요로 하지는 않습니다.

이렇게 인간의 평범한 능력에서 영감을 받아 개발된 특별한 AI의 학습 능력을 '제로샷 학습(Zero-shot learning)'이라고 합니다. 제로샷 학습을 통해 AI가 빅데이터와 딥러닝의 지난한 시간이 없이도 인간처럼 아주 적은 정보 만으로 정답을 추론해낼 수 있게 된 것이지요.


AI 개발도 대량의 데이터와 컴퓨팅 자원 없이, 그리고 인간의 개입 없는 비지도 학습으로 이뤄진다는 말입니다. AI 발전의 대세인 딥러닝을 능가하는 방식이 개발된 것입니다. 딥러닝 방식이 자연어처리(NLP)와 이미지 분류 등에서 뛰어난 성능을 과시하고 있지만 경제적인 면에서 넘어야 할 산이 많은 것도 사실입니다.


모든 산업 분야에서 기계학습이 가능할 만큼의 빅 데이터를 확보하기도 쉽지 않고, 설사 확보했더라도 실제 사용할 수 있게 데이터를 정제·가공하는데 막대한 비용이 발생하는 등 다양한 숙제가 남아있기 때문입니다. 제로샷 학습은 적은 양의 데이터로도 딥러닝 만큼의 효과를 낼 수 있는 새로운 방식인 것이지요.


제로샷 학습은 기계학습에서 많이 사용되는 '전이학습'에서 발전된 방식으로 데이터 간의 관계와 공통점을 이용해 정답을 찾는 방식에 대한 학습입니다.


예를 들어 문제 A에 대한 정답이 문제 B, C, D 등 다른 문제에도 존재할 경우 AI가 A~D 문제들의 관계를 분석해 공통점을 파악합니다. 그리고 그 공통점을 분석해 정답을 찾아내는 방식입니다. 데이터가 풍부하지 않아도 정답을 유추할 수 있는 것이지요.


이 방식을 가장 적절하게 활용하고 있는 곳이 구글의 '인공신경망 기계번역(GNMT)'입니다. 시스템이 한 번도 해보지 않았던 언어 간 번역을 다른 언어 사이의 번역 데이터를 활용해 유추하는 방식입니다. 학습한 경험이 없어도 이미 저장된 데이터를 변형하고 해석해 학습했던 문제와 학습하지 않았던 문제 간의 특징을 분석해 답을 예측하는 것입니다.


학습된 데이터의 양으로 AI의 성능을 판단하는 시대는 저물고 있습니다. AI 개발 과정에서 데이터 학습 과정이 대폭 줄어든다면 엄청난 시간과 비용을 절약할 수 있습니다. 인간의 역량을 뛰어넘는 AI도 곧 등장하지 않을까요?




김종화 기자 justin@asiae.co.kr

<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

간격처리를 위한 class