2015년 12월 12일 토요일

[인공지능]인공지능 개발에 가속도를 붙이는 베이지언(Bayesian)

오늘은 베이지언(Bayesian Program Learning 또는 BPL)이 머신러닝의 또 다른 방향을 제시한다는 내용의 기사를 소개해드리려고 합니다. 그동안 머신러닝에 대한 기사를 몇 번 소개해 드렸는데요, 그 기사들을 통해서 알 수 있었던 것은 머신러닝을 하기 위해서는 컴퓨터가 학습할 충분한 양의 데이터가 필요하다는 것이었습니다. 컴퓨터가 패턴을 읽어내기 위해서는 대량의 데이터가 필요하다는 것이었죠. 그런데 오늘은 대량의 데이터가 없이도 '마치 사람과 같이' 한 번 보면 그대로 모방할 수 있는 인공지능을 개발할 수 있다는 내용을 소개해 드리려고 합니다.  

원문 기사 보러가기는 여기를 눌러주세요.

이 그림은 사람과 기계가 지구상의 글자들을 어떻게 모방하는지를 보여준다. (Credit: Danqing Wang)

아래 영상에는 연구진이 어떤 연구를 했는지가 그대로 설명되어 있습니다. 사람은 화면 속에 나오는 등산장비를 한 번 보면 그 등산 장비가 어떤 특징을 갖고 있는지 금세 부분 별 특징을 짚어낼 수 있습니다. 그리고 등산장비와 핸드폰 줄 같이 비슷하게 생겼지만 전혀 다른 카테고리에 속하는 두 물건이 섞여 있을 때 등산장비만을 쉽게 골라낼 수 있습니다. 어린이들은 한 번 동물을 보면 그 동물이 무슨 동물인지 알고, 자동차 엔지니어는 부품 교체를 어떻게 하는지 한 번 보면 그것을 그대로 따라 할 수 있습니다. 과연 기계도 이처럼 한 번 보면 그대로 모방할 수 있을까요? 



연구진은 이를 확인하기 위해 산스크리트어와 티벳어등 모두 50개의 언어에서 1623개의 알파벳을 사용해 실험을 했습니다. 각 알파벳 뿐만 아니라 각각의 알파벳에 해당하는 손글씨를 수집했습니다. 그리고 기계에게 이 글자들의 생김새를 보여주는 동시에 사람들이 이 글자(처음보는 글자)를 보고 어떻게 따라 쓰는지, 손글씨를 쓰는 과정도 보여주었습니다. 

그런데 이 과정에서 주목할 만한 사실을 발견하게 됩니다. 사람들이 글자를 보고 따라 쓰는 방법을 분석한 결과 획을 긋는 순서 등에서 공통점이 발견된 것입니다. 사람의 경우 처음보는 글자라고 할 지라도 그 글자를 어떻게 따라 쓰면 좋을지에 대해 공통적으로 인식하는 패턴이 있다는 얘기입니다. 바로 이부분이 연구진이 원하는 것이었습니다. 연구진은 기계도 처음 보는 글자에서 사람과 같이 패턴을 발견해서 그 글자를 따라 쓸 수 있는가 하는 것을 알아내고자 했습니다. 

이를 테스트 하기 위해 기계에게 글자 하나를 보여주고, 그 글자를 쓰는 방법을 몇 가지 알려준 다음, 기계 스스로 그 글자를 쓰도록 했습니다. 그리고 나서 똑 같은 글자에 대해 기계가 쓴 것과 사람이 쓴 것을 구분할 수 있는지 사람을 대상으로 "비주얼 튜링 테스트"를 했습니다. 튜링테스트 결과 사람이 쓴것과 기계가 쓴것을 제대로 골라낸 비율은 25% 이하였습니다. 무려 75%가 기계가 쓴 글자와 사람이 쓴 글자를 구분해 내지 못한 것입니다. 이 정도 되면 기계가 사람만큼 한 번 보고 제대로 분류할 수 있는 학습 능력을 가졌다고 봐야 할 것입니다. 

이 연구진들은 자신들이 개발한 베이지안 학습법에 대해 굉장히 자신있는 모습입니다. 난생 처음보는 문자를 빠르게 배워야 하는 시스템이 필요하다면 그건 아마 자신들이 개발한 시스템일 것이라고 얘기 합니다. 물론 문자 분류작업이라는 것이 아주 간단한 작업이어서 아직 보완할 점이 많다는 것에 대해서도 인정합니다. 그러나 동시에 알고리즘이 다듬어 진다면 차세대 음성인식 시스템 등에 활용될 수 있을 것으로 전망하는 등 베이지언 알고리즘이 머신러닝에 있어 큰 변화를 가져올 것임을 예고합니다.  

최근 들어 쏟아져 나오는 인공지능 관련 기사들을 보고 있으면 정말 그 발전 속도가 어마어마하다는 생각이 듭니다. 불과 어제까지만 하더라도 머신러닝의 필수 요소로 충분한 양의 데이터가 거론되었는데, 이런 이야기가 나온지 불과 1~2년 사이에 이제는 데이터의 양도 그리 많이 필요하지 않다는 얘기가 나오기 시작합니다. 머신러닝, 그리고 인공지능 앞으로 어디까지 갈까요? 그리고 얼마나 빨리 갈까요?


연구진
MIT, Joshua Tenenbaum : Research Article 보러가기
NYU, Brenden Lake 
University of Toronto, Ruslan Salakhutdinov 

댓글 없음:

댓글 쓰기