김정희 연구원은 “딥러닝과 머신러닝(기계학습)라는 용어가 혼용되고 있지만, 머신러닝이 좀 더 큰 개념”이라며 “머신러닝의 방법론 중 하나가 딥러닝이고, 그 방법론 중 딥러닝이 가장 많이 쓰여 머신러닝과 동일시되고 있는 것”이라고 설명했다.
딥러닝의 방식은 이렇다. 과거 데이터들은 사전지식을 동원해 데이터를 분류한다. ‘귀가 뾰족하고 네 발이 보이는 사진’이라는 사전지식을 입력해 고양이 사진을 찾아낸다. 이때 고양이의 귀나 다리가 사진에서 잘 안보이면 어떻게 될까? 기계는 바로 고양이 사진이 아니라고 분류했다. 사전지식의 내용과 다르기 때문이다. 하지만 딥러닝은 이러한 사전지식을 사용하지 않는다. 일단 데이터를 넣어놓고 기계가 스스로 특성을 분류한다. 이때 무작정 데이터가 많아선 안되며, 실제로 고양이 사진을 무엇인지 알려주는 이른바 ‘정답’ 데이터도 많아야 한다.
댓글 없음:
댓글 쓰기