예를 들어 "동물원의 호랑이가 사람을 물어 죽이는 것을 봤습니다. 너무나 슬픈 장면이었어요" 라는 대사를 촬영한다고 가정해 보겠습니다. 겁에 질려 호흡이 가쁜상태에서 울면서 얘기할 수도 있고 호랑이 관리를 제대로 못한 동물원 측에 화가나서 분노에 차서 말 할 수도 있고 그도 아니면 모든 것을 받아들이고 담담하게 얘기할 수도 있습니다. 영화를 찍을 당시에는 어떤 감정이 좋을 지 확신 할 수 없을 것입니다. 이 때 각각의 감정선을 따로 따로 촬영해서 보관해 두었다가 편집 시에 각각의 촬영 분을 섞어서 최적의 영상을 하나 만들어 내는 것입니다.
아래 영상을 보면 아시겠지만, 각각의 감정에 따라 연기를 하면 똑 같은 대사를 하더라도 오디오 싱크가 맞지 않습니다. 따라서 섞고자 하는 두 영상의 오디오 싱크를 맞춥니다.(오이오 싱크가 맞춰지면 이에 따라 영상 싱크도 맞춰집니다.)
그리고 나서 섞고자 하는 두 화면의 비율을 어느 정도로 할 것인지를 정합니다. 예를 들어 처음에는 중립 100%로 시작해서 중간에 두려움 100%으로 갔다가 끝날 때는 중립과 두려움을 50:50으로 섞을 수 있습니다.
이 기술은 거의 실시간으로 구현할 수 있는데다가 표정변화가 굉장히 매끄러워서 관객들이 이것이 합성된 영상인지 알아차리기 힘든 정도의 높은 완성도를 갖고 있다고 합니다. 편집이나 재촬영 문제로 늘 골머리를 앓아왔던 감독들에게는 더할나위 없는 희소식일 것 같습니다.
이와 같이 파라미터 값을 실시간으로 변화 시키는 것은 음악 제작 시 볼륨값의 조정이나 이펙터 양의 조절 등 오토메이션이라는 기술로 오래전 부터 활용되어 왔었는데요, 이와 비슷한 기술이 이제 영상에서도, 그것도 아주 높은 수준의 완성도로 구현되는 시대를 맞이한 것으로 보입니다. 청각에 비해 시각은 파급력이 월등히 높다는 점에서 앞으로 이 기술이 어디까지 발전하게 될지 기대되네요.
디즈니 홈페이지에서 관련 내용 보기
참조 기사 보기
댓글 없음:
댓글 쓰기