‘모나리자가 입 열었다’ 사진 달랑 한 장으로 ‘동영상’ 만들어주는 인공지능 기술

By 정경환 2019-05-28

Youtube 'Egor Zakharov'

삼성전자 AI센터에서 공개한 모나리자 영상이 공개돼 관련업계뿐만 일반인들에게도 관심을 받고 있다.

23일 미국 IT전문매체 씨넷은 러시아 모스크바에 위치한 삼성전자 AI연구센터가 얼굴이미지 사진을 영상으로 변환하는 기술을 수학물리학 논문 초고사이트 아카이브(ArXiv.net)에 게재했다고 보도했다.

딥페이크(Deepfake)로 불리는 이미지, 영상변환 기술은 일반적으로 여러 장의 사진이 필요하지만 이번 삼성전자가 개발한 기술은 인물사진 한 장으로도 다양한 표정을 연출할 수 있는 영상을 만들 수 있다.

이번 연구에 대한 결과물 중에 특히 ‘마릴린 먼로’와 ‘모나리자’ 이미지를 영상으로 변환하는 모습을 유튜브에 공개해 대중의 흥미를 증폭시켰다.

이 기술은 여러 장의 사진을 학습하면서 공통된 움직임 패턴을 찾아내 변환결과물이 실제와 얼마나 유사한지 점수를 매기고 변환을 반복해 실물 동작에 근접하도록 한다.

아직 완벽한 것이 아니라 얼굴과 배경 부분이 다소 왜곡되는 모습이 보이지만 얼굴의 각도나 표정에 반응해 자연스럽게 영상으로 변환되는 모습은 상상 속에서나 가능했던 기술적 혁신이라 할 만하다.

논문의 저자들은 앞으로 이 기술이 화상회의, 멀티미디어, 게임산업에서 실질적인 효과를 낼 수 있을 것으로 예상했다.