포스테키안
2022 가을호 / 포스텍 연구실 탐방기
POSTECH Computer Vision Lab
인간의 지능적 활동에서 가장 중요한 것은 빛을 통해 우리 눈으로 들어오는 시각 정보입니다. 우리는 눈을 통해 일상 속에서 물체를 인식하고, 사람을 알아보고, 책을 읽고, 운전하고, 스포츠를 하거나 요리를 하죠. 이 모든 것은 우리가 가진 놀라운 시각지능 덕분에 가능합니다. 이러한 능력을 컴퓨터가 온전히 가지는 날이 올 수 있을까요? 인공지능의 핵심 분야인 컴퓨터비전Computer Vision은 인간 수준 또는 그 이상의 시각지능 기술을 구현하겠다는 목표를 가지고 빠르게 발전하고 있습니다. 특히, 최근 10여 년간 컴퓨터비전 분야는 인공지능의 발전과 함께 괄목할만한 성장을 거두었습니다. 표준적인 물체인식 기술은 이미 5년 전에 특정 환경에서 사람의 능력을 뛰어넘는 결과를 보여주었고 컴퓨터가 인터넷 영상들을 스스로 학습하여 의미 있는 정보를 파악하고 새로운 영상을 생성하는 기술들도 개발되었죠. 이러한 컴퓨터비전 기술들은 이제 스마트폰, 인터넷, 로봇, 카메라 시스템, 자율주행자동차 등에 광범위하게 적용되며 전 세계 산업 분야의 차세대 인공지능 핵심기술이 되었습니다.
포스텍 컴퓨터비전 연구실에서는 곽수하, 박재식, 조민수 3명의 교수가 함께 팀을 이루어 이미지, 비디오, 3차원 데이터에 대한 인식, 해석, 생성 문제를 다루는 다양하고 폭넓은 연구를 진행하고 있습니다. 각 교수가 집중하는 연구 주제는 다르지만, 긴밀하게 협력하며 연구를 진행합니다.
먼저, 곽수하 교수는 인간 혹은 그 이상의 ‘유연하고 강인한 시각지능’ 기술을 집중적으로 연구하고 있습니다. 컴퓨터비전 기술이 크게 발전했다고는 하나 여전히 실제 환경에서 인간처럼 배우고 인식하며 상호작용하는 수준에는 크게 미치지 못하는 것이 현실입니다. 최신 기술이라 하더라도 학습 시 사람에게 지나치게 의존하고, 학습 데이터가 가진 오류나 편향에 취약하며, 악천후나 저조도 같은 극한 환경에서 성능이 크게 하락하고, 사전 정의되지 않은 대상은 인식하지 못하는 등의 문제를 가지기 때문이죠. 곽수하 교수는 이러한 문제로부터 자유로운, 그래서 실험실 환경이 아닌 실세계에서 초인간 수준의 성능을 선보이는 기술 개발을 주요 목표로 하고 있습니다.
다음으로, 박재식 교수는 ‘3차원 공간 이해’와 ‘영상 생성’ 분야를 중점으로 연구하고 있습니다. 지능 로봇, 자율주행 기술에 자신을 둘러싼 공간을 이해할 수 있는 인공지능이 빠질 수 없겠죠? 이를 위해서 실제 3차원 공간을 정확하게 복원하고, 그 공간 안에 무엇이 있는지를 파악하는 딥러닝 기술을 개발하고 있습니다. 최근에는 주어진 영상으로부터 빛의 공간을 하나의 함수로 표현하는 신경망 기반 기법도 연구하고 있습니다. 그리고 영상 생성 분야 연구로는 기존의 기법보다 훨씬 빠르고 인간의 상식에 부합하는 영상 생성 기법에 관한 연구를 진행하고 있습니다.
마지막으로, 조민수 교수는 영상의 이면에 놓인 ‘고차원적 관계구조’를 이해하는 컴퓨터비전 연구에 집중하고 있습니다. 영상 간의 관계 추론 문제를 중심으로 영상정합, 대칭탐지, 물체인식, 물체조립, 비디오 행동인식 등의 주제들을 탐구하고 있고 이와 관련한 머신러닝 연구도 수행하고 있습니다. 이를 통해 최근에는 물체 간의 대응 관계를 찾아내는 연구, 영상 내의 대칭구조를 파악하는 기법, 한두 장의 영상만으로 물체인식을 수행하는 메타러닝 기법, 양자화 기법을 활용하는 효과적인 영상생성 방법론, 비디오를 보고 앞으로 일어날 미래를 예측하는 연구 등 다양한 연구를 발표했습니다.
포스텍 컴퓨터비전 연구실은 최근 몇 년 사이 명실상부 한국 최고의 컴퓨터비전 연구그룹으로 성장했으며 인공지능 분야에서 세계적으로도 인정받는 뛰어난 연구성과를 내놓고 있습니다. 올해 2022년에는 컴퓨터비전 최우수 국제학술대회인 IEEE Conference on Computer Vision Pattern RecognitionCVPR에서 총 16편의 논문을 발표하며 연구실 및 개별교수로 국내 최다 연구성과를 내었고, 이중 한편은 최우수논문상 최종 후보에 올라 그 우수성을 인정받았습니다. 또한, 또 다른 컴퓨터비전 최우수 국제학술대회인 European Conference on Computer VisionECCV, 머신러닝 최우수 국제학술대회인 Conference on Neural Information Processing SystemsNeurIPS에도 각각 6편에 달하는 논문을 발표할 예정입니다. 이러한 성과에 힘입어 최근 연구실 박사과정 학생들도 Google PhD Fellowship, Qualcomm Innovation Fellowship, Naver PhD Fellowship, Samsung Humantech Thesis Prize 등 국내외 유수 연구기관들이 수여하는 상을 수상하고 있답니다.
현재 포스텍 컴퓨터비전 연구실은 박사, 석박통합, 석사과정 학생들을 모두 합해 50명 정도가 됩니다. 세 명의 교수가 함께 연구실을 운영하다 보니 규모가 포스텍에서는 큰 편이죠. 컴퓨터공학과 출신 학생들이 다수이긴 하지만, 전자과, 기계과, 수학과, 산업공학과 등 다양한 학과를 전공한 학생들이 함께 모여있습니다. 연구실 생활은 자유로운 편이라 자신의 생활패턴에 맞게 연구하며 자유롭게 토론하는 화기애애한 분위기가 자연스럽게 형성되어 있습니다. 연구실 중앙에는 큰 공용공간이 있는데 이곳에서는 연구실 정식 멤버들 이외에도 연구참여를 진행하는 학부생들이 드나들며 선배들과 함께 공부하는 모습을 종종 볼 수 있습니다. 이러한 연구참여를 통한 결과물들이 다수의 학부생 과제연구 수상작으로 이어지고 있고 (과제연구 최우수상, 우수상 등 7건), 또한 다수의 최우수 국제학술대회 논문으로 이어지기도 했습니다 (2018년부터 현재까지 CVPR, ECCV 등 4편). 매주 금요일 아침에는 교수들과 학생들이 모두 함께 모이는 정기 세미나가 열리는데, 최근 주목받는 연구와 자신의 연구를 발표하며 열띤 토론을 이어가는 연구실 멤버들을 볼 수 있습니다.
컴퓨터비전 연구실 학생들은 졸업 후에 포스텍, KAIST, GIST 등 국내 유수 대학의 교수 임용은 물론, Google, Meta, NVIDIA, OpenAI, Inria, Qualcomm과 NAVER, Kakao, LG AI Research, Samsung 등 국내외 다양한 연구소, 기업으로도 진출하고 있습니다. 그리고 대학원 기간에도 국내외 연구소에서 인턴 경험을 쌓고 있는 학생들도 많답니다.
컴퓨터비전은 우리 일상을 둘러싼 시각지능 문제를 직접적으로 다루는 분야이기 때문에 인공지능 분야 가운데서도 가장 흥미진진하면서도 다양한 문제들을 탐구할 수 있는 연구분야입니다. 특히, 이론과 실제가 균형 잡혀 있어서 배울 것도 많고 다양한 진로를 개척할 수 있다는 장점도 있죠. 다양하고 흥미로운 연구 주제가 항상 준비되어 있으니 관심 있는 학생들은 포스텍으로 와서 컴퓨터비전 연구실과 함께해 주길 바랍니다!
글 / 컴퓨터공학과 조민수 곽수하 박재식 교수님