다중 교사 증류 방식으로 여러 인코더 기능을 하나에 통합
온보드 환경서 고성능 AI 구동 가능… 로봇 도입 장벽 낮춰
네이버랩스 유럽이 자율주행 로봇용 범용 인코더 '디바인'을 공개했다. /네이버 제공
네이버랩스 유럽이 자율주행 로봇용 범용 인코더 '디바인(DIVINE)'을 23일 공개했다. 그동안 로봇이 여러 개의 인공지능(AI) 인코더를 따로 두고 처리하던 작업을 하나의 인코더로 통합한 기술이다. 메모리 사용량은 90%가량 줄였고 처리 속도는 최대 12배 끌어올렸다.
인코더는 로봇이 카메라, 라이다 등 센서로 수집한 데이터를 AI 모델이 처리할 수 있는 형태로 변환하는 장치다. 그동안 자율주행 로봇은 위치 추정, 깊이 계산, 공간 이해, 사람 인식 같은 작업마다 각각의 AI 모델이 별도의 인코더를 활용해 동일한 입력 데이터를 여러 번 중복 처리해야 했다. 이 때문에 메모리 사용량과 연산량이 과도하게 늘어나는 문제가 있었다.
네이버랩스 유럽은 이를 '다중 교사 증류' 방식으로 풀었다. 이미지, 공간, 사람 인식 등 분야별 전문가 '교사' 모델에서 핵심 지식만 추출해 하나의 '학생' 모델에 이식하는 방식이다. 디바인은 2D 이미지 이해, 3D 공간 재구성, 사람 인식 등을 각각 전문으로 처리하던 여러 인코더의 기능을 하나로 응축한 형태로, 로봇은 디바인 하나만 탑재하면 다양한 AI 작업을 모두 처리할 수 있다.
실제 실험 결과 성능 효율은 크게 향상됐다. 여러 인코더를 탑재했을 때와 비교해 인코더 메모리 사용량은 90%가량 줄었고, 인코딩 처리 속도는 최대 12배 빨라졌다. 로봇 전체 메모리 사용량도 약 62% 감소했으며 시스템 처리 속도는 최대 4배까지 향상됐다.
기존 로봇용 AI 모델은 방대한 연산량 때문에 주로 서버 환경이나 고성능 컴퓨팅 장비에서 구동돼왔다. 디바인은 적은 메모리와 연산량으로도 AI 기능을 실행할 수 있어 로봇에 직접 탑재하는 온보드 환경에서의 활용성을 높였다. 비싸고 무거운 연산 장치를 갖춘 대형 하드웨어가 없어도 다양한 형태의 로봇에 고성능 AI를 적용할 수 있는 기반이 마련된 셈이다.
확장성도 갖췄다. 새로운 AI 기능을 쉽게 추가할 수 있도록 설계돼, AI 모델이 업그레이드될 때마다 새 로봇을 도입할 필요 없이 기존 로봇에 탑재된 디바인을 업데이트하면 성능을 끌어올릴 수 있다.
이동환 네이버랩스 비전그룹 리더는 "전세계적으로 피지컬 AI 상용화를 위해 로봇 두뇌 경량화가 주요 화두로 떠오르고 있다"며 "디바인은 일상과 산업 현장 전반에 걸쳐 AI 로봇 도입 장벽을 낮추는 데 기여할 것"이라고 말했다.
네이버랩스 유럽의 디바인 관련 연구 2건은 '2024 유럽컴퓨터비전학회(ECCV)'와 '2025 컴퓨터비전 및 패턴인식 컨퍼런스(CVPR)'에 각각 채택된 바 있다.
Copyright ⓒ 디지틀조선일보 - 디지틀조선TV