(왼쪽부터) 넷마블 AI센터 오인수 실장, 안수남 팀장, 장시온, 오신혁, 서호
넷마블은 지난 11월 7일부터 11일까지 도미니카공화국 푼타카나(Punta Cana) 및 온라인에서 동시 개최된 EMNLP 2021(Empirical Methods in Natural Language Processing 2021, 이하 EMNLP)의 AI 번역 후보정 기술 챌린지에서 한국 게임업계 최초로 우승을 차지했다고 12일 밝혔다.
EMNLP는 세계 최고 권위의 자연어처리 분야 컨퍼런스로, AI 번역, 챗봇, 기계 독해 등 언어 데이터 기반 자연어처리 접근법에 관한 다양한 연구를 다룬다.
이번 EMNLP에서는 컨퍼런스 외에도 AI 번역 및 전문가 번역 데이터 동시 학습을 통해 AI가 번역 성능을 개선해나가는 후보정(Automatic Post Editing, APE) 기술 챌린지가 개최됐다.
넷마블이 이번 챌린지에서 선보인 AI 번역 후보정 기술의 핵심은 ‘커리큘럼 학습’과 ‘멀티태스크 학습’이다. ‘커리큘럼 학습’은 번역 초안과 후보정 모델 간 상관관계를 AI가 학습하여 번역 퀄리티를 개선하는 모델을, ‘멀티태스크 학습’은 후보정 필요 단어를 분류하는 태스크 등 연관성 있는 항목들을 AI가 하나의 카테고리로 엮어 학습하는 모델을 각각 일컫는다.
논문 발표를 진행한 넷마블 AI센터 안수남 팀장은 “이번 챌린지 과제로 출제된 AI 번역본 데이터가 이미 상당히 고품질이었기에 어떤 단어와 표현을 유지 및 수정해야할지 판단하는 AI 로직이 기술 평가의 핵심이었던 것 같다”며, “넷마블에서 자체 개발한 AI 번역 후보정 기술은 오번역율(Translation Error Rate, TER)과 번역 신뢰도(Bilingual Evaluation Understudy Score, BLEU)를 합산한 최종 평가에서 글로벌 탑 플랫폼 기업보다 더 높은 점수를 받아 우승할 수 있었다”고 설명했다.
넷마블 AI센터 오인수 실장은 “넷마블은 글로벌 게임 퍼블리셔로서 이미 다양한 게임에 AI 번역 기술을 적용 중인데, 기존에는 사람이 직접 진행하던 번역 후보정 작업에 AI 기술을 적용하면서 번역 퀄리티 향상 및 시간 단축 등 여러 이점을 얻게 됐다”며, “향후 기술의 핵심인 커리큘럼 학습과 멀티태스크 학습을 단계별로 고도화하여 궁극적으로는 사람의 검수 없이도 높은 퀄리티의 서비스를 제공할 수 있도록 기술을 발전시켜나갈 것”이라고 말했다.