NHN이 자유대화 분야 인공지능(AI) 빅데이터 구축에 나선다.
NHN은 한국어 음성인식 서비스 활성화를 위한 자유대화 분야 ‘AI 학습용 데이터 구축 사업’ 수행기관으로 선정됐다고 6일 밝혔다.
이번 프로젝트는 과학기술정보통신부 주관, 한국정보화진흥원(NIA)이 추진하는 ‘제2차 인공지능 학습용 데이터 구축 사업’의 일환으로 진행된다. 국내 노인, 소아 계층의 음성 대화 DB, 학습 데이터 등이 부족하다는 점에 착안, 양질의 데이터를 확보해 이를 필요로 하는 곳에 활용되도록 기여한다는 계획이다.
자유대화 분야 연구는 NHN을 비롯해 NHN다이퀘스트, NHN에듀, 크라우드웍스, 아임클라우드, 셀바스 AI, 원더풀플랫폼, 잉글리시헌트, EBS 등 인공지능, 클라우드, 교육 전문 기업·기관 등이 참여하고, 구축된 데이터의 실제 연구에 서강대, 성균관대, 건국대, 한국외대 등 4개 대학도 함께한다.
NHN은 인공지능 및 자연어 처리 기술에 대한 오랜 노하우를 바탕으로 관련 데이터 ▲수집, ▲가공, ▲검수, ▲학습, ▲유효성 검사 관리를 위한 시스템 개발 등 전 과정을 지원한다. 데이터 수집 과정에 인공지능 스피커, 음성 기반 채팅 서비스 등 효율적인 방식을 도입하고, EBS 교육채널, NHN 에듀 교육서비스 채널 등을 적극 활용해 다양한 테스터 및 DB를 확충해 나갈 예정이다.
또한, 크라우드 소싱 기반의 AI 데이터 구축을 통해 관련 일자리 창출에도 힘쓴다. 기초생활수급자, 자립아동, 독거노인 등 사회적 배려 대상자 약 6천여명을 모집할 계획이다.
이번 프로젝트는 국내 대표 바둑AI '한돌(HanDol)'을 개발한 박근한 NHN 기술연구센터 센터장이 총괄한다. 박근한 센터장은 “자유대화 분야의 AI연구를 통해 한국어 음성인식 품질을 한층 높이고, 음성인식뿐 아니라 자연어 처리 분야 발전에도 기여해 나갈 것”이라며, “이번 연구로 구축된 정보가 다양한 곳에 적극적으로 활용되길 희망한다”고 말했다.
구축된 데이터는 AI Hub를 통해 공개할 예정이며, 연구 기간 중 해커톤 등을 개최해 학습 데이터 활용 활성화에도 앞장선다는 계획이다.
한편, 과학기술정보통신부와 한국정보화진흥원은 지난 달 'AI 학습용 데이터 구축 사업 온라인 출범식 및 상생협약식'을 갖고, 사업의 성공적 추진을 통한 AI 산업 발전 및 일자리 창출에 기여할 것을 다짐했다.