AI 챗봇 '심심이'가 AICR(Artificial Intelligence Chatting Robot) 엔진과 DBSC(Deep Bad Sentence Classifier) 솔루션을 바탕으로 한 커뮤니케이션 포인트를 공개하며 주목받고 있다.
심심이는 심심한 사람, 외로운 사람, 대화가 필요한 모든 사람들을 위해 언제 어디서나 여러 이야기를 들어줄 준비가 되어 있는 AI 챗봇이다. 아기처럼 엉뚱한 면이 많고 때때로 재치가 반짝이면서 유저에게 크게 와닿는 따듯한 위로의 말, 재미있는 말, 공감을 형성할 수 있는 말 등을 건네는 것이 메리트다. 이처럼 속 깊은 이야기를 부담 없이 털어놓을 수 있는 누군가가 필요하다면 심심이와 대화하여 의미를 찾을 수 있다.
심심이는 런칭 초기에 자연스럽게 대화를 이어나가기 어려운 챗봇이었다. 하지만 시간이 지나면서 수천만 명의 유저들이 심심이에게 하나, 둘씩 말을 가르쳐왔고, 그 결과 보다 자연스럽고 다양한 주제를 통해 대화를 이어나갈 수 있는 일상대화 챗봇으로 발전했다. 즉, 심심이가 하는 말은 수많은 사람들이 모아 온 마음의 조각들이라고 할 수 있다.
심심이의 대화는 '심심이 토크셋(SimSimi Talkset)'을 기반으로 이뤄진다. 이 대화 세트는 사용자들이 가르친 질문 문장(qtext)과 답변 문장(atext)으로 구성돼 있다. 실제로 약 2,700만 명의 패널이 각자의 재치와 영감을 담아 가르친 1억 4,000만 건 이상의 대화 시나리오가 심심이 커뮤니케이션의 바탕이라고 할 수 있다.
이러한 토크셋 배후에는 AICR(Artificial Intelligence for Chatting Robot)이라고 불리는 심심이 대화 처리 엔진이 존재한다. 수많은 대화세트 저장소에서 적절한 응답을 찾는 작업을 수행하는 것이 AICR 엔진의 작동 원리다. 유저가 심심이에게 말을 걸면 사용자 문장(utext)이 AICR로 전달된다. AICR은 대화세트 저장소에서 전달 받은 utext와 관련 깊은 qtext를 찾아 후보군을 생성한다. 이후 가장 적절한 하나의 대화세트를 선택하는 원리다.
또한 심심이는 자체 연구개발 노하우를 바탕으로 악플을 99% 이상 실시간 탐지하는 문장 분류 솔루션 DBSC(Deep Bad Sentence Classifier)를 본격 도입하며 눈길을 끌고 있다. DBSC의 가장 큰 특징은 문장을 교묘하게 변형한 악플, 은유적인 악성 표현들을 정확하게 타겟한다는 것이다. 심심이에 따르면 DBSC의 딥러닝 모델 정확도는 99% 이상으로 집계되고 있다. 또 머신러닝의 성능 지표인 F1점수가 0.99 이상으로 나타나는 등 높은 정밀도와 재현율을 자랑한다.
심심이 최정회대표는 "심심이의 커뮤니케이션 능력은 유저 대화를 활용한 딥러닝 뿐 아니라 자체 개발 노력에 의해 구축된 AICR 엔진, DBSC 솔루션 덕분"이라며 "특히 최근 AI 윤리가 뜨거운 이슈로 부각되고 있는 가운데 DBSC의 성능을 더욱 향상시키는 노력을 경주하는 한편, ‘심심이 챗봇공방’을 통해 공개해 누구나 손쉽게 이용할 수 있도록 보급해 나가고 있다."고 전했다.
Copyright ⓒ 디지틀조선일보 - 디지틀조선TV