보고, 느끼고, 대화하는 감성 AI 챗봇의 진화 클레온 진상혁 대표 & 휴멜로 이자룡 대표 인터뷰 2021-12-01

챗봇 시장의 미래는 밝다. AI의 발전에 따라 챗봇 시장은 유례없는 큰 성장세를 보이는 중이다. 글로벌 시장조사업체인 마켓앤드마켓에 따르면 전세계 챗봇 시장은 2020년부터 연평균 29.7%의 성장률을 기록하며 2024년에는 10조 9410억원에 이르는 규모가 될 것으로 전망된다.


실제로 AI 기술의 고도화는 챗봇의 진화에 큰 역할을 했다. 머신 러닝(Machine Learning), 자연어 처리 기술(Neuro-Linguistic Programming, NLP) 등의 인공지능 기술은 챗봇의 성능을 크게 끌어올렸다. 시리나 구글 어시스턴트와 같은 개인비서 서비스부터 기업의 고객 문의 서비스, 음식점의 자동 주문까지 AI 기술에 기반한 챗봇 서비스는 이제 일상에서 쉽게 접할 수 있는 하나의 문화가 되었다. 


그렇다면 향후 AI 챗봇의 미래는 어떻게 될까? 지난 10월 스마일게이트 AI 센터는 ‘감성 AI 아바타 챗봇’ 공동 연구 개발을 위해 업계 최고의 스타트업인 클레온, 휴멜로 두 회사와 MOU를 체결했다. 기존의 챗봇과는 차별화된 서비스를 선보이겠다는 포부에서다. 클레온의 진상혁 대표와 휴멜로의 이자룡 대표와의 인터뷰를 통해 진화하고 있는 AI 챗봇의 현 주소를 확인할 수 있었다. 


| 감성 AI 아바타 챗봇, 무엇이 다를까 


‘챗봇(chatbot)’이라는 단어를 들으면 무엇이 연상되는가? 주로 메신저 형태의 텍스트를 기반으로 한 대화형 서비스가 떠오른다. 유저가 문장을 입력하면 챗봇이 그에 맞는 응답을 다시 텍스트로 출력하는 형태다. 텍스트 이외에는 음성을 활용한 보이스 챗봇도 종종 보인다. 그렇다면 스마일게이트 AI 센터에서 개발하고 있는 ‘감성 AI 아바타 챗봇’이란 무엇일까.


클레온휴멜로_1.jpg


클레온 진상혁 대표(이하 ‘진’) “기존 서비스들은 쌍방향 소통보다는 특정한 기능을 수행하는 일방향 소통이 대부분이라 AI 챗봇과 직접 대화한다는 느낌을 주기가 어려웠다. 이루다와 같은 대화형 AI 챗봇도 있었지만 텍스트 기반의 대화로 현실감이 다소 부족했다. 현재 개발 중인 감성 AI 아바타 챗봇 서비스는 텍스트 대 텍스트에서 보이스 대 보이스, 페이스 대 페이스까지 영역을 확장했다. 아바타의 얼굴, 체형, 목소리 등 비언어적 소통까지 더해 실제 사람처럼 화상통화를 하는 듯한 느낌을 받을 수 있다.” 

“무엇보다 유저들이 원하는 얼굴을 만들어서 캐릭터화 할 수 있고, 만들어진 캐릭터가 실시간으로 바로 상호작용할 수 있다는 게 기존 챗봇과는 가장 큰 차이다. 페르소나가 카페 아르바이트생이라면, 단순히 주문만 하는 것이 아니라 서로 인사를 나누고, 제품 재고도 확인하고, 음료를 추천 받는 등 더 친근한 대화가 가능하다.”


클레온휴멜로_2.jpg


테스트 모델 시연을 통해 진 대표가 설명한 ‘실제 사람처럼 화상통화를 하는 듯한’ 아바타 챗봇이 어떻게 구현되는가를 확인할 수 있었다. 사람 같은 아바타의 외관을 보며 실시간으로 대화하듯 주문이 가능했다. 기존의 텍스트뿐 아니라 외관과 음성까지 더 해진 AI 챗봇은 기존 스마일게이트 AI 센터가 지향하는 ‘인간다운 AI(Human-Like AI)’가 현실에서 구현된 장면이었다.  


| 보다 사람다운 AI 챗봇을 위한 특화 기술


사람처럼 실제로 보고 대화할 수 있는 챗봇에는 어떠한 기술이 필요할까. 단순히 생각해도 텍스트 기반 챗봇 이상의 기술력이 필요한 것은 자명하다. 현재 스마일게이트 AI센터와 클레온, 휴멜로가 개발 중인 감성 AI 아바타 챗봇은 고도화된 대화 엔진부터 음성합성 기술(TTS), 딥러닝 기반의 영상 생성 기술까지 최근 인공지능 분야에서 주목 받고 있는 기술의 집대성이라고 볼 수 있다.  




클레온휴멜로_3.jpg
휴멜로에서 서비스 중인 음성합성 솔루션 <프로소디> 

휴멜로는 감정 기반 개인화 음성합성 기술을 보유한 스타트업이다. 현재 AI 음성합성 솔루션인 <프로소디>를 개발해 서비스하고 있다. 2분 분량의 샘플 녹음본만 가지고도 다양한 문장을 음성화할 수 있으며, 한국어만 녹음을 해도 영어, 중국어, 일본어까지 같은 목소리로 구현할 수 있다. 특히 음정이나 음색, 감정 등 세부적인 요소들까지 조절해 실제 사람과 같은 고품질의 음성을 합성하는데 정평이 나 있다. 


휴멜로 이자룡 대표(이하 ‘이’) “서비스를 처음 출시했을 때 ‘음성합성계의 포토샵’이라고 불렸다. 빈 소리에 음의 길이, 높이, 음색, 감정, 단어 등 여러 요소를 하나씩 구분해서 원하는 음성을 만들어낼 수 있기 때문이다. 음성 샘플을 다양하게 요소화 할 수 있기에 원하는 부분만 바꿔 문장화 하거나 타 언어로 바꾸는 일이 가능하다.” 


클레온휴멜로_4.jpg


클레온은 영상 생성 솔루션 분야에서 혁신을 이끄는 업체다. 촬영없이 영상 콘텐츠를 만들 수 있는 <카멜로>라는 서비스를 출시했으며, 휴멜로와의 협업을 통해 자동 더빙, 버추얼 챗봇 등의 제품을 만들어 냈다. 클레온의 핵심 기술은 1장의 사진, 1분의 음성 만으로도 원하는 영상을 만들어내는 ‘딥 휴먼’ 이라는 기술이다. 

“대량의 데이터와 많은 시간이 소요되는 기술 대비 경량화를 시킨 것이 딥 휴먼의 핵심이다. 기존의 모델들은 얼굴 자체를 학습해서 영상을 바꾸는 방식이었다면, 우리는 얼굴에서 정체성이나 감정 등을 판별할 수 있는 네트워크 모델을 구성해 실시간으로 합성이 가능하게끔 만들었다. 그래서 사진 한 장만으로도 아바타를 생성할 수 있을 뿐 아니라 32가지 매개변수 조정을 통해 원하는 인물상을 더 정확하게 표현할 수 있다.“ 

이번 프로젝트는 각각의 기술 분야에서 두각을 나타내고 있는 세 회사의 만남이다. 특히 휴멜로와 클레온, 그리고 스마일게이트 AI 센터의 공통점은 인공지능 AI를 보다 ‘사람처럼’ 표현하기 위해 특화된 기술이라는 점이다. 

클레온휴멜로_5.jpg


“휴멜로의 경우 이름 자체가 ‘휴먼+멜로디’의 합성이다. 그만큼 창업 초기부터 ‘인공지능이 사람처럼 창의적일 수 있을까?’를 항상 고민해왔다. 주로 엔터테인먼트 쪽과 협업을 하며 사람과 닮은, 매력적인 AI 개발에 집중했다. 그만큼 이번 프로젝트 진행은 저희 회사의 방향성과도 완전히 부합하는 좋은 기회라고 생각한다.”



| 혁신적인 AI기술의 성장 동력은 ‘협업’

 

현재 스마일게이트 AI센터와 휴멜로, 클레온은 MOU를 맺고 프로젝트 검증을 위한 PoC(Proof of Concept) 단계를 진행 중이다. 연내에 AI 아바타 서비스의 프로토타입을 개발하는 것이 목표다. 스마일게이트 AI 센터가 전체 프로젝트를 매니징하며 기술적인 부분에서 협업을 이어나가고 있다. 


클레온휴멜로_6.jpg


“스마일게이트 AI센터의 경우 챗봇 기술을 가지고 있어서 전체적인 과정을 리드하고 통합하는 모습이 타 회사와는 확실히 달랐다. 우리 기술을 기반으로 제품이나 서비스를 개발하는 경우들이 많았는데, AI 센터는 명확한 자체 기술을 중심으로 우리나 클레온의 기술을 붙여 확장해 나가는 것이 인상적이었다.”


“프로젝트를 진행하다 보면 기획 단계에서 멈추는 경우가 잦다. AI센터의 경우 처음부터 실무팀들과 회의를 진행하고, 바로 기획안을 짜고, 실행에 옮기는 등 추진력이 굉장해서 대기업이 아닌 스타트업 같다는 인상을 받았다. 현재도 매주 실무진들끼리 주간 미팅을 진행하고 있다.”


클레온휴멜로_7.jpg


클레온과 휴멜로 모두 핵심 기술을 보유 업체인 만큼 현재 IT 뿐 아니라 교육, 방송 등 다양한 산업군의 회사들과 기술 및 서비스 개발을 진행하고 있다. 이미 두 회사가 오랜 시간 긴밀하게 협업하며 관계를 맺은 업체다. 더 혁신적인 AI 서비스를 만들고 새로운 가치를 창출하기 위해서는 무엇보다 ‘협업’이 중요하다는 것이 두 대표의 공통적인 의견이다.


“핵심 기술을 보유하는 것은 당연하고, 그 외에 제품을 만드는데 필요한 기술은 협업을 통해 많이 구축하고자 한다. 이제 막 시장이 커지기 시작한 타이밍이기 때문에 저희가 가진 기술이 가장 잘 활용될 수 있는 곳을 찾아 다양한 시도를 진행 중이다.”


“스마일게이트처럼 확실한 기술과 함께 강력한 IP를 가진 회사가 최적의 협업 파트너다. 기술만 있다고 해서 가치가 있는 것은 아니기 때문이다. 한유아처럼 사람들에게 친숙하고 매력적인 캐릭터에 우리의 기술력을 적용하면 더 새로운 콘텐츠를 만들어낼 수 있고, 더 많은 가치를 얻을 것이라고 생각한다.”


각각의 특화된 기술을 가지고 한 자리에 모인 세 회사의 만남. 이번 협업이 차별화된 매력과 감성의 AI 아바타 챗봇을 개발하는 것을 넘어, 인간다운 AI 기술의 발전과 더 많은 비즈니스 분야 확장의 기회가 될 것이라 기대한다.


 


EDITOR's COMMENT 

#Smiilegate.AI 

2020년 8월에 설립된 스마일게이트의 Smilegate.AI는 AI(인공지능) 기술을 기반으로 엔터테인먼트 산업에 특화된 연구를 진행한다. ‘재미있는 AI(Fun AI)’와 ‘인간적인 AI(Human-Like AI)’의 핵심 기술을 확보하고 실용화 가능한 혁신적 AI 기반 서비스를 지속적으로 발굴한다. Smilegate.AI는 인간처럼 감정을 표현하고 행동하며, 상대와 공감할 수 있고, 환경에 적응할 수 있는 종합적 인간화 AI 기술을 개발하는 한편, 다양한 이종 산업과의 연계를 통해 엔터테인먼트 분야의 새로운 비즈니스 기회를 창출할 예정이다. 

스마일게이트 뉴스룸에 실린 모든 컨텐츠는 언론에서 활용 하실 수 있습니다.
단, 콘텐츠를 기사에서 인용 시 ‘스마일게이트 뉴스룸’으로 표기 부탁드립니다.
관련 콘텐츠
관련 콘텐츠