공유하기

카카오톡
블로그
페이스북
X
주소복사

진화한 KT AI, ‘긴장된다’ 말하니 “까짓거 쫄지 마”라고 답했다


입력 2019.10.30 14:36 수정 2019.10.30 14:36        김은경 기자

‘감성·언어’ 지능 기술로 기존 딱딱한 AI 말투 벗어나

“AI는 거스를 수 없는 흐름”…KT, ‘AI 전문기업’ 선언

30일 서울 종로구 광화문 KT스퀘어에서 열린 ‘AI 컴퍼니 선언 기자간담회’에서 시연자가 KT의 AI 기술이 접목된 사례들을 선보이고 있다.ⓒ데일리안 김은경 기자

‘감성·언어’ 지능 기술로 기존 딱딱한 AI 말투 벗어나
“AI는 거스를 수 없는 흐름”…KT, ‘AI 전문기업’ 선언


딱딱한 말투에 기계적으로 답하던 기존의 인공지능(AI) 스피커. 사용하다 보면 어쩐지 혼잣말을 하는 것 같아 민망스러워 거부감을 느끼던 이용자들도 이제는 일상 언어로 자연스럽게 AI 스피커와 대화할 수 있게 된다.

KT는 30일 서울 종로구 광화문 KT스퀘어에서 기자간담회를 열고 자사의 AI 기술이 적용된 실제 사례들을 선보였다. 크게 ▲감성·언어 지능 ▲영상·행동 지능 ▲분석·판단 지능 ▲예측·추론 지능 등 4개 지능 영역에서 시연이 이뤄졌다.

먼저 ‘감성·언어’ 영역에서는 시끄러운 환경에서도 목소리를 정확히 인식하고, 여러 사람의 음성을 깨끗하게 분리하는 스피치 세퍼레이션(Speech Separation) 기술을 공개했다.

시끄러운 환경을 조성하기 위해 청소기 소리를 임의로 재생하자 시연장은 소음으로 가득 찼다. 이 상태에서 시연자 두 명이 동시에 한 마이크에 대고 한 명은 한국어로, 한 명은 영어로 말하는 소리를 녹음했다.

이후 녹음된 소리를 재생해보니 녹음 환경이 시끄럽고 사용한 언어가 달랐음에도 불구하고 각각의 목소리를 분리 인식해 잡음 없이 분리 녹음된 것을 확인할 수 있었다.

이필재 KT 마케팅부문장(부사장)이 30일 서울 종로구 광화문 KT스퀘어에서 열린 ‘AI 컴퍼니 선언 기자간담회’에서 발언하고 있다.ⓒKT

이어 문서기계 독해(MRC·Machine Reading Comprehension) 기술 시연이 진행됐다. AI에 ‘대화 스타일링 기술’을 적용해 말 그대로 대화 상대에 따른 말투나 목소리 톤 등이 입혀진다는 설명이다.

시연자가 기존의 어색하고 딱딱한 말투로 대화를 주고받던 AI 스피커에 “지니야 너 말투가 너무 딱딱해”라고 말하자 “그럼 편하게 이야기를 나눌 수 있는 지니를 불러줄게요”라며 다른 AI를 소환했다.

시연자가 “지니야 나 너무 긴장돼”라고 말하자 새로운 AI는 “까짓거 쫄지마”라고 능청스럽게 대답했다. 이어 시연자가 “너 말투가 왜 그래”라고 하니 “네가 반말하면 나도 반말한다”라고 응수했다.

한 문장만 녹음하면 영어 음성을 만들어주는 영어 개인화 음성합성(English P-TTS) 기술도 소개됐다. 시연자가 동화 ‘인어공주’에 나오는 한 문장을 영어로 녹음하자 잠시 학습 과정을 거친 뒤 시연자의 목소리와 말투, 톤으로 책을 읽어주는 모습이 시연됐다.

단어 간의 연결은 매끄러웠으며 음의 높낮이도 전혀 어색하지 않았다. 해당 기술에 대한 관심이 쏟아지자 이필재 KT 마케팅부문장(부사장)은 “6개월 이내에 관련 서비스를 출시하겠다”고 못을 박았다.

이어 다른 지능 영역 시연도 진행됐다. ‘영상·행동’ 영역에서는 다양한 상황을 인식하고, 사람처럼 동작과 표정을 표현해주는 기술을 시연했다. 시연자와 똑 닮은 3차원(3D) 아바타는 계절에 맞춰 옷과 동작, 배경이 바뀌었다. 시연자는 “앞으로 이 기술로 고가의 디스플레이나 카메라 없이 실감형 콘텐츠를 생성하고 감상할 수 있다”고 설명했다.

KT 홍보모델들이 KT의 AI 디바이스들을 소개하고 있다.ⓒKT

‘분석·판단’ 영역에서는 많은 양의 데이터로부터 숨겨진 정보를 찾아 실시간으로 판단하는 기술을 선보였다. 시연자가 AI 스피커에 “축구 모델 사진 찾아서 메일로 보내줘”라고 말하자 AI가 실시간으로 웹을 분석해 이강인 관련 사진을 찾아 메일로 보내는 모습을 확인할 수 있었다.

‘예측·추론’ 영역에서는 스스로 상황을 예측 및 분석하고 이를 추론해 상황에 대한 실시간 조치와 적합한 솔루션을 추천하는 기술이 소개됐다. ‘기가트윈(GiGAtwin)’은 작은 데이터를 바탕으로 자가학습으로 실제와 같은 트윈 모델을 생성해 문제해결을 도출하는 기술이다.

KT 관계자는 “최근 경찰청과 기가트윈 기술을 적용해 새로운 신호체계를 개발 중”이라며 “지능적으로 AI가 교통신호까지 분석하면 시뮬레이션을 통해 10% 이상 교통체증으로 인한 문제를 해결할 수 있고, 앞으로 이를 활용해 연간 30조원 규모의 교통정체 비용을 줄일 수 있도록 기여하겠다”고 밝혔다.

이날 KT가 선보인 기술들은 대부분 바로 상용화가 가능한 수준까지 개발이 진행된 상태다. 이 부사장은 “오늘 선보인 기술들은 대부분 개발을 마친 상태고, 고객 조사가 끝나는 대로 바로 론칭할 수 있다”고 자신했다.

시연이 끝난 뒤 인공지능 스피커에 대한 보안 우려도 제기됐다. 문영일 KT 정보보안 단장은 “기가지니에서 가장 중요하게 생각하는 것은 보안”이라며 “다단계 보안으로 하나가 뚫려도 다음 단계에서 막을 수 있고, 전송구간이 암호화돼 있어 직원들도 내부 접근 제어 통제를 통해 사생활을 볼 수 없게 돼 있다”고 단언했다.

한편 이날 KT는 AI 생활화를 이끌기 위해 ‘AI 전문기업(AI Company)’으로 변신하겠다고 선언했다. KT는 향후 4년간 3000억원을 투자하고 AI 전문인력 1000명을 육성할 방침이다.

김은경 기자 (ek@dailian.co.kr)
기사 모아 보기 >
0
0
김은경 기자가 쓴 기사 더보기

댓글 0

0 / 150
  • 최신순
  • 찬성순
  • 반대순
0 개의 댓글 전체보기