"몇 주 안에 구글 이용자들에게 무료 배포"
챗 GPT 개발사 오픈AI가 시각과 청각 등을 활용해 사람과 자연스럽게 대화할 수 있는 인공지능(AI) 기술을 개발했다.
AP통신에 따르면 오픈AI는 새로운 거대언어 인공지능 모델이라며 ‘GPT-4o(포오)’를 13일(현지시간) 공개했다. 미라 무라티 최고기술책임자(CTO)는 이날 발표 영상에 직접 등장해 이 모델을 공개하며 “놀랍게도 사람과 똑같은 수준의 의사소통이 가능하다”고 말했다.
오픈 AI는 이 모델이 시청각 정보를 실시간으로 처리하는 수준이라고 설명했다. 무라티 CTO는 “GPT-4o는 사람과 비슷한 수준으로 보고, 듣고, 생각한다”며 “우리는 이 모델이 기존 딥러닝 기술을 뛰어넘었다고 자신있게 말할 수 있다”고 설명했다. 실제 이날 시연된 GPT-4o의 응답 시간은 232밀리초로 평균 320밀리초의 인간의 응답 시간과 거의 비슷했다.
GPT-4o는 단순 문자 형태로만 대화할 수 있었던 기존 모델과는 달리 실시간 음성 대화가 가능하다. 이날 무라티 CTO가 발표 현장에서 “잠을 잘 못자는 친구를 위해 이야기를 들려달라”고 하자 GPT-4o는 다양한 감정과 톤으로 이야기를 들려줬다. 또 수학 문제(3x+1=4)를 써서 보여주자 이를 시각적으로 인지해 곧바로 풀이해 냈다.
이 기술은 총 50개 언어로 전 세계 이용자들에게 무료로 출시될 예정이다. 다만 기존의 유료 회원들은 무료 회원보다 5배 많은 양의 데이터를 한 번에 검색할 수 있다. 오픈AI 측은 이날 시연된 청각과 시각 검색 기능 또한 몇 주 안에 공개될 예정이라고 밝혔다.