사진=Camilo Concha / Shutterstock.com
오픈AI가 새로운 인공지능(AI) 도구 '보이스 엔진'(Voice Engine)을 개발해 공개했다. 15분 분량의 음성 샘플만 있으면 사람 음성을 학습해 모방 음성을 만들 수 있게 된 것이다. 다만 위험성을 고려해 출시 여부는 신중하게 접근한다는 입장이다.
오픈AI는 29일(현지시간) 자사 블로그에 "인조(Synthetic) 음성의 도전과 기회 탐색하기"란 제목의 글을 통해 자사가 개발한 보이스 엔진의 사전 실험 결과를 공개했다.
2022년 말 보이스 엔진을 처음 개발한 오픈AI가 이날 공개한 실제 사람의 음성 샘플과 이를 이용해 보이스 엔진으로 생성한 음성은 거의 구분이 어려울 정도로 비슷했다. 오픈AI는 어린이 교육을 위한 음성 해설 콘텐츠, 실시간 개인 맞춤형 응답 생성 기능, 동영상과 팟캐스트 같은 콘텐츠를 여러 언어로 번역해 전 세계적으로 서비스하는 사례 등 긍정적인 활용을 기대했다. 언어 기능에 영향을 주는 질환을 앓는 환자들을 위한 치료 애플리케이션이나 장애인을 위한 소통 기기에 지원된 사례도 있다고 오픈AI는 전했다.
그러나 회사 측은 "인조 음성 기능의 오용 가능성 때문에 더 광범위한 출시에 대해서는 조심스럽게 접근하고 있다"며 "현재로서는 이 기술을 미리 보여주기(preview)만 하되 널리 출시하지는 않기로 했다"고 밝혔다.
블룸버그 통신은 "오픈AI가 사람의 목소리를 흉내 낼 수 있는 기능을 공개하며 AI 기술의 새로운 지평을 열었다"면서도 "이는 딥페이크(AI로 만든 영상이나 이미지, 음성 조작물) 위험에 대한 불안감도 일으키고 있다"고 기대가 우려를 동시에 나타냈다.
신현보 한경닷컴 기자 greaterfool@hankyung.com
이 뉴스에 대한 의견과 질문을 자유롭게 남겨보세요!