3월 29일, 오픈 에이아이(OpenAI)에서 보이스 엔진(Voice Engine)에 대한 데모 음성을 공개했다. 이는 보이스 엔진에 대한 상표권을 출원한 지 2주도 되지 않은 시점의 공개인데, 해당 엔진은 이미 헤이젠(HeyGen)이나 Age of Learning 같은 기업의 AI 서비스에 적용되어 오고 있었다고 한다. 다만 일반 사용자에게는 배포되지 않았던 것인데, 이번에 공개한 것이다.
📍 헤이젠(HeyGen)인공지능(AI)을 활용해 영상을 제작하는 플랫폼.
인간과 유사한 맞춤형 아바타를 만들 수 있고 한국어로 제작한 영상을 영어, 힌디어 등 다양한 언어로 번역할 수 있는 기능도 제공한다. 입모양도 실제 말하는 것과 동일하게 번역해 준다.
📍 Age of Learning
어린이들을 위한 디지털 교육 프로그램을 제작하는 회사.Age of Learning의 프로그램은 교육 전문가 팀의 연구 기반으로 개발되었으며, 연구에 따르면 ABCmouse를 사용하는 어린이는 프로그램을 사용하지 않는 어린이보다 읽기 쓰기 능력에서 향상된 실력을 보였다고 한다.
2007년 Doug Dohring에 의해 설립되었으며, 본사는 미국 캘리포니아주 글렌데일에 있다. 현재 CEO는 Alex Galvagni.
✅ 목차OpenAI, 보이스 엔진
OpenAI, 보이스 엔진 데모 음성 들어보기
보이스 엔진에 대한 OpenAI의 입장
마치며
OpenAI, 보이스 엔진
이번에 공개한 보이스 엔진 데모 음성은 약 15초 길이의 짧은 음성이지만, 원본과 유사한 자연스러운 음성을 구현해 내며, 감성적이면서도 사실적인 목소리를 만들어낸다고 OpenAI는 밝히고 있다.
OpenAI는 2022년 말 처음으로 음성 엔진을 개발한 후, 이를 사용해 텍스트 → 음성 변환 API, ChatGPT 음성 및 소리 내어 읽기 등의 음성서비스를 지원해 왔다. 하지만 한편으로는 합성 음성의 오용 가능성 때문에 신중하게 접근하고 있으며, 책임감 있는 배포를 고민하고 있다고 한다.
OpenAI, 보이스 엔진 데모 음성 들어보기
그럼 오픈 에이아이(OpenAI)에서 이번에 공개한 엔진(Voice Engine)에 대한 데모 음성을 들어보자. (출처 : 오픈AI)
📍 영어 (원본)
📍 스페인어(AI)
📍 만다린어(AI)
📍 독일어(AI)
📍 프랑스어(AI)
📍 일본어(AI)
보이스 엔진에 대한 OpenAI의 입장
다음은 보이스 엔진에 대한 OpenAI의 공식입장이다. 음성 AI가 합성음성과 딥페이크 등에 악용될 것에 대해 많이 우려하고 있음을 알 수 있다.
보이스 엔진은 AI로 가능해진 것을 공유하려는 우리의 약속이다. 우리는 AI 안전에 대한 접근 방식과 발전에 대한 약속에 따라 이 기술을 미리 보기 형식으로 오픈한다. 하지만 널리 출시하지는 않았다. 우리는 이번 Voice Engine의 미리 보기가 음성 AI에 대한 잠재력을 제고하고, 보다 설득력 있는 생성 모델로 사회적 탄력성을 강화하는데 동기부여로 작용하길 바란다. 음성 AI의 사용에 있어 특히 다음과 같은 조치를 권장한다.
- 은행 계좌 및 기타 민감한 정보에 접근하는 보안 수단으로써의 음성 기반 인증은 단계적으로 폐지하기 바란다.
- AI가 개인의 목소리를 남용하지 않도록, 개인의 목소리 보호하기 위한 정책을 탐색해야 한다.
- (딥페이크 등) 사기성 AI 콘텐츠의 가능성에 대비해, AI 기술의 역량과 한계를 대중에게 교육해야 한다.
- 시청각 콘텐츠의 출처를 추적하는 기술의 개발 및 채택을 가속화하여, 실제 사람과 AI의 경계를 명확하게 해야 한다.
OpenAI, 보이스 엔진 데모 음성 전문 보러 가기 》
마치며
이번 오픈 에이아이(OpenAI)에서 공개한 보이스 엔진 데모 음성을 확인하며, 실제 원본 음성과 AI 음성의 유사함에 놀라게 되었다. 특히 선거철, AI를 활용한 딥페이크에 대한 우려가 높아진다. 초상권만이 아니라 목소리에 대한 개인의 고유성도 보호돼야 하는 시점이다.
▼ 딥페이크? 딥페이크 뜻! 활용 및 악용 사례까지
함께 보면 좋은 글
앤트로픽, 생성형 AI 챗봇 클로드 3(claude 3) 경량버전 '하이쿠' 출시
클로드 3(claude 3)과 앤트로픽(Anthropic)
GPT스토어 오픈, 피부로 실감할 AI시대의 도래
GPT 스토어를 잘 이용하려면? _ GPT스토어 이용법 정리
미드저니 저작권 침해소송과 생성 AI의 저작권 문제
GPT, 챗GPT, GPTs, GPT Builder, GPT스토어 뜻, 개념정리
챗 지피티(Chat GPT), 미드저니, 스테이블디퓨전, 데비안아트, 깃허브 코파일럿... 생성AI 줄줄이 저작권 소송
구글 SGE, 생성형 AI 검색 사용 설정하는 방법
[AI 소식] 구글 자율 학습 로봇 '오토RT' 공개
마이크로 소프트의 코파일럿 오류
오픈AI의 챗GPT, 폐쇄적 AI와 개방형 AI동맹의 대립
빙 이미지 크리에이터로 그린 '6년 근 인삼 한 뿌리' 기상천외한 AI그림
2024년 새해 인사_빙 이미지 크리에이터와 미리캔버스로 만든 AI 그림 연하장
챗 지피티(Chat GPT)와 빙 이미지 크리에이터(Bing Image Creator)로 만든 AI 창작 동화
참고 : OpenAI
'ITAI공유실' 카테고리의 다른 글
삼성의 차기 XR 헤드셋(HMD), 코드명 '프로젝트 무한(Project Infinite)' (4) | 2024.12.19 |
---|---|
앤트로픽, 생성형 AI 챗봇 클로드 3(claude 3) 경량버전 '하이쿠' 출시 (1) | 2024.03.18 |
생성형 AI(Generative AI) 뜻과 역사, 분야 (3) | 2024.03.18 |
클로드 3(claude 3)과 앤트로픽(Anthropic) (0) | 2024.03.13 |
마이크로 소프트의 코파일럿 오류 (0) | 2024.01.18 |
댓글