명탐정 코난 나비넥타이 음성변조기 실사판이 생성AI를 통해 만들어졌다

2024. 1. 11. 10:49일본 뉴스

https://youtu.be/sHQNeyfp6OY?si=IFk4_7xLgg0iZ6q7&t=156

이건 조금 시간이 지난 뉴스이기는 한데, 음성 생성AI를 활용해서 다른 사람의 목소리를 카피해서 말할 수 있는 아이템이 만들어졌다.

애니메이션 명탐정 코난에 보면 코난이 나비넥타이로 다른 사람의 목소리로 바꿔서 말하는 걸 볼 수 있는데 넥타이가 아니다 뿐이지 거의 비슷한 걸 내놨다고 봐야할 듯.

위의 영상 재생버튼을 누르면 영상에서 2분 36초부터 보면 음성변조기를 개발한 사람이 기시다 후미오 총리의 목소리를 카피해서 자기가 하는 말이 기시다의 음성으로 나오는 장면이 나온다.

영상 3분 39초로 넘어가면 TV 아나운서가 기시다 목소리로 변조해서 말하는데 그게 더 명료하게 들리기는 한다.

다만 단점이 하나 있어 보인다. 영상을 보면 기기에 대고 말하는 사람 자신의 목소리 자체는 사라지지 않고 말하는 사람이 말하고 난 후에서야 변조된 목소리가 기기를 통해 흘러나오는 구조인 듯하다.

보이스 피싱으로 써먹으면 좋을 거 같기도 하다. 실제로 영상에서도 납치 사기 뭐 이런 것에 악용될 수도 있다 이런 얘기가 나오고 있다.

기기를 개발한 엔지니어는 안노 유키히로라는 이름으로 보이는 AI 엔지니어다.

목소리 카피의 구조는 이와 같다.

카피하고 싶은 사람의 음성 데이터를 PC에 집어넣고 기계학습을 통해 2시간 정도 학습을 한다. 그 후에 기기(마이크)를 통해 다른 사람의 목소리로 얘기할 수 있다.

당연히 음성 데이터의 길이가 길면 길 수록 좋지만 어떠한 사람의 10분 정도 분량의 음성 데이터가 있으면 저렇게 목소리를 복사해서 기기로 써먹을 수 있게 할 수 있다고 얘기하고 있다.

한편, 데이터를 수집하고 써먹는 과정에서 남의 거를 써먹었기 때문에 초상권 등의 문제가 생길 수도 있다는 얘기도 하고 있다.

딥페이크로 안노 엔지니어가 여자처럼 자신의 얼굴과 목소리를 바꾸고 말하는 장면이 막판에 나오기도 한다.

영화에서도 더빙이 없어지고 AI를 활용해서 미국 배우가 자기 목소리로 일본어로 얘기하는 것이 가능해져서 더빙 업계가 더 타격을 입을 수도 있겠다는 얘기도 있다.

써먹을 수 있는 곳이 매우 많은 듯하다. 그런 한편 반대로 직접 만나는 것의 가치가 올라갈 것이라는 것도 공감이 간다.