Google의 MusicLM은 과대 광고에 부응합니까?

Google의 MusicLM은 과대 광고에 부응합니까?
당신과 같은 독자는 MUO를 지원하는 데 도움이 됩니다. 귀하가 당사 사이트의 링크를 사용하여 구매하면 당사는 제휴 수수료를 받을 수 있습니다. 자세히 알아보기

2023년 1월 Google은 텍스트 설명을 기반으로 음악을 생성할 수 있는 실험적인 AI 도구인 MusicLM을 발표했습니다. 뉴스와 함께 Google은 MusicLM에 대한 놀라운 연구 논문을 발표하여 많은 사람들이 허공에서 음악을 불러내는 능력에 현혹되었습니다.





오늘의 메이크업 비디오 콘텐츠를 계속하려면 스크롤하세요.

텍스트 프롬프트가 주어지면 모델은 장르에서 악기, 유명한 예술 작품을 설명하는 추상 캡션에 이르기까지 모든 종류의 설명을 전달하는 충실도 높은 음악을 생성하겠다고 약속했습니다. 이제 MusicLM이 대중에게 공개되었으므로 이를 테스트하기로 결정했습니다.





AI 음악 생성기를 만들려는 Google의 시도

  Google용 웹 애플리케이션's MusicLM AI music generator

'편안한 재즈'와 같은 텍스트 프롬프트를 바로 재생할 수 있는 트랙으로 바꾸는 것은 틀림없이 AI 음악 실험의 성배입니다. Dall-E 또는 Midjourney와 같은 유명한 AI 이미지 생성기와 유사하게 멜로디와 비트가 있는 트랙을 생성하기 위해 약간의 음악 노하우가 필요하지 않습니다.





2023년 5월 Google의 AI Test Kitchen에 가입한 사람들은 처음으로 데모를 사용해 볼 수 있습니다. 사용자 친화적인 웹 페이지와 몇 가지 안내 규칙(전자 악기와 클래식 악기가 가장 잘 작동하고 '바이브'를 지정하는 것을 잊지 마십시오)을 통해 음악 스니펫을 생성하는 것은 상상할 수 없을 정도로 쉽습니다.

속도는 상대적으로 충실도가 높은 샘플과 함께 MusicLM이 진정으로 제공하는 몇 안 되는 것 중 하나입니다. 그러나 진정한 테스트는 스톱워치만으로 측정되지 않았습니다. MusicLM은 몇 마디로 실제적이고 듣기 좋은 음악을 만들 수 있습니까? 정확하지는 않습니다(곧 설명하겠습니다).



하드 드라이브를 선택하는 방법

Google의 AI Test Kitchen에서 MusicLM을 사용하는 방법

MusicLM을 사용하는 것은 쉽습니다. 대기자 명단에 등록할 수 있습니다. Google의 AI 테스트 키친 당신이 그것을 가고 싶다면.

웹 앱에서 듣고 싶은 음악 종류를 설명하는 몇 개의 단어에서 몇 개의 문장으로 메시지를 작성할 수 있는 텍스트 상자가 표시됩니다. 최상의 결과를 얻으려면 Google은 '매우 설명적'이라고 조언하며 음악의 분위기와 감정을 포함하도록 노력해야 한다고 덧붙였습니다.





준비가 되면 Enter 키를 눌러 처리를 시작합니다. 약 30초 이내에 두 개의 오디오 스니펫을 오디션에 사용할 수 있습니다. 두 가지 중에서 프롬프트와 일치하는 최고의 샘플에 트로피를 수여할 수 있는 옵션이 있으며, 이는 Google이 모델을 훈련하고 출력을 개선하는 데 도움이 됩니다.

MusicLM의 사운드

인간은 적어도 40,000년 전부터 음악이 언어의 발달 이전인지, 이후인지, 동시에 발생했는지에 대한 결정적인 생각 없이 음악을 만들어 왔습니다. 따라서 어떤 면에서 MusicLM이 이 고대의 보편적 예술에 대한 코드를 해독하지 못한 것은 놀라운 일이 아닙니다.





Google의 MusicLM 연구 논문 MusicLM은 유명한 작품에 속한 캡션에서 음악을 생성하고 다양한 프롬프트 시퀀스에 따라 부드러운 방식으로 장르 또는 분위기를 변경하는 것과 같은 지침을 따를 수 있다고 제안했습니다.

그러나 그렇게 큰 주문을 처리하기 전에 MusicLM에 먼저 극복해야 할 몇 가지 근본적인 문제가 있음을 발견했습니다.

템포를 고수하기 어려움

모든 음악가의 가장 기본적인 일은 단순히 제 시간에 맞춰 연주하는 것입니다. 즉, 템포를 고수하십시오. 놀랍게도 그것은 MusicLM이 100% 할 수 있는 일이 아닙니다.

실제로 동일한 프롬프트를 10번 사용하여 20개의 음악 트랙을 생성했지만 3개만 제 시간에 맞춰졌습니다. 나머지 17개 샘플은 음악을 설명하는 데 널리 사용되는 용어인 '분당 비트'로 작성된 지정된 템포보다 빠르거나 느렸습니다.

이 예에서는 '분당 80박자로 연주되는 평화롭고 명상적인 솔로 클래식 피아노'라는 프롬프트를 사용했습니다. 가까이서 들으면 작은 샘플 길이 내에서 음악이 종종 빨라지거나 느려집니다.

음악은 또한 강한 비트가 부족하고 마치 누군가가 작품 중간에 연주를 치는 것처럼 들렸습니다. 이것이 의도적이든 아니든, MusicLM이 실제로 비트를 고수하는 것 외에도 음악의 적절한 시작 또는 끝을 작곡할 수 있는지 판단하기 어렵습니다.

무작위 악기 선택

아마도 MusicLM은 아직 엄격한 타이밍으로 연주하는 방법을 배우지 않았기 때문에 다른 일반적인 음악 매개변수로 이동했습니다. 우리는 그것이 특정 도구에 대한 우리의 요청을 승인하는지 확인하고 싶었습니다.

안드로이드를 위한 최고의 무료 음악 플레이어

'솔로 신디사이저' 및 '솔로 베이스 기타'와 같은 설명이 포함된 여러 가지 프롬프트를 작성했습니다. 다른 것들은 'String quartet'이나 'Jazz band'와 같은 더 큰 앙상블이었습니다. 대체로 당신이 요청한 것을 얻을 확률은 50:50인 것 같았습니다.

한 가지 이론은 모델이 일부 악기를 인기 있는 음악 장르와 연관시킨다는 것입니다. 예를 들어 '솔로 신디사이저, 코드 진행. 활기차고 낙관적입니다.' 자체적으로 신디사이저 사운드를 얻는 대신 MusicLM은 드럼과 베이스로 완성된 전자 트랙을 제작했습니다.

모델에 기기에 대한 특정 요청을 이해하기에 충분한 데이터와 충분한 교육이 없었을 가능성이 있습니다.

보컬은 방정식에서 벗어났습니다.

당시 제한 사항에 따라 모델은 보컬이 포함된 음악을 제작하지 않습니다. MusicLM의 까다로운 저작권 문제와 버그가 많은 보컬 Google이 이 제한을 설정하여 안전하게 플레이하기로 선택한 이유일 수 있습니다.

그러나 얼마 동안 MusicLM을 실험한 후, 모델의 출력에 대한 Google의 제어가 정확히 철통이 아니라는 것을 깨달았습니다. 이상하게도 '어쿠스틱 기타'와 같은 프롬프트는 배경에 숨막히게 들리는 유령 같은 보컬이 포함된 트랙을 생성합니다.

이것은 흔한 일이 아니지만 처음부터 설득력 있는 보컬을 만드는 MusicLM의 능력에 대해 궁금해하게 만듭니다.

VOCALOID 및 Synthesizer V와 같은 소프트웨어를 통해 AI 보조 보컬 합성 기술 , 현재 모델에서 보컬을 생략하면 기존 기술과 경쟁하기에 아직 충분하지 않은지 궁금합니다. MusicLM은 음악가들이 칭찬을 부르기까지 갈 길이 멀다.

AI 음악 생성기의 미래

  MusicLM에 대한 다양한 프롬프트 제안's web application

MusicLM은 생성적 AI 음악 기술을 발전시켰지만 음악 산업에서 실제 작업을 수행하기 전에 학교로 돌아가서 몇 가지 더 배워야 합니다.

지금까지 제너레이티브 AI 음악에 대한 최선의 시도는 OpenAI의 JukeboxAI라는 모델이었습니다. 정확히 사용할 준비가 된 상태는 아니었고 단 1분의 음악을 렌더링하는 데 무려 9시간이 걸렸습니다.

당신의 노력으로 오디오 왜곡과 아티팩트가 가득한 진정한 외계인 소리 트랙을 되찾을 가능성이 높습니다. 거꾸로, 당신은 지루하지 않을 것입니다 Jukebox가 불러내는 기괴한 창조물 듣기 .

이를 고려하여 MusicLM은 사용자 친화적인 AI 음악 생성기로 상당한 발전을 이루었습니다. 원시 오디오 형식으로 음악을 생성하는 것이 얼마나 복잡한지 생각해 보면 임의 출력에 대한 모델을 거의 용서할 수 있습니다.

그러나 모델을 작동시킨 후 MusicLM은 Google이 초기 연구 논문에 게시한 내용과 비교할 때 반쯤 구운 느낌입니다. AI 이미지 생성기가 Apple의 이미지를 잘못 인식하는 경우는 거의 없으며, 마찬가지로 AI 음악 생성기는 템포 및 악기와 같은 몇 가지 기본 사항을 올바르게 파악해야 합니다.

Google의 MusicLM이 기대에 미치지 못함

기술 회사들이 AI 전선에서 서로 경쟁하기 위해 경쟁하는 상황에서 MusicLM은 준비가 되기 전에 공개 시험에 들어간 것처럼 느껴집니다. 기본을 올바르게 하는 대신 모델은 음악 제작에 훨씬 더 모호하고 주관적인 접근 방식을 취하는 것 같습니다.

Google은 프롬프트를 구체적으로 지정하도록 권장할 수 있지만 템포를 잘 처리할 수 없으며 매번 요청한 악기를 얻을 수 있다고 보장할 수 없습니다. MusicLM은 흥미롭고 강력한 AI 발전에 대한 좋은 시연일 수 있지만 음악이 최종 목표라면 아직 갈 길이 멉니다.