KI-Tipps 15.08.2025, 08:00 Uhr

KI macht die Musik

Nicht nur Texte und Bilder lassen sich mit generativer KI erzeugen, sondern auch Musik. Beethovens zehnte Symphonie oder ein wahrer Hörgenuss kommen dabei zwar noch nicht heraus, aber die eine oder andere hübsche Melodie ist dabei.
(Quelle: Shutterstock/tete_escape)
Der Wirbel um generative künstliche Intelligenz wie ChatGPT und bildgenerierende KIs wie Stable Diffusion und DALL-E ist ungebrochen. Allmählich erobert KI das nächste Feld: die Musik. Die Technik steckt noch in den Anfängen, produziert aber bereits passable Musikstücke mit eingängigen Melodien. Lediglich ein Bereich ist mitunter von geringer Qualität: Gesang.
Die Musikgeneratoren haben unterschiedliche Stärken und Schwächen. Sie lernen in diesem Artikel fünf davon kennen, um sich selbst ein Bild zu machen.
Achtung: Beachten Sie die Lizenzbedingungen – wobei die Nutzung für nicht-kommerzielle Zwecke in der Regel erlaubt ist.

1. MusicGPT

MusicGPT ist ein KI-Musikgenerator, der Prompts innerhalb weniger Minuten in komplette, originelle Songs verwandelt. Egal, ob Sie als Musiker nach Inspiration suchen, Hintergrundmusik benötigen oder einfach nur neugierig auf die kreativen Möglichkeiten von KI sind. Auf der webbasierten Bedienoberfläche können Sie Ihren gewünschten Sound beschreiben und sofort zwei KI-produzierte Songs generieren lassen. Sie können dabei Instrumente, Genre, Stimmung und Struktur vorgeben und ausserdem eine grosse Bibliothek mit KI-Tracks der Community erkunden, Bild 1.
Bild 1: Bei MusicGPT können Sie etwa die Instrumente, das Tempo, die Stimmung und die Struktur im Prompt vorgeben
Quelle: PCtipp.ch
Im ersten Schritt surfen Sie zu musicgpt.com und klicken oben rechts auf Sign up, um ein Konto zu erstellen. Nach der Anmeldung sehen Sie die Anzahl der Credits, die Sie investieren können, um Musik zu generieren. In der kostenlosen Version erhalten Sie 500 Credits im Monat. Das genügt, um etwa zehn Musikstücke komponieren zu lassen. In den Kontoeinstellungen erfahren Sie, was wie viele Credits kostet. Nun geben Sie den Prompt ein, der das gewünschte Musikstück beschreibt.
Tipp: Je detaillierter der Prompt, desto besser das Ergebnis. MusicGPT verarbeitet Details zu Instrumenten, Tempo, Stimmung, Struktur und zu bestimmten Musiktechniken. Ein Beispiel: heiterer akustischer Folk-Track mit Gitarre, Banjo, Saxofon und sanftem Schlagzeug bei 90 BPM, geeignet für eine lange Zugreise.
Bild 2: Zur Inspiration können Sie sich Songs aus der Community anhören
Quelle: PCtipp.ch
Wenn Sie keinen Gesang wollen, aktivieren Sie die Option Instrumental. Starten Sie den Vorgang mit einem Klick auf das Pfeilsymbol. MusicGPT generiert zwei Versionen Ihres Songs. Das Ganze dauert ein paar Minuten. In den Kontoeinstellungen sehen Sie den Fortschritt. Im Gegensatz zu manch anderer Musik-KI erstellt MusicGPT auch lange, mehrminütige Musikstücke. Trotz des gleichen Prompts unterscheiden sich die beiden Musikstücke deutlich. Abschliessend laden Sie diese bei Gefallen herunter. Beachten Sie: Der Download kostet weitere Credits, Bild 2.

2. Riffusion

Der nächste Kandidat nennt sich Riffusion. Technisch gesehen ist das Tool mit Bildgeneratoren verwandt, die auf Stable Diffusion beruhen, daher auch der Name. Riffusion ist ein KI-gestützter Musikgenerator, mit dem sich sofort Musik aus Textprompts erstellen lässt. Dabei kommt das innovative KI-Modell FUZZ zum Einsatz, Bild 3. Es basiert auf der Diffusion-Transformer-Architektur, die eine Verarbeitung von Merkmalen und Mustern in mehreren Schichten ermöglicht.
Bild 3: Die Musik-KI Riffusion geht technisch betrachtet andere Wege und verwendet ein KI-Modell namens FUZZ, das auf einer Diffusion-Transformer-Architektur basiert
Quelle: PCtipp.ch
Riffusion ersetzt nicht herkömmliche Musikproduktions-Software. Den von der KI generierten Kompositionen fehlt manchmal die Tiefe und Raffinesse von Menschen geschaffener Musik. Der Gesang klingt mitunter merkwürdig. Wenn Sie jedoch nur nach einer schnellen und innovativen Möglichkeit suchen, Musik zu generieren, bietet Riffusion eine intuitive und kostenlose Lösung.
Zunächst erstellen Sie unter der Adresse riffusion.com ein neues Konto oder melden sich mit Ihrem Google-Konto an.
Tipp: Stöbern Sie als Erstes ein wenig durch die Playlists auf der Startseite, um ein Gefühl dafür zu bekommen, was mit Riffusion möglich ist. Nun geben Sie in das Eingabefeld Ihren Prompt ein, der den gewünschten Stil, die Stimmung oder die Instrumente beschreibt, die Riffusion verwenden soll, Bild 4.
Bild 4: Riffusion ermöglicht den Zugriff auf eine umfangreiche Bibliothek mit KI-generierter Musik
Quelle: PCtipp.ch
Dazu ein Beispiel: slow piano, building up, desert vibes, dramatic, electronic, cello solo. Auch hier haben Sie mit einem Schieberegler die Option, rein instrumentale Musik zu erzeugen. Ein Klick auf Generate generiert zwei Versionen des Musikstücks – die meist zwischen zwei und vier Minuten lang sind. Freunde der Musik des Commodore 64 können Sounds produzieren, etwa mit dem Prompt C64 sound, retro, computer game, 80ies. Über das Symbol mit den drei Punkten lassen sich die Werke herunterladen. Ein Klick auf Remix erzeugt weitere Versionen.
Alle grundlegenden Funktionen von Riffusion sind kostenlos. Wer Musik für kommerzielle Zwecke erzeugen oder fortgeschrittene Funktionen nutzen will, benötigt ein Abonnement ab 6 US-Dollar monatlich.

3. Aiva

Aiva steht für «Artificial Intelligence Virtual Artist». In der kostenlosen Version stehen drei Downloads pro Monat zur Verfügung. Generieren können Sie beliebig viele Tracks, die auch mehrere Minuten lang sein können. Sie finden Aiva unter creators.aiva.ai. Als Log-in dient das Google-Konto oder Ihre E-Mail-Adresse und ein Passwort, Bild 5.
Bild 5: Mit Aiva lassen sich beliebig viele Musikstücke erstellen, aber in der Gratisversion nur drei pro Monat herunterladen
Quelle: PCtipp.ch
Aiva ist besonders für klassische und symphonische Musik geeignet, kommt aber auch mit anderen Stilen zurecht. Es ist der erste virtuelle Komponist, der von einer Musikgesellschaft, der französischen SACEM, anerkannt wurde. Aiva hat bereits mehrere Studioalben generiert.
Die Bedienoberfläche wirkt etwas unübersichtlich. In der Mitte sehen Sie die vorhandenen Kompositionen und links eine Menüleiste, die sich aber teilweise an anderer Stelle wiederholt. Auch der Create-Button ist doppelt vorhanden. Um ein neues Opus zu generieren, klicken Sie auf Create Track und danach auf From a Style. Hangeln Sie sich durch die umfangreiche Style Library, bis Sie einen passenden Stil gefunden haben. Beispiele sind Jazz, Lounge, Synthwave und Techno bis zu 8-Bit-Musik. Nun klicken Sie auf den Button + Create neben dem Stil. Im folgenden Fenster lassen sich Tonart und Länge festlegen. Ein Klick auf Create tracks startet die Komposition. Die Tracks lassen sich nachträglich bearbeiten. Dazu klicken Sie auf den Button mit den drei Punkten und wählen anschliessend die Option Open in Editor, Bild 6.
Bild 6: Die erstellten Songs lassen sich nachträglich detailliert bearbeiten, etwa Instrumente und Akkorde verändern
Quelle: PCtipp.ch
Tipp: Wenn Sie eingangs Step by step anklicken, haben Sie noch mehr Kontrolle. Auch hier entscheiden Sie sich zunächst für einen Stil. In den weiteren Schritten lassen sich die Akkordfolgen und die einzelnen Instrumente akkurat editieren. Interessant ist auch der Menüpunkt Radio. Wählen Sie einen Stil aus, erhalten Sie eine passende lange Playlist.
Ausser der kostenlosen Version stehen zwei Abonnements von Aiva zur Auswahl. Standard kostet 15 Euro im Monat, die Pro-Version 49 Euro, Bild 7.
Bild 7: Als Besonderheit bietet Aiva unter dem Menüpunkt Radio eine lange Playlist zu einer bestimmten Musikrichtung
Quelle: PCtipp.ch

4. Loudly

Loudly verspricht, innerhalb von Sekunden einen Song zu komponieren. Kostenlos lässt sich eine limitierte Anzahl Musikstücke pro Tag generieren, aber nur eines herunterladen. Für den vollen Zugang ist eine monatliche Gebühr fällig. Das Personal-Abonnement kostet 15 US-Dollar pro Monat, die Pro-Variante gibt es für 49 US-Dollar monatlich, Bild 8.
Bild 8: Mit Loudly lassen sich Musikstücke aus einer Vielzahl von Genres generieren
Quelle: PCtipp.ch
Sie können Genre, Energie, Instrumente, Taktart und Dauer auswählen, und Loudly generiert auf dieser Grundlage eine Auswahl an Songideen. Auf der Webseite loudly.com können Sie sich zunächst einmal umhören. Dazu klicken Sie auf Templates und lauschen den Beispieltracks. Sie können zudem Filter einsetzen. Mood gibt die Stimmung vor, etwa Laid-back oder Melancholic. Es folgt das Genre, das von Ambient bis Trance reicht. Bei Vocals legen Sie fest, ob Sie instrumentale Stücke hören wollen oder solche mit Gesang. Schliesslich lassen sich noch Instrumente, Tonart und Ära vorgeben, Bild 9.
Bild 9: Pro Prompt erhalten Sie mit Loudly drei Versionen eines Musikstücks, die jedoch auf 30 Sekunden limitiert sind
Quelle: PCtipp.ch
Nachdem Sie sich eingeloggt haben, gelangen Sie in das Tonstudio. Hier klicken Sie sich von oben nach unten durch. Wählen Sie zunächst das gewünschte Genre wie Rock, Techno oder Synthwave. Jetzt kommt die Länge an die Reihe, die in der kostenlosen Variante jedoch auf 30 Sekunden begrenzt ist.
Bei den Instrumenten können Sie bis zu sieben selbst festlegen, wobei die Vorauswahl meist sinnvoll erscheint. Die nächsten beiden Punkte Genre Blend und Energy erzeugen einen Mix und steuern die Intensität.
Interessant ist auch die Einstellung Structure. Hier lässt sich der Verlauf des Musikstücks festlegen, etwa ob der Höhepunkt in der Mitte oder am Ende liegt. Die Einheit von Tempo sind Beats per Minute. Je höher der Wert, desto schneller die Musik. Schliesslich lässt sich über den Menüpunkt Key noch die Tonart auswählen, was sich auf die Musikstimmung niederschlägt.
Nach einem Klick auf Generate erstellt Loudly drei Musikstücke. Was Ihnen gefällt, fügen Sie über das Herz-Symbol zu Ihrer Bibliothek hinzu. Die Songs lassen sich nachträglich bearbeiten. Dazu klicken Sie auf Studio und gelangen zu einer Art Mischpult, Bild 10. Während Sie die Musik abspielen, lassen sich in Echtzeit Parameter verändern. Loudly bietet auch die Option, Musik über einen Prompt zu generieren. Das verbirgt sich hinter dem Menüpunkt Text to music.
Bild 10: In einem virtuellen Tonstudio lassen sich die Erzeugnisse von Loudly nachträglich bearbeiten
Quelle: PCtipp.ch

5. Udio

Udio wurde von ehemaligen Google-DeepMind-Forschern gegründet. Dieser KI-Musikgenerator nimmt Ihre Beschreibungen (egal ob Genre, Instrumente oder spezielle Klänge) und erstellt daraus Kompositionen. Es gibt verschiedene Preismodelle für Udio, einen kostenlosen Plan, den Standard-Plan für 9,90 Euro im Monat und einen Pro-Plan für 28,80 Euro. Der kostenlose Plan umfasst zehn Tagescredits, grundlegende Funktionen, zwei gleichzeitige Generationen und ausserdem Remixing-Optionen.
Surfen Sie zu udio.com und erstellen Sie ein Konto. Auf der Startseite finden Sie Songs zur Inspiration, kategorisiert in Trending, Top-Kategorien und Top-Titel. Nach einem Klick auf Create geben Sie eine Beschreibung der gewünschten Musik ein, zum Beispiel retro synthesizer rock, 8 bit music, 1980s, c86.  Klappen Sie die Option Advanced Controls auf. Dort können Sie etwa das Modell auswählen, die Länge bestimmen und die Stärke des Prompts einstellen. Klicken Sie erneut auf Create, um zwei Musikstücke generieren zu lassen, Bild 11.
Bild 11: Die Musikanwendung Udio ermöglicht es Ihnen bereits auf der Startseite, ein eigenes Musikstück generieren zu lassen
Quelle: PCtipp.ch
Über View und Song Details lässt sich das Lied nachträglich bearbeiten. Sie können die Lyrics ändern, den Track verlängern und sich mit Edit Cover Art ein Cover generieren lassen. Sind Sie mit dem Song zufrieden, können Sie diesen abschliessend herunterladen oder teilen. Ihre Werke lassen sich im Format MP3 oder WAV herunterladen. Von den hier vorgestellten Modellen kommt Udio menschlicher Musik am nächsten, Bild 12.
Bild 12: Neben dem Prompt erlauben es die fortgeschrittenen Funktionen von Udio, auf das zu generierende Musikstück einzuwirken
Quelle: PCtipp.ch

Fazit: ausprobieren lohnt

Musik generierende KI-Algorithmen können wohlklingende Kompositionen erzeugen, sind aber noch nicht in der Lage, die Kreativität, Vielfalt und emotionale Tiefe abzubilden, die menschliche Musiker in ihre Werke einfliessen lassen. Sie können gleichwohl als Inspiration dienen. Wie man bei ChatGPT beobachten konnte, macht die KI-Entwicklung rasante Fortschritte. Entsprechend werden sich auch die Fähigkeiten der KI-Modelle zur Musikerzeugung schnell verbessern.
Zu bedenken ist jedoch: Musik zu erzeugen, ist wesentlich aufwendiger, als Texte oder Bilder zu generieren. Audio hat zwar eine niedrige Bandbreite, erfordert aber in der Regel 44 000 Samples pro Sekunde. Das bedeutet, dass wenige Sekunden Musik bezüglich Rechenleistung einem riesengrossen Bild oder einer Unmenge Text entsprechen. Dazu kommt: Die steigende Qualität der Musik ist nur möglich, weil die KI mit echten Daten trainiert ist, auch mit urheberrechtlich geschützter Musik. Die Inhaber dieser Musik werden an den Einnahmen der KI-Tools bislang nicht beteiligt.

Andreas Dumont
Autor(in) Andreas Dumont



Kommentare
Es sind keine Kommentare vorhanden.