Jan Hagemeister gab Einblicke in ein aktuelles Projekt, bei dem es darum geht, eine Cloud-Instanz zu betreiben mit einem KI-Modell zur Erzeugung von Musik aus Textvorgaben.
Ziel des Projekts ist es, aus einfachen Texteingaben – wie z.B. “70 slow love song” oder “80ties dance track” – eine Audio-Datei zu erzeugen, die ein typisches Musikstück in der beschriebenen Musik-Richtung wiedergibt. Die Grundlage dazu bildet ein KI-Modell, welches von der Firma Meta (Facebook) zu diesem Zweck mit mehr als 20.000 Beispiel-Datensätzen trainiert wurde. Mit den passenden Werkzeugen soll dieses Modell mit eigenen Trainings-Datensätzen verfeinert und erweitert werden, so dass es als Inspirationsquelle für einen Musik-Produzenten dienen kann.
Jan zeigte zunächst, wie er sich eine Entwicklungsumgebung für diesen speziellen Zweck vorbereitet hat. Für die hohen Leistungsanforderungen des KI-Modells kommt eine GPU in einer Google Cloud-Instanz zum Einsatz. Diese lässt sich mit wenigen Klicks über eine Weboberfläche konfigurieren und starten. Google bietet dazu zahlreiche Optionen für unterschiedliche GPU-Varianten, Speicherausstattung, zu installierendes Betriebssystem und die Auswahl unterschiedlicher Rechenzentren weltweit an. Am Ende erhält man eine IP-Adresse der Instanz, auf die man dann per SSH-Tunnel zugreifen kann.
Mit Hilfe eines vorkonfigurierten Image und ein paar wenigen Befehlen im Terminal installierte Jan anschließend die Software “Jupyter” sowie eine Port-Umleitung für den lokalen Zugriff auf den Webserver der Cloud-Instanz. Jupyter bietet eine Entwicklungs-Oberfläche im Browser an, um mit Python-Scripten das KI-Modell zu betreiben und zu testen. Mit ein paar wenigen Script-Zeilen generierte die KI dann tatsächlich neue Musik-Dateien, die sich direkt im Browser abspielen ließen.
Für die Einrichtung und Vorbereitung aller Schritte hatte Jan sich zuvor im Internet schlau gemacht. Nach seiner Einschätzung braucht man ca. 1 Woche, um sich mit den Grundlagen für KI-Entwicklung vertraut zu machen, wenn man frisch mit diesem Thema durchstarten möchte. Er berichtete begeistert von den umfangreichen Möglichkeiten der zahlreichen Python-Bibliotheken. Im Zuge seiner Tests konnte Jan die KI auch für andere Anwendungszwecke wie Text- oder Daten-Analysen bereits erfolgreich einsetzen.
Google Cloud GPU
https://cloud.google.com/gpu?hl=de
Jupyther
https://jupyter.org
https://jupyterlab.readthedocs.io/en/latest/
Pandas
https://pandas.pydata.org/docs/index.html
NumPy
https://numpy.org