Mastodon
Zu sehen ist eine Audiospur mit Markierungen im Audio, die beschriftet sind mit "Deadair" oder "Filler".

Künstliche Intelligenz hilft beim Schneiden von Podcasts

01.05.2023 | Digital, Medien | 1 Kommentar

KI bzw. AI ist gerade ein Trend-Thema. Kaum ein Bereich bleibt davon ausgeschlossen. In vielen Bereichen wird damit experimentiert, Content erstellt oder die Content-Erstellung vereinfacht. Warum sollte es in der Podcast-Produktion anders sein? Gerade die Post-Produktion winkt hier mit einer großen Zeitersparnis beim Schneiden von „ähs“ oder „ehms“ oder längeren Gedankenpausen. Wie schön wäre es, wenn man hier supportet werden könnte.

Ich habe zwei Online-Tools getestet, wobei ich bei einem Tool schon schnell ausgestiegen bin, weil es mein Zielbild nicht richtig abdeckte. Dafür hat mich ein anderes Tool umso mehr überrascht. Aber der Reihe nach.

Descript – lokal installiertes Programm mit Text-Fokus

Descript ist ein Tool, in das man die Dateien lädt und anschließend eine Textansicht, also ein Transskript des Podcasts erhält. Das Transkript ist auch gleichzeitig der Editiermodus. Aber von Anfang an:

Nach der Registrierung lädt man sich das Programm runter, in dem man die eigentliche Arbeit vornimmt. Es gibt ein ausführliches, englisches Video-Tutorial, das einem erklärt, wie man Descript nutzt. Dann kann man auch schon die Audiodateien hochladen. Stand jetzt kann nur eine Multi-Track-Datei mit maximal 3 Tonspuren hochgeladen werden. Einen Upload der Spuren als Einzeldatei habe ich nicht gefunden. Nach dem Upload kommt dann der angesprochene Text-Editor.

Das Transkript des Audios liest sich gut. Wenn man dann aber das Audio mit dem Text vergleicht war in meinem Test schnell die Ernüchterung da: der Text und die Füllwörter bzw. Wortbestandteile werden nicht gut erkannt und stimmen nicht überein. Es fehlen also im Text zum Teil Wörter, die man rausschneiden würde. Das ist deswegen ungünstig, weil der Texteditor auch das Schnittprogramm ist. Lösche ich ein Wort im Text-Editor, wird es auch im Audio entfernt. Ist das Wort aber gar nicht im Texteditor, kann ich es auf diesen Weg nicht im Audio entfernen.

Noch nicht alle Features auf Deutsch verfügbar

Die Features wie „automatische ehm“-Entfernung sind leider in meiner Version noch nicht verfügbar gewesen. Nur Gesprächspausen konnten automatisch entfernt werden. Damit sind für mich wichtige Punkte nicht gegeben und ich habe den Test eingestellt. Vielleicht ist es zu einem späteren Zeitpunkt besser für meine Zwecke geeignet. Insgesamt kostet Descript in der kleinsten Variante ca. 12 € monatlich für 10 Stunden Audio im Monat.

Cleanvoice App – Gute Nachbearbeitung mit Schnittlisten

Nach ein wenig googeln bin ich auf Cleanvoice gestoßen. Neben Füllwörtern sollen auch „Mundgeräusche“ und große Lücken automatisch erkannt und entfernt werden. Das ist nach der Erfahrung mit Descript erstmal ein großes Versprechen. Also auf in den Test. Cleanvoice arbeitet vollständig als Onlinetool. Es muss also nichts installiert werden.

Für Podcasts können auch Multi-Track-Aufnahmen ins Programm geladen werden

Meine erste, positive Überraschung: neben einer Einzelaufnahme können auch Multi-Track-Aufnahmen hochgeladen werden. Danach kann man unterscheiden zwischen dem „Standard-Setup“ und den einzelnen Features, die zur Bearbeitung genutzt werden sollen. Und dann fängt es auch schon an zu arbeiten.

Der Wartebildschirm, während Cleanvoice das Audio bearbeitet. Nach dem Upload kann man das Fenster auch schließen.

Während der Bearbeitung kann man die Seite verlassen, denn die Verarbeitung geschieht auf den Servern von Cleanvoice. Wenn alles fertig ist, bekommt man eine Mail mit einem Link. Anschließend gibt es eine kurze Zusammenfassung, was gemacht wurde und kann die Dateien fertig runterladen:

Aber wer lieber sehen will, was am Audio konkret angepasst wurde, kann sich auch die Schnittlisten für Audition oder Reaper / Ultraschall runterladen. Damit kann man in den Originaldateien sichtbar machen, was geschnitten wurde und was dort erkannt wurde.

Ansicht der Schnittliste von Cleanvoice im Originalaudio in Reaper.

Das Ergebnis hat mich überrascht. Für mich ist das ein richtiger Game-Changer in der Nachbearbeitung von Podcasts.

Cleanvoice gibt es als Abo oder als „pay as you go“- / Prepaid-Variante

Bei Cleanvoice muss man kein Abo abschließen. Es gibt Cleanvoice als Abo, aber auch als „pay as you go“-Modell. Dabei kauft man Credits, die man zeitunabhängig nutzen kann. Beide Pakete starten ab 10 €. Je nach Modell (Abo vs. pay as you go) gibt es dafür 5-10 Stunden Audioverarbeitung. Weil es im kurzen Test so gut funktionierte, gehe ich mit Cleanvoice in den Langzeittest und werde diesen Artikel updaten, wenn ich noch mehr Erfahrung habe.

Ersetzt die automatische Post-Production die Nachbearbeitung?

Nein, aus meiner Sicht nicht. Denn inhaltliche Anpassungen oder eine Endkontrolle sollte in jedem Fall statt finden. Aber es erspart einem viel Arbeit beim Schneiden von ähs oder anderen Störgeräuschen. Wir werden es für Ausgang Podcast jetzt einfach noch intensiver testen.

Wie sind Deine Erfahrungen mit AI-Audio-Bearbeitungs-Tools? Schreibe es gerne in die Kommentare.

About Sebastian
Medieninteressierter Kölner mit einem Hang zum allen neueren, technischen Möglichkeiten mit einer großen Vorliebe zum Fortbewegen mit Bus, Straßenbahn und Bahn. Dies ist sein privater Blog, in dem er sich genau im Schwerpunkt  mit diesen großen Themenbereichen beschäftigt.

1 Kommentar

  1. Hi!
    Danke für den Artikel, bist du zufällig über ein AI Tool gestoßen, das automatisch den letzten Satz schneiden kann. Ich markiere meine Fehler bei der Aufnahme mit Klickern / Schnipsen, also einem lauten Geräusch, damit ich sehe, wann ich schneiden muss. Danach spreche ich den satz nochmal. Jetzt wäre es ja super, wenn es ein Tool gäbe, das den letzten vollständigen korrekten Satz erkennt. Ich hoffe man versteht wie ich es meine, ist dir da zufällig was bekannt? :) Vielen Dank vorab!
    Max

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert