AIne Ahnung

Adam A. Siwy
AIne Ahnung

Ein Podcast über künstliche Intelligenz und maschinelles Lernen.

Episodes

  1. Episode 8: Die KI-Reise geht weiter: Text-to-Speech Synthese mit ElevenLabs

    05/17/2023

    Episode 8: Die KI-Reise geht weiter: Text-to-Speech Synthese mit ElevenLabs

    Kilometer achttausendeinundachzig, Willkommen zur achten Episode des AIne Ahnung-Podcasts mit Adam. In dieser Folge dreht sich alles um die Anwendung von KI im Alltag. Adam berichtet von der fortschreitenden Entwicklung seiner Podcast-Produktionspipeline, die es ihm ermöglicht, in kürzester Zeit eine Episode zu erstellen. Er erklärt die Verwendung von Speech-to-Text, insbesondere die Nutzung der Whisper-API, um aus Sprachaufnahmen Text zu generieren. Zusätzlich führt er nun Text-to-Speech ein und präsentiert eine modellierte Synthese seiner eigenen Stimme von Eleven Labs. Dadurch eröffnen sich neue Möglichkeiten, den Podcast in verschiedenen Sprachen zu übersetzen und somit neue Märkte zu erschließen. Adam erwähnt auch die freie Version von Eleven Labs sowie die Experimentierphase für mehrere Stimmen. Obwohl es noch einige Herausforderungen gibt, ist er beeindruckt von der Klonung seiner Stimme und plant, die Landing-Page der achten Episode zu verlinken, auf der die synthetisierten Übersetzungen in verschiedenen Sprachen zu hören sind. Adam teilt auch einen Ausblick auf zukünftige Themen wie OCR und Handschrifterkennung. Er betont seine kontinuierliche Arbeit an der Optimierung der Podcast-Produktionspipeline und lädt die Zuhörer ein, Feedback zu geben. Abschließend grüßt er Sebastian, der sich für die Episode interessiert, und verabschiedet sich. Hört rein und genießt den Podcast! Mehr Infos zu ElevenLabs: https://beta.elevenlabs.io/speech-synthesis

  2. Episode 6: Automatisierung des Podcastings: Speech-to-Text und Qualitätsverbesserung mit KI

    05/17/2023

    Episode 6: Automatisierung des Podcastings: Speech-to-Text und Qualitätsverbesserung mit KI

    Kilometer 7.794. In der sechsten Episode des AIne Ahnung-Podcasts erforscht der Gastgeber Adam das Thema Speech-to-Text. Adam teilt seine Erfahrungen mit der Automatisierung des Podcasting-Prozesses und startet mit einer persönlichen Beobachtung. Er befindet sich gerade im Auto, was zu einigen Hintergrundgeräuschen führt, und nutzt die Zeit zwischen Arbeit und Zuhause, um diese kurze Episode aufzunehmen. Adam gesteht, dass er von Natur aus ein fauler Mensch ist und bereits versucht hat, den Podcast-Prozess zu automatisieren. Bisher war es jedoch immer ein langwieriger Prozess, den Podcast aufzunehmen, zu bearbeiten, ein Intro hinzuzufügen und die Show-Notizen zusammenzustellen. Eine Idee, die Adam bereits in der vorherigen Episode hatte, war die Verwendung einer Speech-to-Text-Engine, um den Podcast zu transkribieren. In der vorherigen Episode hat er IBM Watson dafür genutzt und wollte diese Idee weiterverfolgen. Jetzt hat er sich für OpenAI's Whisper achieve entschieden. Adam erklärt, dass er ungefähr vier Stunden damit verbracht hat, alles einzurichten. Er hat OpenAI's Whisper-Modellsoftware auf seinem Windows 11-System in einem Subsystem für Linux installiert. Er hat experimentiert und festgestellt, dass das kleine Modell bereits gute Ergebnisse liefert. Dadurch entfällt für ihn die zeitaufwendige Aufgabe, den Text für jede Episode manuell zu transkribieren. Stattdessen kann er die AI-Tools nutzen, um den transkribierten Text zu generieren. Adam erwähnt, dass er den generierten Text dann durch ChatGPT schickt und den AI-Agenten bittet, eine Zusammenfassung der Episode zu erstellen. Diese Zusammenfassung wird dann zur Beschreibung der Episode verwendet. Es ist ein einfacher Ansatz, den Adam gewählt hat, der jedoch mit einer gewissen Vorbereitungszeit verbunden war. Ein weiteres Problem, dem Adam begegnet ist, ist die Aufnahmequalität des Podcasts. Da er kein Studio-Mikrofon verwendet und sich im Auto befindet, ist die Klangqualität nicht optimal. Hier kommt Adobe Enhance zur Hilfe. Adam hat die AI von Adobe genutzt, um eine Audio-Datei hochzuladen und Störgeräusche und eingeschränkte Qualität zu entfernen. Die Sprachqualität wird verbessert, und nach wenigen Minuten kann er eine qualitativ hochwertigere Datei herunterladen. Adam ist mit dem Ergebnis zufrieden und freut sich, dass er keine manuellen Anpassungen oder Unterdrückungsmaßnahmen mehr vornehmen muss. Adam betont, dass diese KI-Tools noch in einem Beta-Stadium sind, aber er findet die Ergebnisse bereits beeindruckend. Er muss sich nun nicht mehr um die Transkription des Textes oder die Verbesserung der Klangqualität kümmern. Diese Aufgaben werden von den KI-Tools kostenlos erledigt. Abschließend erwähnt Adam, dass er bereits einige Tipps von ChatGPT erhalten hat, wie er den Podcast-Feed am besten vorbereiten kann. Einer der nächsten Schritte wird die Veröffentlichung der Episoden sein.

  3. Episode 5: KI im Alltag - Einblicke, Erkenntnisse und Explorationen

    05/17/2023

    Episode 5: KI im Alltag - Einblicke, Erkenntnisse und Explorationen

    In der fünften Episode des AIne Ahnung-Podcasts erkundet der Gastgeber die Rolle der künstlichen Intelligenz (KI) im Alltag. Er teilt Erkenntnisse aus einem kürzlich besuchten Webinar mit dem AI Explorer Club, einer Gruppe von KI-Experten. Eine wichtige Erkenntnis ist, dass KI die Arbeit nicht ersetzen, sondern unterstützen soll. Dieses Werkzeug kann die eigene Arbeit ergänzen und beschleunigen. Früher müssten mehrere Personen verschiedene Aufgaben erledigen, aber nun können Elemente der Arbeit an KI ausgelagert werden, die sie im Autopilotmodus erledigt. Ein Beispiel ist das Generieren von Texten, Bildern, Sprache und Videos durch generative KI. Der erste Takeaway ist, dass KI die Arbeitswelt unterstützt, wenn man sich darauf einlässt. Der zweite Takeaway besagt, dass KI keine vollständige Automatisierung darstellt. Das Pareto-Prinzip wird erwähnt, dass 80 Prozent der Arbeit durch KI erledigt werden können, während weiterhin 20 Prozent manueller Prozesse erforderlich sind. Es ist möglich, noch mehr Aufgaben an KI auszulagern, vielleicht sogar 90 Prozent, wenn man es gründlich plant und die KI-Agenten entsprechend automatisiert. Dennoch sollte es kein Verhältnis von 100 Prozent KI zu 0 Prozent menschlicher Nacharbeit geben. Der menschliche Faktor bleibt wichtig, um die Arbeit zu bewerten und zu koordinieren. Der dritte Takeaway betont, dass man sich aktiv mit KI beschäftigen sollte. Viele Menschen lesen darüber oder kommen in den Medien damit in Kontakt, haben jedoch keine direkte Schnittstelle dazu. Es wird jedoch immer einfacher, auf KI-Tools zuzugreifen und sie zu nutzen. ChatGPT dient als Beispiel für eine zugängliche Schnittstelle, die von Schülern bis hin zu älteren Menschen leicht verstanden und genutzt werden kann. KI wird zunehmend in unseren Alltag integriert, und es ist nicht nur wichtig, darüber zu reden, sondern auch explorativ zu erforschen, was damit möglich ist. Der Gastgeber ist davon überzeugt, dass die Episoden kürzer werden und sich spezifisch mit AI-Tools auseinandersetzen werden. Für heute endet die Episode bei Kilometer 7.784.

About

Ein Podcast über künstliche Intelligenz und maschinelles Lernen.

To listen to explicit episodes, sign in.

Stay up to date with this show

Sign in or sign up to follow shows, save episodes, and get the latest updates.

Select a country or region

Africa, Middle East, and India

Asia Pacific

Europe

Latin America and the Caribbean

The United States and Canada