11 episodes

AIne Ahnung Adam A. Siwy

- Technology

Ein Podcast über künstliche Intelligenz und maschinelles Lernen.

- MAY 30, 2023
Episode 11: KI in der Entwicklerwelt: Tab 9 Codeunterstützung

Episode 11: KI in der Entwicklerwelt: Tab 9 Codeunterstützung

In der 11. Episode des AIne Ahnung Podcasts setzt Adam seine Experimente mit KI-Tools fort und erkundet die Integration von KI in Entwicklungsumgebungen. Er beschäftigt sich mit der Verwendung von Tab 9, einer Erweiterung für Visual Studio Code, um KI-gestützte Code-Vorschläge zu erhalten. Adam teilt seine Erfahrungen und wie es sich anfühlt, neue Funktionen und alternative Wege vorgeschlagen zu bekommen, die er zuvor nicht kannte. Er berichtet auch von seinem technischen Projekt, bei dem er ein PHP8-Skript erstellt hat, um den aktuellen Ordner auszulesen und basierend darauf einen Podcast-Feed zu generieren. Adam erklärt, wie er TAP9 und die Dokumentation genutzt hat, um das Skript effizient zu erstellen. Er ermutigt Programmierer, mit KI-Tools zu experimentieren und erwähnt zukünftige Tools wie den Github Co-Pilot, der ähnliche KI-basierte Code-Vorschläge bieten wird. Adam gibt einen Ausblick auf kommende Episoden, in denen er sich mit generativen Bildern und Videos experimentell beschäftigen wird. Mit diesem Ausblick verabschiedet er sich von der Episode. Kilometer 8.510. Ciao!
- MAY 26, 2023
Episode 10: KI-Experimente und dynamische Integration eines MP3-Players

Episode 10: KI-Experimente und dynamische Integration eines MP3-Players

In der zehnten Episode des AIne Ahnung Podcasts setzt Adam seine Experimente mit KI-Tools fort und erkundet verschiedene Skripting- und Programmieralgorithmen. Er konzentriert sich auf die Integration eines MP3-Players auf seiner Podcast-Website, mit dem Zuhörer die gewünschte Episode und Sprache auswählen können. Adam erklärt, wie er die Dropdown-Elemente für die Episode und Sprache vorbereitet hat und mithilfe von Javascript ein dynamisches Skript erstellt hat. Er ist beeindruckt von der Effizienz, mit der er mithilfe der KI einen funktionierenden Player generieren konnte, der nun auf der Landingpage seiner Website zu sehen ist. Adam plant weitere Experimente mit komplexeren Problemstellungen und verschiedenen Programmiersprachen wie JavaScript, PHP, Elixir und Python. Er lädt die Zuhörer ein, Feedback zu geben und Ideen für weitere Tools und Integrationen vorzuschlagen. Mit diesem Ausblick verabschiedet er sich von der Episode. Kilometer 8.460. Ciao!
- MAY 23, 2023
Episode 9: AI-Tools zur Digitalisierung von handgeschriebenem Text

Episode 9: AI-Tools zur Digitalisierung von handgeschriebenem Text

Adam präsentiert in der neunten Episode des AIne Ahnung Podcasts verschiedene AI-Tools zur handschriftlichen OCR (optischen Zeichenerkennung). Nachdem er zuvor mit Sprach-zu-Text- und Text-zu-Sprach-Syntheseexperimenten beeindruckt war, widmet er sich nun dem Erfassen und Digitalisieren von handschriftlichen Texten. Er stellt drei Tools vor: die Vision API von Google, Tesseract OCR und Transcribus. Adam hat ein 30-seitiges Manuskript geschrieben und möchte es digitalisieren. Er fotografiert die Seiten und lässt sie durch die OCR-Tools laufen. Quantitativ werden die Texte gut erfasst, mit einzelnen Wörtern und Absätzen. Allerdings ist er mit den Ergebnissen noch nicht zufriedenstellend. Etwa jedes dritte oder vierte Wort wird falsch erkannt oder den arabischen Buchstaben zugeordnet. Adam glaubt jedoch, dass OCR bessere Ergebnisse liefern kann und plant, weiterzuforschen. Er wird versuchen, sauberere und besser lesbare Seiten zu verwenden. Adam lädt die Zuhörer ein, ihm ihre Erfahrungen oder Tipps zur handschriftlichen Texterkennung mitzuteilen. Er erwähnt bereits den Rat eines Google-Mitarbeiters und freut sich über weitere Rückmeldungen. Mit diesem Ausblick verabschiedet er sich und verspricht, dran zu bleiben. Kilometer 8.434. Ciao!
- MAY 17, 2023
Episode 8: Die KI-Reise geht weiter: Text-to-Speech Synthese mit ElevenLabs

Episode 8: Die KI-Reise geht weiter: Text-to-Speech Synthese mit ElevenLabs

Kilometer achttausendeinundachzig, Willkommen zur achten Episode des AIne Ahnung-Podcasts mit Adam. In dieser Folge dreht sich alles um die Anwendung von KI im Alltag. Adam berichtet von der fortschreitenden Entwicklung seiner Podcast-Produktionspipeline, die es ihm ermöglicht, in kürzester Zeit eine Episode zu erstellen. Er erklärt die Verwendung von Speech-to-Text, insbesondere die Nutzung der Whisper-API, um aus Sprachaufnahmen Text zu generieren. Zusätzlich führt er nun Text-to-Speech ein und präsentiert eine modellierte Synthese seiner eigenen Stimme von Eleven Labs. Dadurch eröffnen sich neue Möglichkeiten, den Podcast in verschiedenen Sprachen zu übersetzen und somit neue Märkte zu erschließen. Adam erwähnt auch die freie Version von Eleven Labs sowie die Experimentierphase für mehrere Stimmen. Obwohl es noch einige Herausforderungen gibt, ist er beeindruckt von der Klonung seiner Stimme und plant, die Landing-Page der achten Episode zu verlinken, auf der die synthetisierten Übersetzungen in verschiedenen Sprachen zu hören sind. Adam teilt auch einen Ausblick auf zukünftige Themen wie OCR und Handschrifterkennung. Er betont seine kontinuierliche Arbeit an der Optimierung der Podcast-Produktionspipeline und lädt die Zuhörer ein, Feedback zu geben. Abschließend grüßt er Sebastian, der sich für die Episode interessiert, und verabschiedet sich. Hört rein und genießt den Podcast!

Mehr Infos zu ElevenLabs: https://beta.elevenlabs.io/speech-synthesis
- MAY 17, 2023
Episode 7: Kreative KI - Individuelle Podcast-Cover mit Stable Diffusion

Episode 7: Kreative KI - Individuelle Podcast-Cover mit Stable Diffusion

Willkommen zur siebten Episode des AIne Ahnung-Podcasts mit Adam. Diesmal dreht sich alles um künstliche Intelligenz und ihre Rolle in unserem Alltag. Adam berichtet von seinem Experiment, sich verstärkt mit KI zu beschäftigen. In den vorherigen Episoden sprach er bereits über die Sprach-zu-Text-Synthese, die die Podcast-Beschreibungen generiert. Nun widmet er sich der generativen KI Stable Diffusion, die Bilder erzeugen kann. Adam möchte individuelle Cover für jede Podcast-Episode erstellen, was bisher viel manuelle Arbeit erforderte. Mit Stable Diffusion möchte er diese Aufgabe automatisieren und mithilfe von Textbeschreibungen einzigartige Podcast-Cover gestalten. Er berichtet von seinen ersten Experimenten und seiner Begeisterung für diese Technologie. Adam plant, die Cover mit jeder Episode weiter zu verbessern und freut sich auf weitere Entdeckungen in der Welt der generativen KI. Kilometer 7.984, viel Spaß beim Zuhören!
- MAY 17, 2023
Episode 6: Automatisierung des Podcastings: Speech-to-Text und Qualitätsverbesserung mit KI

Episode 6: Automatisierung des Podcastings: Speech-to-Text und Qualitätsverbesserung mit KI

Kilometer 7.794. In der sechsten Episode des AIne Ahnung-Podcasts erforscht der Gastgeber Adam das Thema Speech-to-Text. Adam teilt seine Erfahrungen mit der Automatisierung des Podcasting-Prozesses und startet mit einer persönlichen Beobachtung. Er befindet sich gerade im Auto, was zu einigen Hintergrundgeräuschen führt, und nutzt die Zeit zwischen Arbeit und Zuhause, um diese kurze Episode aufzunehmen.

Adam gesteht, dass er von Natur aus ein fauler Mensch ist und bereits versucht hat, den Podcast-Prozess zu automatisieren. Bisher war es jedoch immer ein langwieriger Prozess, den Podcast aufzunehmen, zu bearbeiten, ein Intro hinzuzufügen und die Show-Notizen zusammenzustellen. Eine Idee, die Adam bereits in der vorherigen Episode hatte, war die Verwendung einer Speech-to-Text-Engine, um den Podcast zu transkribieren. In der vorherigen Episode hat er IBM Watson dafür genutzt und wollte diese Idee weiterverfolgen. Jetzt hat er sich für OpenAI's Whisper achieve entschieden.

Adam erklärt, dass er ungefähr vier Stunden damit verbracht hat, alles einzurichten. Er hat OpenAI's Whisper-Modellsoftware auf seinem Windows 11-System in einem Subsystem für Linux installiert. Er hat experimentiert und festgestellt, dass das kleine Modell bereits gute Ergebnisse liefert. Dadurch entfällt für ihn die zeitaufwendige Aufgabe, den Text für jede Episode manuell zu transkribieren. Stattdessen kann er die AI-Tools nutzen, um den transkribierten Text zu generieren.

Adam erwähnt, dass er den generierten Text dann durch ChatGPT schickt und den AI-Agenten bittet, eine Zusammenfassung der Episode zu erstellen. Diese Zusammenfassung wird dann zur Beschreibung der Episode verwendet. Es ist ein einfacher Ansatz, den Adam gewählt hat, der jedoch mit einer gewissen Vorbereitungszeit verbunden war.

Ein weiteres Problem, dem Adam begegnet ist, ist die Aufnahmequalität des Podcasts. Da er kein Studio-Mikrofon verwendet und sich im Auto befindet, ist die Klangqualität nicht optimal. Hier kommt Adobe Enhance zur Hilfe. Adam hat die AI von Adobe genutzt, um eine Audio-Datei hochzuladen und Störgeräusche und eingeschränkte Qualität zu entfernen. Die Sprachqualität wird verbessert, und nach wenigen Minuten kann er eine qualitativ hochwertigere Datei herunterladen. Adam ist mit dem Ergebnis zufrieden und freut sich, dass er keine manuellen Anpassungen oder Unterdrückungsmaßnahmen mehr vornehmen muss.

Adam betont, dass diese KI-Tools noch in einem Beta-Stadium sind, aber er findet die Ergebnisse bereits beeindruckend. Er muss sich nun nicht mehr um die Transkription des Textes oder die Verbesserung der Klangqualität kümmern. Diese Aufgaben werden von den KI-Tools kostenlos erledigt.

Abschließend erwähnt Adam, dass er bereits einige Tipps von ChatGPT erhalten hat, wie er den Podcast-Feed am besten vorbereiten kann. Einer der nächsten Schritte wird die Veröffentlichung der Episoden sein.