47 episodes

Du bist Data Scientist oder interessierst dich für Daten, Maschine Learning und AI? Dann ist dieser Podcast für dich. Wir teilen unsere Learnings aus über 180 Projekten, du bekommst Infos und Anregungen zu spannenden Themen rund um Daten.

Wir klären auf, geben Hinweise und teilen unsere Erfahrungen, die wir in mehr als 10 Jahren als Data Scientists im B2B Bereich gesammelt haben.
Wir decken auf, was wirklich hinter den Hypes und Trends der Data Science Branche steckt.
Wir hinterfragen, was ein Data Science Projekt erfolgreich macht und welche Faktoren es zum Scheitern verurteilen.

In Numbers We Trust - Der Data Science Podcast INWT Statistics GmbH

    • Technology

Du bist Data Scientist oder interessierst dich für Daten, Maschine Learning und AI? Dann ist dieser Podcast für dich. Wir teilen unsere Learnings aus über 180 Projekten, du bekommst Infos und Anregungen zu spannenden Themen rund um Daten.

Wir klären auf, geben Hinweise und teilen unsere Erfahrungen, die wir in mehr als 10 Jahren als Data Scientists im B2B Bereich gesammelt haben.
Wir decken auf, was wirklich hinter den Hypes und Trends der Data Science Branche steckt.
Wir hinterfragen, was ein Data Science Projekt erfolgreich macht und welche Faktoren es zum Scheitern verurteilen.

    #47: Von Prognosen und Prompts: Data Science trifft generative KI mit Tobias Sterbak

    #47: Von Prognosen und Prompts: Data Science trifft generative KI mit Tobias Sterbak

    In dieser Episode spricht Mira mit Tobias Sterbak, einem Freelance Machine Learning Engineer mit Fokus auf NLP-Anwendungen, über Data Science und generative KI. Wir vergleichen klassische Data Science-Methoden mit den neuesten KI-Ansätzen wie Large Language Models (LLMs). Ihr erfahrt, wie sich Datenbereitstellung, Validierung und Feature Engineering unterscheiden und welche Herausforderungen dabei auftreten. Außerdem gehen wir auf die Bedeutung der User Experience und die Schwierigkeiten bei der Bewertung der Modelle ein.
     
    ***Links:***
    Website von inwt: https://www.inwt-statistics.de
    Blog von Tobias Sterbak: https://www.depends-on-the-definition.com/
    Website von Tobias Sterbak: https://tobiassterbak.com/
    Ein Feuer auf der Tiefe (engl.: A Fire Upon the Deep) von Vernor Vinge https://de.wikipedia.org/wiki/Ein_Feuer_auf_der_Tiefe
    Fragen, Feedback und Themenwünsche gern an: podcast@inwt-statistics.de

    • 46 min
    #46: Strategien zur Performance-Optimierung in R

    #46: Strategien zur Performance-Optimierung in R

    R ist keine Compilersprache und damit von Natur aus eher langsam. Wir sprechen darüber wie man die Performance von R Code optimieren kann und welche spezifischen Herausforderungen R dabei mit sich bringt. Wir besprechen Methoden, um Engpässe im Code effizient zu identifizieren, darunter Tools wie system.time, microbenchmark und profvis. Anschließend teilen wir Techniken für die Arbeit mit großen Datensätzen und die Parallelisierung. Wir zeigen wie durch gezielte Optimierung erhebliche Performance-Verbesserungen erzielt werden können.
    ***Links:***
    Episode #41: Strategien zur Performance-Optimierung in Python https://www.podbean.com/ew/pb-weg8d-158cd71
    Blogartikelserie zu Code Performance in R:
     R-Code beschleunigen https://www.inwt-statistics.de/blog/code-performanz-in-r-r-code-beschleunigen
    Warum ist mein Code langsam? https://www.inwt-statistics.de/blog/code-performanz-in-r-warum-ist-mein-code-langsam
    Parallelisierung https://www.inwt-statistics.de/blog/code-performanz-in-r-parallelisierung
    Mit großen Datensätzen arbeiten https://www.inwt-statistics.de/blog/code-performanz-in-r-mit-grossen-datensaetzen-arbeiten

    Rccp: https://www.rcpp.org/
    Fragen, Feedback und Themenwünsche gern an: podcast@inwt-statistics.de

    • 24 min
    #45: Data Science bei 1&1 Versatel – Dr. Stephan Hausberg im Gespräch über den Aufbau von Data Teams

    #45: Data Science bei 1&1 Versatel – Dr. Stephan Hausberg im Gespräch über den Aufbau von Data Teams

    Wie baue ich ein Data Team auf? Wie kriege ich beim Hiring the richtigen Leute? Und wie fördere ich eine gute Fehlerkultur? All diesen Fragen ist Dr. Stephan Hausberg, Head of Data Science und Business Analytics bei 1&1 Versatel, in den letzten Jahren begegnet. In diesem Interview lässt er uns an seinen Learnings teilhaben. Enjoy!
     
    **Links**
    Buch: Story Telling with Data https://www.storytellingwithdata.com/books
    Stephan Hausberg auf LinkedIn: https://www.linkedin.com/in/dr-stephan-hausberg-679750118/
    Mira Céline Klein auf LinkedIn: https://www.linkedin.com/in/mira-celine-klein-848753264/ 
    Feedback & Themenwünsche gern an: podcast@inwt-statistics.de
    Website inwt: https://www.inwt-statistics.de/

    • 49 min
    #44: Lineare Regression in der Praxis – Oldie oder Goldie?

    #44: Lineare Regression in der Praxis – Oldie oder Goldie?

    Ist die lineare Regression nicht nur längst überholtes Zeug aus der Statistik 1 Vorlesung? Trotz ihrer vermeintlichen Einfachheit ist sie ein wichtiges Werkzeug in der Data Science. Ein Werkzeug das oft unterschätzt wird. Wir diskutieren wann lineare Regression zum Einsatz kommt, ihre Grenzen, Alternativen und Beispiele aus der Praxis.
    **Links:**
    [Blog] Einfache lineare Regression: https://www.inwt-statistics.de/blog/einfache_lineare_regression
    [Blog] Multiple lineare Regression: https://www.inwt-statistics.de/blog/multiple_lineare_regression
    [Blog] Beispielregression - Zunge vs. Zahlen: https://www.inwt-statistics.de/blog/beispielregression_zunge_vs_zahlen
    Fragen, Feedback und Themenwünsche gern an: podcast@inwt-statistics.de

    • 40 min
    #43: Damit es im Live-Betrieb nicht kracht: Vermeidung von Overfitting & Data Leakage

    #43: Damit es im Live-Betrieb nicht kracht: Vermeidung von Overfitting & Data Leakage

    Zwei Herausforderungen bei der Zuverlässigkeit von Prognosen im Live-Betrieb sind Overfitting (Modell ist zu stark an Trainingsdaten angepasst) und Data Leakage (Modell verfügt über Informationen, die es in der realen Anwendung nicht hat). Wir sprechen darüber, was Overfitting und Data Leakage genau sind und wo ihre Ursachen liegen. Außerdem diskutieren wir Lösungsansätze. 
     
    **Links:**
    Spurious Correlations: https://www.tylervigen.com/spurious-correlations 
    inwt Website: https://www.inwt-statistics.de/
     

    • 41 min
    #42: Frontends in Data Science: Welches Visualisierungstool ist das Richtige?

    #42: Frontends in Data Science: Welches Visualisierungstool ist das Richtige?

    Welches das richtige Visualisierungstool ist, hängt stark vom Projekt und auch vom Team ab. Wir erkunden drei Ansätze – interne Umgebungen wie Python Dash oder R Shiny, Dashboard-Tools wie Grafana und Redash, sowie Eigenentwicklung mit JS-Frameworks wie VueJs oder React – und wie sie sich in Bezug auf Entwicklungsgeschwindigkeit, Anpassungsfähigkeit und Skalierbarkeit unterscheiden. Auf dieser Grundlage geben wir eine Entscheidungshilfe, welcher dieser Ansätze "der Richtige" für ein Projekt ist. 
     
    ***Links***
    Dash: https://dash.plotly.com/
    Shiny: https://shiny.posit.co/
    Vue.js: https://vuejs.org/
    Fragen, Feedback und Themenwünsche gern an: podcast@inwt-statistics.de

    • 28 min

Top Podcasts In Technology

Acquired
Ben Gilbert and David Rosenthal
Lex Fridman Podcast
Lex Fridman
The TED AI Show
TED
All-In with Chamath, Jason, Sacks & Friedberg
All-In Podcast, LLC
Hard Fork
The New York Times
TED Radio Hour
NPR

You Might Also Like

Der KI-Podcast
ARD
Aha! History – Zehn Minuten Geschichte
WELT
0630 - der News-Podcast
1LIVE für die ARD
LANZ & PRECHT
ZDF, Markus Lanz & Richard David Precht
Eine Stunde History - Deutschlandfunk Nova
Deutschlandfunk Nova
Spektrum-Podcast
detektor.fm – Das Podcast-Radio