28 episodios

Streuspanne, dein Podcast für spannende Neuigkeiten, lustige Fun-Facts und interessantes Hintergrundwissen rund um das Thema Statistik.

Streuspanne – Statistik und ihre Kuriositäten Fraunhofer ITWM

    • Ciencia

Streuspanne, dein Podcast für spannende Neuigkeiten, lustige Fun-Facts und interessantes Hintergrundwissen rund um das Thema Statistik.

    »Streuspanne-Lexikon« – F wie Freiheitsgrade

    »Streuspanne-Lexikon« – F wie Freiheitsgrade

    Der neue Eintrag unseres »Streuspanne-Lexikons« ist »F wie Freiheitsgrade« – und das, wie immer in unseren Lexikon-Folgen, kurz und knapp in wenigen Minuten.

    Freiheitsgrade beschreiben in der Statistik die Anzahl
    unabhängiger Informationen, die in eine Schätzung einfließen. Wenn also aus n Daten ein Mittelwert berechnet wird, dann fließen n unabhängige Informationen ein – also hat der Mittelwert n Freiheitsgrade. Bei der Standardabweichung bzw. der Varianz sind es hingegen nur n-1.  

    Ein bekanntes Beispiel für die Anwendung der Freiheitsgrade ist die Varianzanalyse. Hier untersucht man, ob es signifikante Unterschiede in einem bestimmten Merkmal zwischen verschiedenen Gruppen gibt, etwa in der Lebenserwartung zwischen Geschlechtern oder zwischen Rauchenden und Nichtrauchenden.
    Man vergleicht dabei die Streuung der Gruppenmittelwerte mit der Streuung innerhalb der Gruppen. Um die Streuung innerhalb der Gruppen zu bestimmen, müssen so viele Gruppenmittelwerte berechnet werden, wie es Gruppen gibt. Daher wird
    bei der Berechnung der Freiheitsgrade vom Stichprobenumfang nicht nur 1, sondern zusätzlich die Anzahl der Gruppen abgezogen.

    Falsch berechnete Freiheitsgrade führen zu ungenauen
    Schätzungen und verzerrten Ergebnissen. Bei großen Stichproben können kleine Fehler weniger ins Gewicht fallen, aber gerade bei Varianzanalysen ist eine
    genaue Berechnung der Freiheitsgrade entscheidend, da sie die Grundlage für die Interpretation der kritischen Werte bildet. Was kritische Werte sind, erklären
    wir Euch übrigens im Lexikon-Eintrag »K wie kritische Werte«.

    Ihr habt Statistiken entdeckt oder mathematische Beobachtungen aus dem Alltag, die wir diskutieren oder erklären sollen? Oder gibt es Begriffe, die wir im »Streuspanne-Lexikon« für Euch beleuchten sollen?  Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns mit neuen Ideen.


    Falls Ihr gerade von einer regulären Episode des
    »Streuspanne«-Podcasts hierher gefunden habt, springt schnell zurück!

    • 4 min
    »Streuspanne-Lexikon« – K wie kritische Werte

    »Streuspanne-Lexikon« – K wie kritische Werte

    Im neuen Eintrag unseres »Streuspanne-Lexikons« dreht sich alles um »K wie kritische Werte« – und das, wie immer in unserem Lexikon, kurz und knapp in wenigen Minuten.

    Kritische Werte dienen dazu, die Signifikanz von Ergebnissen in statistischen Analysen zu bestimmen. Sie helfen also dabei, festzustellen, ob ein beobachteter Effekt auf Zufall beruht oder tatsächlich signifikant ist.

    Um kritische Werte zu bestimmen, tut man so, als würde nur der Zufall agieren, und bestimmt dann extreme Rand-Ereignisse, die sehr selten sind. Dabei regelt die Signifikanz – also eine Art Seltenheitsmaß – was »selten«
    konkret bedeutet. Das genaue Berechnen erfordert ein wenig Kenntnisse in Wahrscheinlichkeitsrechnung, allerdingt gibt es für die gängigen Testverfahren Formelsammlungen.

    Um die Bedeutung kritischer Werte zu verdeutlichen,
    betrachten wir in diesem Eintrag kurz ein gängiges Beispiel mit dem Wurf einer Münze: Angenommen, wir wollen herausfinden, ob eine Münze fair ist oder nicht. Dafür werfen wir die Münze zehn Mal und beobachten, dass sie neun Mal auf Kopf und nur einmal auf Zahl landet. Das mag vielleicht ungewöhnlich erscheinen, aber es
    könnte auch durch Zufall passieren. Um das zu überprüfen, betrachten wir die Wahrscheinlichkeiten für verschiedene Ergebnisse. Die Bereiche, in denen die
    Anzahl der Kopf- und Zahlwürfe als typisch für eine faire Münze betrachtet wird, werden als kritische Werte festgelegt – da Ergebnisse außerhalb dieser Bereiche als selten genug angesehen werden, um nicht auf reinem Zufall zu beruhen. Somit können wir anhand dieser kritischen Werte bestimmen, ob das beobachtete Ergebnis signifikant ist oder nicht.

    Im Lexikon-Eintrag stellen wir die kritischen Werte außerdem den p-Werten gegenüber und erwähnen dabei unsere letzte reguläre Folge, die sich ausführlich mit den p-Werten befasst. Diese Folge findet Ihr hier: www.itwm.fraunhofer.de/p-werte

    Außerdem spricht Jochen die Binomialverteilung an, die kurze Erklärung dazu, gibt es im »Streuspanne-Lexikon« zu B wie Binomialverteilung unter www.itwm.fraunhofer.de/binomialverteilung


    Ihr habt Statistiken entdeckt oder mathematische Beobachtungen aus dem Alltag, die wir diskutieren oder erklären sollen? Oder gibt es Begriffe, die wir im »Streuspanne-Lexikon« für Euch betrachten sollen?  Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns mit neuen Ideen.


    Falls Ihr gerade von einer regulären Episode des
    »Streuspanne«-Podcasts hierher gefunden habt, dann zurück zur Folge!

    • 6 min
    Viel Lärm um Bias – Wie Noise Entscheidungen und Statistiken verzerrt

    Viel Lärm um Bias – Wie Noise Entscheidungen und Statistiken verzerrt

    Wie viel verdient man in der Rockmusik? Ob eure Antwort »mehrere Millionen« oder »Das ist brotlose Kunst« lauten wird, hat oft weniger mit der Frage an sich zu tun, sondern mit den eigenen, individuellen Verzerrungen und Denkfehlern – dem statistischen Rauschen oder »Noise«. 

     

    Es wurde und wird viel über diese Denkfehler – Englisch Bias – geschrieben. Im Alltag ist es sehr schwer, ihnen nicht zu erliegen, weil sie sich völlig unbemerkt in unsere Entscheidungsprozesse einschmuggeln. In der Statistik kennt man den Begriff Bias ebenfalls. Dort ist es die systematische Abweichung eines Schätzverfahrens, welches im Mittel nicht den wahren Wert liefert. Gleichzeitig erfährt der Begriff hier weniger Aufmerksamkeit, weil das Problem zum einen gut verstanden ist und zum anderen mit wachsendem Stichprobenumfang immer geringer wird. 

     

    Symbolisiert wird der Bias immer gerne durch die eine Zielscheibe, bei der die Punktewolke der Einschusslöcher systematisch von der schwarzen Mitte abweicht. Siehe dazu auch der Blogpost »Von zitternden Schützen« von uns: www.itwm.fraunhofer.de/standardabweichung 

     

    Buch zu Noise sammelt Beispiele zu verzerrten Entscheidungen 

    Der Wirtschaftsnobelpreisträger Kahnemann widmet in seinem Buch »Noise: Was unsere Entscheidungen verzerrt – und wie wir sie verbessern können« die Aufmerksamkeit der Rückseite der Zielscheibe. In der Statistik würde man sagen: Er will die Standardabweichung bzw. Streuung genauer verstehen. 

    Unsere bloggenden Statistik-Experten Dr. Sascha Feth und Dr. Jochen Fiedler besprechen in der neuen Episode mit Esther Packullat, was man gewinnen kann, wenn man Streuungen zerlegt, und wieso das in der Medizin, bei Krediten oder vor Gericht viel öfter getan werden sollte. 

    Ganz nebenbei erfahren wir, warum die Datengrundlage des »Healy« derart stark von einem Bias befallen ist, dass man solche Studien ohne Chance auf Korrektur direkt in die Tonne treten kann. All das und noch viel mehr in der neuen »Streuspanne«-Folge! 

    Wir erwähnen folgende Links, Blogbeiträge und Bücher in der aktuellen Folge: 


    Buchtipp: »Noise. Was unsere Entscheidungen verzerrt – und wie wir sie verbessern können« von Daniel Kahneman, Olivier Sibony, Cass R. Sunstein 


    »Streuspanne« Blogpost »Von zitternden Schützen«: www.itwm.fraunhofer.de/standardabweichung 


    »Streuspanne«-Podcast-Folge »Statistik beweist – Parapsychologie ist (kein) Humbug. Über parapsychologische Studien und ihre kuriosen Entdeckungen«: www.itwm.fraunhofer.de/parapsychologie 


    ZEIT-Artikel zur neuen Resolution des UN-Menschenrechtsrats »Künstliche Intelligenz kann diskriminieren«: https://s.fhg.de/zeit-un-resolution 


    Spiegel-Titel-Story »Das Ende der Macho-Medizin«: https://s.fhg.de/spiegel-medizin 


    Buchtipp: »Unsichtbare Frauen –  Wie eine von Daten beherrschte Welt die Hälfte der Bevölkerung ignoriert« von Caroline Criado-Perez 



     

    Ihr habt ein Zahlenphänomen oder eine Kuriosität entdeckt, die wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne über presse(at)itwm.fraunhofer.de bei uns. 

    • 29 min
    »Streuspanne-Lexikon« – M mit Mittelwert (oder Median)

    »Streuspanne-Lexikon« – M mit Mittelwert (oder Median)

    »Streuspanne-Lexikon« – M wie Mittelwert und M wie Median 

    Der neue Eintrag unseres »Streuspanne-Lexikons« erklärt »M wie Mittelwert« oder »M wie Median« – und das, wie immer in unseren Lexikon-Folgen, kurz und knapp in unter fünf Minuten.  

    Der Mittelwert – auch als arithmetisches Mittel bekannt – ist der Durchschnitt einer Datenmenge. Damit soll eine Art zentraler Lagewert einer numerischen Datenreihe darstellt werden. Wenn man beispielsweise zehn verschiedene Werte hat, addiert man diese und teilt die Summe durch die Anzahl der Werte, um den Mittelwert zu erhalten. Aber nicht alle »Mittel« sind gleich!  

    Der Median zum Beispiel teilt eine Stichprobe in zwei gleich große Hälften. Damit repräsentiert der Median den typischen Wert einer geordneten Gruppe, unbeeinflusst von extremen Werten am oberen oder unteren Ende. 

    Für diese Robustheit gegen Ausreißer wird der Median oft gelobt. Am arithmetischen Mittel hagelt es zusätzlich oft Kritik, wenn es auf Schulnoten angewendet wird. Ob diese Robustheit wirklich so wichtig ist, und ob die Kritik im Falle der Schulnoten gerechtfertigt ist, das erfahrt Ihr hier im neuen Eintrag unseres »Streuspanne-Lexikons« 

    Habt Ihr Fragen zu Mittelwerten oder Beobachtungen aus dem Alltag, die wir diskutieren oder erklären sollen? Oder gibt es andere mathematische Begriffe, die wir im »Streuspanne-Lexikon« für Euch beleuchten sollen?  Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns mit neuen Ideen.  

    Falls Ihr gerade von einer regulären Episode des »Streuspanne«-Podcasts  hierher gefunden habt, springt schnell zurück! 

    • 6 min
    p-Werte: Nicht der Weisheit letzter Sch(l)uss

    p-Werte: Nicht der Weisheit letzter Sch(l)uss

    Die neue Podcast-Folge dreht sich um die sogenannten »p-Werte«, auch als empirische Signifikanz bekannt. Das »Streuspanne«-Team erklärt anhand von Statistik aus dem Wilden Westen, was es damit auf sich hat und wie man zum Beispiel testen kann, ob ein Würfel gezinkt ist.

    Die p-Werte sind mit das wichtigste Maß, um zu entscheiden, welche Studien überhaupt veröffentlicht werden und bestimmen dadurch auch beispielsweise, welche Medikamente zugelassen werden. Man könnte sagen: Sie entscheiden sogar über Leben und Tod. Das führt in der Praxis zu allerhand Problemen wie der Replikationskrise auf Grund von falsch positiven Studienergebnissen.

    Die bloggenden Statistik-Experten Dr. Sascha Feth und Dr. Jochen Fiedler besprechen in der neuen Episode, was es mit den p-Werten auf sich hat. Aber selbst wenn Ihr mit den p-Werten schon vertraut seid, lohnt sich das Einschalten, denn auch die Kritik an diesem Konzept wird diskutiert.

    Was versteht man unter p-Hacking oder »sizeless stare«? Was ist die Nullhypothese? Wie sieht der Einsatz von p-Werten im Wissenschaftsalltag aus? Und was hat das Ganze mit würfelnden Cowboys zu tun – all das und noch viel mehr in der neuen »Streuspanne«-Folge!

    Wir erwähnen folgende Links, Blogbeiträge und Bücher in der aktuellen Folge:

    • Streuspanne Blog-Post zu Sensitivität und Spezifität im Kontext Corona: www.itwm.fraunhofer.de/spezifitaet

    • Buchtipp: »The Cult of Statistical Significance: How the Standard Error Costs Us Jobs, Justice, and Lives (Economics, Cognition, and Society)« von Stephen T. Ziliak und Deirdre Nansen Mccloskey

    • »Streuspanne« Podcast-Folge »Statistik beweist – Parapsychologie ist (kein) Humbug. Über parapsychologische Studien und ihre kuriosen Entdeckungen«: www.itwm.fraunhofer.de/parapsychologie

    • »Streuspanne-Lexikon« – B wie Binomialverteilung:

    www.itwm.fraunhofer.de/binomialverteilung

    • »Streuspanne-Lexikon« – K wie Konfidenzintervall https://itwm.fraunhofer.de/konfidenzintervall

    • Shoutout an die Quarks Science Cops und ihre Arbeit:

    Quarks Science Cops - quarks.de



    Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns.

    • 42 min
    »Streuspanne-Lexikon« – B wie Binomialverteilung

    »Streuspanne-Lexikon« – B wie Binomialverteilung

    Im heutigen »Streuspanne-Lexikon«-Eintrag
    geht es darum, wofür man die Binomialverteilung braucht und was das überhaupt
    ist. Wie gewohnt: kurz und knapp verständlich erklärt – in unter fünf Minuten. 

    »Eine Figur in jedem siebten Ei!« – Im Beispiel des Lexikonbeitrags interessiert sich das »Streuspanne«-Team dafür, wie oft eine Happy-Hippo-Figur in einem Überraschungsei zu finden ist, wenn jemand einen
    Monat lang jeden Tag ein Ei kaufen würde. Hier wäre die individuelle Erfolgswahrscheinlichkeit »p« genau ein Siebtel, die Anzahl der Wiederholungen »N« wäre 30 Tage und »k« ist das zufällige Ergebnis, nämlich die Anzahl der Erfolge.


    Wie oft man nun welchen Wert von k erwarten darf, das regelt die Binomialverteilung.

     

    Neben Überraschungseiern kann man damit auch
    andere Wahrscheinlichkeiten (zum Beispiel für einen Münz- oder Würfelwurf) berechnen und Voraussagen über komplexe Vorgänge wie dem Verbreiten von Krankheiten treffen.

     

    Die Formel für die Binomialverteilung lautet

    (N über k) mal p^k mal (1-p)^(N-k).

    Auf den ersten Blick sieht das kompliziert aus, aber mit ein bisschen Lesehilfe verliert die Formel ihren Schrecken.

    p^k ist einfach zu verstehen: Wenn ich k Erfolge in N Wiederholungen haben möchte, dann muss k-Mal der Erfolg eintreten, was mit der Wahrscheinlichkeit p passiert. Also schlicht die Wahrscheinlichkeit p, k-mal mit sich selbst multipliziert.

     

    Analog lässt sich gut nachvollziehen, wieso (1-p)^(N-k) in der Formel steht. Denn ich muss bei k Erfolgen dann mit genau N-k Misserfolgen rechnen, und jeder einzelne Misserfolg passiert mit Wahrscheinlichkeit 1-p.

     

    Der letzte Bestandteil (N über k) ist etwas
    abstrakter. Das ist der sogenannte Binomialkoeffizient. Was das mathematisch heißt, wäre zu ausufernd für einen Lexikon-Eintrag, aber es zählt einfach, auf wie viele Möglichkeiten sich k Erfolge in N Versuchen unterbringen lassen.


    Schwere Worte, aber mit einfacher Bedeutung.

     

    Aber wie sieht diese Binomialverteilung
    aus?

    Wenn N immer größer wird, nähert sich die
    Binomialverteilung immer weiter einer Normalverteilung an. Die Anzahl der Treffer verteilen sich links und rechts symmetrisch zum Erwartungswert, bei p=1/2 also genau der Mitte. Genau an diesem Erwartungswert ist die Anzahl der Treffer am größten, in beide Richtungen wird sie immer kleiner. 

     

    Ganz in Kürze: Die Binomialverteilung zählt die Anzahl an Erfolgen in einer festgelegten Anzahl von Wiederholungen. Was das für die Überraschungseier und die Figuren heißt, hört Ihr im »Streuspanne-Lexikon«.

     

    Ihr habt eine seltsame Statistik in den Medien entdeckt und wollt, dass wir sie im Podcast zum Thema machen? Oder Euch ist ein mathematisches Zahlen- oder
    Gedankenspiel aufgefallen? Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns. Auch Vorschläge für
    weitere Lexikon-Einträge sind willkommen.

     

    Ihr seid gerade aus einer anderen langen, regulären Streuspanne-Folge hierher gesprungen? Dann schnell wieder zurück zur langen Folge!

    • 4 min

Top podcasts en Ciencia

Palabra Plena, con Gabriel Rolón
Infobae
Jefillysh: Ciencia Simplificada
Carolina Jefillysh
La Ciencia Pop
Gabriel León
Choses à Savoir PLANETE
Choses à Savoir
Podcast de la División de Anestesiología UC
Maximiliano Zamora H.
Radio Semilla
Radio Semilla

También te podría interesar

Eigenraum
Thomas Kahle
Spektrum-Podcast
detektor.fm – Das Podcast-Radio
Wissenschaft im Brennpunkt
Deutschlandfunk
IQ - Wissenschaft und Forschung
Bayerischer Rundfunk
Das Universum
Florian Freistetter, Ruth Grützbauch, Evi Pech
Sternengeschichten
Florian Freistetter