25 avsnitt

Streuspanne, dein Podcast für spannende Neuigkeiten, lustige Fun-Facts und interessantes Hintergrundwissen rund um das Thema Statistik.

Streuspanne – Statistik und ihre Kuriositäten Fraunhofer ITWM

    • Vetenskap

Streuspanne, dein Podcast für spannende Neuigkeiten, lustige Fun-Facts und interessantes Hintergrundwissen rund um das Thema Statistik.

    »Streuspanne-Lexikon« – M mit Mittelwert (oder Median)

    »Streuspanne-Lexikon« – M mit Mittelwert (oder Median)

    »Streuspanne-Lexikon« – M wie Mittelwert und M wie Median 

    Der neue Eintrag unseres »Streuspanne-Lexikons« erklärt »M wie Mittelwert« oder »M wie Median« – und das, wie immer in unseren Lexikon-Folgen, kurz und knapp in unter fünf Minuten.  

    Der Mittelwert – auch als arithmetisches Mittel bekannt – ist der Durchschnitt einer Datenmenge. Damit soll eine Art zentraler Lagewert einer numerischen Datenreihe darstellt werden. Wenn man beispielsweise zehn verschiedene Werte hat, addiert man diese und teilt die Summe durch die Anzahl der Werte, um den Mittelwert zu erhalten. Aber nicht alle »Mittel« sind gleich!  

    Der Median zum Beispiel teilt eine Stichprobe in zwei gleich große Hälften. Damit repräsentiert der Median den typischen Wert einer geordneten Gruppe, unbeeinflusst von extremen Werten am oberen oder unteren Ende. 

    Für diese Robustheit gegen Ausreißer wird der Median oft gelobt. Am arithmetischen Mittel hagelt es zusätzlich oft Kritik, wenn es auf Schulnoten angewendet wird. Ob diese Robustheit wirklich so wichtig ist, und ob die Kritik im Falle der Schulnoten gerechtfertigt ist, das erfahrt Ihr hier im neuen Eintrag unseres »Streuspanne-Lexikons« 

    Habt Ihr Fragen zu Mittelwerten oder Beobachtungen aus dem Alltag, die wir diskutieren oder erklären sollen? Oder gibt es andere mathematische Begriffe, die wir im »Streuspanne-Lexikon« für Euch beleuchten sollen?  Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns mit neuen Ideen.  

    Falls Ihr gerade von einer regulären Episode des »Streuspanne«-Podcasts  hierher gefunden habt, springt schnell zurück! 

    • 6 min
    p-Werte: Nicht der Weisheit letzter Sch(l)uss

    p-Werte: Nicht der Weisheit letzter Sch(l)uss

    Die neue Podcast-Folge dreht sich um die sogenannten »p-Werte«, auch als empirische Signifikanz bekannt. Das »Streuspanne«-Team erklärt anhand von Statistik aus dem Wilden Westen, was es damit auf sich hat und wie man zum Beispiel testen kann, ob ein Würfel gezinkt ist.

    Die p-Werte sind mit das wichtigste Maß, um zu entscheiden, welche Studien überhaupt veröffentlicht werden und bestimmen dadurch auch beispielsweise, welche Medikamente zugelassen werden. Man könnte sagen: Sie entscheiden sogar über Leben und Tod. Das führt in der Praxis zu allerhand Problemen wie der Replikationskrise auf Grund von falsch positiven Studienergebnissen.

    Die bloggenden Statistik-Experten Dr. Sascha Feth und Dr. Jochen Fiedler besprechen in der neuen Episode, was es mit den p-Werten auf sich hat. Aber selbst wenn Ihr mit den p-Werten schon vertraut seid, lohnt sich das Einschalten, denn auch die Kritik an diesem Konzept wird diskutiert.

    Was versteht man unter p-Hacking oder »sizeless stare«? Was ist die Nullhypothese? Wie sieht der Einsatz von p-Werten im Wissenschaftsalltag aus? Und was hat das Ganze mit würfelnden Cowboys zu tun – all das und noch viel mehr in der neuen »Streuspanne«-Folge!

    Wir erwähnen folgende Links, Blogbeiträge und Bücher in der aktuellen Folge:

    • Streuspanne Blog-Post zu Sensitivität und Spezifität im Kontext Corona: www.itwm.fraunhofer.de/spezifitaet

    • Buchtipp: »The Cult of Statistical Significance: How the Standard Error Costs Us Jobs, Justice, and Lives (Economics, Cognition, and Society)« von Stephen T. Ziliak und Deirdre Nansen Mccloskey

    • »Streuspanne« Podcast-Folge »Statistik beweist – Parapsychologie ist (kein) Humbug. Über parapsychologische Studien und ihre kuriosen Entdeckungen«: www.itwm.fraunhofer.de/parapsychologie

    • »Streuspanne-Lexikon« – B wie Binomialverteilung:

    www.itwm.fraunhofer.de/binomialverteilung

    • »Streuspanne-Lexikon« – K wie Konfidenzintervall https://itwm.fraunhofer.de/konfidenzintervall

    • Shoutout an die Quarks Science Cops und ihre Arbeit:

    Quarks Science Cops - quarks.de



    Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns.

    • 42 min
    »Streuspanne-Lexikon« – B wie Binomialverteilung

    »Streuspanne-Lexikon« – B wie Binomialverteilung

    Im heutigen »Streuspanne-Lexikon«-Eintrag
    geht es darum, wofür man die Binomialverteilung braucht und was das überhaupt
    ist. Wie gewohnt: kurz und knapp verständlich erklärt – in unter fünf Minuten. 

    »Eine Figur in jedem siebten Ei!« – Im Beispiel des Lexikonbeitrags interessiert sich das »Streuspanne«-Team dafür, wie oft eine Happy-Hippo-Figur in einem Überraschungsei zu finden ist, wenn jemand einen
    Monat lang jeden Tag ein Ei kaufen würde. Hier wäre die individuelle Erfolgswahrscheinlichkeit »p« genau ein Siebtel, die Anzahl der Wiederholungen »N« wäre 30 Tage und »k« ist das zufällige Ergebnis, nämlich die Anzahl der Erfolge.


    Wie oft man nun welchen Wert von k erwarten darf, das regelt die Binomialverteilung.

     

    Neben Überraschungseiern kann man damit auch
    andere Wahrscheinlichkeiten (zum Beispiel für einen Münz- oder Würfelwurf) berechnen und Voraussagen über komplexe Vorgänge wie dem Verbreiten von Krankheiten treffen.

     

    Die Formel für die Binomialverteilung lautet

    (N über k) mal p^k mal (1-p)^(N-k).

    Auf den ersten Blick sieht das kompliziert aus, aber mit ein bisschen Lesehilfe verliert die Formel ihren Schrecken.

    p^k ist einfach zu verstehen: Wenn ich k Erfolge in N Wiederholungen haben möchte, dann muss k-Mal der Erfolg eintreten, was mit der Wahrscheinlichkeit p passiert. Also schlicht die Wahrscheinlichkeit p, k-mal mit sich selbst multipliziert.

     

    Analog lässt sich gut nachvollziehen, wieso (1-p)^(N-k) in der Formel steht. Denn ich muss bei k Erfolgen dann mit genau N-k Misserfolgen rechnen, und jeder einzelne Misserfolg passiert mit Wahrscheinlichkeit 1-p.

     

    Der letzte Bestandteil (N über k) ist etwas
    abstrakter. Das ist der sogenannte Binomialkoeffizient. Was das mathematisch heißt, wäre zu ausufernd für einen Lexikon-Eintrag, aber es zählt einfach, auf wie viele Möglichkeiten sich k Erfolge in N Versuchen unterbringen lassen.


    Schwere Worte, aber mit einfacher Bedeutung.

     

    Aber wie sieht diese Binomialverteilung
    aus?

    Wenn N immer größer wird, nähert sich die
    Binomialverteilung immer weiter einer Normalverteilung an. Die Anzahl der Treffer verteilen sich links und rechts symmetrisch zum Erwartungswert, bei p=1/2 also genau der Mitte. Genau an diesem Erwartungswert ist die Anzahl der Treffer am größten, in beide Richtungen wird sie immer kleiner. 

     

    Ganz in Kürze: Die Binomialverteilung zählt die Anzahl an Erfolgen in einer festgelegten Anzahl von Wiederholungen. Was das für die Überraschungseier und die Figuren heißt, hört Ihr im »Streuspanne-Lexikon«.

     

    Ihr habt eine seltsame Statistik in den Medien entdeckt und wollt, dass wir sie im Podcast zum Thema machen? Oder Euch ist ein mathematisches Zahlen- oder
    Gedankenspiel aufgefallen? Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns. Auch Vorschläge für
    weitere Lexikon-Einträge sind willkommen.

     

    Ihr seid gerade aus einer anderen langen, regulären Streuspanne-Folge hierher gesprungen? Dann schnell wieder zurück zur langen Folge!

    • 4 min
    Mr Bayes und Mr Frequentist streiten über einen Löwen – Was steckt hinter den zwei großen Denkschulen der Statistik?

    Mr Bayes und Mr Frequentist streiten über einen Löwen – Was steckt hinter den zwei großen Denkschulen der Statistik?

    Erinnert Ihr Euch an den Skandal-Löwen aus Berlin im letzten Jahr? Mit welcher Wahrscheinlichkeit haben die Bilder denn tatsächlich einen Löwen gezeigt? Während jeder Mensch die Frage nach der Wahrscheinlichkeit recht intuitiv versteht, kann man sich damit in der Statistik relativ schwertun.


    Vor allem, wenn man zur Denkschule des Frequentismus gehört, will man die Frage so gar nicht verstehen – der Frequentismus ist die am häufigsten verwendete Denkschule wohlgemerkt.

     In der neuen Streuspanne-Folge stehen sich Vertreter der zwei größten Statistik-Denkschulen im Gespräch gegenüber. So bringt das Team dem Publikum die beiden Ansätze zur Wahrscheinlichkeitsberechnung spielerisch näher: Auf der einen Seite schlüpft Jochen Fiedler in die Rolle von Mr. Bayes für die Bayes'sche Statistik und auf der anderen Seite spielt Sascha Feth Mr. Frequentist, der für die frequentistischen Denkschule spricht.

     

    Welche Rolle spielen Vorwissen und Zufallsexperimente? Warum passt der alte Blog zu Losbuden, Gustav Gans und Donald Duck in die Folge und wie viel Querverweise passen in eine Podcast-Episode? Und natürlich: War es denn ein Löwe? Hört selbst!

     

    Alle gesammelten Links und Tipps aus der Folge
    gibt es hier:

     Buchtipp »Die Illusion der Vernunft« von Philipp Sterzer

     

    Blog »Losbude, Corona und Donald Duck«
    www.itwm.fraunhofer.de/losbude

     

    Beispiel aus dem Blog: Wir besuchen einen Jahrmarkt. Dort gibt es zwei Losbuden. Die erste, von Gustav betrieben, ist für ihre höhere Gewinnchance bekannt. Die zweite, von Donald betrieben, lässt einen deutlich seltener gewinnen. Wir schicken jetzt 100 Personen auf den Jahrmarkt und fragen sie am Ende, wie viele Gewinne sie gezogen haben. Können wir daraus erkennen, wie viele Personen bei Gustav waren?

     

    Blogpost »Gibt es den Zufall wirklich?« www.itwm.fraunhofer.de/blog-zufall

     

    Podcast »Streuspanne-Lexikon: K wie Konfidenzintervall
    www.itwm.fraunhofer.de/konfidenzintervall

     

    Podcast »Streuspanne-Lexikon: »S wie Schätzung«

    www.itwm.fraunhofer.de/schaetzer

     

    Der Satz von Bayes im Kontext eines Blogposts aus
    den Anfängen der »Streuspanne« www.itwm.fraunhofer/aussagesicherheit

     

    Ihr habt ein Phänomen, Paradox oder eine kuriose Statistik entdeckt, die wir in der »Streuspanne« besprechen sollen? Oder Euch ist ein mathematisches Zahlen- oder Gedankenspiel aufgefallen, über das wir podcasten könnten? Dann meldet Euch gerne bei uns.

    • 37 min
    »Streuspanne-Lexikon« – K wie Konfidenzintervall

    »Streuspanne-Lexikon« – K wie Konfidenzintervall

    Heute erklären wir im »Streuspanne-Lexikon« K wie Konfidenzintervall. Oder auch: K wie »kurz und knapp« – in unter fünf Minuten.

    Kurz gesagt, ist ein Konfidenzintervall ein Vertrauensbereich. Wenn man bei einem Schätzer einen einzelnen Wert bestimmt, dann ist dieser Wert von der Stichprobe abhängig, und würde sich bei einer Wiederholung des Experimentes ändern. Wie ein Schätzer funktioniert, wird in unserer Lexikon-Folge »S wie Schätzung« erklärt, die ihr am besten vorher hört.

    Das Konfidenzintervall ist ein Bereich, in dem ein unbekannter Parameter vermutet wird. Je breiter dieser Bereich – bzw. Intervall – ist, desto wahrscheinlicher ist es, dass der unbekannte Werte vom Intervall abgedeckt wird. Gleichzeitig verliert das Intervall mit zunehmender Breite an Aussagekraft, wie im Podcast durch das Beispiel der Körpergrößen klar wird.

    Wenn das Intervall zu breit ist, muss mehr Aufwand betrieben und der Stichprobenumfang vergrößert werden, um eine genauere Aussage über das Ergebnis zu treffen und damit das Konfidenzintervall schmaler zu wählen. Hier gilt ein Wurzelgesetz – Wenn das Konfidenzintervall halbiert werden soll, wird die vierfache Menge an Daten benötigt.

    Oft werden beim Konfidenzintervall noch konkrete Zahlen genannt, wie z.B. 95-Prozent-Konfidenzintervall genannt. Allgemein gilt: Je größer die Konfidenz, desto breiter wird das Intervall. Die Konfidenz ist also ein Maß dafür, ob man einen unbekannten, aber festen Wert zufällig mit einem Intervall erfasst.

    Die Intervallgrenzen werden nach einer genauen Rechenvorschrift aus der Stichprobe bestimmt. Sie hängen damit vom Zufall ab und können »gut« oder »schlecht« sein – also den wahren Wert enthalten oder nicht enthalten.

    Ihr habt eine komische oder außergewöhnliche Statistik in den Medien entdeckt und wollt, dass wir diese im Podcast diskutieren? Oder Euch ist ein mathematisches Zahlen- oder Gedankenspiel aufgefallen? Welche Begriffe sollen wir im »Streuspanne-Lexikon« erklären? Meldet Euch gerne über presse@itwm.fraunhofer.de bei uns mit neuen Ideen.

    Ihr seid gerade aus einer anderen langen, regulären Streuspanne-Folge hierher gesprungen? Dann schnell wieder zurück zur langen Folge!

    • 6 min
    »Streuspanne-Lexikon« – S wie Schätzung

    »Streuspanne-Lexikon« – S wie Schätzung

    Die Schätzung im »Streuspanne-Lexikon« in unter fünf Minuten erklärt.

    Was ist eigentlich die mathematische Definition einer Schätzung? Und wie kann ich so etwas »Unpräzises« überhaupt definieren?

    Schätzung meint im Alltag oft cleveres Raten, in der Statistik ist »der Schätzer« aber ein fester Ausdruck und Regel, bzw. eine eigene Rechenvorschrift.

    Ein Beispiel: Wir werfen eine Münze, um die unbekannte Wahrscheinlichkeit für Kopf zu ermitteln, und tun dabei so, als
    wüssten wir die Wahrscheinlichkeit nicht, weil die Münze manipuliert sein könnte.

    Dann könnten wir einfach die Anzahl an beobachteten Köpfen durch die Anzahl an Würfen teilen und schon haben wir einen Schätzwert für diese unbekannte Wahrscheinlichkeit. Wir schätzen hier auf Grundlage von Daten. Bei der Erhebung der Daten ist der Zufall immer auf die ein oder andere Weise beteiligt, danach gibt es aber keine Variation mehr. Das ist die
    kurze Zusammenfassung einer Schätzung in der Statistik. 

    Theoretisch kann bei einer Schätzung beliebig viel schiefgehen und der Schätzwert daher um wahren, unbekannten Wert stark
    abweichen. Um das zu vermeiden, gibt es zwei Strategien:

    Strategie 1: Der Stichprobenumfang wird angehoben. Die unbekannte Wahrscheinlichkeit einer Münze kann bei 100
    Würfen robuster ermittelt werden als bei zehn Würfen.

    Strategie 2: Ein Konfidenzintervall wird bestimmt. Eine Erklärung, wie das funktioniert, findest Du im Streuspanne-Lexikoneintrag »K wie Konfidenzintervall«.

    In der Praxis ist eine Schätzung oft nicht – wie in unserem Beispiel – mit einer einfachen Division zu berechnen. Unsere selbst entwickelte Software Jurojin
    (www.jurojin.de) kann solche komplexen Schätzungen rund um
    Zuverlässigkeitsdaten zum Beispiel effizient berechnen.

    Ihr habt eine kuriose Statistik in den Medien entdeckt und wollt, dass wir diese in einer regulären Streuspanne-Folge zum Thema machen? Oder Ihr habt einen Ausdruck aus der Statistik, den wir unbedingt im Lexikon erklären sollen? Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns.

    Ihr seid gerade aus von einer anderen Stelle der Streuspanne-Welt hierher gesprungen? Dann schnell wieder zurück zur langen
    Folge!

    • 4 min

Mest populära poddar inom Vetenskap

Dumma Människor
Acast - Lina Thomsgård och Björn Hedensjö
I hjärnan på Louise Epstein
Sveriges Radio
A-kursen
Emma Frans och Clara Wallin
P3 Dystopia
Sveriges Radio
Vetenskapsradion Historia
Sveriges Radio
Språket
Sveriges Radio

Du kanske också gillar