Ni som kan statistik - Hilfe!

Tassetass · 13 Dec 2015

Jag vet så lite om statistik att jag inte ens vet om den här frågan går att besvara, men jag chansar: Hur läser man den här tabellen? Avseende utbildningsnivå så förstår jag så mycket att den som har gymnasial eller förgymnasial utbildning löper större risk att åtalas, meddelas strafföreläggande eller åtalsunderlåtelse än den som har eftergymnasial utbildning. Men! Vad innebär 1,4 resp 1,7? Det finns ju en * och någon sorts förklaring längst ner, misstänker att den ger mig svaret men jag begriper ju inte.

Den som kan hjälpa mig kan få en skumtomte, en kram eller - om det krävs - min förstfödde.

Niyama · 13 Dec 2015

Bilden syns inte.

mandalaki · 13 Dec 2015

Jag ser den - så skicka hit ONGEN!

Tassetass · 13 Dec 2015

Niyama skrev:
Bilden syns inte.

Ah men va fn... Jäkla dropbox!

Det står så här:

Utbildning
Eftergymnasial 1,0
Gymnasial 1,4*
Förgymnasial 1,7*

* p = < 0,05

Tassetass · 13 Dec 2015

mandalaki skrev:
Jag ser den - så skicka hit ONGEN!

Alltså... Hit med hjälpen först.

mandalaki · 13 Dec 2015

Tassetass skrev:
Alltså... Hit med hjälpen först.

Jag försökte! Googlade fram vad p var. Men du vill inte veta.

lizan · 13 Dec 2015

Vad siffrorna betyder vet jag inte, skulle behöva faktiskt se hela tabellen inkl tabellhuvud.

Men stjärnan innebär att p-värdet är mindre än 0,05- det här betyder att detta är statistiskt signifikant. Att man kan säga att det man hittat är sant (eller snarare att det är mindre än 5% chans att det beror på slumpen).

mandalaki · 13 Dec 2015

lizan skrev:
Vad siffrorna betyder vet jag inte, skulle behöva faktiskt se hela tabellen inkl tabellhuvud.

Men stjärnan innebär att p-värdet är mindre än 0,05- det här betyder att detta är statistiskt signifikant. Att man kan säga att det man hittat är sant (eller snarare att det är mindre än 5% chans att det beror på slumpen).

Ser inte du heller bilden alltså? Jag gör det.

lizan · 13 Dec 2015

mandalaki skrev:
Ser inte du heller bilden alltså? Jag gör det.

Nix, ser ingen bild.

Gammeln · 13 Dec 2015

mandalaki skrev:
Jag försökte! Googlade fram vad p var. Men du vill inte veta.

Den som är någorlunda allmänbildad vet att p betyder probability, den sk nollhypotesen .

Squie · 13 Dec 2015

Ser fin bild...o får rysningar av p-värdet.

mandalaki · 13 Dec 2015

Gammeln skrev:
Den som är någorlunda allmänbildad vet att p betyder probability, den sk nollhypotesen .

Alldeles rätt. Jag hade bara glömt att jag visste att Inom statistisk hypotesprövning är p-värdetsannolikheten för att erhålla en teststatistika minst så extrem som den faktiskt observerade, givet att nollhypotesen är sann.

Trani · 14 Dec 2015

Jag ser bilden och försöker ruska fram lite kunskap... Siffrorna du undrar över är t-värdet, vilket visar på skillnaden i relation till medelvärdet för all data. Ju längre bort från noll desto mer skiljer sig variabeln (gruppen) från normalspridningen.

Googla t-värde och p-värde så hittar du nog en del pedagogiska förklaringar!

Tassetass · 14 Dec 2015

Tack alla! :bow:

Skumtomtar och kramar kan skickas, men den förstfödda behåller jag.

Amha · 14 Dec 2015

Tassetass skrev:
Tack alla! Skumtomtar och kramar kan skickas, men den förstfödda behåller jag.

Vilken blåsning

Tassetass · 14 Dec 2015

Amha skrev:
Vilken blåsning

Gammeln · 14 Dec 2015

Tassetass skrev:
Tack alla! Skumtomtar och kramar kan skickas, men den förstfödda behåller jag.

Hit med en godis påse

men ingen kram tack

Inglorion · 15 Dec 2015

Vilken totalt värdelös tabell!

Det står ju inte ens vilken sorts model de har använt som bas

T värde håller jag nog inte med om att det är heller, då borde de vara högre på många ställen för att ha ett signifikant p-värde (det landar i normala fall runt +-1.7). Det skulle därmed kunna vara både z värde eller wald (jag gissar från vad jag antar hur datan ser ut) att de har använt någon sorts GLM men då behöver man veta link funktionen för att kunna säga. Hur stor sample size användes? Varför finns det inga confidence interval eller effekt size värden? Varför rapporteras inte ett specifikt p värde? (det sista är en sån där komisk grej där folk verkligen inte vet vad de gör, det får mig att skratta lite

).

Jag lägger in en spoiler för de som vill veta hur värdelösa p-värden är (eller NHST för den delen, de håller ju ihop i samma stinkande soppa). Ni som inte vill veta kan fortsätta leva i okunskap

Det brukar göra livet lite lättare

Myterna om hur fantastiska p-värdena är totalt katastrofala men sträcker sig tyvärr hela vägen in i de flesta biologiska statistisk kurser. Ett p-värde betyder tyvärr inte att något är sant, eller är askalas bra eller att en (antagligen) smått värdelös hypotes är korrekt eller inte korrekt. Allt det betyder är att resultatet är statistisk signifikant, det betyder inte att det är biologiskt signifikant (eller liknande beroende på vad man jobbar med. Värdet är också högst beroende av din sample size, vilket saknas i exemplet ovan, då det ger den statistiska kraft ett test har att säga om det är signifikant eller inte. Har du låg statistiks kraft är därmed resultatet du får högst opålitligt då chansen är hög för ett typ II fel (att ett resultat är signifikant trots att det egentligen inte är/borde vara det), eller att ett typ I fel (att resultatet är inte signifikant trots att det borde vara det). Har du väldigt hög statistisk kraft blir precis vad som helst statistiskt signifikant. Tyvärr är träningen i hur man kollar det innan man samlar in sin data väldigt låg, även om man har hört ordet är det oerhört många som inte har någon aning om hur man kollar det.

I biologin t.ex. bryr vi oss egentligen om effekter, och det är antar jag liknande i det juridiska exemplet ovan. Vi vill veta hur stor effekt t.ex. temperatur har på en art eller hur stor effekt t.ex. gymnasial utbildning har på om en person begår ett brott. Statistisk signifikans kan inte säga det, den säger enbart att det finns en effekt. Vilket, för att vara ärlig, jag kunde ha sagt innan jag ens hade försökt göra något med datan. Det finns alltid en effekt, om du kolalt tillräckligt noga. Det är där problemen med NHST kommer in (Null Hypothesis Significant Testing) kommer in. Tyvärr blir de allra flesta tränade i att jobba med noll-hypoteser, som i ungefär 99% av fallen är totalt värdelösa. Majoriteten av vad som kallas "silly nulls" eller "noll nulls", dvs svaret ger dig ingen ny information. En noll hypotes som säger "det finns ingen skillnad i längd mellan kvinnor och män" är faktist tämligen värdelös, det kan jag ju säga utan data att det antagligen är. Däremot är frågeställningen "hur stor skillnad är det i längd mellan kvinnor och män" en intressantare fråga, men den passar inte in NHST . Den andra öppnar liksom upp för att kolla på åt vilket håll det går (är män kortare än kvinnor och med hur mycket t.ex).

Det finns en anledning att vissa journals och områden börjar förbjuda p-värden. P värden och jakten på statistik signifikans (p hacking) leder inte enbart ofta till feltolkningar av författare och läsare, manipulation av analys, utan också till en ökning av publikation av typ II i journals då resultat som inte var signifikanta ofta ratas (utan någon tanke på varför och vad det resultatet betyder).

Det är inte enbart hur NHST och p värden används idag som är konstigt och fel, men jag tror att det blir lite väl mycket att gå in i historien bakom p värden, det finns eminenta artiklar som går mer på djupet bakom felen med p värden också. R A Fisher hade inte varit glad om han han funnits idag och sett hur det miss-används dock.

Att studenter på det stora hela inte får lära sig att det finns andra tekniker än NHST för att analysera data är faktist helt förkastligt, t.ex. är Bayesian en teknik som kanske tar lite längre tid att lära sig men däremot har ett sundare framework runt hur man tittar på data osv (men att tro att det finns en ultimat lösning och att allt är svart och vitt vore också fel).

inverterad · 15 Dec 2015

@Tassetass, jag är inte en lika skillad statistiker som @Inglorion, men det jag klurar över är vilken sorts test som gjorts för att få fram siffrorna 1, 1,4 osv. p<0,05 säger att resultaten för gymnasial och förgymnasial är signifikanta (men man vill ju gärna se det exakta p-värdet, inte bara att det är mindre än 0,05), men själva siffrorna i sig säger ingenting om man inte vet hur de tagits fram.

Ni som kan statistik - Hilfe!

Tassetass

Niyama

mandalaki

Tassetass

Tassetass

mandalaki

lizan

mandalaki

lizan

Gammeln

Squie

mandalaki

Trani

Tassetass

Amha

Tassetass

Gammeln

Inglorion

inverterad

Välj ämne nedan

Bukefalos, Hästnyheter, Radannonser

Allmänt, Barn, Dagbok

Hund, Katt, Andra Djur

Hästrelaterat