Ni som kan statistik - Hilfe!

Tassetass

Trådstartare
Jag vet så lite om statistik att jag inte ens vet om den här frågan går att besvara, men jag chansar: Hur läser man den här tabellen? Avseende utbildningsnivå så förstår jag så mycket att den som har gymnasial eller förgymnasial utbildning löper större risk att åtalas, meddelas strafföreläggande eller åtalsunderlåtelse än den som har eftergymnasial utbildning. Men! Vad innebär 1,4 resp 1,7? Det finns ju en * och någon sorts förklaring längst ner, misstänker att den ger mig svaret men jag begriper ju inte. :p

tabell.tiff


Den som kan hjälpa mig kan få en skumtomte, en kram eller - om det krävs - min förstfödde. :D
 
Vad siffrorna betyder vet jag inte, skulle behöva faktiskt se hela tabellen inkl tabellhuvud.

Men stjärnan innebär att p-värdet är mindre än 0,05- det här betyder att detta är statistiskt signifikant. Att man kan säga att det man hittat är sant (eller snarare att det är mindre än 5% chans att det beror på slumpen).
 
Vad siffrorna betyder vet jag inte, skulle behöva faktiskt se hela tabellen inkl tabellhuvud.

Men stjärnan innebär att p-värdet är mindre än 0,05- det här betyder att detta är statistiskt signifikant. Att man kan säga att det man hittat är sant (eller snarare att det är mindre än 5% chans att det beror på slumpen).
Ser inte du heller bilden alltså? Jag gör det.
 
Jag ser bilden och försöker ruska fram lite kunskap... Siffrorna du undrar över är t-värdet, vilket visar på skillnaden i relation till medelvärdet för all data. Ju längre bort från noll desto mer skiljer sig variabeln (gruppen) från normalspridningen.

Googla t-värde och p-värde så hittar du nog en del pedagogiska förklaringar!
 
Vilken totalt värdelös tabell!

Det står ju inte ens vilken sorts model de har använt som bas :crazy: T värde håller jag nog inte med om att det är heller, då borde de vara högre på många ställen för att ha ett signifikant p-värde (det landar i normala fall runt +-1.7). Det skulle därmed kunna vara både z värde eller wald (jag gissar från vad jag antar hur datan ser ut) att de har använt någon sorts GLM men då behöver man veta link funktionen för att kunna säga. Hur stor sample size användes? Varför finns det inga confidence interval eller effekt size värden? Varför rapporteras inte ett specifikt p värde? (det sista är en sån där komisk grej där folk verkligen inte vet vad de gör, det får mig att skratta lite :D).

Jag lägger in en spoiler för de som vill veta hur värdelösa p-värden är (eller NHST för den delen, de håller ju ihop i samma stinkande soppa). Ni som inte vill veta kan fortsätta leva i okunskap :D Det brukar göra livet lite lättare :D

Myterna om hur fantastiska p-värdena är totalt katastrofala men sträcker sig tyvärr hela vägen in i de flesta biologiska statistisk kurser. Ett p-värde betyder tyvärr inte att något är sant, eller är askalas bra eller att en (antagligen) smått värdelös hypotes är korrekt eller inte korrekt. Allt det betyder är att resultatet är statistisk signifikant, det betyder inte att det är biologiskt signifikant (eller liknande beroende på vad man jobbar med. Värdet är också högst beroende av din sample size, vilket saknas i exemplet ovan, då det ger den statistiska kraft ett test har att säga om det är signifikant eller inte. Har du låg statistiks kraft är därmed resultatet du får högst opålitligt då chansen är hög för ett typ II fel (att ett resultat är signifikant trots att det egentligen inte är/borde vara det), eller att ett typ I fel (att resultatet är inte signifikant trots att det borde vara det). Har du väldigt hög statistisk kraft blir precis vad som helst statistiskt signifikant. Tyvärr är träningen i hur man kollar det innan man samlar in sin data väldigt låg, även om man har hört ordet är det oerhört många som inte har någon aning om hur man kollar det.

I biologin t.ex. bryr vi oss egentligen om effekter, och det är antar jag liknande i det juridiska exemplet ovan. Vi vill veta hur stor effekt t.ex. temperatur har på en art eller hur stor effekt t.ex. gymnasial utbildning har på om en person begår ett brott. Statistisk signifikans kan inte säga det, den säger enbart att det finns en effekt. Vilket, för att vara ärlig, jag kunde ha sagt innan jag ens hade försökt göra något med datan. Det finns alltid en effekt, om du kolalt tillräckligt noga. Det är där problemen med NHST kommer in (Null Hypothesis Significant Testing) kommer in. Tyvärr blir de allra flesta tränade i att jobba med noll-hypoteser, som i ungefär 99% av fallen är totalt värdelösa. Majoriteten av vad som kallas "silly nulls" eller "noll nulls", dvs svaret ger dig ingen ny information. En noll hypotes som säger "det finns ingen skillnad i längd mellan kvinnor och män" är faktist tämligen värdelös, det kan jag ju säga utan data att det antagligen är. Däremot är frågeställningen "hur stor skillnad är det i längd mellan kvinnor och män" en intressantare fråga, men den passar inte in NHST . Den andra öppnar liksom upp för att kolla på åt vilket håll det går (är män kortare än kvinnor och med hur mycket t.ex).

Det finns en anledning att vissa journals och områden börjar förbjuda p-värden. P värden och jakten på statistik signifikans (p hacking) leder inte enbart ofta till feltolkningar av författare och läsare, manipulation av analys, utan också till en ökning av publikation av typ II i journals då resultat som inte var signifikanta ofta ratas (utan någon tanke på varför och vad det resultatet betyder).

Det är inte enbart hur NHST och p värden används idag som är konstigt och fel, men jag tror att det blir lite väl mycket att gå in i historien bakom p värden, det finns eminenta artiklar som går mer på djupet bakom felen med p värden också. R A Fisher hade inte varit glad om han han funnits idag och sett hur det miss-används dock.

Att studenter på det stora hela inte får lära sig att det finns andra tekniker än NHST för att analysera data är faktist helt förkastligt, t.ex. är Bayesian en teknik som kanske tar lite längre tid att lära sig men däremot har ett sundare framework runt hur man tittar på data osv (men att tro att det finns en ultimat lösning och att allt är svart och vitt vore också fel).
 
@Tassetass, jag är inte en lika skillad statistiker som @Inglorion, men det jag klurar över är vilken sorts test som gjorts för att få fram siffrorna 1, 1,4 osv. p<0,05 säger att resultaten för gymnasial och förgymnasial är signifikanta (men man vill ju gärna se det exakta p-värdet, inte bara att det är mindre än 0,05), men själva siffrorna i sig säger ingenting om man inte vet hur de tagits fram.
 

Bukefalos, Hästnyheter, Radannonser

Allmänt, Barn, Dagbok

Hund, Katt, Andra Djur

Hästrelaterat

Omröstningar

  • 🇪🇺EU VALET 2024🇸🇪
Tillbaka
Upp