Simpsons paradoks (også kalt Yule-Simpson-effekten) er at statistiske resultater fra en analyse av aggregert data, kan gi et annet resultat enn hva som er tilfelle i en statistisk analyse på gruppenivå.

Simpsons paradoks for kvantitative data: en positiv trend ( ,  ) vises for to separate grupper, mens en negativ trend ( ) vises når gruppene kombineres.

Fenomenet har vært kjent blant statistikere i mange år, men kan ikke sies å være kjent blant allmennheten. Det er viktig å ta hensyn til dette fenomenet dersom statistikk brukes som underlag for kausalitetsslutninger (dvs. at noe er årsak til noe annet).

Eksempel rediger

Tenk at det utføres en undersøkelse på hva ingeniører og lærer tjener fordelt mellom kjønn. Utvalget består av 20 mannlige og 5 kvinnelig ingeniører, og 15 mannlige og 10 kvinnelige lærere. Anta videre at de fire gruppene har følgende gjennomsnittlig lønnsnivå.

Menn Kvinner
Ingeniør 800 000,- 860 000,-
Lærer 400 000,- 430 000,-
Gjennomsnitt for kjønn 628 571,- 573 333,-

Fra tabellen over ser vi at kvinnelig ingeniører tjener gjennomsnittlig bedre enn mannlige ingeniører, og at kvinnelige lærer tjener gjennomsnittlig bedre enn mannlige lærere, paradokset er at menn tjener gjennomsnittlig bedre enn kvinner. Årsaken er at det er forholdsvis flere menn enn kvinner som er ingeniører.

For å komme ut av dette paradokset må analysen standardiseres. I dette tilfellet vil det være å analysere gjennomsnittslønnen mellom kjønnene hvor forholdet mellom antall lærer og ingeniører holdes likt for begge kjønn. [1]

Referanser rediger

  1. ^ Bigelow, John & Malinas, Gary (02.02.2004). «Simpson's Paradox» (engelsk). Stanford. Besøkt 17. juni 2013.