Ekstremverdi

En observert verdi som er avvikende eller ytterliggående og skiller seg vesentlig fra andre observerte verdier

En ekstremverdi, også kjent som utligger[1][2] (fra engelsk outlier), er et begrep innen statistikk og matematisk statistikk som viser til en avvikende eller ytterliggående observert verdi som skiller seg vesentlig ut fra andre observerte verdier («løpsk» eller «vill» observasjon). En ekstremverdi i et gitt utvalg vil ikke ha samme karakteristikk som resten av datapunktene, altså en distinkt statistisk verdi.

En statistisk ekstremobservasjon (rød) i et todimensjonalt koordinatsystem.

Ekstremverdier kan forekomme som tilfeldige variabler i et hvilket som helst forsøk, men indikerer ofte enten målefeil eller at populasjonen har en skjev fordeling. Ekstremverdier elimineres av og til fra måledata før videre analyse.

Ekstremverdier kan finnes ved å betrakte dataene i et diagram, for eksempel med et boksplott. Forskjellige sentralitetsmål har ulik robusthet når det gjelder ekstremverdier. For eksempel kan gjennomsnittet ofte endres svært mye på grunn av en ekstremverdi, mens medianen som regel endres i betydelig mindre grad.[3] Det samme gjelder spredningsmål, for eksempel er standardavviket vanligvis mer følsomt for ekstremverdier sammenlignet med kvartilavstanden.

Se også rediger

Referanser rediger