Korrelasjon, eller samvariasjon (skrives vanligvis som corr eller bare r), er i statistikk og sannsynlighetsregning et mål på styrken og retningen mellom to kvantitative variabler[1]. Korrelasjon bli ofte målt i en korrelasjonskoeffisient.

Empirisk observert korrelasjon er ikke tilstrekkelig for å fastslå at det er kausalitet (dvs. at en variabel forårsaker en annen), da korrelasjon også kan være resultat av spuriøse sammenhenger.

Fire datasett som alle har korrelasjonen 0,81. (Eksempel hentet fra Francis Anscombe.)

Korrelasjonskoeffisient rediger

Korrelasjonskoeffisient (ofte kun referert til som korrelasjonen) er et mål på den underliggende avhengigheten mellom to stokastiske variabler. Målet vil alltid ligge mellom -1 og 1: En korrelasjon nær null betyr at det ikke eksisterer noen lineær sammenheng mellom de to variablene. En positiv korrelasjonskoeffisient indikerer en positiv sammenheng, mens en negativ korrelasjonskoeffisient indikerer en negativ sammenheng[2].

Korrelasjonen mellom   og   noteres ofte som  . For to stokastiske variabler   og   er korrelasjonen definert som:

 

der   er kovarians og   er varians.

Denne korrelasjonskoeffisienten er alltid -1 ≤ Corr ≤ 1. Dersom korrelasjonen mellom   og   er lik -1 eller +1, så er det en lineær sammenheng mellom de to. Med andre ord finnes det to konstanter   og   slik at:

 

Korrelasjon i en investeringsportfølje rediger

En investor som ønsker 2 aksjer som er uavhengige av hverandre vil søke å kjøpe 2 aksjer med lav korrelasjon. Da vil ikke porteføljen stige/falle like raskt som hvis aksjene hadde positiv korrelasjon.

Referanser rediger

  1. ^ Fligner, Moore Notz (2015). The Basic Practice of Statistics. New York: W. H. Freeman and Company. s. 111. 
  2. ^ Tufte, Per Arne : Kvantitativ metode”', Fagen, Katrine & Selleberg, Ann-Mari Selleberg (red). Mange ulike metoder. Gylendal, 2011, s. 93-94

Se også rediger

Eksterne lenker rediger

  • R-Psychologist Correlation visualisering av korrelasjon mellom to variabler