Fiolinplott

metode for å plotte numeriske data

Et fiolinplott er en metode for å plotte numeriske data hvor man benytter en sannsynlighetstetthet (ofte glattet med en kjernetetthetsestimator[1]) for å gi en representasjon av den underliggende fordelingen til dataene. Den kan være er et alternativ til et boksplott som representerer de numeriske data gjennom kvartilene deres.

Eksempel på et fiolinplott.
Eksempel på et fiolinplott i den vitenskapelige publikasjonen PLOS Pathogens.

I likhet med et boksplott vil et fiolinplott ofte inneholde en markør for medianen til dataene, en boks som markerer interkvartilavstanden og muligens alle prøvepunktene gitt at antallet målinger ikke er for høyt.

BrukRediger

I likhet med boksplott kan fiolinplott brukes for å vise sammenligninger av en variabelfordeling (eller utvalgsfordeling) på tvers av forskjellige "kategorier" (eksempelvis sammenligning av temperaturfordeling mellom dag og natt, eller sammenligning av bilprisfordelinger på tvers av forskjellige bilprodusenter).

Fordeler og ulemperRediger

Et fiolinplott kan være mer informativt enn et vanlig boksplott. Et boksplott viser bare sammendragsstatistikk som gjennomsnitt eller median og interkvartilene, mens et fiolinplott viser den kontinuerlige fordeligen av dataene. Fiolinplott kan særlig være nyttig når dataene har en multimodal fordeling (mer enn en topp). I slike tilfeller kan et fiolinplott vise tilstedeværelsen av forskjellige topper, deres posisjon og relative amplitude. I denne sammenhengen spiller imidlertid glattefunksjonen en viktig rolle.

Selv om et fiolinplott inneholder mer informasjon enn et boksplott kan de være vanskelige å forstå, muligens fordi de nettopp inneholder mye informasjon eller muligens på grunn av at de er mindre utbredt. De kan derfor være vanskeligere å forstå, særlig for mange lesere som ikke er vant med dem. I slike tilfeller kan en alternativ plottemetode være å plotte en serie stablede histogrammer eller kjernetetthetsfordelinger.

VarianterRediger

I 2020 ble det vist at fiolinplott med speilet tetthet (mirrored density violin plot) kan gi bedre ytelse enn konvensjonelle fiolinplott for identifisering av interessante strukturer.[2][bør utdypes]

Et fiolinplott kan ha flere lag. For eksempel kan den ytterste formen representere alle mulige resultater, mens laget innenfor kan representere verdiene som oppstår 95% av tiden. Det neste laget (dersom det finnes) kan for eksempel representere verdiene som oppstår 50% av tiden.

Se ogsåRediger

  • Svermplott (swarm plot), kan kombineres med fiolinplott

ReferanserRediger

  1. ^ «Violin Plot». National Institute of Standards and Technology. 
  2. ^ «Analyzing the fine structure of distributions». 14. oktober 2020.