Hjelp:Samleartikkel

Hjelp:Samleartikkel er ikke argumenter for hvorfor du skal lage samleartikler. Det er derimot et kort essay om hvorfor du er på feil spor om du forsøker å lage slike.

Hvis vi omtaler et fenomen som oppstår ved at en overordnet ting oppstår, så kan vi omtale denne overordnede tingen. Vi kan ha artikler om hjul og motorer, og så kan vi ha en artikkel om at en bil består av disse tingene. Det vi da har er omtale av delene, som hver for seg er ting, og om samlingen av deler som igjen er en ting. Delene i den overordnede tingen blir ofte omtalt som medlemmer i denne. Dette er strukturen til et velstrukturert leksikon, og denne antakelsen er den Wikidata bygger på. Det vil si at vi lager beskrivelser av ting som vi relaterer med predikat. Hvis målet vårt er å omtale alle delene i en ting, og vi gjør dette i en stor uformelig blobb, så har vi ikke lengre entydige ting å relatere med våre predikat. Mennesker er flinke til å skape de nødvendige assosiasjonene utfra en uformelig fritekst, men å lage en graf basert på subjektpredikatobjekt basert på fritekst er veldig vanskelig, og å mate noe slikt inn i en database enda vanskeligere.

Et kjent problem på Wikipedia er omtale av Bonnie & Clyde. Noen prosjekt omtaler paret og noen Bonnie Parker og Clyde Barrow hver for seg. Deretter vil de bruke dataelementene om Bonnie og Clyde i artikkelen om paret. Problemet er at artikkelen om paret er det som er bundet mot elementet på Wikidata. Denne veien fungerer det måtelig, for har de Q-iden for personene så kan de aksessere elementene eksplisitt i artikkelen om paret. Andre prosjekt omtaler Bonnie og Clyde i hver sin seksjon i artikkelen om paret, og stor er overraskelsen når de ikke klarer å lage lenker fra elementet og til seksjonene. Mange har forsøkt å gå rundt problemet, og det finnes en nokså crappy løsning som tilsynelatende fungerer.

Her skal det sies at en kan gi en kortfattet intro til slike deler av et større hele uten at det større hele dermed skifter karakter. Ha klart for deg hva du beskriver på høyeste nivå i artikkelen, og formuler ingressen utfra det. Er ingressen om paret Bonnie & Clyde, eller om personene Bonnie og Clyde?

Det som lager problemer er at i en semantisk web så sier en at noe er en ting ved lenka en bruker som alias for tingen. Når da noen sier at Bonnie har en URL så er dette maskinnavnet til personen. Tilsvarende så sier de at Clyde har en annen URL. Vi kan videre si at alle lenker i en bestemt gruppe (lenkesky) representerer Bonnie og at Clyde har en tilsvarende gruppe. Så har paret en egen gruppe av lenker. Alt vel og bra. Da kommer noen og insisterer på at de vil ha egne lenker inn i skya til paret som er de enkelte personene. Boom! Paret er plutselig personen, og ikke nok med det, plutselig blir Bonnie det samme som Clyde. Det er veldig vanlig at dette skjer i familierelasjoner, hvor barn omdirigeres til foreldre og dermed deler samme omtale.

For å unngå slike sammenblandinger så forsøker programvaren i Wikidata å spore hvor en lenke til en artikkel egentlig havner. Hvis artikkelen er opptatt av en annen lenke så blir redigeringen blokkert. Det betyr at vi kun kan identifisere en artikkel fra en artikkel på Wikidata. Vi kan ha et element om paret Bonnie og Clyde, men omtale av personene må i hvert sitt dataelement. Samtidig vet vi at lenkene fra Wikidata ikke er helt entydige, så de kan kun brukes som en svak indikasjon på hvordan ting egentlig er. De kan ikke brukes som entydige påstander om relasjoner, de er tvetydige.

Hvis vi samler omtale av et eller annet fenomen så er det samlebegrepet som skal omtales. Vi kan for eksempel lage en artikkel om «norske forfattere», men da omtaler vi det overordnede fenomenet. Da er Henrik Ibsen et medlem i «norske forfattere». Henrik Ibsen er ikke «norske forfattere». For å gjøre det enda litt mer kaotisk så kan en forfatter være medlem av flere slike samlebegrep. Henning Mankell er et godt eksempel. Han omtales ofte som «svensk forfatter»», men han bodde i store deler av livet både i Norge og i Mosambik. Han er medlem av gruppene med disse forfatterne, men han er ikke gruppene. Hvis han var det så ville det gjøre at forfattere fra Norge, Sverige og Mosambik ville bli det samme.

Så vi lager et element «norske forfattere» og lar Henrik Ibsen bli medlem av denne gruppen, samtidig som vi angir at Ibsen er del av gruppen. For å få til dette må vi lage element for både «norske forfattere» og for «Henrik Ibsen». Disse elementene vil gjerne få en merkelapp og en beskrivelse på norsk, og etter hvert også ekstra utsagn. Disse påstandene er da om det omtalte, det vil si om «norske forfattere» og «Henrik Ibsen». Hvis vi har artikler om det omtalte så vil de få lenker til oss. Det er imidlertid ikke sikkert at vi har en artikkel, eller om vi har en at den beholdes. Hvis vi flytter inn en omtale av Henrik Ibsen inn i «norske forfattere» og sletter artikkelen om ham, så vil ikke omtalen følge med inn i elementet på Wikidata. Den vil bestå som et separat element. Alle som omtaler Henrik Ibsen vil bruke elementet om ham, og lenke til hverandre, mens vår omtale i en artikkel om «norske forfattere» er tapt for alle andre enn oss. Når søkemotorer finner en seksjon langt nede i en artikkel så vil de bruke Wikidata og finne at «nope, brukes ikke i lenkeskya for Henrik Ibsen» og ranke den ned.

Moralen er: skriv en leksikonartikkel om et entydig begrep. Hvis du får en innskytelse om å lage flere lead in i teksten, den fete teksten i begynnelsen av en omtale, så har du sannsynligvis gjort noe feil.