Corpus Oral de Lenguaje Adolescente (COLA) er et sett med lydopptak gjort blant ungdommer i Madrid, Buenos Aires og Santiago de Chile for å forske på spansktalende tenåringers spontane talespråk. Lydopptakene har blitt samlet inn og transkribert av språkforskere ved Universitetet i Bergen og Høgskolen i Østfold.[1]

Leder for COLA-korpuset per 2020 er språkforskeren Annette Myre Jørgensen.

COLA-prosjektets mål er å analysere det spanske ungdomsspråkets ulike varianter. COLA-korpuset er inspirert av the The Bergen Corpus of London Teenage Language (COLT), som ble bygget opp av Anna Brita-Stenström.

Nærmere om COLA rediger

COLA-korpuset består av innspillinger gjort av og med ungdommer som er mellom 13 og 18 år gamle, i uformelle samtaler fra Madrid (500.000 ord), Santiago de Chile (200.000 ord) og Buenos Aires (80.000 ord). Santiago korpuset, COLAs, er bygget opp av førstemanuensis Eli-Marie Drange ved universitetet i Agder. Esperanza Eguia Padilla har stått for hele transkriberingen og anonymiseringen av samtlige lydfiler. Forskerne har konsentrert seg om ungdomsspråket i hovedstedene, fordi man regner med at innflytelsen fra andre språk kommer først dit, og at det tar litt lenger tid før påvirkning fra andre språk sprer seg til andre byer i landet.

Informantene i COLA-korpuset har hatt minidisker og MP3-spillere på seg i tre, fire dager for å ta opp samtalene med sine jevnaldrende kamerater, uten voksne til stede. Ungdommene deles etter sosiologiske kriterier. De fyller inn skjemaer på bosted, foreldres yrke og utdannelse. Informantene er lovet anonymitet i tråd med kriteriene for persondata satt av Norsk senter for forskningsdata (NSD). Samtalene er transkribert ved hjelp av programmet Transcriber, som følger kriteriene satt av Text Encoding Initiative (TEI). Tekst og tale kan kobles sammen og transkripsjonene brukes med søkeverktøy.

Om korpusforskning rediger

Med datalingvistikkens siste nyvinninger har korpusforskningen fått en stadig mer fremtredende rolle. I COLA-prosjektet analysereres språklige fenomén med utgangspunkt i et korpus hvor lyd og tekst er koblet sammen. Aspekt observert ved korpusforsking diskuteres i Aijmer og Stenströms bok Discourse Patterns in Spoken and written corpora (Aijmer and Stenström, 2004) og i From the COLT’s mouth, Language Corpora Studies in honour of Anna-Brita Stenström (Breivik og Hasselgren, 2002).

COLA-prosjektet har i to omganger blitt finansiert av Historisk-filosofisk fakultet ved UiB, og fikk støtte fra Meltzerfondet i 2004 og 2005. Prosjektet fikk også midler fra NFR[klargjør] i 2006, 2007 og 2008. Dette har gjort det mulig å samle inn og transkribere samtaler mellom ungdommer i høy- mellom- og lavstatusskoler i Madrid.

Referanser rediger

  1. ^ «COLA - Corpus Oral de Lenguaje Adolescente». Språkbanken. Besøkt 23. desember 2020. «COLA (Corpus Oral de Lenguaje Adolescente Resource) is a corpus of recorded, spontaneous speech among teenagers from different schools and youth clubs in Madrid, Buenos Aires and Santiago de Chile. It is created for the purpose of studying teenage language in Spanish.» 

Litteratur rediger

  • Aijmer and Stenström, Discourse Patterns in Spoken and written corpora (2004) Amsterdam: Benjamin's Publishing Company
  • Biber et al., Longman Grammar of Spoken and Written English (2002) Harlow: Pearson Education Limited
  • Breivik and Hasselgren From the COLT’s mouth, Language Corpora Studies in honour of Anna-Brita Stenström (2002)
  • Drange Eli-Marie, Anglicism in the informal speech of Norwegian and Chilean adolescents (2009). Youngspeak in a multilingual perspective. Amsterdam: Benjamin's Publishing Company
  • Jørgensen, A. M., & Drange, E.-M.: La lengua juvenil de las metrópolis Madrid y Santiago de Chile. Arena Romanistica, 9, 74-96 (2012)
  • Jørgensen, A. M., & Eguía Padilla, E.: Presentación de COLA, un corpus oral de lenguaje adolescente en línea. Actes du XIXème Congrés des romanistes scandinaves: Háskoli Islands (2015)

Eksterne lenker rediger