Indoariske språk

Indoariske språk
Region	Det indiske subkontinent
Antall brukere	Ca. 1,2 milliarder
Lingvistisk; klassifikasjon	Indoeuropeisk; Indoiransk; Indoariske språk
	Videre inndeling
Inndeling	Delt inn geografisk, ikke genetisk (se klassifisering nedenfor)
	Språkkoder
ISO 639-2	inc
ISO 639-5; Hierarki	inc; ine : iir : inc
Glottolog	indo1321
	Portal: Språk
	Indoariske språk på Commons

Indoariske språk er en gren av den indoeuropeiske språkfamilien. De er framfor alt utbredt i Sør-Asia. Sammen med de iranske språkene og nuristanispråkene danner de den indoiranske undergruppa av indoeuropeiske språk. De til sammen over 100 indoariske språkene som snakkes i dag, har rundt én milliard brukere, først og fremst i nordlige og sentrale India, i Pakistan, Bangladesh, Nepal, Sri Lanka og på Maldivene. Blant de viktigste indoariske språkene er hindi, det nært beslektede urdu, bengali, ytterligere regionale indiske språk samt det klassiske språket sanskrit.

De indoariske språkene er ikke i slekt med de dravidiske språkene, som tales i sørlige India, men gjennom langvarig språkkontakt har de utvikla mange fellestrekk. På grunn av et stort antall folkevandringer og den gjensidige språkkontakta i området, har inndelinga av de indoariske språkene i genetiske undergrupper, samt det å sette skiller mellom de enkelte språkene og dialektene, bydd på problemer.

De indoariske språkene er i stor grad analytiske. Den grunnleggende ordstillinga i alle språkene er subjekt–objekt–verb. Det mest karakteristiske trekket fonologisk sett er det store antallet plosiver. Flere av dagens indoariske språk benytter en rekke ord som er lånt inn direkte fra sanskrit.

Forhold til andre språk rediger

Den indoeuropeiske språkfamilien rediger

Utdypende artikler: Indoeuropeiske språk, urindoeuropeisk og historisk lingvistikk

William Jones (1746–1794) var sentral i oppdagelsen av indoeuropeiske språk og viktig for utviklingen av komparativ lingvistikk

De indoariske språkene utgjør en undergren av de indoeuropeiske språkene, som også de fleste språk i Europa tilhører. Andre grener er for eksempel gresk, romanske språk, slaviske språk og germanske språk. De indoariske språkene er dermed også fjernt beslekta med norsk. Dette slektskapet viser seg også ved første øyekast hos noen få ord i de moderne språkene. Ordet for «navn» er på bengali nām, hindiordet for «ny» er nayā og «ku» heter på marathi gau. I andre tilfeller som «hjul» og nepali cakkā kan man bare vise det felles opphavet ved hjelp av kompliserte etymologier. For størstedelen av ordforrådet og framfor alt grammatikken i de moderne indoariske språkene kan man imidlertid knapt finne likheter i dagens europeiske språk. Mellom klassiske språk, som sanskrit og latin eller klassisk gresk, er overensstemmelsene derimot betydelig større, både i ordforråd og morfologi. Man kan for eksempel jamføre former som sanskrit dantam og latin dentem «tann» (akkusativ), eller sanskrit abharan og klassisk gresk epheron «de bar».

Oppdagelsen av at sanskrit var i slekt med språk i Europa, var tonegivende for utviklingen av den komparative lingvistikken. Engelskmannen William Jones hadde lært seg sanskrit i løpet av sin tid som dommer i Calcutta, og postulerte i 1786 som første person at sanskrit var i slekt med gresk, latin, gotisk og keltiske språk. På dette grunnlaget grunnla den tyske språkforskeren Franz Bopp (1791–1867) den komparative indoeuropeiske språkforskninga. At de moderne indoariske språkene var i slekt med sanskrit, kom man på først senere, men man skjøt da også over mål og sa at også de dravidiske språkene stammet fra sanskrit.^[1] Først i 1856 fastslo Robert Caldwell at de dravidiske språkene utgjør en selvstendig språkfamilie.

Den indoiranske språkgrenen rediger

Utdypende artikkel: Indoiranske språk

Innen de indoeuropeiske språkene står de indoariske språkene nær de iranske språkene, som blant annet persisk, kurdisk og pashto tilhører. Selv her viser slektskapen seg tydeligst i de eldste språkformene: i urpersisk, de akemenidiske storkongenes språk og sanskrit er mange ord som daiva og deva «gud», būmi og bhūmi «jord» samt aspa og aśva «hest» nesten like, mens de moderne språkene har skilt seg fra hverandre. De indoariske og iranske språkene danner til sammen den indoiranske språkgrenen. Som en selvstendig undergren av disse, regnes den lille gruppen nuristanispråk, som tales i Afghanistan og Pakistan. De dardiske språkene, som også tales i den nordvestlige delen av Sør-Asia, har en usikker stilling innen de indoiranske språkene. De ble tidligere regna sammen med nuristanispråkene eller ansett som en selvstendig gren, men anses nå som en undergruppe av de indoariske språkene.

Sørasiatisk språkbunt rediger

Utdypende artikler: Dravidiske språk, mundaspråk og tibetoburmanske språk

I gult: De indoariske språkene innen språkfamiliene i Sør-Asia.

De indoariske språkene deler det indiske subkontinentet med tre andre språkfamilier: de dravidiske språkene (hvis viktigste medlemmer er tamilsk, malayalam, telugu og kannada), som hovedsakelig er utbredte i det sørlige India; den mindre gruppa mundaspråk (en gren av de austroasiatiske språkene) i midtre India og de tibetoburmanske språkene (en gren av de sinotibetanske språkene) ved subkontinentets nordlige og østlige grenser. De indoariske språkene er ikke genetisk beslekta med disse språkfamiliene, men de har gjennom årtusenlang språkkontakt hatt stor gjensidig innflytelse på hverandre i ordforråd, morfologi og fonetikk (spesielt karakteristisk er kanskje forekomsten av retroflekse konsonanter). På grunn av de tallrike fellestrekkene sammenføres disse språkene i en sørasiatisk språkbunt. Framfor alt har det vært en betydelig vekselvirkning av lånord mellom de indoariske og dravidiske språkene. De dravidiske språkene har tatt over ord fra sanskrit i stor mengde, mens de selv har utøvd en sterk strukturell innflytelse på de indoariske språkenes fonetikk og syntaks.

Historikk rediger

De indoariske språkene har en historie på nesten fire tusen år. Man deler den inn i tre historiske stadier: Urindoarisk (vedisk, klassisk sanskrit), mellomindoarisk (prakritspråk, pali, apabhramsha) og nyindoarisk (de indoariske språkene som snakkes fra cirka 1000 e.Kr. til i dag).

Forhistorie rediger

Som medlemmer av den indoeuropeiske språkfamilien stammer de indoariske språkene fra et antatt indoeuropeisk urspråk, som kan antas å ha blitt talt i fjerde eller tredje årtusen f.Kr., på steppene i det som i dag er sørlige Russland. Fra den urindoeuropeiske befolkninga delte det seg en gruppe som brukte benevnelsen «arier» (ārya) om seg selv, og som talte et forstadium til de indoiranske språkene. Etter at de hadde oppholdt seg en tid i Baktria, delte de seg omkring 2000 f.Kr. i en iransk og en indoarisk gren.^[2] Iranerne slo seg ned i det som i dag er nordlige og vestlige Iran, mens indoarierne innvandra i flere bølger til den indiske halvøya, antageligvis rundt 1500 f.Kr.^[3] Det eldste språklige beviset for indoariernes tilstedeværelse stammer fra det hurrittiske Mitanni-riket i nordlige Mesopotamia og nordøstlige Syria. Der fantes det på 1500- til 1200-tallet f.Kr. en herskende klasse som bar entydig indoariske navn og dyrka guder som Indra. I en lærebok i hesteskjøtsel, som mitannieren Kikkuli forfatta på 1400-tallet f.Kr. på hettitisk, finnes enkelte fagbegreper som har blitt lånt inn fra indoarisk.^[4] Disse tidlige indoariske sporene i vestlige Asia forsvant sporløst etter Mitannirikets undergang.

Urindoariske språk rediger

Utdypende artikler: Vedisk sanskrit, sanskrit og Panini

Den urindoariske fasen begynner med indoariernes innvandring til India i løpet av det andre årtusenet f.Kr. Denne innvandringa skjedde antageligvis i flere bølger eller i løpet av en lang tidsperiode. Etter hvert bredte indoarierne seg ut i nordlige India og trengte ut urbefolkningas språk, men ikke uten å bli påvirka av dem. Mye tyder derfor på at de dravidiske språkene og mundaspråkene en gang ble talt i et mye større område, før de ble trengt tilbake til respektivt sørlige områder og fjell- og skogsområder av den indoariske ekspansjonen. Ideen om at indoarierne er en innfødt befolkning i India og skal ha grunnlagt Induskulturen, som er populær i India, er ikke holdbar ifølge den vestlige språkvitenskapens synsvinkel.^[5]

Hymne 10.90 (Purusha sukta) i Rigveda. Vedisk sanskrit var forløperen til klassisk sanskrit.

Vedisk og klassisk sanskrit sammenfattes med betegnelsen urindoarisk eller urindisk. Vedisk, språket som Veda-skriftene er skrevet på, er den tidligst bevarte indoariske språkformen. Dateringa av tekstene, som i lang tid kun ble videreført muntlig, er usikker, men de eldste hymnene i Rigveda må ha oppstått kort tid etter indoariernes innvandring til India etter midten av det andre årtusenet f.Kr. Vedisk utgjør en arkaisk form av sanskrit med større grammatisk formrikdom og visse forskjeller i fonologi og ordforråd. Forskjellen fra klassisk sanskrit tilsvarer omtrent forskjellen mellom Homers språk og klassisk gresk. Språket i brahmanaene og sutraene er et mellomstadium mellom vedisk og klassisk sanskrit.

For å ivareta en feilfri resitasjon av de hellige tekstene ble vitenskapen om fonetikk og grammatikk tidlig utvikla i India. Denne ble fullført i Paninis grammatikk. Omkring 300 f.Kr. kodifiserte denne grammatikken den dannede overklassens språk. Det enkle folket snakka på denne tida allerede mellomindoariske språkformer. Betegnelsen «sanskrit» (saṃskr̥ta «tilrettelagt») står også i motsetning til begrepet «prakrit» (prākr̥ta «naturlig»), som man sammenfatter de mellomindoariske språkene med. Paninis grammatikk ble normativ for klassisk sanskrit. Følgelig ble sanskrit som litteraturspråk konservert på et arkaisk stadium, og eksisterte, i likhet med latin i middelalderens Europa, over en lang tidsperiode som et religions- og lærdomsspråk. Denne stillinga har sanskrit beholdt fram til i dag, men i en svakere form. Indias forfatning erkjenner til og med sanskrit som et av landets 22 nasjonalspråk.

Sanskritlitteraturens blomstringstid var i midten av det første årtusenet e.Kr. Dette innebærer at for eksempel en dikter som Kalidasa, som antagelig levde på 400-tallet, skrev sine verk i en tid da sanskrit lenge kun hadde vært et skriftspråk, og holdt seg til regler som ble forumlert av en grammatiker som hadde levd 700 år før ham. Til forskjell fra lyd- og formlæren var syntaksen så å si uregulert av Panini, og kunne derfor under påvirkning av de mellomindoariske språkene utvikle egenarter som ikke ville ha vært vanlige i de tidligere stadiene av urindoarisk. Karakteristisk for klassisk sanskrit er forkjærligheten for passivkonstruksjoner og danning av omfattende sammensetninger med opptil 20 bestanddeler.

Mellomindoariske språk rediger

Utdypende artikkel: Middelindoariske språk

De mellomindoariske språkene oppsto allerede fra ca. 600 f.Kr. fra urindoarisk. Da de talte formene av urindoarisk var noenlunde enhetlige, er den vanlige påstanden om at spesifikke mellomindoariske språk «oppstod fra sanskrit» villedende. Kjennetegnene for utviklinga fra ur- til mellomindoarisk er en forenkling av formlæra og ordenes fonetiske struktur (for eksempel sanskrit trividya til pali tevijja). Flere mellomindoariske språkvarianter har blitt bevart. For disse brukes ofte samlingsbegrepet «prakrit». De eldste språklige vitnesbyrdene om mellomindoarisk og samtidig de eldste skriftlige levningene i India er keiser Ashokas edikt, som ble nedskrevet på en rekke ulike regionale dialekter. Disse har blitt bevart i innskrifter i stein fra ulike deler av India, skrevet med brahmi-skrifta. De reformerende religionene buddhismen og jainismen brukte prakrit for sine skrifter. Selv i diktninga ble stiliserte former av prakrit brukt, delvis parallelt med sanskrit. Det klassiske sanskritdramaet er flerspråklig: hovedpersonene snakker sanskrit, kvinnene sauraseni-prakrit, komiske rollefigurer snakker magadhi-prakrit, og de lyriske sangene er forfatta på maharashtri-prakrit.

Manuskript på bjørkebark av Paninis grammatikk fra 1600-tallets Kashmir. Panini formulerte 3 959 regler om morfologien til sanskrit.

De mellomindoariske språkene kan inndeles i tre faser. Den tidligste fasen representeres av pali, som er det viktigste mellomindoariske språket i egenskap av språket i Theravada-kanonen og mye annen buddhistisk litteratur. I buddhistiske land som Sri Lanka, Burma og Thailand har pali status som klassisk språk. De senere prakritvariantene deles inn i en vestlig og en østlig gren. Hovedformene av vestlig prakrit, sauraseni, var utbredt i området ved elvene Ganges og Yamuna. Den var dessuten standardformen av prakrit i dramaet og språket i visse jainistiske tekster. Til østlig prakrit hørte magadhi, språket i landet Magadha i nåværende Bihar. Det brukes også for å framstille lavere klasser i sanskritdramaer. Geografisk og språklig inntok ardhamagadhi («halvmagadhi»), som ble talt i Kosala (dagens østre Uttar Pradesh), en mellomstilling. Den tidlige jainistiske kanonen er skrevet på ardhamagadhi. Maharashtri, forløperen til dagens marathi, var beslekta med ardhamagadhi. Det brukes framfor alt som språk i poesien, samt for sangene i sanskritdramaer. Fonologisk utgjør det den mest framskredne dialekten i den mellomste fasen. Utenfor India finnes niya-prakrit belagt i håndskrifter fra 200- til 600-tallet som forvaltningsspråk for indoariske grupper i Xinjiang. Beslekta med det er det noe eldre gandhari, språket i indoariske Khotan-manuskripter fra det første århundret.

Ved midten av det første årtusenet ble neste stadium av mellomindoarisk, det man kaller apabhramsha (apabhraṃśa «forderva språk»). Begrepet brukes generaliserende for alle indoariske dialekter fra den sene mellomindoariske fasen. Apabhramsha var grammatisk enda mer forenkla enn prakritspråkene, og utgjorde allerede et overgangsspråk til nyindoarisk. Det viktigste litteraturspråket fra denne perioden var nagara-apabhramsha. Dessuten fantes flere regionale apabhramshaer som utgjør forgjengerne til de nåværende indoariske språkene.

Singalesisk er et særtilfelle, da singaleserne innvandra til Sri Lanka allerede rundt 500 f.Kr., antageligvis fra Gujarat.^[6] Deres språk, som har vært isolert fra de øvrige indoariske språkene, har blitt utvikla på egen hånd. Fra første århundre f.Kr. finnes et singalesisk prakrit bevart i innskrifter. Det singalesiske tilsvaret til apabhramsha-fasen er elu.

Nyindoariske språk rediger

Thailandsk eksemplar av Pālikanonen til Theravādaskolen. Pāli er et eksempel på et mellomindoarisk språk.

Overgangen fra mellom- til nyindoarisk fant sted rundt 900–1100 e.Kr. Denne fasen er dårlig dokumentert. De første tekstene på nyindoariske språk dukka opp relativt sent: Bevart fra 1100-tallet finnes en kort innskrift på marathi og en glose på bengali. Det eldste litterære verket på marathi kom i 1290, på gujarati i 1394, og på urdu omkring år 1400.^[7]

I de nyindoariske språkene ble den grammatiske utviklinga som avtegna seg allerede i den mellomindoariske fasen fullstendig gjennomført. Kun rester fra den gamle flekterende språkstrukturen ble bevart, og i stedet ble det utvikla en analytisk struktur. Enkelte språk utvikla perifrastiske og agglutinerende former. Her er de vestlige språkene generelt mer konservative enn de østlige. Spesielt mange arkaiske elementer har blitt bevart i de dardiske språkene. Framfor alt når det gjelder ordforrådet, etterlot de muslimske sultanene av Delhi og mogulene, som hadde persisk som hovedspråk, samt den britiske kolonitida seg spor i de indoariske språkene.

Språkgeografi rediger

Det hovedsakelige utbredelsesområdet for dagens indoariske språk omfatter den nordlige delen av den indiske halvøya omtrent fra Indus i vest til Assam i øst, samt fra Himalaya i nord til omtrent 18. breddegrad i sør. De indoariske språkene er Sør-Asias største språkgruppe. 15 av Indias 22 offisielle språk er indoariske, og tre av fire indere taler et indoarisk språk som morsmål.^[8] Selv i Pakistan, Bangladesh, Nepal, Sri Lanka og på Maldivene er et indoarisk språk statsspråk. Utbredelsesområdet omfatter altså også store områder utenfor India, men på den andre sida omfatter de ikke de områdene i sørlige India der det i stedet snakkes dravidiske språk.

Sentrale India rediger

Utbredelsesområde for de indoariske språkene.

Indias to offisielle nasjonalspråk er engelsk og hindi. Antallet morsmålstalere av hindi avhenger av i hvilken utstrekning nærliggende språk/dialekter regnes som varianter av hindi eller som selvstendige språk. I snever betydning har hindi over 200 millioner morsmålstalere, men om man går ut fra den indiske regjeringas utvidede definisjon, er det 420 millioner som snakker hindi. Om man også regner med dem som snakker hindi som andrespråk, tales de av 500 millioner indere, og dette tallet øker stadig. Standardisert hindi hviler på hindustani, et overregionalt handelsspråk på grunnlag av khariboli, dialekten i Delhi og området rundt. Det er statsspråk i de nordindiske statene i Uttar Pradesh, Bihar, Jharkhand, Chhattisgarh, Madhya Pradesh, Rajasthan, Haryana, Uttarakhand og Himachal Pradesh samt i unionsterritoriet Delhi, og brukes av befolkninga som skriftspråk. I dette sentralindiske området brukes en rekke nært beslektede regionalspråk, som delvis også klassifiseres som hindidialekter. Disse underdeles i to grupper, «vesthindi» eller «vestsentralindisk» (haryanvi, braj-kanauji, bundeli) og «østhindi» eller «østsentralindisk» (awadhi, bagheli, chhattisgarhi).

Av politiske grunner klassifiserer den indiske regjeringa en rekke andre språk som «hindidialekter». Fra en språkvitenskapelig synsvinkel er de selvstendige språk, tilhører ulike undergrupper av indoariske språk og har delvis også egne skriftspråk.^[9] Disse er språkene i den østindiske biharigruppen (med bhojpuri, maithili og magahi), de vestindiske rajasthanispråkene (som vekslende regnes som ett språk eller en språkgruppe) samt i nord den nordindiske gruppa paharispråk, som snakkes ved grensa til Himalaya. Målet er at hindi skal fungere som et virkelig nasjonalspråk. Uansett har hindi, som medie- og prestisjespråk, stadig mer innflytelse på andre indoariske språk.

Urdu, de indiske og pakistanske muslimenes språk, og hindi er på det hverdagsspråklige området nesten identiske; begge bygger på hindustani, og de to språkenes dialekter skiller seg lite fra hverandre. Urdu skiller seg imidlertid ut ved et stort antall låneord fra persisk og arabisk, og bruken av det arabiske alfabetet. Til tross for at det har 65 millioner brukere (med andrespråktalere 105 millioner), er urdu et språk uten territorielt grunnlag. Den muslimske bybefolkninga i nordlige India utgjør en majoritet av dets talere. I tillegg er urdudialekten dakhini utbredt i sørindiske områder som Hyderabad. I Pakistan snakkes urdu som morsmål av en liten del av befolkninga (omtrent 10 millioner), men er landets offisielle nasjonalspråk, og fungerer som overregionalt handels- og utdanningsspråk. Antallet urdutalere stiger derfor uavbrutt.

I øst rediger

Til de østindiske språkene regnes den ovennevnte biharigruppa (sammenlagt 65 millioner brukere) med hovedspråkene bhojpuri, maithili og magahi, som tales i Bihar mellom de sentralindiske språkvariantene og bengali. Bengali (med 210 millioner brukere det nest største indoariske språket) er språket i de indiske delstatene Vestbengal og Tripura, samt i Bangladesh. Enkelte av bengalivariantene (chittagong, sylhetti og rajbangsi) klassifiseres også som selvstendige språk. Nordøstenfor snakkes assamesisk i den indiske staten Assam av 15 millioner mennesker.

Språket i delstaten Orissa, som ligger på Indias østkyst, er oriya, som snakkes av 32 millioner mennesker. I skogs- og fjellområdene i sentrale India snakkes – foruten adivasistammebefolkningenes ikke-indoariske språk, også de to indoariske overgangsdialektene bhatri og halbi.

Sør og vest rediger

Marathi er utbredt i nordvestlige Deccan i delstaten Maharashtra, og har sammenlagt 80 millioner brukere. Nært beslekta med marathi er konkani (8 millioner brukere), som er statsspråk i Goa og dessuten tales helt i sør i Maharashtra samt ved kysten i Karnataka og Kerala.

I stammeområdene i nordlige Maharashtra, østre Gujarat og sørlige Rajasthan snakker man bhili og khandeshi, to indoariske språk som tidligere ble betrakta som gujaratidialekter. Khandeshi betegnes noen ganger også som en språkgruppe, bestående av khandeshi, dhanki og ahirani. Gujarati, som snakkes vest for disse, har 45 millioner brukere og snakkes i delstaten Gujarat, samt av en del av befolkninga i Mumbai (Bombay). Nord for dette finnes Rajasthans språk, den såkalte rajasthanigruppa, som utgjøres av språkene marwari (15 millioner), malvi, bagri, lambardi og nimadi, hver med 1–2 millioner brukere.

Sindhis språkområde (22 millioner brukere) begynner i vestlige Gujarat og fortsetter til den pakistanske grensa i provinsen Sindh ved Indus' nedre løp. Nær beslekta med sindhi er den såkalte vestlige gruppa panjabi-dialekter, som også betegnes som lahndagruppa. Av lahnda-dialektene har siraiki gjort seg gjeldende som skriftspråk. Et annet vestpanjabisk språk er hindko. Sammenlagt snakker ca. 80 millioner lahnda, hindko eller siraiki. Det egentlige (østlige) panjabi har sammenlagt 30 millioner brukere, og er utbredt i den nordlige delen av den pakistanske Indusdalen samt i den indiske delen av Panjab. Dogri-kangri (2,2 millioner brukere) snakkes i Jammu-området i den indiske delstaten Jammu og Kashmir. Det ble tidligere regna som en dialekt av panjabi, men hører til en separat språkgren, og er i India offisielt erkjent som selvstendig språk.

Nord rediger

Nord for språkområdet til hindi snakkes nepali av 16 millioner mennesker. Det er nasjonalspråk i Nepal og er også utbredt i Sikkim, Darjiling og deler av Bhutan. Andre viktige nordindiske språk er garhwali og kumauni med rundt 2 millioner brukere hver. De snakkes i nedre deler av Himalaya, vest for nepalis språkområde (såkalte vestpaharispråk).

Lengst nordvest på det indiske subkontinentet ligger de dardiske språkenes utbredelsesområde. Det viktigste av dem er kasjmirsk, som tales i Kashmirdalen av 4,5 millioner mennesker, og er det eneste dardiske litteraturspråket. De øvrige dardiske språkene (deriblant pashai, khowar, kalasha, shina og Indus-kohistani) snakkes sammenlagt av 1,2 millioner mennesker i Hindukush-området i Pakistan og Afghanistan.

Øvrige områder rediger

Singalesisk, som snakkes av majoriteten av Sri Lankas befolkning (15 millioner brukere), er adskilt fra resten av det indoariske språkområdet. Dhivehi, Maldivenes språk, har 220 000 brukere og er nært beslekta med singalesisk.

Et spesialtilfelle utgjøres av romani (romanes), sigøynernes språk, som i tallrike varianter er utbredt over Europas og vestlige Asias land med omkring 3,5 millioner brukere. Domari og lomavren er beslekta med romani, og snakkes også utenfor India i vestlige Asia og Europa.

Som en følge av nyere migrasjonsprosesser i den britiske kolonitida brukes indoariske språk av et betydelig antall mennesker i Karibia, Guyana, Sør-Afrika, Mauritius og Fiji. I Fiji fungerer fijiansk hindi som statsspråk.

Klassifisering rediger

Problemer rediger

Forsøk på kategorisering av de indoariske språk.

██ Sentrale

██ Dardiske språk

██ Østlige

██ Nordlige

██ Nordvestlige

██ Sørlige

██ Vestlige

Den interne klassifiseringa av de nyindoariske språkene, som har blitt snakka siden rundt 1000 e.Kr., støter på mange problemer. Ideelt sett vil et stamtre gjengi den genetiske avsondringa av grupper med språk, som har utvikla seg uavhengig av hverandre på grunn av geografiske avstander. Hos de indoariske språkene er denne prosessen meget vanskelig å rekonstruere historisk på grunn av stadige folkevandringsbevegelser med dertil hørende blandingsprosesser. Det finnes knapt noen naturlige hindre i det indiske kjernelandet, og de politiske enhetene er ustabile og har fleretniske og flerspråklige samhold. Disse prosessene resulterer derfor i et dialektkontinuum som strekker seg over hele det indoariske språkområdet fra vest til øst og fra nord til sør.

Følgene av dette er for det første store vanskeligheter med identifiseringa av enkelte språk, med avgrensing av dialekt og språk og med klassifiseringa som helhet. En forvanskende omstendighet er at overgangen fra sen mellomindoarisk til nyindoarisk rundt 900–1100 e.Kr. kun er veldig svakt belagt skriftlig. Derfor blir det nesten umulig å føre nyindoariske språk tilbake til bestemte mellomindoariske språk og dermed oppnå en naturlig gruppedanning av de nyindoariske språkene.

Siden det er vanskelig å lage en enkel, vel motiverbar stamtremodell har det blitt gjort forsøk på å forstå struktureringa av de nyindoariske språkene ved hjelp av bølgeteori. I denne studerer man nyvinninger som utgår fra bestemte senter, som i tidas løp har rørt seg gjennom delområder av de nyindoariske språkene og rekonstrueres i isoglosser. Her spiller fenomenet prestisjespråk en stor rolle. Prestisjespråkets kjennetegn og nyvinninger har gått over til nærliggende språk, forsterka gjennom kontakt. (Indoariske prestisjespråk med denne funksjonen har vært vedisk, sanskrit, magadhi, sauraseni og apabhramsha, og i nåtida hindi.) Problemet med bølgeteorien er at ulike isoglosser leder til helt ulike inndelinger, og at det derfor i forlengelsen motvirker en enhetlig klassifisering.

Historiske teorier rediger

Klassifiseringsforsøk i klassisk genetisk forstand har forekommet siden begynnelsen av 1800-tallet. Men først i 1880 ga Augustus Hoernle (1841–1918) en oversikt som er basert på et større antall nyindoariske språk og som dermed er jamførbar med mer moderne formuleringer.^[10] Hoernles hovedinndeling er en nordvestlig og en sørøstlig, hvilket han fører tilbake til tidsmessig separate innvandringsbølger:

Nyindoariske språk (etter Hoernle 1880)
- Nordvestgruppe
  - Nordgruppe: Nepali, kumanauni, garhwali m.fl.
  - Vestgruppe: Sindhi, panjabi, gujarati, hindi m.fl.
- Sørøstgruppe
  - Østgruppe: Bihari, bengali, oriya m.fl.
  - Sørgruppe: Marathi, konkani

Mange senere forskere har overtatt grunnstrukturen i denne områdebetingede klassifiseringa. Imidlertid ble tesen om ulike innvandringsstrømmer forkasta. Et neste viktig steg ble tatt av George Abraham Grierson (1851–1941) i hans verk Linguistic Survey of India (1903–1928), som ennå i dag utgjør et viktig arbeidsgrunnlag. Han gikk ut fra et konsept med «ytre» og «indre» nyindoariske språk. Til de indre regna han pahari-gruppa, panjabi, rajasthani, gujarati og hindi, til de ytre østgruppene (bengali, assamesisk, oriya), sørgruppa (marathi, konkani, singalesisk) og en nordvestgruppe (lahnda, sindhi). I mellom plasserte han en «mellomgruppe» av overgangsspråk (blant annet awadhi og chhattisgarhi). Indre-ytre-konseptet holdt imidlertid like lite vann som migrasjonstesen.

I sitt verk The Origin and Development of Bengali Language fra 1926 la Suniti Kumar Chatterji (1890–1977) fram en ny klassifisering som ligna dagens teorier. Selv om gruppene fortsatt har områdeavhengige navn, utgår Chatterji fra språkvitenskapelige kjennetegn og bestemte fonetiske isoglosser, og kommer dermed til følgende ikke-hierarkiske klassifisering:

Nyindoariske språk (etter Chatterji 1926)
- Nord: Pahari, nepali
- Nordvest: Lahnda, panjabi, sindhi
- Sørvest: Rajasthani, gujarati
- Sentral: Hindi og beslektede språk
- Øst: Bihari, bengali, assamesisk, oriya
- Sør: Marathi, singalesisk

Grierson reviderte i 1931 sin opprinnelige teori, og kom til en indre inndeling ganske lik Chatterjis. Også de klassifiseringene som ble framlagt av Ralph Lilley Turner (1888–1983) i sitt verk Some Problems of Sound Change of Indo-Aryan i 1960, av Sumitra Mangesh Katre (1906–1988) i sitt verk Some Problems of Historical Linguistics in Indo-Aryan i 1965 og av George Cardona i 1974 er varianter av Chatterjis teori.

Særtilfellene dardisk, romani og singalesisk rediger

Mens man altså så smått hadde funnet et omtrentlig konsensus om de nyindoariske språkenes kjerne, dog uten å ha kommet fram til en allment akseptert inndeling i hver detalj, fantes det fortsatt større uenigheter om grensegruppene, nemlig dardiske språk, de romske språkene (romani, domari og lomavren) og singalesisk og dhivehi. De senere har man enten regna til de sørindoariske språkene (marathi, konkani) eller behandla som en egen gruppe.

Det er ennå ikke fullstendig klarlagt hvilke språk som hører til de dardiske språkene. Nuristanispråkene ble opprinnelig regnet som dardiske språk, men de fleste forskere tenderer i dag til å oppfatte nuristanispråkene som en tredje gren av de indoiranske språkene, med samme rang som iranske og indoariske språk. De (resterende) dardiske språkenes stilling innen nyindoarisk er imidlertid fortsatt omstridt. Mens visse forskere betrakter det som en undergren av nordvestindisk (sammen med lahnda og sindhi), er det også de som mener at dardiske språk er en egen gren av indoariske språk.

Romani – og dermed de øvrige romske språkene, ble identifisert som indoariske språk av August Friedrich Pott i 1845 og av Franz Miklošič i årene 1882-1888. De påviste at dette var nyindoariske og ikke middelindoariske språk, og konstaterte dermed at forgjengerne til romanifolket ikke kunne ha forlatt India signifikant tidligere enn 1000 e.Kr. På grunn av fonetiske likheter ble de romske språkene tidligere regnet til den nordvestindiske undergruppen. I moderne fremstillinger er det mer vanlig å plassere romske språk i den sentralindiske gruppen, og da som språk som står hindi nært. Dette er f.eks. tilfelle i Yaron Matras: Romani. A Linguistic Introduction fra 2002. Det er fortsatt ikke konsensus i denne saken. I denne artikkelen behandles de romske språkene som en separat gren av nyindoarisk.

I Metzler Lexikon Sprache (1993, 3. opplag 2005) benyttet Jost Gippert en klassifisering som han betegnet som «for tilfellet beste arbeidshypotesen». Klassifiseringen i denne artikkelen stemmer i stor grad overens med denne.

Hovedgrener av nyindoarisk rediger

Følgende strukturdiagram gjengir nyindoariskens hovedgrener med de viktigste språkene. En fullstendig klassifisering framstilles i neste avsnitt.

Nyindoarisk
- Dardisk: Kasjmiri, pashai, khowar, Indus-kohistani, shina
- Nordindisk: Garhwali, kumauni, nepali
- Nordvestindisk: Dogri-kangri, hindko, lahnda (vestpanjabi), panjabi, sindi
- Vestindisk: Marwari, malvi, nimadi, gujari, bagri, lambardi, gujarati, vasavi, bhili, khandeshi
- Sentralindisk: Hindi, urdu, braj-kanauji, haryanvi, bundeli, awadhi, chhattisgarhi
- Østindisk: Bhojpuri, maithili, magahi, sadri, oriya, assamesisk, bengali, chittagong, sylhetti, rajbangsi
- Sørindisk: Marathi, konkani
- Singalesisk-dhivehi: Singalesisk, dhivehi
- Romani-domari: Romani, domari

Klassifisering av de nyindoariske språkene rediger

For hver hovedgren av nyindoarisk angis i følgende oversikt den strukturelle inndelinga og de tilhørende språkene med deres aktuelle antall brukere. For språkidentifikasjonen (og avgrensning mot dialekter) henvises det framfor alt til David Dalbys The Linguasphere Register (2000). Det bør gjøres oppmerksom på at de framstilte enhetene faktisk er «språk» og ikke bare «dialekter»; hvert anført språk har som regel flere dialekter. Mellom nærliggende språk finnes det normalt overgangsdialekter hvis posisjon naturligvis er problematisk. For en fullstendig og detaljert framstilling med dialekter og underdialekter, se den eksterne lenka under, som denne klassifiseringa er basert på. Informasjonen om antall brukere kommer i all vesentlighet fra Ethnologue (15. utgave 2005), og ved større språk har statistiske årbøker og ytterligere kilder blitt brukt.

Hovedgrener i versaler, genetiske undergrupper i halvfet, språknavn i normalstil. Alternative navn på språket og antall brukere i parentes.

DARDISKE (23 språk med 5,7 millioner brukere)

Kasjmirsk
- Kasjmirsk (keshur) (4,5 millioner)
Shina
- Shina (500 000), brokshat (brokskat, brokpa) (3 000), ushojo (2 000), dumaki (500) [regnes også som en domaridialekt], phalura (dangarik) (10 000), sawi (sau) (3 000)
Kohistani
- Indus-kohistani (220 000), kalami-kohistani (bashkarik, garwi) (40 000), torwali (60 000), kalkoti (4 000), bateri (30 000), chilisso (3 000), gowro (200), wotapuri-katarqalai (2 000), tirahi (100)
Chitral
- Khowar (chitrali) (240 000), kalasha (5 000)
Kunar
- Pashai (110 000), gawarbati (10 000), dameli (5 000), shumasti (1 000)

NORDINDISKE eller PAHARI (3 språk med 21 millioner brukere)

Vestpahari
- Garhwali (2,2 millioner), kumauni (2,4 millioner)
Østpahari
- Nepali (16 millioner)

NORDVESTINDISKE (20 språk med 135 millioner brukere)

Dogri-kangri
- Dogri-kangri (2,2 millioner), gaddi (bhamauri) (120 000), churahi (110 000), bhattiyali (100 000), bilaspuri (300 000), kunnauri-harijani (6 000), chambeali (130 000), madeali (800 000), mahasu-pahari (650 000), jaunsari (100 000), kului (110 000), bhadrawahi-pangwali (90 000), pahari-potwari (200 000)
Lahnda
- Hindko (3 millioner), lahnda (vestpanjabi) (45 millioner), siraiki (sørpanjabi, multani) (30 millioner)
Panjabi
- Panjabi (østpanjabi) (30 millioner)
Sindhi
- Sindhi (22 millioner), kachchi (850 000), jadgali (100 000)

VESTINDISKE (13 språk med 78 millioner brukere)

Rajasthani
- Marwari (15 millioner), harauti (600 000), goaria (25 000), malvi (1,2 millioner), nimadi (1,4 millioner, gujari (gujuri) (1–2 millioner), bagri (1,8 millioner), lambadi (lamani) (2,8 millioner), lohari (noen få tusen)
Gujarati
- Gujarati (45 millioner), vasavi (1 million), saurashtri (300 000)
Bhili-khandeshi
- Bhili (6 millioner), kandeshi (2,5 millioner)

SENTRALINDISKE (14 språk med 320 millioner brukere, andrespråksbrukere 655 millioner)

Vest
- Hindi (200 millioner, med andrespråk 490 millioner), urdu (60 millioner, med andrespråk 105 millioner), braj-kanauji (6 millioner), haryanvi (bangaru) (13 millioner), bundeli (8 millioner), gowli (35 000), chamari (5 000), sansi (10 000), ghera (10 000), bhaya (700)
Øst
- Awadhi (21 millioner), bagheli (400 000), chhattisgarhi (12 millioner), dhanwar (15 000)

ØSTINDISKE (26 språk med 347 millioner brukere)

Bihari
- Bhojpuri (26 millioner), maithili (25 millioner), magahi (12 millioner), sadri (2 millioner), oraon-sadri (200 000), angika (750 000), bote-majhi (10 000)
Oriya
- Oriya (32 millioner), adiwasa-oriya (300 000), halbi (800 000)
Tharu
- Rana thakur-tharu (270 000), saptari-tharu (250 000), chitwania-tharu (80 000), deokri-tharu (80 000), mahotari-tharu (30 000), buksa (45 000)
Assamesisk-bengali
- Assamesisk (15 millioner), bengali (210 millioner), chittagong (14 millioner), sylhetti (5 millioner), rajbangsi (2,4 millioner), chakma (600 000), bishnupriya-manipuri (75 000), hajong (20 000)

SØRINDISK (4 språk med 89 millioner brukere)

Marathi
- Marathi (80 millioner)
Konkani
- Konkani (8 millioner), bhil-konkani (600 000), varli (500 000)

SINGALESISK-DHIVEHI (2 språk med 4 millioner brukere)

Singalesisk (13 millioner), dhivehi (220 000)

ROMANI-DOMARI (3 språk med 4 millioner brukere)

Romani (3,5 millioner), domari (500 000), lomavren (100 000?)

UKLASSIFISERTE (8 språk med 200 000 brukere) Foruten de klassifiserte nyindoariske språkene finnes det visse skriftløse språk som hittil ikke har blitt innordna i noen av hovedgrenene. Muligens er noen av disse språkene dialekter av klassifiserte språk. Hittil finnes ingen språkvitenskapelige undersøkelser eller grammatikker for noen av disse språkene. Det dreier seg om:

Tippera (100 000), kanjari (50 000), od (50 000), usui (5 000), vaagri booli (10 000), darai (7 000), kumhali (1 000), chinali (1 000).

Lydlære rediger

De indoariske språkenes fonembestand har holdt seg ganske stabil i løpet av de forskjellige språkstadiene. Karakteristiske lyder, som de retroflekse og aspirerte konsonantene, forekommer både i ur- og mellomindoarisk, samt i nesten alle nyindoariske språk. Derimot har det foregått til dels store forandringer i fordelinga av lydene i ordene gjennom de ulike språkstadiene.

Konsonanter rediger

Karakteristisk for konsonantsystemet i de indoariske språkene er et stort antall (som regel 20) plosiver, som deles inn etter fem artikulasjonssteder (velar, palatal, retrofleks, dental og labial). Kontrasten mellom retrofleks ṭ og dental t (jamfør hindi totā «papegøye» og ṭoṭā «brist») er typisk for språkene i Sør-Asia. Selv om man tradisjonelt klassifiserer c og j som plosiver, uttales de i praksis snarere som affrikater, altså ʧ og ʤ.^[11] Forskjellen mellom stemte og ustemte konsonanter (f.eks. henholdsvis p og b) er også betydningsskillende på samme måte som aspirasjon, som forekommer såvel ved ustemte som ved stemte plosiver (f.eks. p, b mot ph, bh). Ifølge den tradisjonelle indiske grammatikkens beskrivelse finnes for hvert av de fem radene plosiver en homorganisk (uttalt på samme artikulasjonssted) nasaler. Dermed oppstår følgende system av plosiver og nasaler (angitt med IAST-transkripsjon og lydverdi i IPA):

	Plosiver				Nasaler
	Ustemt	Ustemt aspirert	Stemt	Stemt aspirert	Nasaler
Velarer	k [k]	kh [kʰ]	g [g]	gh [gʱ]	ṅ [ŋ]
Palataler	c [c]	ch [cʰ]	j [ɟ]	jh [ɟʱ]	ñ [ɲ]
Retroflekser	ṭ [ʈ]	ṭh [ʈʰ]	ḍ [ɖ]	ḍh [ɖʱ]	ṇ [ɳ]
Dentaler	t [t̪]	th [t̪ʰ]	d [d̪]	dh [d̪ʱ]	n [n]̪
Labialer	p [p]	ph [pʰ]	b [b]	bh [bʱ]	m [m]

Noen perifere indoariske språk har forenkla dette systemet. I singalesisk har aspirasjonen forsvunnet (trolig på grunn av innflytelse fra tamilsk), mens assamesisk ikke har noen retroflekse fonemer. Andre språk har utvikla ytterligere fonemer; for eksempel har sindhi implosivene [ɠ], [ʄ], [ɗ] og [ɓ]. Når det gjelder nasalene, var opprinnelig kun m, den dentale n og den retroflekse ṇ selvstendige fonemer, men skillene mellom de to siste er ikke bevart i alle moderne språk. Lydene ṅ og ñ er som oftest kun posisjonsbetingede allofoner, som kun forekommer foran de tilsvarende plosivene. I visse språk har de imidlertid oppnådd sekundær fonemstatus.

I klassisk sanskrit forekom vibranten r [r] og lateralen l [l]. Andre indoariske språk har utvida sitt fonemforråd på dette området: en retrofleks lateral ḷ [ɭ] forekommer allerede i vedisk, og senere blant annet i oriya, marathi, gujarati og panjabi. Hindi, bengali, panjabi og sindhi har en retrofleks flakk [ɽ]. Mens det i urindoarisk forekom ytterligere fire frikativer, de tre sibilantene ś [ɕ], ṣ [ʂ] og s [s] samt h [ɦ] har de tre opprinnelige sibilantene falt sammen til én lyd i de moderne språkene, i vest som oftest [s], i øst [ʃ]. Som oftest har imidlertid en forskjell mellom [s] og [ʃ] blitt gjeninnført via lånord. De halvvokalene som forekommer er y [j] og v [ʋ].

Foruten disse opprinnelige indoariske konsonantene har mange nyindoariske språk overtatt nye fonemer gjennom lånord fra persisk og engelsk, nemlig [f], [z], [x], [ɣ] og [q]. I alle språk utenom urdu er disse fonemenes stilling imidlertid ikke særlig befesta, og i utydelig uttale blir de ofte erstatta av liktlydende lyder, altså omtrent philm i stedet for film.

Vokaler rediger

Antallet vokalfonemer er i de fleste nyindoariske språkene mellom seks og ti. Romani har bare fem vokaler. Singalesisk har derimot et system med 13 vokaler, som i første omgang bygger på forskjeller i vokallengde. For de dardiske språkene og visse dialekter av marathi har det blitt beskrevet systemer med opptil 18 vokaler, men disse er ikke tilstrekkelig utforska.^[12]

Vokalsystemet er i de viktigste indoariske språkenes vokalsystemer som følger:

Språk	Vokalfonemer
Marathi, nepali	i, e, a, ə, o, u
Oriya:	i, e, a, ɔ, o, u
Bengali:	i, e, æ, a, ɔ, o, u
Assamesisk:	i, e, ɛ, a, ɒ, ɔ, o, u
Gujarati:	i, e, ɛ, a, ə, ɔ, o, u
Hindi, panjabi:	i, ɪ, e, æ, a, ə, ɔ, o, u

Anmerkning: Den korte a-lyden kan gjengis som ʌ eller ə.

Det symmetriske ti-vokal-systemet i hindi og panjabi står nærmest sanskrit. I sanskrit besto imidlertid forskjellen mellom par som i / ī først og fremst i vokallengde: i / iː. I de nyindoariske språkene har denne kvantitative forskjellen blitt erstatta av en kvalitativ: ɪ / i. Det er imidlertid mulig at den kvalitative forskjellen allerede fra begynnelsen gikk inn i forskjellen etter vokallengde.^[13] I hvert fall for kort a ə og lang ā aː ble en forskjell i vokalkvalitet beskrevet allerede i de eldste grammatikkene. Dessuten hadde sanskrit de «konsonantiske vokalene» r̥, r̥̄ og l̥. De to siste er meget uvanlige, men r̥ forekommer derimot også i de moderne språkene i lånord fra sanskrit, og uttales i da som rɪ (for eksempel r̥ṣi rɪʃɪ «rishi»).

Fonemene æ og ɔ i hindi og panjabi går opprinnelig tilbake til diftongene ai og au, og uttales i visse dialekter fortsatt som diftonger. Mens disse diftongene er fonematiske, oppfattes de tallrike vokalforbindelsene i nyindoariske språk ikke som selvstendige fonemer.

De rene vokalene har i de fleste nyindoariske språk tilsvarende nasalvokaler (for eksempel hindi cā̃d «måne»). Sanskrit har likeså en nasalisering som betegnes som anusvara (ṃ) (for eksempel māṃsa «kjøtt»), som imidlertid bare opptrer i forutsigbare tilfeller og derfor, i motsetning til nasalvokalene i de moderne språkene, ikke er fonemisk. Det samme gjelder for den ustemte aspiranten visarga (ḥ) i sanskrit, som oftest opptrer i slutten av ord, og språkhistorisk går tilbake til s eller r (jamfør nominativendelsen -aḥ i sanskrit med gresk -os og latinsk -us.

Ordmelodi rediger

Den eldste indoiranske språkformen, vedisk, hadde en toneaksent som tilsvarte den gammelgreske (jamfør vediske pā́t, padáḥ med gammelgresk poús, podós «fot»). Aksenten kunne falle på hvilken som helst stavelse i ordet, og ble uttalt med en høy tone (udātta). I klassisk sanskrit ble den tonale aksenten endra til en dynamisk aksent. Aksentens posisjon stemte ikke overens med den gamle tonale aksenten, men falt, omtrent som i latin, etter forutsigbare regler på den nest siste, tredje siste eller fjerde siste stavelsen. Betoninga følger ulike regler i de nyindoariske språkene, men er nesten aldri betydningsskillende. Et unntak er assamesisk (jamfør 'pise «han drikker» med pi'se «da»).

Panjabi utgjør et spesialtilfelle, da det er et tonespråk. De tre betydningsskillende tonene (for eksempel koṛā «piske», kóṛā «spedalsk», kòṛā «hest») har oppstått sekundært under innflytelse av tidligere aspirerte konsonanter (jamfør panjabi kòṛā med hindi ghoṛā).

Fonologiske endringer rediger

De urindoariske språkene hadde en komplisert fonologi, som fortsatt står ganske nær den indoeuropeiske typen. De viktigste punktene der sanskrit skiller seg fra det rekonstruerte indoeuropeiske urspråket er følgende:

Vokalene *a, *e og *o sammenfaller til a (jamfør latin agit med sanskrit ajati «han driver», gammelgresk esti med sanskrit asti «han er» og gammelgresk posis med sanskrit patiḥ «make, hersker»)
De stavelsesdannende nasalene *n̥ og *m̥ går over til a (jamfør latin in- med sanskrit a-)
Monfotongisering av *ai og *au til e og o (jamfør gammelgresk oida med sanskrit veda «jeg veit»)
Labiovelarene *k^w, *g^w og *g^wh faller sammen med velarene k, g og gh. Foran opprinnelig fremre vokaler går disse over til palatalene c og j (jamfør latin -que og sanskrit ca «og»).
Palatovelarene *ḱ, *ǵ og *ǵh går over til ś, j og h (jamfør latin centum med sanskrit śatam «hundre»), som gjør at sanskrit tilhører satemspråkene.
En rekke ustemte aspirerte konsonanter oppstår foruten de stemte.
Retroflekse konsonanter oppstår under innflytelse fra ikke-indoariske språk.

I begynnelsen av ord og inne i ord opptrer det komplekse konsonantsamlinger i sanskrit (for eksempel jyotsna «måneskinn»). Ordene kan derimot slutte kun med bestemte konsonanter, og forbindelser av flere konsonanter forekommer som regel ikke (jamfør latin vox og avestisk vāxš med sanskrit vāk «stemme»). Når lyder møtes inne i ord eller ved to tilgrensende ord opptrer sandhifenomener (for eksempel na uvāca til novāca «han sa ikke»).

I løpet av den mellomindoariske perioden ble fonologien betydelig endra. Ingen sandhiregler ble gjeldende lenger, og fonembestanden ble noe mindre. Den viktigste forandringa i de mellomindoariske språkene var den radikale forenklinga av stavelsesstrukturen til en type som ligna den i dravidiske språk: konsonantforbindelser i ordenes begynnelse var ikke lenger mulige, inne i ord forekom kun bestemte konsonantforbindelser som var lette å uttale (fordoblede konsonanter eller forbindelser med en nasal som første bestanddel) og i slutten av ord var det ikke tillatt med noen konsonanter utenom den nasaliserte ṃ. De viktigste lydforandringene i mellomindoarisk er:

Konsonantforbindelser i ordenes begynnelse blir redusert (for eksempel sanskrit prathama «første», skandha «skuldre» til pali paṭhama, khandha)
Konsonantforbindelser i det indre av ord assimileres (for eksempel sanskrit putra «sønn», hasta «hånd» til pali putta, hattha)
Utlydende konsonanter bortfaller (for eksempel sanskrit paścāt «bak» til pali pacchā), kun -m og -n beholdes som nasalisert anusvara (for eksempel sanskrit kartum «gjøre» til pali kattuṃ).
Frikativene ś, ṣ og s sammenfaller (for eksempel sanskrit desá «land», doṣa «feil» og dāsa «tjener» til pali desa, dosa, dāsa)
De konsonantiske vokalene r̥, r̥̄ og l̥ faller bort (for eksempel sanskrit pr̥cchati «han spør» til pali pucchati)
Diftongene ai, au og lydforbindelsene aya og ava' går over til monoftongene e og o (for eksempel sanskrit auṣaḍha «legeurt», ropayati «han planter» til pali osaḍha, ropeti)
I den senere fasen faller intervokaliske konsonanter bort (for eksempel sanskrit loka til prakrit loa, aspirerte intervokalistiske konsonanter blir til h (for eksempel sanskrit kathayati «han forteller» til prakrit kahei). Dermed oppstår rekker på to vokaler, som ikke var tillat i sanskrit.

I de nyindoariske språkene har stavelsesstrukturen utvikla seg vekk fra den enkle typen i mellomindoarisk ved at korte vokaler har bortfalt. Konsonanter i slutten av ord forekommer hyppigere enn i sanskrit, og i midten av ord er ytterlige konsonantkombinasjoner mulig. Denne utviklinga forsterkes gjennom lånord fra ikke-indoariske språk. Mange nyindoariske språk har gjennomgått spesielle utviklinger, som det ikke kan gås nærmere inn på her. Sentrale kjennetegn som karakteriserer fonetikken i flertallet av de nyindoariske språkene er:

Bortfall av korte vokaler i slutten av ord (for eksempel prakrit phala «frukt» til hindi og nepali phal og bengali og assamesisk phɔl eller oriya phɔlɔ)
Bortfall av ustemte korte vokaler i det indre av ord (for eksempel prakrit sutthira «fast» til hindi suthrā, prakrit gaddaha «esel» til bengali gādhā). Gjennom dette har mange nye konsonantforbindelser oppstått. Dette leder ved flerstavelsesstammer delvis til alternanse (for eksempel hindi samajh-nā «forstå» og samjh-ā «forstått»).
Forenkling av doble konsonanter fører til erstatningsforlengelse av den foregående vokalen (for eksempel prakrit satta «sju» til hindi og marathi sāt, bengali ʃāt, men panjabi satt).
Erstatning av en nasal foran en plosiv gjennom forlengelse og nasalisering av de foregående vokalene (for eksempel prakrit danta «tann» til hindi og bengali dā̃t, men panjabi dand).

Morfologi rediger

De indoariske språkenes morfologi har opplevd grunnleggende endringer i løpet av sin utvikling. Det urindoariske sanskrit var et i høy grad syntetisk og flekterende språk med en komplisert formlære, ikke ulikt latin og klassisk gresk. I løpet av utviklinga av de mellomindoariske språkene skjedde en tydelig forenkling av formdanninga. De nyindoariske språkene har gått over til en vidtgående analytisk språkstruktur med agglutinerende innslag. Språktypologisk er de indoariske språkene sterkt påvirka av sine dravidiske nabospråk, og først og fremst på syntaksen ses utslag av dette, allerede i klassisk sanskrit.

Substantiv rediger

Substantivmorfologien i sanskrit er kompleks. Sanskrit har bevart alle åtte kasus (nominativ, akkusativ, instrumentalis, dativ, ablativ, genitiv, lokativ og vokativ) og tre numerus (entall, totall og flertall) som antas å ha vært til stede i urindoeuropeisk. Etter stammeslutt og kjønn bøyes substantiv i ulike deklinasjonstyper med ulike kasusendelser. Visse stammer har kvalitativ avlyd, og er dermed høyst variable (for eksempel danner stammen pitr̥- «far» følgende former: pitā, pitar-am, pitr-e, pitr̥-bhyām og pitr̥̄-n).

I mellomindoarisk ble dette kompliserte systemet forenklet: totall forsvant, kasussystemet ble redusert via sammenfall av genitiv og dativ, og de variable konsonantstammene ble gjort om til regelbundne vokalstammer (for eksempel sanskrit gacchant-/gacchat- «gående» til pali gacchanta-), til det i apabhramshafasen bare fantes én allmenn deklinasjonstype igjen. I det store og hele finnes imidlertid det gamle kasussystemet igjen i mellomindoarisk, om enn forenkla. Som eksempel angis deklinasjonen av ordet putra-/putta- («sønn») i entall i sanskrit, pali og apabhramsha.

Kasus	Sanskrit	Pali	Apabhramsha
Nominativ	putraḥ	putto	puttu
Akkusativ	putram	puttaṃ	puttu
Instrumentalis	putrena	puttena	putteṇa(ṃ), puttẽ, puttiṃ
Dativ	putrāya	(puttāya)	–
Ablativ	putrāt	puttā, puttasmā, puttamhā	puttahi, puttaho
Genitiv	putrasya	puttassa	puttaha, puttaho, puttassu, puttāsu
Lokativ	putre	putte, puttasmiṃ, puttamhi	putti, puttahiṃ

De nyindoariske språkene har derimot forandret det grunnleggende deklinasjonssystemet. Ur- og mellomindoariskens flekterende system har kun blitt beholdt som rester. Vanligvis finnes kun to primære kasus. Kun sporadisk finnes fortsatt rester av de gamle kasusene instrumentalis, lokativ og ablativ. Nominativ og akkusativ, som gjennom lydforandring falt sammen allerede i apabhramsha, ble sammenfatta til rektus. I motsats til rektus står som regel et obliquus (for eksempel hindi laṛkā – laṛke «gutt», gujarati ghoḍo – ghoḍā «hest»). Visse språk som bengali og assamesisk har ingen spesiell form for oblikt kasus. Formelt går det oblike kasus som oftest tilbake på genitiv, og har i noen få språk fortsatt beholdt denne funksjonen. I de fleste språkene forekommer den imidlertid ikke alene, men blir ytterligere differensiert i sin betydning ved hjelp av et system av postposisjoner og sekundære endelser (for eksempel hindi laṛke ko «til gutten», gujarati ghoḍānuṃ «hestens»). Disse endelsene går opprinnelig tilbake til selvstendige ord, men har delvis smelta sammen med oblikkasuset til sekundære agglutinerende kasusendelser. Genitivendelsen -er i bengali er muligens avleda via partikkelen kera fra det urindoariske substantivet kārya med betydninga «affære».

Flertall dannes på ulike måter. For eksempel i hindi skjer dette flekterende, med en endelse som samtidig uttrykker kasus og antall (jamfør nominativ entall laṛkā, flertall laṛke; obliquus entall laṛke, flertall laṛkõ). Andre språk som bengali bruker derimot agglutinerende flertallsendelser, som også kan inneholde kasusmarkører (jamfør nominativ entall chele, flertall chele-gulo; objektiv entall chele-ke, flertall chele-gulo-ke).

De ur- og mellomindoariske språkene har de tre indoeuropeiske kjønnene hankjønn, hunkjønn og intetkjønn. Blant de nyindoariske språkene beholdes dette systemet i de vestlige språkene (gujarati, marathi, konkai). I singalesisk forekommer også tre kjønn, men der handler det om et annerledes system, som i likhet med de dravidiske språkene bygger på animathet og naturlig kjønn. I de fleste nyindoariske språk har hankjønn og intetkjønn sammenfalt. Lenger øst er kjønnskategorien mindre utprega. De østligste språkene bengali, assamesisk og oriya har mista det helt, i likhet med de dardiske språkene khowar og kalasha lengst vest i det indoariske språkområdet.

Verb rediger

Verbet utmerker seg i urindoarisk (enda sterkere i vedisk enn i klassisk sanskrit) gjennom en stor rikdom av former. Verbene bøyes i tre personer, tre numerus (entall, totall og flertall) og tre diateser (aktivum eller parasmaipada, medium eller ātmanepada og passivum). Tempussystemet har presens, imperfektum, futurum, aorist, perfektum og i vedisk også pluskvamperfektum. Egentlig skilte tempusformene for fortid seg i betydning, men nå brukes de med samme betydning. Den vanligste måten å uttrykke fortid på i klassisk sanskrit er imidlertid en nominalsats med perfektum partisipp. Modusene er indikativ, konjunktiv, optativ og imperativ. Dertil finnes flere aktive og passive partisipper, gerundium, et infinitiv samt et system av avledede verb (kausativ, desiderativum, intensivum). Verbene deles inn i ti klasser etter presensstammens dannelse. Hovedskillet går mellom tematiske verb, som setter inn temavokalen a mellom stamme og endelse, og atematiske verb, som ikke gjør det. Imperfektum dannes i likhet med imperativ og optativ fra presensstammen, mens de øvrige tempusformene er uavhengige av presensstammen. Sanskrits verbalbøyning er komplisert, og bruker regelbundne midler som reduplikasjon og kvantitativ avlyd (guṇa- og vr̥ddhi-stadier (for eksempel dannes fra stammen kr̥- «gjøre» formene kr̥-ta «gjort», kar-oti «han gjør» og ca-kār-a «han har gjort»).

I de mellomindoariske språkene ble dette systemet forenkla og gjort mer regelbundet. Tempusene for fortid, hvis skiller allerede i sanskrit ble opprettholdt på kunstig måte, ble erstattet fullstendig med partisippkonstruksjonen. Konjunktiv døde også ut, i likhet med medium og de avledede verbene, med unntak av kausativ.

De nyindoariske språkene bruker i tillegg til de gamle syntetiske formene, som bøyes etter person og antall, i større utstrekning partisippformer, som forandres etter kjønn og antall, samt analytiske (sammensatte) verbformer av partisipp og hjelpeverb. De ulike nyindoariske språkene er forskjellige i hvordan de bruker disse mulighetene, hvilket gjøres tydelig i følgende jamføring av noen former av verbet for «å komme» i de viktigste nyindoariske språkene:

Språk	Stamme	Presens («jeg kommer»)	Perfektiv («jeg kom»)	Futurum («jeg kommer til å komme»)
Hindi-urdu	ā-	ātā hū̃ (m.), ātī hū̃ (f.)	āyā (m.), āī (f.)	āū̃gā (m.), āū̃gī (f.)
Panjabi	āu-, āv-, ā-	āundā hā̃	āiā (m.), āī (f.)	āvā̃gā (m.), āvā̃gī (f.)
Kasjmiri	y(i)-, ā-	chus yivān (m.), ches yivān (f.)	ās (m.), āyēs (f.)	yimɨ
Sindhi	ac-, ā-, ī-	acā̃ tho (m.), acā̃ thī (f.)	āīus (m.), āīasi (f.)	īndus (m.), īndīas (f.)
Gujarati	āv-	āvũ chũ	āyvo (m.), āvī (f.)	āviʃ
Marathi	ye-, ā-	yetõ (m.), yetẽ (f.)	ālõ (m.), ālẽ (f.)	yeīn
Singalesisk	e-, āv-	enavā	āvā	ennam
Oriya	ās-	āsẽ	āsili	āsibi
Bengali	āʃ	āʃi	āʃlum	āʃbo
Assamesisk	āh-, ɒh-	āhõ	āhilõ	āhim
Nepali	āu-, ā-	āũchu	āẽ	āunechu

Syntaks rediger

Den normale grunnleggende ordstillinga i alle språkstadier av indoarisk er subjekt–objekt–verb (SOV). I sanskrit kan denne rekkefølga variere ganske fritt, men i de nyindoariske språkene er ordstillinga fastere bestemt. Kun ved spesiell betoning kan et satsledd stilles bak verbet. De indoariske språkene deler også de øvrige typologiske kjennetegnene som er karakteristiske for SOV-språk: de bruker postposisjoner i stedet for preposisjoner (for eksempel sanskrit rāmena saha «med Rama») og setter det bestemmende elementet foran det bestemte. Det betyr at attributter kommer foran sine hovedord, og bisatser kommer foran hovedsatser. Eksempler på SOV-rekkefølga med interlinearoversettelse:^[14]

maĩ	tum ko	ye	kitāb	detā hū̃
Jeg	deg	denne	bok	givende er

Hindi: «Jeg gir deg denne bok.»

āmi	ei	āmgula	nūtan	bazār	theke	enechi
Jeg	disse	mangoer	ny	marked	fra	tok med

Bengali: «Jeg tok med disse mangoene fra det nye markedet.»

guru-varayā	maṭa	iskōlēdi	siṃhala	akuru	igennuvā
Lærer+honorificum	meg	mens-på-skolen	singalesisk	skrift	lærte

Singalesisk: «Læreren lærte meg singalesisk skrift da jeg gikk på skolen.»

Allerede i klassisk sanskrit foretrakk man å uttrykke en sats i fortid gjennom en passivkonstruksjon med perfektum partisipp passivum, der den handlende personen står i instrumentalis (for eksempel bālena kanyā dr̥ṣṭā ordrett «jenta (er) sett av gutten» i stedet for bālaḥ kanyām apaśyat «gutten så jenta»). Denne konstruksjonen utvides til intrasitive verb (for eksempel mayā suptam ordrett «det ble av meg sovet» for «jeg sov»). I de nyindoariske språkene har det blitt utvikla en ergativlignende konstruksjon fra dette. Karakteristisk for denne er at i transitive satser i fortid antar subjektet en spesiell form, som betegnes som agentiv, mens det vide intransitive verbet og i nåtidssatser står i grunnformen. Jamfør følgende eksempelsatser fra hindi:

laṛka	kitāb	kharīdtā hai
gutt	bok	lesende er

«Gutten leser boka.»

laṛke ne	kitāb	kharīdī
gutt (agentiv)	bok	lest

«Gutten leste boka.»

Ordforråd rediger

Den indre grammatikken deler inn de moderne indoariske språkenes ordforråd i fire kategorier, som betegnes med sanskritnavn:

tadbhava («derav [det vil si fra et sanskritord] oppstått»): arvord fra urindoarisk
tatsama («det samme som det [det vil si et sanskritord]»): direkte lån fra sanskrit
deśya («lokal»): ord uten tilsvarigheter i sanskrit
videśi («fremmede»): lånord fra ikke-indiske språk

Arvord rediger

Kjernen i det nyindoariske ordforrådet utgjøres av tadbhava-ordene, som har blitt henta på naturlig måte fra urindoarisk over mellomstadiet, de mellomindoariske prakritspråkene, og dermed har endra form gjennom en rekke lydforandringer. Slik går hindiordet khet («åker») via prakrit khetta tilbake til sanskrit kṣetra. Visse ord som deva («gud») eller nāma («navn») hadde allerede i urindoarisk en så enkel form at de ikke gjennomgikk noen videre forandring. Tadbhava-ord kan opprinnelig ha et ikke-indoeuropeisk opphav, da det allerede i sanskrit fantes lånord fra dravidiske språk og mundaspråk.

Sammenligning av noen indoariske ord^[15]

Språk	Hånd	Tann	Øre	Gjøre	Drikke	Høre
Sanskrit	hasta	danta	karṇa	kar-	pib-	śṛn-
Hindi	hāth	dā̃t	kan	kar-	pī-	sun-
Bengali	hāt	dā̃t	kān	kɔr-	pi-	ʃon-
Panjabi	hatth	dand	kann	kar-	pī-	suṇ-
Marathi	hāt	dāt	kān	kar-	pi-	aik-
Gujarati	hāth	dā̃t	kān	kar-	pī-	sā̃bhaḷ-
Oriya	hātɔ	dāntɔ	kānɔ	kɔr-	pi-	suṇ-
Sindhi	hathu	ɗandu	kanu	kar-	pi-	suṇ-
Assamesisk	hāt	dā̃t	kān	kɔr-	pi-	xun-
Nepali	hāt	dā̃t	kān	gar-	piu-	sun-
Kasjmiri	athɨ	dād	kan	kar-	co-	buz
Singalesisk	ata	data	kaṇa	kara-	bo-, bī-	ähe-
Romani	vast	dand	kan	ker-	pi-	sun-

Sanskritismer rediger

Ord som har blitt lånt inn i uforandra form (eller snarere: uforandra skrivemåte) direkte fra sanskrit, betegner man som tatsamas. Uttalen kan dermed avvike fullstendig: forskjellene mellom bestemte lyder som ś og ṣ bevares oftest ikke lengre, i hindi og marathi bortfaller ofte kort a i slutten av ord, og i bengali blir konsonantsamlinger assimilert. Dermed uttales tatsama-ordet ātmahatyā («selvmord») på hindi [aːtmʌhʌtjaː], men på bengali [ãttohɔtta]. I singalesisk regnes ord som blir overtatt fra pali – som på grunn av at det er den buddhistiske kanons språk inntar en like viktig rolle som sanskrit – som tatsama-ord. Delvis forekommer dubletter av tadbhava- og tatsama-ord, der tatwsama-ordet da oftest har en spesialisert betydning.

I de moderne indoariske litteraturspråkene (foruten slike som urdu, som er underlagt islams kulturelle innflytelse) har bruken av sanskritord blitt svært frekvent. Framfor alt i det høyere registerets ordforråd finnes det mange sanskritismer, i likhet med hvordan latinske og greske lånord har blitt brukt i de europeiske språkene. Nasjonalistiske kretser fremmer bruk av sanskritord som et symbol for politisk hinduisme^[16], og forsøker å etablere sanskritnyord i skriftspråket selv for nyere begreper som «elektrisitet». I hverdagsspråket brukes det imidlertid oftere engelske lånord enn kunstige sanskritnyord.

Lånord rediger

Til deśya-ordene regnes ord uten paralleller i sanskrit. Til disse hører ord som har blitt arva fra urindiske dialekter, som mangler i sanskrit, samt lånord fra dravidiske språk og mundaspråk. Dertil kommer i nyindoariske språk et større antall lånord som hentes fra ikke-indiske språk, framfor alt persisk, arabisk, portugisisk og engelsk, som den indiske grammatikken regner til videśi-kategorien.

Under det rundt åtte hundre år lange islamske herredømmet i nordlige India var persisk overklassens hoffspråk. Så kom mange persiske, og via persisk formidling også arabiske, ord inn i de indoariske språkene. For urdu, de indiske muslimenes språk, overtar persisk-arabisk en lignende rolle som ordkilde som sanskrit har for de språkene som for det meste tales av hinduer. Dermed er det mange ord av persisk-arabisk avstamming i urdu, men få i språk som nepali, assamesisk og singalesisk, som ikke har hatt noen islamsk innflytelse.^[17]

En forholdsvis liten andel av lånordene kommer fra portugisisk, som de indiske språkene kom i kontakt med fra 1500-tallet gjennom europeiske sjøfarere. Fra portugisisk har ord som chave for «nøkkel» (hindi cābhī, marathi cāvī), janela for «vindu» (hindi janglā, bengali jānālā, singalesisk janēlaya) og mestre for «håndverker» (hindi mistrī, marathi mestrī) kommet til. Siden den britiske kolonitida har det også kommet mange lånord fra engelsk. Framfor alt moderne begreper som «hotell» (hoṭal), «billett» (ṭikaṭ, fra ticket) og «sykkel» (sāikil, fra cycle) har blitt tatt opp fra engelsk.

Skriftsystemer rediger

De indoariske språkene skrives med ulike indiske skriftsystemer, ulike varianter av det persiske alfabetet, og i enkelte tilfeller det latinske alfabetet. Divehi, språket på Maldivene, har en egen skrift som kalles thaana. Den er dokumentert siden 1599, og er utviklet med det arabiske alfabetet som forbilde.

Indiske skriftsystemer rediger

Utdypende artikler: Indiske skriftsystemer og brahmiskrift

Hinduistisk mantra på sanskrit skrevet med devanagariskrift.

Fragment av den sjette søyleinskripsjon til Ashoka den store i brahmiskrift. Sandstein fra Mauryariket.

Gurmukhi benyttes av sikhismen i deres hellige tekster. Her ser vi Adi Granth (Gurū Granth Sāhib), som er den primære teksten

De fleste skriftsystemer som brukes for indoariske språk er indiske skriftsystemer. I likhet med tibetansk skrift, tamilsk skrift, burmesisk skrift, thai-skrift, khmer-skrift, laotisk skrift, javanesisk skrift, balinesisk skrift, kawiskrifta samt tagbanwaskrifta, baybayin og hanunó'oskrifta på Filippinene, stammer alle de indiske skriftsystemene fra brahmiskrifta. I landsbyen Kodumanal i delstaten Tamil Nadu, er det avdekket flere inskripsjoner og tekstfragmenter av brahmiskrifta, som er tidfestet til det femte og muligens det sjette århundre f.Kr.^[18] Bedre kjent er ediktene i brahmiskrift som ble skrevet av Ashoka den store (334-232 f.Kr.) på Ashokasøyler fra 200-tallet f.Kr. Opphavet til brahmiskrifta er uklart. Det anses som sannsynlig at den ble utforma med det arameiske alfabetet som forbilde. Tesen om at skrifta stammer fra indusskrifta ble lansert av den engelske indologen Alexander Cunningham i 1877. Den forkastes av moderne vestlige forskere, men er populær i India.^[19]

I historiens løp har brahmiskrifta blitt oppdelt i mange regionale varianter, som grafisk kan skille seg ganske sterkt fra hverandre. Strukturelt er de imidlertid veldig likartede, og deler alle samme funksjonsprinsipp. Det dreier seg om en mellomform mellom alfabet og stavelsesskrift – såkalt abugida – der hvert konsonanttegn har en inneboende vokal a, som kan modifiseres ved hjelp av diakritiske tegn. Konsonantforbindelser uttrykkes gjennom ligaturer. Tegnenes ordningsrekkefølge er ikke tilfeldig som i det latinske alfabetet, men gjenspeiler de indoariske språkenes fonologi. Bokstavene ordnes på følgende måte:

Vokaler (a, ā, i, ī, u, ū, r̥, r̥̄, l̥, e, ai, o, au)
Plosiver og nasaler etter artikulasjonssted fra bakre til fremre
- Velarer (ka, kha, ga, gha, ṅa)
- Palataler (ca, cha, ja, jha, ña)
- Retroflekser (ṭa, ṭha, ḍa, ḍha, ṇa)
- Dentaler (ta, tha, da, dha, na)
- Labialer (pa, pha, ba, bha, ma)
Halvvokaler (ya, ra, la, va)
Sibilanter og aspiranter (śa, ṣa, sa, ha)

Tegnoppsettet er vesentlig det samme i de ulike skriftene. Noen skrifter har et spesielt tegn for det retroflekse ḷ, og andre spesialtegn kan dannes med en understilt prikk.

Tabellen nedenfor viser seks forskjellige indiske skriftsystemer som anvendes for indoariske språk. Den siste kolonnen viser konsonantraden ka, kha, ga, gha, ṅa (velarene) i de respektive skriftspråk:

Skrift	Språk	Eksempel
Devanagari	Hindi, bihari, rajasthani, marathi, nepali, kasjmiri, sanskrit
Bengalsk skrift	Bengali, assamesisk, bishnupriya manipuri, sanskrit
Gurmukhi	Panjabi, sindhi, hindustani, sanskrit
Gujaratiskrift	Gujarati, kutchi, hindi, sanskrit
Oriyaskrift	Oriya, sanskrit
Singalesisk skrift	Singalesisk, pāli, sanskrit

Sanskrit ble tradisjonelt ofte skrevet med skriftsystemene til regionale språk, men siden 1870-årene har devanagari slått gjennom som standardskrift for sanskrittekster. Noen indoariske språk bruker flere skriftspråk parallelt. Kasjmiri ble fra ca 800 e.Kr. frem til det 14. århundre stort sett skrevet med śāradāskrift. I dag skrives det i Pakistan med det persiske alfabet, og i India med devanagari. For panjabi forekommer tre skriftsystemer: I Pakistan benyttes Shahmukhi, som er en variant av det persiske alfabet, sikher benytter gurmukhi, mens hinduer skriver panjabi ved hjelp av devanagari.

Det persiske alfabetet rediger

Utdypende artikler: Det persiske alfabetet, urdualfabetet og nastaliqskrift

Urdudikt av den indiske poeten Mirza Ghalib (1797–1869) i nastaliqskrift.

Det persiske alfabetet er blitt brukt siden 642 e.Kr. til å skrive persisk. Varianter av det brukes også til å skrive aserbajdsjansk og usbekisk. Det består av 32 tegn og ble utformet med bakgrunn i det arabiske alfabet. Det kalles derfor også det persisk-arabiske alfabet.

Dette skriftspråket erstattet de tidligere pahlaviskriftsystemene og det avestiske alfabetet, som ble brukt til å skrive middeliranske språk, herunder avestisk. Det persiske alfabet benyttes av de indiske muslimene til å skrive urdu. I Pakistan brukes det til å skrive sindhi, panjabi og kasjmiri. Det er imidlertid ikke spesielt egnet til å gjengi indoariske språk.

For det første uttrykkes ikke korte vokaler, og blant de lange vokalene gjøres det ingen forskjell mellom ū, ō og au. I arabiske lånord forekommer redundante bokstaver som uttales likt (for eksempel uttales sin, sad og tha alle som s). For andre lyder som forekommer i indoariske språk finnes det i utgangspunktet ingen tegn i det persiske alfabetet. Derfor har nye bokstaver blitt danna ved hjelp av diakritiske tegn, og urdualfabetet har således tegnene ٹ ṭ, ڈ, ḍ og ڑ ṛ for de retroflekse lydene. Til forskjell skrives de samme konsonantene respektivt ٽ, ڊ og ڙ i sindhialfabetet. Panjabi og kasjmiri orienterer seg mot urdu-ortografien.

Pike tilhørende kalashene fra provinsen Khyber Pakhtunkhwa i Pakistan. Kalasha er et av tre indoariske språk som primært skrives med det latinske alfabetet.

Sindhialfabetet bruker også egne spesialtegn for de aspirerte konsonantene, mens urdualfabetet uttrykker dem ved å kombinere de uaspirerte konsonantene med h (for eksempel sindhi ٿ og urdu ته for th). Urdualfabetet er dessuten en variant av den kursive nastaliqskrifta, som ble utviklet i Iran på 700-tallet e.Kr., mens sindhi fortrinnsvis skrives med den enklere skriften naskh.

I historisk forstand er sindhi også blitt skrevet med khojki, som primært er brukt i enkelte deler av sjiaislamske religiøs litteratur, så vel som av noen få sjiaislamske hemmelige sekter. Også khudabadiskriften ble brukt tidligere; den ble utviklet i det 16. århundre for spesifikt å skrive sindhi, men har sjeldent vært i bruk etter 1947. Og som nevnt i forrige avsnitt anvendes gurmukhi (blant sikher) til å skrive sindhi.

Det latinske alfabetet rediger

Utdypende artikler: Romanes, konkani og kalasha

De eneste indoariske språkene som regelmessig skrives med det latinske alfabetet er romanes og konkani. For romfolk, bedre kjent som sigøynere, har dette en naturlig årsak. Som et historisk omvandrende folk i Europa, har de i over tusen år vært adskilt fra sitt antatte opphavsted omkring dagens Punjab, hvor kjernen av deres vokabular synes å stamme fra. Adskillelsen fra sitt indoariske hjemland, gjør at romanes har utviklet seg som en egen undergruppe av de indoariske språk.

Konkani er et indoarisk språk i den sørvestindiske delstaten Goa, og den elste kjente inskripsjon er i devanagari fra 1187. I 1510 ble området en portugisisk koloni. Den katolske kirke la ned forbud mot tekster skrevet i devanagari, og alle tekster i devanagari, herav de som var skrevet i konkani, ble brent. Som erstatning ble det utvikla en ny ortografi som var basert på portugisisk. Konkani skrives også med devanagari den dag i dag.

Kalasha, som snakkes av kalashene i provinsen Khyber Pakhtunkhwa i Pakistan, er et av de dardiske språkene. Det var lenge et skriftløst språk, og det ble ikke dokumentert før på slutten av 1900-tallet da en alfabetbok ble publisert. I 2004 ble den første alfabetboken basert på det latinske alfabet publisert, med hjelp fra den østerrikske språkforskeren Gregory R. Cooper. Kalasha brukes nå i skoleundervisninga, og til dette formål brukes det latinske alfabet.

I vitenskapelig kontekst brukes latinsk transliterasjon. Den mest brukte standarden er International Alphabet og Sanskrit Transliteration (IAST). I framstillinga av konsonanter orienterer det seg mot bokstavenes lydverdi i engelsk, hvor y brukes for [j]. Aspirerte konsonanter uttrykkes gjennom digrafer som kh, th, osv. Andre lyder som ikke har tilsvarende bokstaver i det latinske alfabetet, uttrykkes i IAST med diakritiske tegn, som makron for lange vokaler og understilte prikker for retroflekse lyder.

Referanser rediger

^ Colin P. Masica: The Indo-Aryan Languages, Cambridge 1991, s. 3
^ Masica: The Indo-Aryan Languages, s. 36
^ Masica: The Indo-Aryan Languages, s. 37
^ Jules Bloch: Indo-Aryan. From the Vedas to modern times. , Paris 1965, s. 11
^ Masica: The Indo-Aryan languages, s. 37 ff
^ Masica: The Indo-Aryan languages, s. 45
^ Bloch: Indo-Aryan, s. 24
^ Census of India: Family-wise grouping of the 114 scheduled and non-scheduled languages – 1991 Arkivert 6. juni 2007 hos Wayback Machine.
^ Hermann Berger: Die Vielfalt der indischen Sprachen, I: Dietmar Rothermund (utg.): Indien. Kultur, Geschichte, Politik, Wirtschaft, Umwelt. Ein Handbuch., München 1995, s. 105
^ Hoernle 1880, Introduction: The local distribution and mutual affinities of the Gaudian languages, side I-XXXV
^ Masica: The Indo-Aryan languages, s. 94
^ Masica: The Indo-Aryan languages, s. 113
^ Masica: The Indo-Aryan languages, s. 111
^ Eksempelet er fra Bloch: Indo-Aryan, s. 307
^ Eksemplene er fra Masica: The Indo-Aryan languages, s. 85
^ Berger: Die Vielfalt der indischen Sprachen, s. 102
^ Masica: The Indo-Aryan Languages, s. 71
^ Rajan, K.; Yatheeskumar, V.P. (2013). «New evidences on scientific dates for Brāhmī Script as revealed from Porunthal and Kodumanal Excavations» (PDF). Prāgdhārā. 21-22: 280–295. Arkivert fra originalen (PDF) 13. oktober 2015. Besøkt 12. januar 2016. «Arkivert kopi» (PDF). Arkivert fra originalen (PDF) 13. oktober 2015. Besøkt 11. august 2016.
^ Masica: The Indo-Aryan Languages, s. 133 f.

Litteratur rediger

Berger, Hermann (1995). Dietmar Rothermund, red. Die Vielfalt der indischen Sprachen. Indien. Kultur, Geschichte, Politik, Wirtschaft, Umwelt. Ein Handbuch. (tysk). München: C. H. Beck. s. 101–110.
Bloch, Jules (1995). Indo-Aryan. From the Vedas to modern times. (engelsk). Paris: Libraire d’Amérique et d’Orient Arien Maisonneuve.
Cardona, George (1990). Bernard Comrie, red. Indo-Aryan Languages. The Major Languages of South Asia, the Middle East and Africa (engelsk). London: Routledge.
Cardona, George og Dhanesh Jain (red.) (2003). The Indo-Aryan Languages (engelsk). London: Routledge. ISBN 0700711309.
Masica, Colin P. (1991). The Indo-Aryan Languages. (engelsk). Cambridge: Cambridge University Press. ISBN 0521299446.
Zograph, Georgij A. (1982). Die Sprachen Südasiens (tysk). Leipzig: VEB Verlag Enzyklopädie.
Ruhlen, Merritt (1991). A Guide to the World's Languages (engelsk). Stanford University Press. ISBN 0804718946.
Dalby, David (1999). The Linguasphere Register of the World's Languages and Speech Communities (engelsk). Linguasphere Press. ISBN 0953291928.
Gippert, Jost; Kleppin, Karin; Glück H. (red.) (1993). Metzler Lexikon Sprache (tysk). Metzler Verlag, Stuttgart 1993; 2. opplag Metzler Verlag, Stuttgart, Weimar 2000, 3. opplag 2005.
Hoernle, August Friedrich Rudolf (1880). A comparative grammar of the Gaudian languages: with special reference to the Eastern Hindi (engelsk). London 1880, nytrykk av Asian Educational Services 1991. ISBN 81-206-0715-5.
Grierson, George A. (1903–1928). Linguistic Survey of India (LSI). (engelsk). I–XI. Calcutta.
Grierson, George A. (1931–1933). On the Modern Indo-Aryan Vernaculars (engelsk). Delhi.
Chatterji, Suniti Kumar (1926). The Origin and Development of Bengali Language (engelsk). Calcutta.
Turner, R.L. (1960). Some Problems of Sound Change of Indo-Aryan (engelsk). Poona: University of Poona.
Katre, Sumitra Mangesh (1965). Some Problems of Historical Linguistics in Indo-Aryan (engelsk). Poona: Deccan College Postgraduate and Research Institute.
Nigam, R.C. (1972). Language Handbook on Mother Tongue in Census (engelsk). New Delhi.
Matras, Yaron (2002). Romani. A Linguistic Introduction (engelsk). Cambridge University Press. ISBN 0521631653.

Eksterne lenker rediger

Kausen, Ernst (2006–2010). «Die Klassifikation der indogermanischen Sprachen» (Worddokument). Besøkt 6. desember 2012.
Grunnlag for klassifiseringa av de nyindoariske språkene i denne artikkelen.
Turner, Ralph Lilley. «A comparative dictionary of Indo-Aryan languages». Besøkt 6. desember 2012.
London: Oxford University Press, 1962–1966. Digitalisert av University of Chicago.

[1] Colin P. Masica: The Indo-Aryan Languages, Cambridge 1991, s. 3

[2] Masica: The Indo-Aryan Languages, s. 36

[3] Masica: The Indo-Aryan Languages, s. 37

[4] Jules Bloch: Indo-Aryan. From the Vedas to modern times. , Paris 1965, s. 11

[5] Masica: The Indo-Aryan languages, s. 37 ff

[6] Masica: The Indo-Aryan languages, s. 45

[7] Bloch: Indo-Aryan, s. 24

[8] Census of India: Family-wise grouping of the 114 scheduled and non-scheduled languages – 1991 Arkivert 6. juni 2007 hos Wayback Machine.

[9] Hermann Berger: Die Vielfalt der indischen Sprachen, I: Dietmar Rothermund (utg.): Indien. Kultur, Geschichte, Politik, Wirtschaft, Umwelt. Ein Handbuch., München 1995, s. 105

[10] Hoernle 1880, Introduction: The local distribution and mutual affinities of the Gaudian languages, side I-XXXV

[11] Masica: The Indo-Aryan languages, s. 94

[12] Masica: The Indo-Aryan languages, s. 113

[13] Masica: The Indo-Aryan languages, s. 111

[14] Eksempelet er fra Bloch: Indo-Aryan, s. 307

[15] Eksemplene er fra Masica: The Indo-Aryan languages, s. 85

[16] Berger: Die Vielfalt der indischen Sprachen, s. 102

[17] Masica: The Indo-Aryan Languages, s. 71

[18] Rajan, K.; Yatheeskumar, V.P. (2013). «New evidences on scientific dates for Brāhmī Script as revealed from Porunthal and Kodumanal Excavations» (PDF). Prāgdhārā. 21-22: 280–295. Arkivert fra originalen (PDF) 13. oktober 2015. Besøkt 12. januar 2016. «Arkivert kopi» (PDF). Arkivert fra originalen (PDF) 13. oktober 2015. Besøkt 11. august 2016.

[19] Masica: The Indo-Aryan Languages, s. 133 f.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]