TIS 620 (Thai Industrial Standard 620) er det vanligste tegnsettet for thai og det eneste som brukes i Thailand. Standarden gis ut av Thai Industrial Standards Institute (TISI), som er underlagt Thailands industridepartement. Standarden heter formelt «Standard for koding av thai-tegn for bruk med datamaskiner» (thai: รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร์). Den nåværende standarden er TIS 620-2553, der 2553 er året den ble implementert, i henhold til den thailandske solkalenderen (1990 e.Kr.); TIS 620-2553 var en oppdatering av den tidligere TIS 620-2529 (1986).

Oppbygning rediger

TIS-620 er et utvidet ASCII-tegnsett som er kompatibelt med 7-bits ASCII. Det bruker 8-bits intervallet fra heksadesimale A1 til FB for å kode thai-skriften. Ettersom thai-skriften er mer kompleks enn f.eks. det latinske alfabetet, med diakritiske tegn og over- og underskrevne vokal-tegn, kan TIS 620 bare brukes for å sende informasjon, og det er nødvendig med videre språksøtte for å få skriften til å vises ordentlig.

Internasjonal bruk rediger

TIS-620 ble tatt i bruk som ISO 8859-11 i 1999; den eneste forskjellen er at ISO 8859-11 definerer heksadesimale A0 som non-breaking space, mens TIS-620 har den som reservert, dog udefinert.

TIS-620 tegnsettet har også blitt tatt i bruk innenfor Unicode (ISO 10646). I Unicode kodes thai mellom U+0E01 og U+0E7F. Tegn fra TIS-620 kan konverteres til UTF-16 ved å legge 0E til foran, og trekke heksadesimale A0 fra.

Kodekart rediger

TIS-620
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x ubrukt
1x
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x ubrukt
9x
Ax  
Bx
Cx
Dx  ั  ิ  ี  ึ  ื  ุ  ู  ฺ         ฿
Ex  ็  ่  ้  ๊  ๋  ์  ํ  ๎
Fx        

I denne tabellen er 20 vanlig mellomrom. Kodepunktene 00-1F, 7F, 80-9F, A0, DB-DE og FC-FF har ingen verdi i TIS-620.

Kodepunktene D1, D4-DA, E7-EE (markert i lyseblått) er diakritiske tegn og over-/underskrevne vokaler.

Rekkefølge rediger

Det finnes bare én rekkefølge for å lagre thai-skrift med denne standarden. Tegnene lagres i den rekkefølgen man ville skrevet dem, dersom man skrev ordet for hånd. Denne rekkefølgen er skjematisk satt opp nedenfor, med ordene เพื่อน ([pɯan] «venn») og คุ้ย ([kui] «å grave med klørne» (som en hund)) som eksempler. For å vise et mer komplisert ord vises også รามเกียรติ์.

Først skrives den forskrevne vokalen, så ordets første konsonant. Deretter kommer den over- eller underskrevne vokalen (ettersom det ikke finnes noen sammensatt vokal som består av både en over- og underskreven vokal, er begge disse det 3. man skriver). Det fjerde tegnet er et diakritisk tegn, typisk et tonemerke. Så kommer den etterskrevne vokalen, og til slutt stavelsens siste konsonant.

4 - ่
3 - ื
1 - เ  2 - พ  5 - อ  6 - น 
3

4 - ้
3
1 -    2 - ค  5 - ย  6 -   
3 - ุ

11 - ์ 
6 - ี 10 - ิ
1 - ร  2 - า  3 - ม  4 - เ  5 - ก  7 - ย  8 - น  9 - ต 


Selv om ำ gjerne oppfattes som en delvis overskrevet vokal, anses den i TIS 620 for å være en etterskrevet vokal, og skal skrives etter diakritiske tegn. F.eks. i et ord som น้ำ ([nám] «vann») skal mai tho skrives før ำ.

Eksterne lenker rediger