Tamil Script Code for Information Interchange

Tamil Script Code for Information Interchange

Tamil Script Code for Information Interchange (TSCII) is a coding scheme for representing the Tamil script. The lower 128 codepoints are plain ASCII, the upper 128 codepoints are TSCII-specific. After long years of being used on the Internet by private agreement only, it was successfully registered with the IANA in 2007. [http://www.iana.org/assignments/charset-reg/TSCII]

TSCII encodes the characters in visual (written) order, paralleling the use of the Tamil Typewriter.

Unicode has used the logical order encoding strategy for Tamil, following ISCII, in contrast to the case of Thai, where the visual order encoding grandfathered by TIS-620 was adopted.

The government of Tamil Nadu endorses its own TAB/TAM standards for 8-bit encoding and other, older encoding schemes can still be found on the WWW.

The free etext collection at [http://www.tamil.net/projectmadurai/ Project Madurai] uses the TSCII encoding, but has already started to provide Unicode versions.

Codepage layout

In the table above 80 is U+0BE6 TAMIL DIGIT ZERO, which has been accepted in Unicode version 4.1. A0 is the NO-BREAK SPACE.The codes AD and FF are unassigned.

References

External links

* [http://www.tscii.org/ TSCII Start Page]
* [http://www.unicode.org/notes/tn15/ Unicode Technical Note #15 Text conversion From TSCII 1.7 to Unicode]
* [http://www.infitt.org/ INFITT (International Forum for Information Technology in Tamil)]
* [http://www.tamilone.com/ TSCII to Unicode Online & Webpage Conversion]
* [http://padma.mozdev.org Padma – Mozilla extension for transforming TSCII to Unicode]


Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Look at other dictionaries:

  • Tamil Script Code for Information Interchange — (Tamilische Schriftkodierung für Informationsaustausch, TSCII) ist ein Zeichensatz, der für die Zeichenkodierung der tamilischen Schrift in Computersystemen benutzt wird. TSCII stellt eine Erweiterung des ASCII Zeichensatzes dar. TSCII kodiert… …   Deutsch Wikipedia

  • Indian Script Code for Information Interchange — (ISCII) is a coding scheme for representing various writing systems of India. It encodes the main Indic scripts and a Roman transliteration. The supported scripts are: Assamese, Bengali, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya,… …   Wikipedia

  • ASCII-Code — American Standard Code for Information Interchange (ASCII, alternativ US ASCII, oft [æski] ausgesprochen) ist eine 7 Bit Zeichenkodierung und bildet die US Variante von ISO 646 sowie die Grundlage für spätere mehrbittige Zeichensätze und… …   Deutsch Wikipedia

  • Ascii-code — American Standard Code for Information Interchange (ASCII, alternativ US ASCII, oft [æski] ausgesprochen) ist eine 7 Bit Zeichenkodierung und bildet die US Variante von ISO 646 sowie die Grundlage für spätere mehrbittige Zeichensätze und… …   Deutsch Wikipedia

  • TSCII — Tamil Script Code for Information Interchange (Tamilische Schriftkodierung für Informationsaustausch, TSCII) ist ein Zeichensatz, der für die Zeichenkodierung der tamilischen Schrift in Computersystemen benutzt wird. TSCII stellt eine Erweiterung …   Deutsch Wikipedia

  • ANSI X3.4-1968 — American Standard Code for Information Interchange (ASCII, alternativ US ASCII, oft [æski] ausgesprochen) ist eine 7 Bit Zeichenkodierung und bildet die US Variante von ISO 646 sowie die Grundlage für spätere mehrbittige Zeichensätze und… …   Deutsch Wikipedia

  • ASCII — American Standard Code for Information Interchange (ASCII, alternativ US ASCII, oft [æski] ausgesprochen) ist eine 7 Bit Zeichenkodierung und bildet die US Variante von ISO 646 sowie die Grundlage für spätere mehrbittige Zeichensätze und… …   Deutsch Wikipedia

  • ASCII-Tabelle — American Standard Code for Information Interchange (ASCII, alternativ US ASCII, oft [æski] ausgesprochen) ist eine 7 Bit Zeichenkodierung und bildet die US Variante von ISO 646 sowie die Grundlage für spätere mehrbittige Zeichensätze und… …   Deutsch Wikipedia

  • ASCII-Zeichensatz — American Standard Code for Information Interchange (ASCII, alternativ US ASCII, oft [æski] ausgesprochen) ist eine 7 Bit Zeichenkodierung und bildet die US Variante von ISO 646 sowie die Grundlage für spätere mehrbittige Zeichensätze und… …   Deutsch Wikipedia

  • ASCII-Zeichentabelle — American Standard Code for Information Interchange (ASCII, alternativ US ASCII, oft [æski] ausgesprochen) ist eine 7 Bit Zeichenkodierung und bildet die US Variante von ISO 646 sowie die Grundlage für spätere mehrbittige Zeichensätze und… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”