Romanian-HOWTO

De la Wiki.lug.ro
Versiunea din 25 februarie 2007 14:19, autor: Cmatei (Discuție | contribuții) (Codificare)

Salt la: navigare, căutare

Să ne facem Linuxul să vorbească și să scrie corect românește.

ÎN LUCRU! Ajutorul vostru va fi foarte apreciat.

Introducere

Localizarea sistemului pentru limba română ridică mai multe probleme:

  • codificarea și afișarea corectă a tuturor literelor din alfabetul limbii române precum și a semnelor tipografice în uz
  • formatarea corectă a datelor, numerelor, etc
  • traducerea aplicațiilor
  • ...

Codificare

În ceea ce privește codificarea setului de caractere folosit există mai multe standarde, care bineînțeles nu sunt direct compatibile:

  • coduri de pagină DOS/Windows - metoda IBM/Microsoft, nu asigură interoperabilitate cu alte sisteme. Extensie a setului ASCII. Nu mai este folosit (?).
  • Latin2 (ISO 8859-2) - cel mai vechi standard internațional care suportă aproximativ limba română. Este o extensie a setului ASCII la 8 biți, care include variante greșite ale literelor ș și ț în setul extins. Nerecomandat.
  • Latin10 (ISO 8859-16) - tot o extensie a ASCII, cu caracterele corecte. Nerecomandat, întrucât nu permite interoperabilitatea decât cu sisteme care folosesc această codificare.
  • Unicode - o serie de standarde care ar trebui să acopere toate sistemele de scriere ale pământului (semne grafice, metode de codificare, reguli de sortare și afișare, etc). Un standard dezvoltat în paralel este ISO/IEC 10646 care asignează valori numerice pentru semnele grafice (simplifcat: litere) din repertoriul Unicode.

Standardul preferat este Unicode, în particular folosind codificarea UTF-8. UTF-8 este compact pentru alfabetele europene, necesitând 1 octet pentru caracterele ASCII standard și cel mult 2 octeți pentru diacritice. Indiferent de reprezentarea internă a caracterelor într-o aplicație, dacă aceasta permite salvarea de fișiere, comunicația etc folosind UTF-8, este posibilă o bună interoperabilitate cu alte aplicații, indiferent de sistemul de operare.

Problema codificării setului de caractere folosit pentru limba română este tratată exhaustiv aici

Fonturi

În X, precum și în consolă

Tastatură

În X, precum și în consolă

Ortografie și gramatică

Accesibilitate

Text-to-speech: