II Le codage du texte

A) Les différents types de codages et leurs caractéristiques


 L'ASCII : Les caractères sont comptés sur 7 bits qui sont représentés en binaire sur O et 1. C'est l'équivalent de 128 caractères soit 2^7. Ce codage fut inventé par les américains, cette langue ne comporte pas d'accents écris ni cédille il ne sont donc pas présent dans cet alphabet en revanche pour l'alphabet français
ISO 8859-1 : les caractères sont comptés sur 8 bits. c'est l'équivalent de 2^8 soit 256 caractères différents. Ces derniers sont suffisant pour mémoriser notre alphabet latin avec les caractères spéciaux (accents, cédilles...)

ISO 8859-15 : C'est une variante de l'ISO 8859-1 qui a les mêmes fonctionnalités en plus développées comme l'ajout de certain caractères spéciaux comme €, œ et Œ

*WINDOWS-1252 : C'est un codage propre au ordinateur Windows qui fonctionne de manière similaire à l'ISO avec comme seule particularité la différence de certains caractères

MacRoman : C'est un codage propre au Apple Macintosh. Il possède les mêmes fonctionnalités que l'ISO et le Windows mise à part quelques différences dans les caractères spéciaux

UTF-8 : Codage universel qui permet de reproduire un nombre de caractères quasi illimité tel que l'alphabet Chinois.
Ce codage est accessible depuis toutes plate formes et se code sur 8 à 32 bits.
Avec ce système on s'affranchit de la conversion des caractères spéciaux en code HTML. Un "e" avec accent aigu devient donc un "é" et non "&eacute" dans le code source.

Aucun commentaire:

Enregistrer un commentaire