Ceci est une ancienne révision du document !
Nous avons vu que les signaux numériques peuvent être traduits en informations binaires pouvant être groupées en octets pour être stockées dans les ordinateurs. Qu'un octet peut prendre n'importe quelle valeur entière de 0 à 255.
Toutefois, un ordinateur traite aussi des nombres bien plus grands, des textes, des images …
Il va falloir donc falloir utiliser un codage de l'information basé sur les octets mais adapté à l'information à traiter. Un entête indiquera le type et l'organisation des données de la même façon que le fait l'extension du nom des fichiers.
Pour aller plus loin
Les informaticiens utilisent souvent le système hexadécimal base 16, proche du binaire mais plus facile à utiliser que celui-ci. Il utilise les chiffres de 0 à 9 et les lettres de A à F. Un octet se code alors à l'aide de 2 caractères. (#00 = 0, #01 = 1 … #0A = 10 … #0F = 15, #10 = 16 … #FF = 255).
(Système hexadécimal, 2020) dans Wikipédia https://fr.wikipedia.org/wiki/Syst%C3%A8me_hexad%C3%A9cimal)
Une adresse IP peut être codé sur 4 octets contenant des nombres entre 0 et 255 (ex. 192.168.10.25). Cela nous donne 255*255*255*255 possibilités soit 4228250625 adresses.
Les nombres entiers sont codé sur 4 ou 8 octets suivant les langages utilisés (ex. 158236451). On utilise alors un tableau binaire de 32 ou 64 colonnes.
Les nombres réels utilisent la notation en virgule flottante (mantisse et exposant) que vous apprendrez plus tard.
La table ASCII permet de coder les touches du clavier et d'afficher les caractères à l'écran et sur l'imprimante.
Il en existe différentes versions en fonction des alphabets utilisées.
Aujourd'hui elle est remplacée par un système international, UTF-8, qui permet de regrouper tous les alphabets.
Un fichier texte est enregistré sur l'ordinateur avec une extension .txt. Il ne contient que le code des touches utilisées. Les fichiers .odt (LibreOffice Writer) et .docx (Microsoft Word) contiennent le code des touches et les informations de mise en forme.
Le mot “Nous” utilise
les codes hexadécimaux 4e 6f 75 73
soit en décimal 78 111 117 115
et en binaire 01001110 01101111 01110101 01110011.
Les informations binaires sont stockées et traitées dans des fichiers reconnaissables à leur extension (.txt .odt .doc … pour les textes). L'extension est transmise en entête des données.
Les textes utilisent la table ASCII pour coder les touches et les caractères à afficher.
La palette VGA permettait de coder les couleurs au début de l'informatique (16 couleurs maximum). Elle est aujourd'hui remplacée par des palettes plus importantes (format PNG, GIF …). Les palettes restent davantage adaptées aux dessins (peu de couleurs <1000) et utilisent un système de compression de donnée sans perte.
Les photos numériques qui retranscrivent des millions de couleurs ont mené à la création du système RVB utilisant la “notation #rrvvbb ou (r,v,b)” qui code les couleurs sur 3 octets en indiquant une quantité de rouge, de vert et de bleu pour chaque point. C'est une technique qui permet d'obtenir plus de 16 millions de couleurs. Le format JPG l'utilise associé à une technique de compression de donnée avec perte.
Les 16 couleurs de base avec leur code palette, RVB, nom en français et nom informatique.
Une image est organisée en points placés sur des lignes et des colonnes, les pixels. Un fichier image comprend :
Le résultat en binaire : 01010000 01001110 01000111 00010100 00011110 00001001 00001001 00001001 00001110 …
Les images utilisent les palettes de couleurs ou le codage RGB et l'entête précise l'organisation des pixels (lignes, colonnes) avant de transmettre la couleur des points.
Pour aller plus loin