3. Le vocabulaire : petit lexique

Tout d'abord, un mot sur le vocabulaire employ� :

3.1. 8 bits

Des caract�res sont dits � 8 bits � s'ils correspondent � des accents ou � des signes sp�ciaux comme � � �, non inclus dans le standard ASCII � 7 bits �.

Ce standard, sans accents ni caract�res sp�ciaux, correspond aux 128 (2^7) premiers caract�res des 256 (2^8), de 0 � 255.

Pour des raisons historiques (place disponible, inutilit� pour les �tats uniens) seuls les 128 (2^7) premiers caract�res ont �t� normalis�s par l'ASCII : par exemple le A qui est le 65e caract�re de la table ASCII s'�crit 0100 0001 en notation binaire.

Pour les caract�res situ�s hors de la norme ASCII, diff�rentes � normes � ou � standards � incompatibles, comme l'Unicode, l'iso-8859, le latin, le cp (...) fixent ces correspondances.

Par exemple, dans le standard ASCII �tendu par l'iso-8859-1, le 224�me caract�re �quivalent not� � eb � en hexad�cimal correspond � � � �.

3.2. La police de caract�res

Une police de caract�res est une correspondance entre des codes informatiques et des caract�res (alphanum�riques...) affichables par l'ordinateur.

La police de caract�res est l'ensemble des repr�sentations graphiques des caract�res d'un standard.

3.3. Les polices de caract�res

Il existe plusieurs polices de caract�res 8 bits pouvant r�pondre au besoins des francophones.

Je vous recommande de lire � ce sujet l'excellent site de Roman Czyborra qui a fait une th�se sur ce sujet et qui vous donnera une explication fort d�taill�e

Pour r�sumer, il est n�cessaire de choisir une police de caract�res pour que tous les caract�res fran�ais soient disponibles.

Voici la liste des polices dites � ISO 8859 �, mais attention, il existe leurs �quivalents en � code page � pour windows (comme cp1252).

De cette longue liste, il convient de ne retenir que :

Les choix de polices de caract�res sont souvent des questions ou la raison se heurte aux habitudes.

Pour ma part, si vous h�sitez, je vous recommande l'ISO 8859-15 latin 9, pour diverses raisons :

Le Francophones HOWTO utilise donc le latin 9 dans tous les exemples, car il y a de grandes chances que votre syst�me ne soit pas encore compatible latin 9... autant donc vous proposer des manipulations et des travaux pratiques utiles :-)

Toutefois, si vous ne pouvez utiliser l'ISO 8859-15 latin 9 et d�cidez d'en choisir une autre, je vous recommande d'�viter les cp propres au monde DOS/Windows et de vous rabattre sur l'ISO 8859-1 latin 1 qui est encore un standard fort r�pandu : dans chaque exemple je vous invite alors � remplacer les � latin9 � par des � latin1 �

3.4. Table de clavier

Une table de clavier est un fichier permettant de faire correspondre l'empreinte physique des cabochons, � touches � du clavier, au r�sultat obtenu sur l'�cran de l'ordinateur.

Pour linux, ces fichiers sont dans /usr/lib/kbd/keytables/ ou /usr/share/kbd/keytables/

Par exemple, les claviers fran�ais AZERTY ont une table de clavier diff�rente des claviers suisse romands QWERTZ, ou des claviers du reste du monde, QWERTY.

Cela ne concerne que l'apparence du clavier, l'empreinte des cabochons, donc disposition relative des caract�res sur le clavier, et non son �lectronique interne ; si votre clavier ne vous convient pas, il vous suffit donc d'utiliser des autocollants pour le transformer en un autre clavier francophone.

3.5. � Home �, � End �, � Page_Up � et � Page_Down �

Les touches � Home �, � End �, � Page_Up � et � Page_Down � dont les noms varient selon les claviers sont les touches permettant respectivement d'aller en d�but/fin de ligne et de monter/descendre d'une page.

Les codes affectes � ces touches sont respectivement 102 et 107 pour � Home � et � End � en mode terminal.

Dans les pictogrammes des claviers ISO 9995-7, ces touches sont repr�sent�s par des fl�ches aux traits appuy�s.

Lorsqu'on presse une touche, le clavier �met un code, qui est intercept� par la table de clavier.

La table de clavier, si elle reconnait le code, renvoie la chaine associ�e � la touche, en l'occurence� "\e[4� � pour � End �.

Lorsque bash ou un autre programme re�oit cette chaine, il ne la connait pas !

Donc il faut lui dire, dans le .inputrc que "\e[4�" signifie "aller � la fin de la ligne"

Donc pour que ces touches fonctionnent dans le shell bash, on ajoutera donc dans le fichier .inputrc (dans votre �/ ou dans /etc/inputrc) les lignes:

set meta-flag on
set convert-meta off
set input-meta on
set output-meta on
set bell-style visible
"\e[1~":beginning-of-line
"\e[3~":delete-char
"\e[4~":end-of-line
"\e\C-h": backward-kill-word
"\e\e[3~": kill-word

Les premi�res lignes permettent d'afficher les caract�res 8 bits, et de remplacer le � bip � en cas d'erreur par un �clair blanc � l'�cran.

3.6. Touches mortes

Les touches mortes sont des touches qui ne produisent pas de caract�res en elles-m�mes, mais qui modifient la fa�on dont la frappe suivante va �tre interpr�t�e, par exemple, le tr�ma ou l'accent circonflexe sont en g�n�ral des touches mortes.

Une touche morte est une touche qui doit donc �tre suivie d'un espace pour obtenir l'accent seul, ou dans le cas o� elle est suivie d'une voyelle y positionne un accent, par exemple :

	� ^ � puis � e � donne � � �
 � ^ � puis � espace � donne � ^ �

Les touches mortes sont :

3.7. � BackSpace � et � Delete �

En raison d'une erreur volontaire et historique sous Linux, pour � �muler � le fonctionnement d'un clavier de console VT, ces 2 touches sont fr�quemments m�lang�es, au mieux fonctionnant � l'identique, au pire ne fonctionnant pas du tout.

Commen�ons donc par bien les d�finir :

Le pav� num�rique offre une touche au marquage identique et � effet identique lorsque � Verr Num � ou � Num Lock � est d�sactiv�.

Ces deux touches correspondent chacune � un de ces codes :

Ceci dans le but d'effacer � gauche du curseur avec BackSpace, � droite du curseur avec Delete.

3.8. � UTC � et � GMT �

Chaque partie du monde a sa propre norme horaire, bas�e sur des fuseaux.

La France se trouve en zone MET, � heure moyenne europ�enne � soit GMT+1 ; la zone � MET DST � correspond � l'heure d'�t� activ�e soit GMT+2.

C'est le temps UTC, d�fini � Paris, qui sert de r�f�rence aux diff�rentes heures l�gales.

L'acronyme � GMT � est employ� 99% du temps pour d�signer UTC, mais c'est une erreur ou un abus de langage.

Enfin, � titre purement indicatif, il existe l'heure astronomique, aussi compt�e sur des �talons atomiques mais d�cal�e de 4 minutes par jour de l'heure terrestre car se basant sur la position de la terre dans l'espace par rapport aux �toiles.

Hosting by: Hurra Communications GmbH
Generated: 2007-01-26 18:01:25