Tout d'abord, un mot sur le vocabulaire employ� :
Des caract�res sont dits � 8 bits � s'ils correspondent � des accents ou � des signes sp�ciaux comme � � �, non inclus dans le standard ASCII � 7 bits �.
Ce standard, sans accents ni caract�res sp�ciaux, correspond aux 128 (2^7) premiers caract�res des 256 (2^8), de 0 � 255.
Pour des raisons historiques (place disponible, inutilit� pour les �tats uniens) seuls les 128 (2^7) premiers caract�res ont �t� normalis�s par l'ASCII : par exemple le A qui est le 65e caract�re de la table ASCII s'�crit 0100 0001 en notation binaire.
Pour les caract�res situ�s hors de la norme ASCII, diff�rentes � normes � ou � standards � incompatibles, comme l'Unicode, l'iso-8859, le latin, le cp (...) fixent ces correspondances.
Par exemple, dans le standard ASCII �tendu par l'iso-8859-1, le 224�me caract�re �quivalent not� � eb � en hexad�cimal correspond � � � �.
Une police de caract�res est une correspondance entre des codes informatiques et des caract�res (alphanum�riques...) affichables par l'ordinateur.
La police de caract�res est l'ensemble des repr�sentations graphiques des caract�res d'un standard.
Il existe plusieurs polices de caract�res 8 bits pouvant r�pondre au besoins des francophones.
Je vous recommande de lire � ce sujet l'excellent site de Roman Czyborra qui a fait une th�se sur ce sujet et qui vous donnera une explication fort d�taill�e
Pour r�sumer, il est n�cessaire de choisir une police de caract�res pour que tous les caract�res fran�ais soient disponibles.
Voici la liste des polices dites � ISO 8859 �, mais attention, il existe leurs �quivalents en � code page � pour windows (comme cp1252).
ISO 8859-1 : latin 1 : langues d'Europe de l'ouest, Afrikaans, Swahili. Le Swahili, n'utilise aucun caract�re accentu� (comme l'Anglais, le Malais et l'Indon�sien), donc n'importe quel version fait l'affaire. Pour l'Afrikaans, je ne sais plus exactement quel �tait le choix initial (c'est-�-dire o� avait �t� rang� le 'n au d�part), mais il ne me semble pas que ce soit dans Latin 1. Dans la pratique, bien s�r, les Afrikaaner utilisent Latin 1 ; la m�me chose se passe pour un certain nombre des cas qui suivent.
ISO 8859-2 : latin 2 : langues d'Europe centrale et orientale. Dans les faits : Polonais, Tch�que, Slovaque, Slov�ne, Croate, Hongrois, Roumain, probablement aussi le Sorbe ou Sorabe (Wende en allemand). Officiellement, je crois que l'Albanais s'�crit aussi en Latin-2, mais comme dans les faits c'est identique au Latin 1... Il y a un probl�me pour le Roumain, car le Latin 2 contient formellement les caract�res avec une c�dille, quand en roumain on utilise une virgule souscrite.
ISO 8859-3 : latin 3 : Esp�ranto et Maltais. Initialement, c'�tait pr�vu pour les langues d'Europe du Sud, y compris le Turc, les langues d'Espagne (donc Catalan, Basque), le Fran�ais. Mais dans la pratique, c'est limit� � ces deux langues.
ISO 8859-4 : latin 4 : langues baltes (incomplet). Pas utilis� dans la pratique, remplac� par Latin 7 (iso-8859-13), ou plut�t en pratique la codepage 1257 Windows. Pour l'Este ou Estonien, on peut aussi utiliser Latin 9.
ISO 8859-9 : latin 5 (comme latin 1, moins l'Islandais, plus le Turc). Usage : le Turc et peut-�tre l'Az�ri, mais il manque le schwa, un � e � renvers�. Codage officiel aux Pays-Bas du fait des Turcs qui y habitent.
ISO 8859-10 : latin 6 : langues nordiques, sauf le Lapon Skolt. Pas utilis� dans la pratique : ne servirait que pour les langues sames (ou lapones), mais il manque des caract�res, et le public concern� est de toute mani�re assez limit�.
ISO 8859-11 : Thai. Pas encore officiellement adopt�.
ISO 8859-12 : Indien (n'existe pas encore). Pr�vu pour le devanagari, pour �crire l'Hindi, la langue principale de l'Inde, et aussi un grand nombre d'autres langues indiennes, dont le Sanskrit.
ISO 8859-13 : latin 7 : langues baltes. Plus exactement : couvre les langues du pourtour de la mer Baltique, donc aussi le Polonais, l'Allemand et les langues de scandinavie. Mais dans la pratique il est r�duit en utilisation aux langues baltes et � l'Este ou Estonien.
ISO 8859-14 : latin 8 : langues celtes. Pour le Breton, le Ga�lique et les dialectes parl�es au Pays de Galles et en Irlande.
ISO 8859-15 : latin 9 : comme latin 1, en y comblant quelques manques. Pour le Fran�ais, le Finnois (en concurrence avec Latin 1) et l'Este ou Estonien (en concurrence avec Latin 7).
De cette longue liste, il convient de ne retenir que :
ISO 8859-1 latin 1 : police ouest-europ�enne utilis�e par la majorit� des syst�mes UNIX, elle permet de disposer de tous les caract�res Fran�ais sauf les � o e li�s �, l'euro et l'y tr�ma majuscule
cp850 : �quivalent sous DOS de cette police, mais incompatible : il faut utiliser un outil de traduction de fichiers tel GNU recode.
ISO 8859-15 latin 9 : police de l'union europ�enne, il s'agit d'une version r�vis�e de l'ISO 8859-1 latin 1 pour inclure tous les caract�res des pays europ�ens ; ainsi on y retrouve les caract�res Fran�ais manquant, l'euro, et des caract�res finlandais manquants.
latin 0 : l'ISO 8859-15 latin 9 est souvent incorrectement abr�g�e en latin0, qui correspondait au nom du projet, de par son ambition � remplacer le latin 1 un jour. Je vous renvoie au site de l'ISO et � la documentation compl�te de ce standard
cp1252 : �quivalent sous Windows de cette police, aussi incompatible, qui apporte les m�mes caract�res manquants, du fait d'une r�vision r�cente de cette norme.
ISO 8859-9 latin 5 : police officielle en Turquie et en Hollande, o� les caract�res Islandais peu utilis�s ont �t� remplac�s par les caract�res turcs.
cp1254 : �quivalent sous Windows de cette police, aussi incompatible, qui apporte les caract�res manquant au Fran�ais pr�c�demment cit�s et remplace les caract�res Islandais peu utilis�s par les caract�res turcs.
Les choix de polices de caract�res sont souvent des questions ou la raison se heurte aux habitudes.
Pour ma part, si vous h�sitez, je vous recommande l'ISO 8859-15 latin 9, pour diverses raisons :
Il supporte l'int�gralit� des caract�res utilis�s en Fran�ais de mani�re standard sur les UNIX, pour les �changes de fichiers entre Solaris et Linux par exemple
Il s'agit de la police 8 bits choisie par l'union europ�enne si l'Unicode, �volution du 8 bits, n'est pas disponible
Il permet d'�crire des textes avec l'int�gralit� des caract�res utilis�s dans l'union
Il est en train de devenir le nouveau standard dans la messagerie �lectronique au sens large, supplantant progressivement l'ISO 8859-1 latin 1
Le Francophones HOWTO utilise donc le latin 9 dans tous les exemples, car il y a de grandes chances que votre syst�me ne soit pas encore compatible latin 9... autant donc vous proposer des manipulations et des travaux pratiques utiles :-)
Toutefois, si vous ne pouvez utiliser l'ISO 8859-15 latin 9 et d�cidez d'en choisir une autre, je vous recommande d'�viter les cp propres au monde DOS/Windows et de vous rabattre sur l'ISO 8859-1 latin 1 qui est encore un standard fort r�pandu : dans chaque exemple je vous invite alors � remplacer les � latin9 � par des � latin1 �
Une table de clavier est un fichier permettant de faire correspondre l'empreinte physique des cabochons, � touches � du clavier, au r�sultat obtenu sur l'�cran de l'ordinateur.
Pour linux, ces fichiers sont dans /usr/lib/kbd/keytables/ ou /usr/share/kbd/keytables/
Par exemple, les claviers fran�ais AZERTY ont une table de clavier diff�rente des claviers suisse romands QWERTZ, ou des claviers du reste du monde, QWERTY.
Cela ne concerne que l'apparence du clavier, l'empreinte des cabochons, donc disposition relative des caract�res sur le clavier, et non son �lectronique interne ; si votre clavier ne vous convient pas, il vous suffit donc d'utiliser des autocollants pour le transformer en un autre clavier francophone.
Les touches � Home �, � End �, � Page_Up � et � Page_Down � dont les noms varient selon les claviers sont les touches permettant respectivement d'aller en d�but/fin de ligne et de monter/descendre d'une page.
Les codes affectes � ces touches sont respectivement 102 et 107 pour � Home � et � End � en mode terminal.
Dans les pictogrammes des claviers ISO 9995-7, ces touches sont repr�sent�s par des fl�ches aux traits appuy�s.
Lorsqu'on presse une touche, le clavier �met un code, qui est intercept� par la table de clavier.
La table de clavier, si elle reconnait le code, renvoie la chaine associ�e � la touche, en l'occurence� "\e[4� � pour � End �.
Lorsque bash ou un autre programme re�oit cette chaine, il ne la connait pas !
Donc il faut lui dire, dans le .inputrc que "\e[4�" signifie "aller � la fin de la ligne"
Donc pour que ces touches fonctionnent dans le shell bash, on ajoutera donc dans le fichier .inputrc (dans votre �/ ou dans /etc/inputrc) les lignes:
set meta-flag on set convert-meta off set input-meta on set output-meta on set bell-style visible "\e[1~":beginning-of-line "\e[3~":delete-char "\e[4~":end-of-line "\e\C-h": backward-kill-word "\e\e[3~": kill-word |
Les premi�res lignes permettent d'afficher les caract�res 8 bits, et de remplacer le � bip � en cas d'erreur par un �clair blanc � l'�cran.
Les touches mortes sont des touches qui ne produisent pas de caract�res en elles-m�mes, mais qui modifient la fa�on dont la frappe suivante va �tre interpr�t�e, par exemple, le tr�ma ou l'accent circonflexe sont en g�n�ral des touches mortes.
Une touche morte est une touche qui doit donc �tre suivie d'un espace pour obtenir l'accent seul, ou dans le cas o� elle est suivie d'une voyelle y positionne un accent, par exemple :
� ^ � puis � e � donne � � � � ^ � puis � espace � donne � ^ � |
Les touches mortes sont :
be et fr: l'accent aigu en AltGr de 1 pour les Fran�ais et en AltGr de � pour les Belges, l'accent grave en AltGr de 7 pour les fran�ais & en AltGr de carr�/cube pour les Belges, le tr�ma et l'accent circonflexe tous deux � c�t� du P
sf et usx: les accent aigus, graves, circonflexes, les tr�mas et la tilde
qc: les accent graves, circonflexes, les tr�mas et la c�dille
En raison d'une erreur volontaire et historique sous Linux, pour � �muler � le fonctionnement d'un clavier de console VT, ces 2 touches sont fr�quemments m�lang�es, au mieux fonctionnant � l'identique, au pire ne fonctionnant pas du tout.
Commen�ons donc par bien les d�finir :
BackSpace : touche plac�e en haut � droite du pav� principal, au dessus d' � Entr�e �, au cabochon marqu� d'une fl�che vers la gauche.
Delete : touche du pav� curseur au cabochon marqu� � Suppr � ou � Del �, � gauche de � Fin � ; en ISO 9995-7 elle correspond � trois barres obliques fines orient�es sud-ouest/nord-est.
Le pav� num�rique offre une touche au marquage identique et � effet identique lorsque � Verr Num � ou � Num Lock � est d�sactiv�.
Ces deux touches correspondent chacune � un de ces codes :
BS : caract�re ASCII 0x08, ou control-h.
DEL : caract�re ASCII 0x7F, ou control-?
^D : caract�re ASCII 0x04, ou control-d.
Ceci dans le but d'effacer � gauche du curseur avec BackSpace, � droite du curseur avec Delete.
Chaque partie du monde a sa propre norme horaire, bas�e sur des fuseaux.
La France se trouve en zone MET, � heure moyenne europ�enne � soit GMT+1 ; la zone � MET DST � correspond � l'heure d'�t� activ�e soit GMT+2.
GMT est l'heure solaire moyenne de Greenwich. L'heure est compt�e � partir de midi et est donc d�cal�e de 12 h par rapport au temps universel. GMT est bas�e sur la rotation de la terre, ce n'est donc pas un temps r�gulier. En effet, la vitesse de rotation de la Terre subit des variations faibles mais assez chaotiques, en plus elle diminue sur le long terme.
UTC, � temps universel coordonn� �, est compt� � partir de minuit toujours par rapport au m�ridien z�ro. Il est bas� sur des �talons atomiques, mais des secondes intercalaires sont ajout�es occasionnellement pour faire en sorte qu'il ne s'�carte jamais de plus de une seconde de l'heure solaire moyenne. Le site de l'opdaf et le lexique donnent plus de renseignements.
C'est le temps UTC, d�fini � Paris, qui sert de r�f�rence aux diff�rentes heures l�gales.
L'acronyme � GMT � est employ� 99% du temps pour d�signer UTC, mais c'est une erreur ou un abus de langage.
Enfin, � titre purement indicatif, il existe l'heure astronomique, aussi compt�e sur des �talons atomiques mais d�cal�e de 4 minutes par jour de l'heure terrestre car se basant sur la position de la terre dans l'espace par rapport aux �toiles.
Hosting by: Hurra Communications GmbH
Generated: 2007-01-26 18:01:25