Marche bien avec les patches mentionn�s pr�c�demment.
Telnet n'est pas ne traite pas les caract�res 8-bits (il n'est pas"8-bit-clean") par d�faut. Pour pouvoir envoyer des codes de touches Unicode � un h�te distant, vous devez mettre telnet en mode "outbinary". Il y a deux fa�ons de faire cela :
$ telnet -L <hote>
et
$telnet
telnet> set outbinary
telnet> open <hote>
en outre, utilisez les patches mentionn�s pr�c�demment.
Netscape 4.05 ou plus peut afficher des documents HTML en encodage UTF-8. Tout ce qu'un document n�cessite est la ligne suivante, situ�e entre les tags <head> et </head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
Netscape 4.05 ou plus peut aussi afficher du HTML et du texte en
encodage UCS-2 avec le [byte-order mark].
http://www.netscape.com/computing/download/Lynx 2.8 a un �cran d'options (touche 'O') qui permet de s�lectionner la table de caract�res utilis�e � l'affichage. Quand il, tourne dans un xterm ou depuis une "Linux console" en mode UTF-8, s�lectionnez "UNICODE UTF-8".
Maintenant, encore une fois, tout ce qu'un document n�cessite est la ligne suivante, entre les tags <head> et </head> :
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
Quand vous visualisez des fichiers texte encod�s en UTF-8, vous devez aussi passer � la ligne de commande l'option "-assume_local_charset=UTF-8" (affecte seulement les URLs de type file:/...) ou "-assume_charset=UTF-8" (affecte toute les URLs). Sinon, dans Lynx-2.2.8, vous pouvez, dans l'�cran d'options, changer le jeu de caract�res suppos� par d�faut ("assumed document character set") en "utf-8".
Il y a aussi, dans l'�cran d'options, une option permettant de choisir le jeu de caract�res par d�faut ("preferred document character set"), mais cela n'a pas d'effet, au moins avec les URLs file:/... et http://... servies par apache-1.3.0.
Cependant, il y a un probl�me concernant les espaces et les fins de lignes : regardez � la section russe de x-utf-8.html, ou utf-8-demo.txt.
Notez aussi que dans Lynx-2.8.2, configur� avec l'option -enable-prettysrc, les jolies combinaisons de couleurs ne marchent plus correctement quand le jeu de caract�res pour l'affichage � �t� positionn� � "UNICODE-UTF-8". Ce probl�me est r�solu par le patch lynx282.diff.
D'apr�s les d�veloppeurs de lynx : "Pour une utilisation s�rieuse de
l'affichage UTF-8 avec Lynx, il est toujours recommand� de compiler avec la
biblioth�que slang et -DSLANG_MBCS_HACK."
ftp://ftp.gnu.org/pub/gnu/lynx/lynx-2.8.2.tar.gz
http://lynx.browser.org/
http://www.slcc.edu/lynx/
ftp://lynx.isc.org/
Des pages de test pour les navigateurs peuvent �tre trouv�es sur les
pages d'Alan Wood et James Kass :
http://www.hclrss.demon.co.uk/unicode/#links,
http://home.att.net/~jameskass/
Le programme yudit
de G�sp�r Sinai
http://czyborra.com/yudit/
est un �diteur de texte unicode de premier ordre pour le syst�me X
Window.
Il supporte le traitement simultan� de beaucoup de langages, m�thodes
d'entr�e, conversions de caract�res locaux standards.
Il est �quip� pour supporter l'entr�e de texte dans tous les langages
avec seulement un clavier anglais, en utilisant des tables de
configuration du clavier.
Il peut �tre compil� en 3 versions : interface graphique Xlib , KDE, ou Motif.
Il peut �tre personnalis� tr�s facilement. Typiquement, vous voudrez modifier votre fonte. Depuis le menu font je choisis "Unicode". Puis, puisque la commande "xlsfonts '*_*-iso10646-1" donnait toujours un affichage ambigu, je choisis un taille de fonte de 13 (pour correspondre � la fonte fixe de 13 pixels de Markhus Kuhn).
Ensuite, vous personnaliserez votre m�thode d'entr�e. Les m�thodes "Straight", "Unicode" et "SGML" sont les plus int�ressantes. Pour avoir des d�tails sur les autres m�thodes d'entr�es incorpor�es, regardez dans "/usr/local/share/yudit/data/".
Pour qu'un changement devienne un r�glage par d�faut pour les prochaines sessions, �ditez votre fichier $HOME/.yuditrc.
Les fonctionnalit�s g�n�rales de l'�diteur sont limit�es � l'�dition, le copier-coller, et le "chercher-remplacer" (search&replace). Pas de fonction d'annulation (undo).
mined98
est un petit �diteur de texte de Michiel Huisjes, Achim M�ller
et Thomas Wolff :
http://www.inf.fu-berlin.de/~wolff/mined.html.
Il vous permet d'�diter des fichier encod�s en UTF-8 ou 8 bits, dans un
xterm UTF-8 ou 8-bits.
Il dispose aussi de puissantes fonctionnalit�s pour entrer les
caract�res Unicode.
Quand mined est lanc� dans un xterm ou une console Linux en mode
UTF-8, vous devriez positionner la variable d'environnement
utf8_term
, ou appeler mined avec l'option -U
.
mined vous permet d'�diter des fichiers encod�s aussi bien en UTF-8
qu'en 8-bits. Par d�faut il utilise un heuristique d'auto-d�tection.
Si vous ne voulez pas vous reposer sur des heuristiques, passez
l'option -u
� la ligne de commande lorsque vous �ditez un fichier
UTF-8, ou +u
lorsque vous �ditez un fichier encod� en 8 bits.
Vous pouvez changer l'interpr�tation � n'importe quel moment depuis
l'�diteur : il affiche l'encodage ("L:h" pour du 8-bits, "U:h" pour de
l'UTF-8) dans la ligne de menu. Vous pouvez cliquer sur le premier de
ces caract�res pour le changer.
Quelques b�mols :
ESC h
le trouve.
-B
de fa�on � ce que la touche
backspace efface le caract�re � gauche du curseur.
vim
(depuis la version 5.4m) supporte les locales multi-octets, mais
seulement si la biblioth�que X a le m�me support, et seulement pour
les encodages avec au moins deux octets par caract�res, i.e les encodages
ISO-2022. Il ne supporte pas l'UTF-8.
Avant tout, vous devriez lire la section "International Character Set Support" (noeud "International") dans le manuel d'Emacs. En particulier, notez que vous devez d�marrer Emacs avec la commande
$ emacs -fn fontset-standard
pour qu'il utilise un jeu de fontes comprenant beaucoup de caract�res
internationaux.� court terme, le package emacs-utf http://www.cs.ust.hk/faculty/otfried/Mule/ d'Otfried Cheong procure un "unicode-utf-8" pour Emacs. Apr�s avoir compil� le programme "utf2mule" et l'avoir install� quelque part dans votre $PATH, installez aussi unicode.el, muleuni-1.el, unicode_char.el quelque part, et ajoutez les lignes
(setq load-path (cons "/home/user/somewhere/emacs" load-path))
(if (not (string-match "XEmacs" emacs-version))
(progn
(require 'unicode)
(if (eq window-system 'x)
(progn
(create-fontset-from-fontset-spec
"-misc-fixed-medium-r-normal-*-12-*-*-*-*-*-fontset-standard")
(create-fontset-from-fontset-spec
"-misc-fixed-medium-r-normal-*-13-*-*-*-*-*-fontset-standard")
(create-fontset-from-fontset-spec
"-misc-fixed-medium-r-normal-*-14-*-*-*-*-*-fontset-standard")
(create-fontset-from-fontset-spec
"-misc-fixed-medium-r-normal-*-15-*-*-*-*-*-fontset-standard")
(create-fontset-from-fontset-spec
"-misc-fixed-medium-r-normal-*-16-*-*-*-*-*-fontset-standard")
(create-fontset-from-fontset-spec
"-misc-fixed-medium-r-normal-*-18-*-*-*-*-*-fontset-standard")))))
� votre $HOME/.emacs. Pour activer un des jeux de fontes, utilisez l'item "Set Font/FonSet" du menu mule, ou Shift-down-mouse-1. Pour l'instant les jeux de fontes avec des hauteurs de 15 et 13 ont le meilleur support Unicode, gr�ce aux fontes 9x15 et 6x13 de Markus Kuhn. Pour ouvrir un fichier encod� en UTF-8, vous pouvez taper
M-x universal-coding-system-argument unicode-utf8 RET
M-x find-file filename RET
ou
C-x RET c unicode-utf8 RET
C-x C-f filename RET
Notez que cela marche avec Emacs seulement en mode fen�tre, pas en mode terminal.
Richard Stallman pr�voit � long terme d'ajouter un support d'UTF-8 int�gr� � Emacs.
(Cette section est �crite par Gilbert Baumann.)
Voici comment apprendre � XEmacs (20.4 configur� avec MULE) l'encodage UTF-8. Malheureusement vous aurez besoin des sources pour pouvoir le patcher.
D'abord vous aurez besoin de ces fichiers fournis par Tomohiko Morioka :
http://turnbull.sk.tsukuba.ac.jp/Tools/XEmacs/xemacs-21.0-b55-emc-b55-ucs.diff
http://turnbull.sk.tsukuba.ac.jp/Tools/XEmacs/xemacs-ucs-conv-0.1.tar.gz
Le .diff est un diff pour les sources C. Le tarball contient du code elisp, qui fournit beaucoup de tables de code qui permettent la conversion depuis et vers Unicode. Comme le nom du diff le sugg�re, il est pr�vu pour XEmacs-21. J'ai eu besoin d'aider un peu 'patch'. La diff�rence la plus notable avec mes sources XEmacs-20.4 est que file-coding.[ch] �tait appel� mule-coding.[ch]
Pour ceux qui connaissent peu XEmacs-MULE (comme moi) voici un guide rapide :
Ce que nous appelons un encodage est appel� par MULE "coding system". Les commandes les plus importantes sont :
M-x set-file-coding-system
M-x set-buffer-process-coding-system [comint buffer]
et la variable 'file-coding-system-alist', qui guide 'find-file' pour qu'il trouve l'encodage utilis�. Une fois que tout marchait, la premi�re chose que j'ai faite fut ceci.
Ce code cherche une ligne de mode sp�ciale commen�ant par _*_ quelque part dans les 600 premiers octets du fichier qui va �tre ouvert. Si cette ligne contient un champ "Encoding: xyz;" et que l'encodage xyz ("coding system" dans le langage d'Emacs) existe, il le s�lectionne. Donc maintenant vous pouvez utiliser :
;;; _*_ Mode: Lisp; Syntax: Common-Lisp; Package: CLEX; Encoding:
utf-8; _*_
et Emacs entrera en mode utf-8 � partir de l�.
Une fois que tout marchait, j'ai d�fini une macro pour \u03BB (lambda grec) comme ceci :
(defmacro \u03BB (x) '(lambda .,x))
En th�orie, xedit
devrait �tre capable d'�diter des fichiers UTF-8 si
vos locales sont configur�es en cons�quence (voir au dessus), et que
vous ajoutez la ligne "Xedit*international: true" � votre fichier
$HOME/.Xdefaults.
En pratique, il reconna�tra les encodages UTF-8 des caract�res non
ASCII, mais il les affichera comme des s�quences de caract�res "@".
En th�orie, axe
devrait �tre capable d'�diter des fichiers UTF-8 si
vos locales sont configur�es en cons�quence (voir au dessus), et que
vous ajoutez la ligne "Axe*International: true" � votre fichier
$HOME/.Xdefaults.
En pratique, il vous laissera simplement un joli fichier core.
Les distributions de teTex 0.9 (et sup�rieures) contiennent une adaptation Unicode de TeX, appel�e Omega ( http://www.gutenberg.eu.org/omega/ftp://ftp.ens.fr/pub/tex/yannis/omega), mais est-ce que quelqu'un conna�trait un tutorial sur ce syst�me ?
Autres liens peut-�tre en rapport :
http://www.dante.de/projekte/nts/NTS-FAQ.html,
ftp://ftp.dante.de/pub/tex/language/chinese/CJK/
MIME : RFC 2279 d�finit les jeux de caract�res UTF-8 et MIME, qui peuvent �tre convertis en encodage 8-bits, quoted-printable ou base64. L'ancienne norme MIME UTF-7 (RFC 2152) est consid�r�e comme �tant obsol�te ("deprecated") et ne devrait plus �tre utilis�e.
Les clients mail sortis apr�s le 1er janvier 1999 devraient �tre capables d'envoyer et d'afficher des courriers encod�s en UTF-8, sous peine d'�tre consid�r�s comme incomplets. Mais ces courriers doivent contenir les �tiquettes (labels) MIME :
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8-bit
Envoyer simplement un fichier UTF-8 vers "mail" via un pipe sans faire attention aux labels MIME ne fonctionnera pas. Les gens qui impl�mentent des clients de courrier devraient jeter un oeil � http://www.imc.org/imc-intl/ et http://www.imc.org/mail-i18n.html
Parlons maintenant des clients mail individuels (ou "mail user agents") :
La situation pour une version non patch�e de pine 4.10 est la suivante.
Pine ne fait pas de conversion de jeu de caract�res. Mais il vous permet de voir des courriers UTF-8 dans une fen�tre texte UTF-8 (console Linux ou xterm).
Normalement, Pine se plaindra du fait qu'il y a diff�rents jeux de caract�res � chaque fois que vous visualiserez un courrier encod� en UTF-8. Pour vous d�barrasser de cet avertissement, choisissez S (setup), puis C (config), et changez la valeur de "character set" � UTF-8. Cette option ne fera rien � part r�duire le nombre d'avertissements, puisque Pine ne conna�t pas UTF-8 en interne.
Notez aussi que pour Pine la notion de caract�res Unicode est tr�s limit�e : il affichera les caract�res latins et grecs, mais ce sont les seuls types de caract�res Unicode qu'il conna�t.
Un patch de Robert Brady http://www.ents.susu.soton.ac.uk/~robert/pine-utf8-0.1.diff ajoute � Pine un support UTF-8. Avec ce patch, il peut d�coder et afficher les ent�tes et le corps des messages correctement. Ce patch n�cessite GNOME libunicode http://cvs.gnome.org/lxr/source/libunicode/.
Kmail (comme tout KDE 1.0) ne contient absolument aucun support pour les mails en UTF-8.
Le Messenger de Netscape Communicator peut envoyer et afficher des mails encod�s en UTF-8, mais cela n�cessite quelques interventions manuelles de l'utilisateur.
Pour envoyer un mail encod� en UTF-8 : apr�s avoir ouvert la fen�tre "Compose", mais avant de commencer � composer le message, s�lectionnez dans le menu "View -> Character Set ->Unicode (UTF-8)" puis composez votre message et envoyez le.
Quand vous recevez un courrier encod� en UTF-8, Netscape ne l'affiche malheureusement pas en UTF-8 directement, et ne donne m�me pas un indice visuel montrant que le courrier a �t� encod� en UTF-8. Vous devez s�lectionner manuellement l'option ad�quate dans "View -> Character Set -> Unicode (UTF-8)". Pour afficher les courriers UTF-8, Netscape utilise des fontes diff�renci�es. Vous pouvez ajuster la fonte utilis�e dans la bo�te de dialogue "Edit -> Preferences -> Fonts". Choisissez la cat�gorie de fontes "Unicode".
Tel�chargez ftp://ftp.gnu.org/pub/gnu/less/less-340.tar.gz et appliquez le patch less-340-utf-2.diff de Robert Brady <rwb197@ecs.soton.ac.uk>. Puis positionnez la variable d'environnement LESSCHARSET :
export LESSCHARSET=utf-8
Si vous avez positionn� une variable d'environnement LESSKEY, v�rifiez
aussi que le fichier vers lequel elle pointe ne d�finit pas
LESSCHARSET.
Si n�cessaire, r�g�n�rez ce fichier en utilisant la commande
'lesskeys', ou enlevez la variable d'environnement LESSKEYS.Procurez vous GNU textutils-2.0 et appliquez le patch
textutils-2.0.diff,
puis lancez configure.
Ajoutez "#define HAVE_MBRTOWC 1", "#define HAVE_FPUTWC 1" � config.h.
Dans src/Makefile, modifiez CFLAGS et LDFLAGS pour qu'ils incluent les
r�pertoires o� libutf8 est install�, puis recompilez.
Procurez vous le package util-linux-2.9y, configurez le, puis d�finissez ENABLE_WIDECHAR dans defines.h , changez le "# if 0" en "# if 1" dans lib/widechar.h. dans text-utils/Makefile, modifiez CFLAGS et LDFLAGS pour qu'ils incluent les r�pertoires o� libutf8 est install�. Puis recompilez.
Figlet 2.2 a une option pour g�rer l'entr�e en UTF-8 : "figlet -C utf-8".
Le programme de communication s�rie C-Kermit http://www.columbia.edu/kermit/, dans les versions 7.0beta10 et sup�rieures, comprend les encodages de fichier et de transfert UTF-8 et UCS-2, et l'encodage de terminal UTF-8. La documentation de ces caract�ristiques peut �tre trouv�e � ftp://kermit.columbia.edu/kermit/test/text/ckermit2.txt
La Xlib de X11 ne peut malheureusement pas encore localiser UTF-8, cela devrait �tre travaill� prochainement.
Hosting by: Hurra Communications GmbH
Generated: 2007-01-26 18:01:25