Page suivantePage pr�c�denteTable des mati�res

3. Assembleurs

3.1 Assembleur en-ligne de GCC

Le c�l�bre GNU C/C++ Compiler (GCC), est un compilateur 32 bits optimisant situ� au coeur du projet GNU. Il g�re assez bien les architectures x86 et permet d'ins�rer du code assembleur � l'int�rieur de programmes C de telle mani�re que les registres puissent �tre soit sp�cifi�s soit laiss� aux bons soins de GCC. GCC fonctionne sur la plupart des plates-formes dont Linux, *BSD, VSTa, OS/2, *DOS, Win*, etc.

O� trouver GCC

Le site principal de GCC est le site FTP du projet GNU: ftp://prep.ai.mit.edu/pub/gnu/ On y trouve �galement toutes les applications provenant du projet GNU. Des versions configur�es ou pr�compil�es pour Linux sont disponibles sur ftp://sunsite.unc.edu/pub/Linux/GCC/. Il existe un grand nombre de miroirs FTP des deux sites partout de par le monde, aussi bien que des copies sur CD-ROM.

Le groupe de d�veloppement de GCC s'est r�cemment scind� en deux; pour plus d'informations sur la version exp�rimentale, egcs, voir http://www.cygnus.com/egcs/

Les sources adapt�s � votre syst�me d'exploitation pr�f�r� ainsi que les binaires pr�compil�s peuvent �tre trouv�s sur les sites FTP courants.

Le portage le plus c�l�bre de GCC pour DOS est DJGPP et il peut �tre trouv� dans le r�pertoire du m�me nom sur les sites ftp. Voir:

http://www.delorie.com/djgpp/

Il existe �galement un portage de GCC pour OS/2 appel� EMX qui fonctionne �galement sous DOS et inclut un grand nombre de routines d'�mulation Unix. Voir les sites

http://www.leo.org/pub/comp/os/os2/gnu/emx+gcc/

http://warp.eecs.berkeley.edu/os2/software/shareware/emx.html

ftp://ftp-os2.cdrom.com/pub/os2/emx09c/

O� trouver de la documentation sur l'assembleur en ligne avec GCC?

La document de GCC inclus les fichiers de documentation au format texinfo. Vous pouvez les compiler avec TeX et les imprimer, ou les convertir au format .info et les parcourir interactivement avec emacs, ou encore les convertir au format HTML, ou en � peu pr�s n'importe quel format (avec les outils ad�quats). Les fichiers .info sont g�n�ralement install�s en m�me temps que GCC.

La section � consulter est C Extensions::Extended Asm::

La section Invoking GCC::Submodel Options::i386 Options:: peut �galement vous aider. En particulier, elle donne les noms de contraintes pour les registres du i386: abcdSDB correspondent respectivement � %eax, %ebx, %ecx, %edx, %esi, %edi, %ebp (aucune lettre pour %esp).

Le site "DJGPP Games resource" (qui n'est pas r�serv� aux seuls d�veloppeurs de jeux) poss�de une page particuli�re sur l'assembleur:

http://www.rt66.com/~brennan/djgpp/djgpp_asm.html

Enfin, il existe une page de la Toile appel�e "DJGPP Quick ASM Programming Guide", contenant des URL sur des FAQ, la syntaxe assembleur AT&T x86, des informations sur l'assembleur en ligne, et la conversion des fichiers .obj/.lib:

http://remus.rutgers.edu/~avly/djasm.html

GCC soutraite l'assemblage proprement dit � GAS et suit donc sa syntaxe (voir plus bas), cela implique que l'assembleur en ligne doit utiliser des caract�res pourcents entre apostrophes pour qu'ils soient pass�s � GAS. Voir la section d�di�e � GAS.

Vous trouverez un grand nombre d'exemples instructifs dans le r�pertoire linux/include/asm-i386/ des sources de Linux.

Appeller GCC pour obtenir du code assembleur en ligne correcte?

Assurez-vous d'appeller gcc avec l'option -O (ou -O2, -O3, etc) pour activer les optimisations et l'assembleur en ligne. Si vous ne le fa�tes pas, votre code pourra compiler mais ne pas s'ex�cuter correctement!! En fait (merci � Tim Potter, timbo@moshpit.air.net.au), il suffit d'utiliser l'option -fasm, faisant partie de toutes les fonctionnalit�s activ�es par l'option -O. Donc si vous avez des probl�mes en raison d'optimisations bogu�es dans votre impl�mentation de gcc, vous pouvez toujours utiliser l'assembleur en ligne. De m�me, utilisez l'option -fno-asm pour d�sactiver l'assembleur en ligne (on peut se demander pourquoi?).

Plus g�n�ralement, les bonnes options de compilation � utiliser avec gcc sur les plates-formes x86 sont


 gcc -O2 -fomit-frame-pointer -m386 -Wall

-O2 est le bon niveau d'optimisation. Les optimisations sup�rieures g�n�rent un code un peu plus important, mais tr�s l�g�rement plus rapide. De telles sur-optimisations peuvent �tre utiles que dans le cas d'optimisations de boucles que vous pouvez toujours r�aliser en assembleur. Si vous avez besoin de faire ce genre de choses, ne le fa�tes que pour les routines qui en ont besoin.

-fomit-frame-pointer permet au code g�n�r� de se passer de la gestion inutile des pointeurs de fen�tre, ce qui rend le code plus petit plus rapide et lib�re un registre pour de plus amples optimisations. Cette option exclue l'utilisation des outils de d�boggage (gdb), mais lorsque vous les utilisez, la taille et la vitesse importent peu.

-m386 g�n�re un code plus compacte sans ralentissement notable, (moins de code signifie �galement mois d'entr�es/sorties sur disque et donc une ex�cution plus rapide). Vous pouvez �galement utiliser l'option -mpentium sur la version GCC g�rant l'optimisation pour ce processeur.

-Wall active toutes les mises-en-garde (warning) et vous �vite de nombreuses erreurs stupides et �videntes.

Pour optimiser encore plus, vous pouvez utiliser l'option -mregparm=2 et/ou les attributs de fonctions qui peuvent �tre utilis�s mais ils peuvent dans certains cas poser de nombreux probl�mes lors de l'�dition de liens avec du code externe (notamment les biblioth�ques partag�es)...

Notez que vous pouvez ajoutez ces options aux options utilis�es par d�faut sur votre syst�me en �ditant le fichier /usr/lib/gcc-lib/i486-linux/2.7.2.3/specs (cependant, ne rajoutez pas -Wall � ces options).

3.2 GAS

GAS est l'assembleur GNU, utilis� par gcc.

O� le trouver?

Au m�me endroit o� vous avez trouv� gcc, dans le paquetage binutils.

Qu'est-ce que la syntaxe AT&T

Comme GAS a �t� invent� pour supporter un compilateur 32 bits sous unix, il utilise la syntaxe standard "AT&T", qui ressemblent assez � l'assembleur m68k. La syntaxe n'est ni pire, ni meilleur que la syntaxe "Intel". Elle est juste diff�rente. Lorsque vous aurez l'habitude de vous en servir, vous la trouverez plus r�guli�re que la syntaxe Intel, quoique que l�g�rement plus ennuyeuse aussi.

Voici les points les plus importants � propos de la syntaxe de GAS:

Un programme existe pour vous aider � convertir des programmes �crits avec la syntaxe TASM en syntaxe AT&T. Voir

ftp://x2ftp.oulu.fi/pub/msdos/programming/convert/ta2asv08.zip

GAS poss�de une documentation compl�te au format TeXinfo, qui est distribu�e entre autre avec les sources. Vous pouvez parcourir les pages .info qui en sont extraites avec Emacs. Il y avait aussi un fichier nomm� gas.doc ou as.doc disponible autour des sources de GAS, mais il a �t� fusionn� avec la documentation TeXinfo. Bien s�r, en cas de doute, l'ultime documentation est constitu�e par les sources eux-m�mes! Une section qui vous int�ressera particuli�rement est Machine Dependencies::i386-Dependent::

Les sources de Linux dont un bon exemple: regardez dans le r�pertoire linux/arch/i386 les fichiers suivants: kernel/*.S, boot/compressed/*.S, mathemu/*.S

Si vous codez ce genre de chose, un paquetage de thread, etc vous devriez regarder d'autres langages (OCaml, gforth, etc), ou des paquetages sur les thread (QuickThreads, pthreads MIT, LinuxThreads, etc).

Enfin g�n�rer � partir d'un programme C du code assembleur peut vous montrer le genre d'instructions que vous voulez. Consultez la section Avez-vous besoin de l'assembleur? au d�but de ce document.

mode 16 bits limit�

GAS est un assembleur 32 bits, con�u pour assembler le code produit par un compilateur 32 bits. Il ne reconna�t que d'une mani�re limit� le mode 16 bits du i386, en ajoutant des pr�fixes 32 bits aux instructions; vous �crivez donc en r�alit� du code 32 bits, qui s'ex�cute en mode 16 bits sur un processeur 32 bits. Dans les deux modes, il g�re les registres 16 bits, mais pas l'adressage 16 bits. Utilisez les instructions .code16 et .code32 pour basculer d'un mode � l'autre. Notez que l'instruction assembleur en ligne asm(".code16\n") autorisera gcc � g�n�rer du code 32 bits qui fonctionnera en mode r��l!

Le code n�cessaire pour que GAS g�re le mode 16 bits aurait �t� ajout� par Bryan Ford (� confirmer?). Toutefois, ce code n'est pr�sent dans aucune distribution de GAS que j'ai essay�e (jusqu'� binutils-2.8.1.x) ... plus d'informations � ce sujet seraient les bienvenues dans ce HowTo.

Une solution bon march� pour ins�rer quelques instructions 16-bit non reconnues pas GAS consiste � d�finir des macros (voir plus bas) qui produisent directement du code binaire (avec .byte), et ce uniquement pour les rares instructions 16 bits dont vous avez besoin (quasiment aucunes, si vous utilisez le .code16 pr�c�dement d�crit, et pouvez vous permettre de supposer que le code fonctionnera sur un processeur 32 bits). Pour obtenir le syst�me de codage correct, vous pouvez vous inspirer des assembleurs 16 bits.

3.3 GASP

GASP est un pr�processeur pour GAS. Il ajoute des macros et une syntaxe plus souple � GAS.

O� trouver gasp?

gasp est livr� avec gas dans le paquetage binutils GNU.

Comment il fonctionne?

Cela fonctionne comme un filtre, tout comme cpp et ses variantes. Je ne connais pas les d�tails, mais il est livr� avec sa propre documentation texinfo, donc consultez-la, imprimez-la, assimilez-la. La combinaison GAS/GASP me semble �tre un macro-assembleur standard.

3.4 NASM

Du projet Netwide Assembler est issu encore un autre assembleur, �crit en C, qui devrait �tre assez modulaire pour supporter toutes les syntaxes connues et tous les formats objets existants.

O� trouver NASM?

http://www.cryogen.com/Nasm

Les versions binaires se trouvent sur votre miroir sunsite habituel dans le r�pertoire devel/lang/asm/. Il devrait �galement �tre disponible sous forme d'archive .rpm ou .deb parmi les contributions � votre distribution pr�f�r�e RedHat ou Debian.

Son r�le

Au moment de l'�criture de ce HOWTO, NASM en est � la version 0.96.

La syntaxe est � la Intel. Une gestion de macros est int�gr�e.

Les formats objets reconnus sont bin, aout, coff, elf, as86, (DOS) obj, win32, et rdf (leur propre format).

NASM peut �tre utilis�e comme assembleur pour le compilateur libre LCC.

Comme NASM �volue rapidement, ce HowTo peut ne pas �tre � jour � son sujet. A moins que vous n'utilisiez BCC comme compilateur 16 bit (ce qui d�passe le cadre de ce document), vous devriez utiliser NASM plut�t que AS86 ou MASM, car c'est un logiciel libre avec un excellent service apr�s-don, qui tourne sur toutes plateformes logicielles et mat�rielles.

Note: NASM est �galement livr� avec un d�sassembleur, NDISASM.

Son analyseur "grammatical", �crit � la main, le rend beaucoup plus rapide que GAS; en contrepartie, il ne reconna�t qu'une architecture, en comparaison de la pl�thore d'architectures reconnues par GAS. Pour les plates-formes x86, NASM semble �tre un choix judicieux.

3.5 AS86

AS86 est un assembleur 80x86, � la fois 16 et 32 bits, faisant partie du compilateur C de Bruce Evans (BCC). Il poss�de une syntaxe � la Intel.

Where to get AS86

Une version compl�tement d�pass�e de AS86 est diffus�e par HJLu juste pour compiler le noyau Linux, dans un paquetage du nom de bin86 (actuellement version 0.4) disponible dans le r�pertoire GCC des sites FTP Linux. Je d�conseille son utilisation pour toute autre chose que compiler Linux. Cette version ne reconna�t qu'un format de fichiers minix modifi�, que ne reconnaissent ni les binutils GNU ni aucun autre produit. Il poss�de de plus certains bogues en mode 32 bits. Ne vous en servez donc vraiment que pour compiler Linux.

Les versions les plus r�centes de Bruce Evans (bde@zeta.org.au) est diffus�e avec la distribution FreeBSD. Enfin, elles l'�taient! Je n'ai pas pu trouver les sources dans la distribution 2.1. Toutefois, vous pouvez trouver les sources dans

http:///www.eleves.ens.fr:8080/home/rideau/files/bcc-95.3.12.src.tgz

Le projet Linux/8086 (�galement appel� ELKS) s'est d'une certaine mani�re charg�e de maintenir bcc (mais je ne crois pas qu'ils aient inclus les patches 32 bits). Voir les sites http://www.linux.org.uk/Linux8086.html et ftp://linux.mit.edu/.

Entre autres choses, ces versions plus r�centes, � la diff�rence de celle de HJLu, g�rent le format a.out de Linux; vous pouvez donc effectuer des �ditions de liens avec des programmes Linux, et/ou utiliser les outils habituels provenant du paquetage binutils pour manipuler vos donn�es. Cette version peut co-exister sans probl�me avec les versions pr�c�dentes (voir la question � ce sujet un peu plus loin).

La version du 12 mars 1995 de BCC ainsi que les pr�c�dentes a un probl�me qui provoque la g�n�ration de toutes les op�rations d'empilement/d�pilement de segments en 16 bits, ce qui est particuli�rement ennuyant lorsque vous d�veloppez en mode 32 bits. Un patch est diffus� par le projet Tunes

http://www.eleves.ens.fr:8080/home/rideau/Tunes/

� partir du lien suivant: files/tgz/tunes.0.0.0.25.src.tgz ou dans le r�pertoire LLL/i386/.

Le patch peut �galement �tre directement r�cup�r� sur

http://www.eleves.ens.fr:8080/home/rideau/files/as86.bcc.patch.gz

Bruce Evans a accept� ce patch, donc si une version plus r�cente de BCC existe, le patch devrait avoir �t� int�gr�...

Comme appeller l'assembleur?

Voici l'entr�e d'un Makefile GNU pour utiliser bcc pour transformer un fichier assembleur .s � la fois en un objet a.out GNU .o et un listing .l:


%.o %.l:        %.s
 bcc -3 -G -c -A-d -A-l -A$*.l -o $*.o $<

Supprimez %.l, -A-l, et -A$*.l, si vous ne voulez pas avoir de listing. Si vous souhaitez obtenir autre chose que du a.out GNU, consultez la documentation de bcc concernant les autres formats reconnus et/ou utilisez le programme objcopy du paquetage binutils.

O� trouver de la documentation

Les documentations se trouvent dans le paquetage bcc. Des pages de manuel sont �galement disponibles quelque part sur le site de FreeBSD. Dans le doute, les sources sont assez souvent une bonne documentation: ce n'est pas tr�s comment� mais le style de programmation est tr�s simple. Vous pouvez essayer de voir comment as86 est utilis� dans Tunes 0.0.0.25...

Que faire si je ne peux plus compiler Linux avec cette nouvelleversion

Linus est submerg� par le courrier �lectronique et mon patch pour compiler Linux avec un as86 a.out n'a pas d� lui parvenir (!). Peu importe: conservez le as86 provenant du paquetage bin86 dans le r�pertoire /usr/bin, et laissez bcc installer le bon as86 en tant que /usr/local/libexec/i386/bcc/as comme que de droit. Vous n'aurez jamais besoin d'appeler explicitement ce dernier, car bcc se charge tr�s bien de tout, y compris la conversion en a.out Linux, lorsqu'il est appel� avec les bonnes options. Assemblez les fichiers uniquement en passant par bcc, et non pas en appelant as86 directement.

3.6 Autres assembleurs

Il s'agit d'autres possibilit�s, qui sortent de la voie ordinaire, pour le cas o� les solutions pr�c�dentes ne vous conviennent pas (mais je voudrais bien savoir pourquoi?), que je ne recommande pas dans les cas habituels, mais qui peuvent se montrer fort utiles si l'assembleur doit faire partie int�grante du logiciel que vous concevez (par exemple un syst�me d'exploitation ou un environnement de d�veloppement).

L'assembleur de Win32Forth

Win32Forth est un syst�me ANS FORTH 32 bit libre qui fonctionne sous Win32s, Win95, Win/NT. Il comprend un assembleur 32 bit libre (sous forme pr�fixe ou postfixe) int�gr�e au langage FORTH. Le traitement des macro est effectu� en utilisant toute la puissance du langage r�flexif FORTH. Toutefois, le seul contexte d'entr�e et sortie reconnu actuellement est Win32For lui-m�me (aucune possibilit� d'obtenir un fichier objet, mais vous pouvez toujours l'ajouter par vous-m�me, bien s�r). Vous pouvez trouver Win32For � l'adresse suivante: ftp://ftp.forth.org/pub/Forth/win32for/

Terse

Terse est un outil de programmation qui fournit LA syntaxe assembleur la plus compacte pour la famille des processeur x86! Voir le site http://www.terse.com. Ce n'est cependant pas un logiciel libre. Il y aurait eu un clone libre quelque part, abandonn� � la suite de mensong�res all�gations de droits sur la syntaxe, que je vous invite � ressusciter si la syntaxe vous int�resse.

Assembleurs non libres et/ou non 32 bits

Vous trouverez un peu plus d'informations sur eux, ainsi que sur les bases de la programmation assembleur sur x86, dans la FAQ de Raymond Moon pour le forum comp.lang.asm.x86. Voir http://www2.dgsys.com/~raymoon/faq/asmfaq.zip

Remarquez que tous les assembleurs DOS devraient fonctionner avec l'�mulateur DOS de Linux ainsi qu'avec d'autres �mulateurs du m�me genre. Aussi, si vous en poss�dez un, vous pouvez toujours l'utiliser � l'int�rieur d'un vrai syst�me d'exploitation. Les assembleurs sous DOS assez r�cents g�rent �galement les formats de fichiers objets COFF et/ou des formats g�r�s par la biblioth�que GNU BFD de telle mani�re que vous pouvez les utiliser en conjonction avec les outils 32 bits libres, en utilisant le programme GNU objcopy (du paquetage binutils) comme un filtre de conversion.


Page suivantePage pr�c�denteTable des mati�res

Hosting by: Hurra Communications GmbH
Generated: 2007-01-26 18:01:15