Site logo

Triceraprog
La programmation depuis le Crétacé

  • Forth sur 6502, épisode 8 ()

    Afficher des caractères

    Lors du précédent article, l'ajout de variables et de la pile des paramètres nous a approché de l'objectif actuel : afficher des caractères à l'écran. Ou plus exactement, remplacer l'affichage de la chaîne de caractères depuis l'assembleur au démarrage du programme vers la partie Forth.

    Pour commencer et s'assurer que j'ai du code qui peut transformer des coordonnées en adresse PPU et afficher un caractère, je crée un mot TEST_EMIT qui va prendre ces coordonnées et afficher un unique caractère comme curseur. Comme je n'ai que 26 lettres majuscules actuellement dans mes données graphiques, il est temps d'aller modifier les données. J'ajoute en caractères 255 un carré plein. Cela fera un bon curseur.

    Il me faut aussi deux variables pour stocker les coordonnées du curseur : CURSOR_X et CURSOR_Y que j'initialise à l'emplacement où je veux afficher le curseur au démarrage (en effet, je n'ai pas encore de moyen de modifier le contenu d'une variable facilement à partir d'un nombre).

        DEFINE_VARIABLE CURSOR_X, POST_LOGIC
        .word $0001
    
        DEFINE_VARIABLE CURSOR_Y, CURSOR_X
        .word $0002
    

    On peut noter que 16 bits pour des coordonnées d'écran en caractères, c'est beaucoup. On peut imaginer « compresser » les deux coordonnées dans une seule variable. Ça compliquera un peu l'écriture cependant. Je me laisse ça en note pour plus tard.

    Ah oui, autre chose. Peut-être que vous l'aviez remarqué avant moi, mais les variables que je définis sont actuellement dans le programme, et donc en ROM ! Pas terrible pour des variables. Je me note ça aussi pour plus tard (mais dans pas longtemps, car sinon, le curseur ne pourra pas bouger).

    Presque EMIT

    Quant à TEST_EMIT, il est en assembleur et il ressemble à ceci :

        ; Test word for hardcoded EMIT
        DEFINE_CODE_WORD TEST_EMIT, CURSOR_Y, 0
        jsr compute_screen_address  ; Now Addr has the screen address in PPU
    
        ; Warning, address endianness is swapped for vram_queue_set_ppu
        ; High byte first
        lda Addr
        sta VramQueuePtr+1
        lda Addr+1
        sta VramQueuePtr
        lda #$00        ; Horizontal increment
        jsr vram_queue_set_ppu
    
        ; Write character to buffer
        vram_t_set_buffer 1
        lda #'C'        ; Hardcoded character
        ldy #$00
        sta (VramQueuePtr), y
    
        END_TO_NEXT
    

    compute_screen_address est une sous-routine qui prend les coordonnées du curseur et calcule l'adresse PPU correspondante. C'est une partie dont je veux m'assurer avoir compris le fonctionnement (et l'écriture en 6502).

    J'utilise ensuite le système du template de projet pour communiquer avec le PPU.

    • VramQueuePtr sert dans un premier temps de variable paramètre pour vram_queue_set_ppu, qui positionne le registre d'adresse PPU. Plus exactement qui prépare la commande dans la liste d'affichage.
    • la macro vram_t_set_buffer réserve de l'espace (ici 1 octet) dans la liste d'affichage et fait pointer VramQueuePtr au début de cet espace. Le contenu de ce buffer sera transféré à l'adresse PPU spécifiée.

    À noter que l'allocation de l'espace retourne sans rien faire s'il n'y a plus de place. Comme je ne vérifie rien, cela peut être assez catastrophique. Pour le moment, j'affiche un seul caractère par rafraîchissement, ça va passer. Le système du template limite la taille d'un transfert à 64 octets et le buffer complet est de 256 octets. Je ne sais pas encore si je mettrai des protections en place ou bien si je laisse l'utilisateur gérer cela. Je n'aime pas trop l'idée de se retrouver avec un programme qui plante sans explication, mais d'un autre côté, c'est du Forth, pas du BASIC.

    Et ça marche, voici le résultat :

    Affichage du curseur sur Family Forth

    Des variables... pour de vrai ?

    Comme indiqué plus haut, le contenu de mes variables sont en ROM. Pas terrible. Comment faire pour avoir des variables définies par la ROM, mais dont le contenu est en RAM ? Une méthode classique est de transformer les variables en constantes. Je sais, dit comme ça, ça semble bizarre. Mais ça se comprend : on transforme une variable, qui contient donc sa propre valeur, en une constante qui contient l'adresse mémoire où la valeur sera stockée. Cet espace sera réservé en RAM.

    Après tout, le fonctionnement d'une variable en Forth n'est rien d'autre qu'un mot qui place une adresse mémoire sur la pile des paramètres. La variable place son propre PFA. Une constante place une valeur spécifiée.

    EMIT... pour de vrai aussi

    Pour le moment TEST_EMIT code en dur le caractère. EMIT, lui, doit envoyer à l'affichage le caractère dont le code est présent sur la pile. Pour avoir un vrai EMIT, il faut donc modifier TEST_EMIT pour qu'il récupère le code caractère depuis la pile des paramètres. Et cette valeur devra y être placée auparavant. Cela tombe bien, je viens d'implémenter le concept de constantes.

    Voici donc mon curseur :

        DEFINE_CONSTANT CURSOR_CODE, TEST_ADDR
        .word $FF
    

    Et la boucle principale Forth devient :

        DEFINE_FORTH_WORD MAIN_LOOP, MEMORY_TEST, 0
        .word READ_JOY_SAFE_word_cfa
        .word MEMORY_TEST_word_cfa
        .word CURSOR_CODE_word_cfa      ; On place le code caractère sur la pile
        .word EMIT_word_cfa             ; On appelle EMIT pour afficher ce caractère
        .word POST_LOGIC_word_cfa
        .word DO_SEMI_word_cfa
    

    Ça fonctionne. Pour un même résultat.

    Cependant, EMIT est censé aussi avancer la position du curseur. Ce que je peux brancher, mais qui va poser problème. Car la position avançant à chaque affichage, le curseur se retrouve affiché à chaque position de l'écran, et l'écran devient rapidement entièrement rempli d'une couleur unie.

    En attendant une vraie gestion de curseur, je replace le curseur à la position initiale à chaque itération de la boucle principale.

        ; MAIN LOOP word
        DEFINE_FORTH_WORD MAIN_LOOP, MEMORY_TEST, 0
        .word READ_JOY_SAFE_word_cfa
        .word MEMORY_TEST_word_cfa
    
        .word CURSOR_INIT_X_word_cfa
        .word CURSOR_X_word_cfa
        .word STORE_word_cfa
        .word CURSOR_INIT_Y_word_cfa
        .word CURSOR_Y_word_cfa
        .word STORE_word_cfa
    
        .word CURSOR_CODE_word_cfa
        .word EMIT_word_cfa
        .word POST_LOGIC_word_cfa
        .word DO_SEMI_word_cfa
    

    Ce qui équivaut en Forth à :

        : MAIN_LOOP
            READ_JOY_SAFE
            MEMORY_TEST
    
            CURSOR_INIT_X CURSOR_X !
            CURSOR_INIT_Y CURSOR_Y !
    
            CURSOR_CODE EMIT
            POST_LOGIC
        ;
    

    Moving Forth, épisode 6

    Revenons un peu à la lecture de la série d'articles Moving Forth avec la sixième partie. Après avoir présenté les primitives du langage, ce qui forme le « kernel », l'auteur aborde la notion de « high-level kernel ». Il s'agit du reste du système, celui qui permet l'interactivité et donc la compilation de nouveaux mots et leur exécution. Ce « high-level kernel » est écrit en Forth et se veut portable, contrairement au « kernel » contenant les primitives, écrit en assembleur.

    On y apprend que le démarrage de Forth est effectué par

    • un mot appelé COLD, qui s'occupe de l'initialisation des variables internes (de l'environnement je dirais),
    • qui lui-même appelle ABORT, qui réinitialise la pile de paramètres,
    • qui lui-même appelle QUIT, qui réinitialise la pile de retour, l'état de l'interpréteur, et lance la boucle principale de l'interpréteur.

    QUIT est une boucle infinie qui lit l'entrée utilisateur et appelle le mot INTERPRET, qui s'occupe de l'analyse de l'entrée.

    J'ai déjà le contenu de COLD et ABORT dans mon bootstrap de Forth. Il me faudra les implémenter en tant que mots Forth.

    Pour implémenter QUIT, il me faudra implémenter la réception de l'entrée utilisateur, et donc du clavier de la Famicom. Puis pas mal d'autres mots qui seront nécessaires pour INTERPRET.

    De là, l'article mentionne sans entrer dans le détail le concept de « vocabulaire », qui permet d'avoir plusieurs dictionnaires de mots, regroupés par fonctionnalités. Comme le Forth de l'article n'en a pas, il n'y a pas plus d'explications. J'ai prévu de mon côté d'implémenter cette notion.

    Puis l'auteur revient sur l'entête d'un mot et du drapeau « IMMEDIATE » que j'avais évoqué lors de la sixième partie et la création des mots complets. Lors de la compilation d'un mot (on verra ça plus tard), les mots trouvés sont normalement « compilés » dans le mot en train d'être définis. Sauf si le mot est marqué comme « IMMEDIATE », auquel cas il est exécuté immédiatement. Cela permet de contrôler la compilation. On peut considérer que c'est de la « méta-compilation », comme des macros qui vont effectuer des opérations pendant la compilation.

    Par exemple, IF est un mot « IMMEDIATE » qui va insérer des instructions de branchement conditionnel dans le mot en cours de définition, conjointement avec ELSE et THEN, qui sont aussi des mots « IMMEDIATE ».

    L'article décrit d'ailleurs rapidement la manière dont la compilation fonctionne :

    • la compilation démarre avec le mot :,
    • le mot est créé avec CREATE,
    • le CFA est initialisé pour pointer sur le DOCOL,
    • on passe en mode « compilation »,
    • chaque mot trouvé voit son CFA ajouté à la fin du PFA du mot en cours de définition,
    • lorsque le mot ; est trouvé, on ajoute le CFA de ;S (EXIT) à la fin du PFA
    • on repasse en mode « interprétation ».

    Il y a des choses en plus qui sont faites, comme rendre le mot visible à la fin de la compilation, l'insérer dans le dictionnaire du vocabulaire courant, traiter les mots « IMMEDIATE », etc... Mais le principe est là.

    Après avoir indiqué les mots qui sont impactés par le modèle d'exécution choisi, la fin de l'article montre le layout mémoire sur CP/M pour le Forth implémenté, ce qui ne m'intéresse pas trop ici, ainsi que différent types de layout de mots Forth.

    Je ne les reproduis pas ici, vous pouvez aller les voir dans l'article original. On y voit quatre Forth différents qui font chacun des choix différents. Mes choix sont globalement ceux de FIG-Forth, ce qui n'est pas étonnant puisque c'est le type de Forth que j'ai pu aborder dans mes expériences précédentes

    La suite

    On s'approche d'un système interactif, mais il reste encore un gros morceau côté Famicom plus que côté Forth : la gestion du clavier. Détecter qu'il est là, scanner les touches, les interpréter, en particulier les touches spéciales (peut-être dans un second temps). Si l'appui sur une touche provoque l'affichage d'un caractère à l'écran, on aura presque la première partie de l'interpréteur.

    Côté Moving Forth, c'est terminé. Il reste en fait deux articles, mais qui traitent de spécificités sur des architectures particulières. Cela s'éloigne trop du projet que j'ai. Je parcourrai peut-être une autre référence comme le livre « Starting Forth », qui me servira probablement de guide pour l'implémentation de QUIT et INTERPRET.

    À bientôt pour la suite !


  • Forth sur 6502, épisode 7 ()

    En route pour l'affichage

    Afficher du texte à l'écran

    L'étape d'aujourd'hui va permettre de se diriger vers l'affichage d'un texte à l'écran depuis la boucle Forth. Pour cela, il faut revenir un peu sur le fonctionnement de la Famicom.

    Le processeur qui s'occupe de l'affichage est le PPU (Picture Processing Unit). Ce processeur a son espace d'adressage mémoire propre de 16 ko dont le routage est configuré par la cartouche insérée. Dans la console, 2 ko de RAM sont dédiés au PPU, assez pour stocker les informations de deux écrans (index de caractères et attributs). La cartouche doit apporter a minima les informations de caractères (en ROM généralement, mais peut aussi offrir un espace RAM pour les construire) ; elle peut aussi étendre le nombre d'écrans (jusqu'à 4) ou ajouter un système de banking de pages.

    De manière générale, tout le mapping de la mémoire du PPU est contrôlé par la cartouche, à part les palettes. La cartouche la plus simple possible n'offrira que les 8 ko de ROM nécessaires aux deux tables de définition de caractères, mais on peut faire beaucoup plus complexe.

    À cela s'ajoute 256 octets de mémoire pour la gestion des sprites.

    Le PPU utilise toutes ses informations pour composer l'image à l'écran. Cependant le processeur 6502 n'a pas accès à cette mémoire. Pour y accéder, il existe des registres mappés dans l'espace d'adressage du CPU. Mais... il y a un mais. Lorsque le PPU est en train de faire le rendu, il a un besoin exclusif d'accès à sa mémoire. Le CPU doit donc attendre que le PPU soit dans une période où il n'a pas besoin d'accéder à sa mémoire : la période de « VBlank » (Vertical Blank), qui correspond au moment où l'écran n'est pas en train d'être rafraîchi (le balayage vertical revient en haut de l'écran).

    Par sécurité, pendant cette période, il faut désactiver le PPU, puis faire les modifications nécessaires et enfin réactiver le PPU. Il y a donc un temps assez bref pendant lequel on peut faire des modifications à la mémoire du PPU.

    Le squelette de projet que j'ai choisi utilise une pratique assez courante : construire une liste de commandes à envoyer au PPU. Lorsque la synchronisation verticale se produit, la liste préparée est traitée. Cette liste est limitée en taille, puisque le temps d'accès est limité.

    Tout cela pour dire que pour afficher un caractère à l'écran, il va falloir envoyer plusieurs commandes au PPU.

    • Tout d'abord positionner le registre d'adresse de la prochaine écriture en mémoire PPU.
    • Puis envoyer le caractère à écrire.

    Le mot Forth EMIT, qui affiche un caractère, devra donc faire tout cela à chaque fois, ce qui n'est pas très efficace. Mais c'est le plus simple à implémenter. Il est possible d'utiliser une incrémentation automatique de l'adresse d'écriture par le PPU, et celle-ci pourra être utilisée pour optimiser TYPE ou ." plus tard. Mais cela ne sera pas si simple, car le buffer de commandes est limité en taille et il faudra traiter la césure de chaînes trop longues.

    À voir. Le principe du projet est d'avoir un équivalent Forth au Family BASIC, pas un système optimisé.

    EMIT va donc ressembler à ceci :

    • récupération des coordonnées du curseur,
    • calcul de l'adresse PPU en fonction des coordonnées,
    • positionnement du registre d'adresse PPU (dans la liste de commandes),
    • écriture du caractère à l'adresse PPU (dans la liste de commandes),
    • mise à jour des coordonnées du curseur,
    • NEXT.

    Il faut donc maintenir les coordonnées du curseur quelque part, et cela signifie l'utilisation de variables.

    Les variables

    Les variables en Forth sont, comme tout le reste, des mots dans le dictionnaire. Lorsqu'une variable est exécutée, elle place l'adresse réservée pour son contenu sur la pile des paramètres, et c'est tout.

    Pour cela, un mot de type variable a pour CFA une routine qui place l'adresse PFA sur la pile des paramètres. Le Parameter Field, lui, est un espace mémoire réservé de deux octets qui contiendra la valeur de la variable.

    Avec la totalité d'un mot de type variable, cela fait 2 octets pour la valeur, 2 octets pour le CFA, 2 octets pour le chaînage, 1 octet pour la longueur du nom, et le nom lui-même. Soit un minimum de 8 octets par variable pour une variable à 16 bits. Cela peut sembler cher payer, mais ce système est autonome.

    Cela permet d'écrire, si la variable s'appelle CURSOR_X par exemple :

        CURSOR_X @  \ lit la valeur de la variable
        CURSOR_X !  \ écrit la valeur dans la variable
    

    Le mot @ (fetch) lit une valeur à l'adresse située au sommet de la pile des paramètres et place cette valeur sur la pile.

    Le mot ! (store) prend une adresse et une valeur sur la pile des paramètres, et écrit la valeur à l'adresse.

    Il nous faut donc écrire :

    • le code assembleur pointé par un mot de type variable (que j'appellerai DOVAR)
    • le mot @
    • le mot !
    • ... et donc s'occuper du fonctionnement de la pile des paramètres.

    Je n'implémenterai pas encore le mot VARIABLE qui permet de définir une nouvelle variable depuis Forth. Je vais écrire les variables directement en assembleur pour le moment.

    Pas si vite !

    Cela fait déjà beaucoup de choses à faire avant d'implémenter EMIT. J'ai besoin d'une étape intermédiaire pour m'assurer que tout fonctionne correctement. Pour cela, je vais réécrire le mot de test en Forth.

    Pour rappel, voici à quoi ressemble le mot de test en assembleur :

       ; A test word that writes $42 to $7FF
        DEFINE_CODE_WORD TEST, BRANCH, 0
        lda #$42
        sta $7FF
        END_TO_NEXT
    

    En Forth, cela s'écrit simplement (pourvu que la base des nombres soit en hexadécimal) :

        : TEST
            42 7FF C! ;
    

    Mais comme c'est le système de pile de paramètres et de variables que je veux tester, je vais plutôt écrire :

        : TEST
            TEST_VALUE @    \ lit la valeur de la variable TEST_VALUE
            TEST_ADDR @     \ lit la valeur de la variable TEST_ADDR
            !               \ écrit cette valeur de TEST_VALUE à l'adresse TEST_ADDR
            ;
    

    Retour à la pile des paramètres

    La pile des paramètres est une zone de mémoire en RAM, de 256 octets. Cela permet de l'indexer facilement en mode indirect avec le registre Y. Pour ne pas monopoliser le registre, je garde une variable d'un octet en Page Zéro. Cela nécessite cependant d'aller chercher et modifier la variable à chaque opération de pile.

    Ainsi, le haut de la pile sera à tout moment :

    • (ParamStack),y pour l'octet de poids faible avec y = REG_PSP
    • (ParamStack),y pour l'octet de poids fort avec y = REG_PSP + 1

    La pile grandit vers les adresses mémoire basses, avec l'index initialisé à 0 et décrémenté lors des PUSH, incrémenté lors des POP. Le premier emplacement de valeur 16 bits sera donc aux adresses indexées par $FE et $FF.

    Je modifie un peu mes macros de définition de mots car FETCH et STORE doivent s'encoder en tant que mots avec les symboles @ et !, mais la génération des labels pour l'assembleur ne peut pas utiliser ces symboles. J'ajoute donc la possibilité de différencier le nom du mot et le symbole utilisé dans le dictionnaire.

    FETCH fait les actions suivantes :

    • récupérer l'adresse au sommet de la pile des paramètres
    • la placer dans un registre d'adresse Page Zero temporaire
    • lire la valeur à cette adresse (2 octets)
    • placer cette valeur sur la pile des paramètres

    STORE fait les actions suivantes :

    • récupérer l'adresse au sommet de la pile des paramètres
    • la placer dans un registre d'adresse Page Zero temporaire
    • récupérer la valeur suivante sur la pile des paramètres (2 octets)
    • écrire cette valeur à l'adresse dans le registre temporaire

    Le mot de test en Forth

    Le mot final de test en Forth devient, accompagné du code des deux variables :

        ; TEST_VALUE, a variable to hold a test value
        DEFINE_VARIABLE TEST_VALUE, STORE
        .word $4200
    
        ; TEST_ADDR, a variable to hold a test address
        DEFINE_VARIABLE TEST_ADDR, TEST_VALUE
        .word $07FE
    
        ; A test word that writes $4242 to $7FE (16 bits)
        DEFINE_FORTH_WORD NEW_TEST, TEST_ADDR, 0
        .word TEST_VALUE_word_cfa
        .word FETCH_word_cfa
        .word TEST_ADDR_word_cfa
        .word FETCH_word_cfa
        .word STORE_word_cfa
        .word DO_SEMI_word_cfa
    

    C'est... beaucoup plus long que les deux instructions d'assembleur initiales. Cela ne fait pas non plus exactement la même chose, car j'ai implémenté tous ces mots pour des valeurs de 16 bits. Plutôt que d'écrire $42 à l'adresse $7FF, j'écris $4200 à l'adresse $7FE (avec l'endianness, cela écrit bien $42 à $7FF). Cela fait passer le test et même si c'est un peu différent, cela teste bien le fonctionnement de la pile des paramètres et des variables.

    Conclusion

    Pas de lecture d'article Moving Forth aujourd'hui, il y a déjà assez de matière ici. J'ai une pile de paramètres fonctionnelle (mais non protégée), un système de variables, deux instructions élémentaires de manipulation de la pile.

    Je m'approche du nécessaire pour l'implémentation de EMIT, qui sera très probablement le sujet du prochain article.


  • Forth sur 6502, épisode 6 ()

    Des mots complets

    Depuis le début de l'implémentation de ce Forth sur 6502, j'ai parlé de « pseudo mots ». Ces mots ont un CFA (Code Field Address) et un PFA (Parameter Field Address), mais pas d'entête de mot ni de principe de dictionnaire.

    Or pour qu'un mot soit complet en Forth, il faut ces deux autres concepts. Dans cette implémentation je vais utiliser deux autres sections : le NFA (Name Field Address) et le LFA (Link Field Address).

    Ce qui donne la structure complète suivante :

    • NFA : entête du mot, dont le premier octet est la longueur du nom du mot, suivi du nom lui-même. Seuls les 5 bits de poids faible sont utilisés pour la longueur (ce qui limite la longueur des noms à 31 caractères). Le bit de poids fort est toujours à 1, les deux autres bits seront vus plus tard. De plus, le dernier octet du nom a son bit de poids fort à 1 pour indiquer la fin du nom.
    • LFA : adresse du mot précédent dans la liste chaînée des mots. Tous les mots disponibles dans ce Forth forment une liste chaînée, chaque mot pointant vers le mot défini avant lui. Le dernier mot défini pointe vers l'adresse 0 pour indiquer la fin de chaîne.
    • CFA : adresse du code machine qui sera exécuté lorsque le mot sera appelé.
    • PFA : paramètres du mot, s'il en a.

    Précision : cette implémentation d'un mot complet est celle que l'on trouve dans des Forth historiques 8 bits. Mais elle n'est pas obligatoire, il peut y avoir des variantes. Rien n'empêche d'inverser l'ordre du NFA et du LFA. Ou de terminer le nom par un octet nul plutôt que par un marqueur dans le bit de poids fort.

    En regardant des normes plus récentes (section 3.3), on voit qu'il existe un « name space » un « code space » et un « parameter space », et que les mots sont organisés dans un « dictionnaire », cependant, il est laissé à l'implémentation de faire les choix de représentation.

    Implémentation

    Pour implémenter ces mots complets, j'ajoute des macros pour faciliter l'écriture (et surtout la réécriture en cas de changement d'idée).

    Mon mot de test, qui permet de valider que le programme exécute bien la boucle, était comme ceci :

    test_word_cfa:
        .word test_word_pfa
    test_word_pfa:
        lda #$42
        sta $7FF
        jmp next
    

    Il devient maintenant :

        DEFINE_CODE_WORD TEST, BRANCH, 0
        lda #$42
        sta $7FF
        END_TO_NEXT
    

    La macro DEFINE_CODE_WORD prend trois paramètres : le nom du mot, le mot précédent (pour le chaînage) et un drapeau pour les mots immédiats, que l'on n'a pas encore abordé. La macro END_TO_NEXT termine le mot en appelant NEXT.

    Ainsi, pour le mots Forth définis par du code assembleur, il ne reste apparent que le code lui-même, encadré par les macros.

    J'ai une seconde macro qui permet de définir des mots exécutés par « DOCOL », c'est-à-dire des mots écrits comme une série de pointeurs vers d'autres mots.

    La boucle principale devient :

        DEFINE_FORTH_WORD MAIN_LOOP, TEST, 0
        .word READ_JOY_SAFE_word_cfa
        .word TEST_word_cfa
        .word POST_LOGIC_word_cfa
        .word DO_SEMI_word_cfa
    

    Moving Forth, épisode 5

    Avançons dans la lecture de la série d'articles Moving Forth avec la cinquième partie.

    L'auteur présente le code source d'un ANSI Forth, CamelForth, pour les processeurs Z80, 8051 et 6809. Passons. Ce qui m'intéresse le plus, c'est la notion de « kernel ». À partir de quel ensembles de mots de base écrits peut-on construire un Forth complet ? Et surtout, combien de mots doit-on implémenter en assembleur avant de construire le reste par dessus ?

    C'est une question que je me posais dès le premier article dans la conclusion. Je me disais que pour faciliter les choix d'implémentation, il serait intéressant d'avoir un minimum de mots implémentés en assembleur.

    Cependant, ce dont nous prévient l'article, c'est que même s'il est théoriquement possible de se limiter à 13 primitives, dans la pratique, faire ce choix entraînera un Forth peu véloce.

    L'auteur propose une liste de critères pour décider si un mot doit être implémenté en assembleur ou en Forth :

    • la base arithmétique, logique et mémoire le sont. Cela semble évident.
    • si le mot est difficile à écrire en Forth (ou de manière trop complexe), alors il devrait être en assembleur.
    • si le mot est très souvent utilisé, il devrait être en assembleur.
    • si le code assembleur est plus compact (ou vraiment plus efficace) que le code Forth, il devrait être en assembleur.
    • si la logique du mot est complexe, il devrait être en Forth.

    Avec ces critères, l'auteur arrive à une liste de 70 primitives dans son implémentation. Cela donne une idée d'échelle.

    Il décrit enfin une boucle de développement pour l'implémentation d'un Forth. Je suis déjà parti sur la mienne, mais cela est intéressant à regarder.

    L'auteur implémente toute sa base en premier, puis assemble et corrige les erreurs. Puis écrit du code qui affiche un premier caractère une fois l'initialisation complète. Puis il écrit un mot entièrement en Forth et vérifie le fonctionnement de NEXT, DOCOL et ;S/EXIT.

    Enfin, il implémente les branchements et DODOES globalement en même temps qu'avoir un interpréteur interactif rudimentaire afin de tester ses mots.

    Globalement, c'est similaire à ce que je suis en train de faire. J'ai écrit un octet en mémoire plutôt qu'un caractère à l'écran, car c'était plus simple. Mais l'idée est la même.

    De plus, je teste de manière automatique, et je compte bien continuer. Même si on va voir que ça va se compliquer un peu.

    Conclusion et prochain épisode

    J'ai à présent une liste de mots de deux types différents formant un dictionnaire. Ce que je voudrais maintenant est afficher un message à l'écran. J'ai déplacé et changé le message écrit par le squelette de projet pour me donner un modèle, et je veux à présent faire la même chose, mais dans la boucle Forth.

    J'ai commencé quelques essais et des questions se posent sur la granularité des mots. Je vais devoir implémenter le mot EMIT. Celui-ci aura besoin de conserver une position à l'écran. Pour cela, je vais avoir besoin de variables.

    Pour transformer ces variables en adresse mémoire, je peux soit tout écrire en assembleur (ce que je fais probablement faire dans un premier temps), mais aussi en profiter pour implémenter quelques mots de traitement arithmétique.

    Bref, à la prochaine !


  • Forth sur 6502, épisode 5 ()

    La boucle, pour de vrai !

    Jusqu'à présent, la boucle principale du programme en Forth était basée sur un hack. Ce hack consistait à réinitialiser l'IP (Instruction Pointer) à la fin du traitement. C'est un peu comme si à chaque fois qu'on avait fini le traitement, on relançait le programme depuis le début.

    Il est temps d'implémenter un nouveau mot Forth : BRANCH. Ce mot, suivi dans le PFA par un offset, opère un saut inconditionnel en additionnant cet offset à l'IP courant. En choisissant un offset négatif, l'exécution va revenir en arrière et donc créer une boucle infinie.

    Le pseudo code est le suivant :

        (IP) -> X       lit l'offset pointé par l'Instruction Pointer
                        L'IP ayant été positionné sur l'emplacement après le mot BRANCH
                        par NEXT.
        IP + X -> IP    ajoute l'offset à l'IP
        NEXT            appelle NEXT pour continuer l'exécution
    

    Du fait du traitement de mots en 16 bits, cela donne un code assez long en 6502. Mais je crois que ce sera le cas pour toute cette aventure. Le 6502 est un processeur foncièrement 8 bits. Encore une fois, modulo ma méconnaissance de ce CPU. Je reviendrai peut-être dessus plus tard en le maîtrisant mieux. Ou on me signalera des optimisations.

    Avec le mot BRANCH implémenté, la liste de mots de ma boucle principale devient :

    loop_words:
        .word main_loop_cfa
        .word branch_cfa
        .word $fffc ; -4 in little-endian to create an infinite loop
    

    Plus besoin de reset_code dont je retire le label et le pseudo PFA. Le hack est enlevé et j'ai enfin ma boucle complète en Forth. Puisque loop_words est maintenant un (pseudo-)mot Forth complet, je lui ajoute un CFA et le bootstrap change en initialisant le registre W avec ce CFA et en appelant DOCOL.

    C'est un peu plus élégant je trouve... mais cela fait perdre une place dans la pile de retour, puisque la première valeur de IP (même pas initialisée) y sera poussée par DOCOL. À voir lequel du bootstrap par IP + NEXT ou par W + DOCOL est le plus intéressant.

    Moving Forth, épisode 4

    C'est un tout petit article que cette quatrième partie de la série Moving Forth, tout comme ma partie d'implémentation ci-dessus.

    Cette partie pose la question : comment est-ce qu'on démarre l'implémentation d'un Forth ? Cool ! Mais j'ai déjà commencé. En vrai, j'ai déjà lu plusieurs fois cette série d'articles, il n'y a donc pas de surprise et cette partie entre autres m'a guidé dans mes choix initiaux.

    L'article commence par mettre sur la table deux choix d'implémentation : une implémentation en assembleur en direct sur la machine hôte, ou une implémentation par méta-compilateur, c'est-à-dire un autre Forth qui génère le code machine du Forth cible. Pas de surprise si vous avez suivi jusque-là, c'est la version assembleur que j'ai choisie. L'auteur lui, après avoir indiqué que la voie du méta-compilateur est plus complexe, préfère néanmoins celle-ci, plus portable et plus moderne (même pour 1993).

    J'avais l'idée éventuellement d'avoir aussi un méta-compilateur avec lequel des programmes pourraient être écrits en Forth pour la machine cible, ici la Famicom. Mais je ne suis pas certain de l'intérêt. Ma démarche est celle d'offrir à la Famicom un parallèle Forth au Family BASIC, avec un interpréteur interactif sur la machine et son clavier. Pour créer des jeux modernes sur Famicom, il y a déjà des outils je pense plus adaptés.

    Donc : Forth en assembleur ! Tout du moins son noyau.

    Même si un méta-compilateur serait intéressant pour développer les mots au-delà du noyau... mmmhhhh... Bon on verra.

    L'article continue en parlant de Forth en C comme d'une question qui ne peut pas ne pas se poser. Peut-être parce qu'en 1993, le C est le langage sérieux pour le développement système ? C'est un chemin que j'avais pris il y a quelques années quand je m'étais intéressé au Forth. Mais rapidement, j'étais arrivé à la conclusion que ce sont deux langages aux philosophies (et modèles) très différents, et l'implémentation faisait un peu gymnastique de contorsion.

    Au final, pourquoi pas, en implémentant une machine virtuelle Forth en C, avec quelques commandes de base du noyau. Ça fait partie des choses sur lesquelles je voudrais revenir maintenant que je maîtrise mieux le Forth. Vous le sentez venir le rabbit hole ? Allez, sur la pile !

    Prochain épisode

    Un article très court donc. Le suivant sera plus intéressant pour la suite de l'implémentation car il traitera de ce qui forme un noyau Forth : les mots de base, les primitives, sur lequel le reste est construit.

    Et je pense qu'il sera temps de faire un détour vers le passage à des mots Forth complets, avec leur entête et leur chaînage.


  • Forth sur 6502, épisode 4 ()

    NEXT

    Nous y voilà ! Après avoir mis en place un framework de tests dans l'article précédent, il est temps d'implémenter le mot NEXT.

    Un petit rappel du premier article de Moving Forth : NEXT est le mot qui permet de faire avancer l'exécution d'une séquence de pointeurs vers des mots Forth. Son pseudo-code (en modèle Indirect Threaded Code) est le suivant :

        (IP) -> W   récupère la mémoire pointée par IP dans le registre "W"
                    -> W contient maintenant l'adresse du Code Field
        IP+2 -> IP  avance IP, le compteur de programme
        (W) ->  X   récupère la mémoire pointée par W dans le registre "X"
                    -> X contient maintenant l'adresse du code d'exécution
        JP (X)      saute à l'adresse présente dans le registre X
    

    Implémentation

    En 6502, le code est un peu long, car l'adressage indirect nécessite de passer par des registres en page zéro. Et les manipuler demande plusieurs instructions. Je ne suis pas très versé en 6502, on verra s'il y a moyen de faire mieux plus tard.

    Dans certains Forth, NEXT est tellement court qu'il se pose la question d'en faire une macro. Ici, la réponse est assez simple : c'est non. Le code est assez long, et donc NEXT sera appelé avec un JMP à son adresse.

    Très bien, j'ai donc NEXT. Il me faut aussi une liste de mots à appeler. Le but étant d'implémenter l'écriture d'une valeur en mémoire, je vais créer un pseudo-mot TEST-WORD. Puis comme il faut faire cela en boucle, un second mot qui réinitialisera l'IP (Instruction Pointer) au début de la séquence, que je vais appeler RESET-CODE.

    Cela donne quelque chose comme ceci :

    loop_words:
        .word test_word_cfa
        .word reset_code_cfa
    

    Les pointeurs sont vers les CFA (Code Field Address) des mots. Pour rappel, le CFA est l'adresse où se trouve le code machine qui sera en charge d'exécuter le mot suivant (oui, c'est bien du Indirect Threaded Code, c'est indirect).

    Par exemple, pour TEST-WORD, le CFA est l'adresse de la première instruction assembleur qui compose le mot :

    test_word_cfa:
        .word test_word_pfa
    test_word_pfa:
        lda #$42
        sta $7FF
        jmp next
    

    NEXT va lire le CFA, puis sauter à l'adresse indiquée, qui est test_word_pfa. Et donc exécuter le code qui place la valeur $42 à l'adresse $07FF, avant de redonner la main à NEXT.

    J'ai dit plus haut que c'était un pseudo-mot. En effet, le CFA et le PFA ne sont qu'une partie de la définition d'un mot complet en Forth. Mais comme cette partie n'a pas été abordée pour le moment, et qu'elle n'est pas nécessaire pour faire fonctionner NEXT, je laisse ceci de côté.

    Reste à bootstrapper l'IP pour qu'il pointe sur loop_words au démarrage du programme. J'ajoute donc un petit code d'initialisation qui... sera aussi le code du mot RESET-CODE :

    boot_forth:
    
        ; Set the Instruction Pointer to the start of temporary Forth code
    reset_code:
        lda #<loop_words
        sta REG_IP
        lda #>loop_words
        sta REG_IP + 1
    
        ; Jump to the Forth NEXT loop
        jmp next
    

    Plus tard, il faudra aussi initialiser d'autres registres dans ce code. Mais pour le moment, ça suffit.

    J'enlève l'ancien code d'écriture en mémoire de la boucle principale, je remplace par un appel à boot_forth, et voilà ! Les tests passent... Mais le code d'affichage n'affiche plus le HELLO FAMICOM du squelette. C'est normal puisque la boucle principale Forth n'appelle pas le code de synchro et d'affichage.

    La boucle complète

    J'ai tous les éléments pour remettre en place la boucle principale. Il suffit de créer deux mots (ou plutôt pseudo-mots) qui feront juste un appel aux deux routines présentes initialement dans la boucle principale.

    read_joy_safe_word_cfa:
        .word read_joy_safe_word_pfa
    read_joy_safe_word_pfa:
        jsr read_joy_safe
        jmp next
    
    post_logic_word_cfa:
        .word post_logic_word_pfa
    post_logic_word_pfa:
        jsr post_logic
        jmp next
    

    Et de modifier la liste des mots à appeler dans loop_words :

    loop_words:
        .word read_joy_safe_word_cfa
        .word test_word_cfa
        .word post_logic_word_cfa
        .word reset_code_cfa
    

    Et l'affichage remarche. Avec beaucoup plus d'indirections et donc plus lent, c'est vrai. Je verrai plus tard comment regrouper les appels. Ou comment modifier les sous-routines pour les implémenter directement comme des mots.

    En tout cas pour le moment, j'ai retrouvé le comportement initial. Parfait.

    DOCOL et ;S

    Dans la partie 2 de cette série, j'avais listé les mots DOCOL et ;S comme prioritaires à implémenter. En effet, ces mots permettent d'appeler des mots définis par d'autres mots. C'est exactement ce qui est fait avec loop_words. Sauf que cela n'est pas un vrai mot. Il n'a même pas de CFA. Cette liste est démarrée manuellement par le code d'initialisation, que je rappelle en boucle.

    Mais cette boucle est aussi un petit hack avec le RESET-CODE. Je ne peux pas l'utiliser proprement pour démontrer DOCOL et ;S. Je vais donc créer un autre pseudo-mot

    main_loop_cfa:
        .word docol
    main_loop_pfa:
        .word read_joy_safe_word_cfa
        .word test_word_cfa
        .word post_logic_word_cfa
        .word do_semi_cfa
    

    docol étant le code machine de DOCOL et do_semi_cfa le pointeur sur le CFA de ;S.

    La boucle « hack » se retrouve donc remplacée par :

    loop_words:
        .word main_loop_cfa
        .word reset_code
    

    Pseudo-code pour les deux mots

    Le pseudo-code de DOCOL est le suivant :

       PUSH IP      pousse IP sur la pile de retour
       W+2 -> IP    puisque W pointait sur le Code Field,
                    W+2 est l'adresse du Parameter Field.
                    Le Parameter Field contient la liste des
                    adresses des mots à exécuter. IP pointe
                    donc sur cette liste.
       JUMP NEXT    saute à NEXT pour continuer l'exécution
    

    Le pseudo-code de ;S est le suivant :

       POP IP       récupère l'adresse de retour depuis
                    la pile de retour et la place dans IP
       JUMP NEXT    saute à NEXT pour continuer l'exécution
    

    Et ça fonctionne

    À nouveau, les tests passent et l'affichage fonctionne. Les trois premiers mots Forth sont donc implémentés : NEXT, DOCOL et ;S.

    Moving Forth, article 3

    Jetons à présent un œil sur le troisième article de la série Moving Forth. Son titre est « Demystifying DOES> », mais il en profite surtout pour décortiquer le fonctionnement des CFA et PFA.

    On passe sur l'introduction, qui revient sur des erreurs dans les parties précédentes pour arriver à l'explication du Code Field.

    Le Code Field, c'est le cœur du fonctionnement d'un mot en Forth. C'est un indicateur de la nature du mot, de la façon dont il va se comporter, être exécuté. Le Code Field indique quoi faire avec les paramètres du mot, les paramètres étant situés dans le Parameter Field, qui suit le Code Field.

    Ainsi, on peut définir différents fonctionnements :

    • un mot qui exécute les paramètres comme du code machine,
    • un mot qui traite les paramètres comme des référence à d'autres mots,
    • un mot qui traite les paramètres comme un emplacement mémoire réservé pour une variable,
    • etc...

    En quelque sorte, le Code Field représente une routine avec un paramètre implicite : le Parameter Field.

    L'article fait un parallèle avec la programmation objet, où le Code Field serait la méthode unique d'une classe, et le Parameter Field l'instance de cette classe pour chaque mot utilisant ce Code Field. Je ne suis pas certain que ce parallèle aide beaucoup... mais pourquoi pas.

    Code Field et Indirect Threaded Code

    Dans le modèle ITC (Indirect Threaded Code), le Code Field est une adresse qui pointe vers un code machine chargé d'interpréter le contenu du Parameter Field. On a vu deux cas pour le moment :

    • un Code Field qui pointe vers DOCOL entraîne l'appel successif de tous les mots dont les listés dans le PFA. Ces mots sont eux-mêmes représentés par leur CFA.
    • un Code Field qui pointe vers directement sur l'adresse du Parameter Field. Dans ce cas, le code machine est directement dans le PFA.

    Il existe différents Code Field standards en Forth, mais rien n'empêche l'utilisateur d'en définir de nouveaux. Et c'est exactement ce que fait le mot DOES> mentionné par le titre. Cependant, son fonctionnement nécessitera probablement un article à lui seul. Retenez juste que DOES> permet de définir une nouvelle classe de mots partageant un même Code Field personnalisé.

    L'article mentionne aussi les mots CREATE ou encore ;CODE, qui respectivement permettent de définir un nouveau mot et de définir un mot dont le code est écrit en assembleur. Là encore, ce sont des sujets pour plus tard lorsqu'il sera question de définir des mots par programmation.

    Pour le moment, je n'ai toujours que des pseudo-mots, et ils sont tous définis directement dans le code assembleur.

    L'article est plus long car il aborde ces sujets dans les différents modèles d'exécution de Forth, ainsi que les mots CONSTANT et VARIABLE, qui sont des mots de constructions avec un Code Field particulier, que nous verrons plus tard.

    La suite

    J'ai à présent les premiers pseudo-mots pour mon Forth, mais il m'en manque un pour créer la boucle en entier. En effet, pour le moment je réinitialise l'interpréteur pour relancer la boucle. Ce n'est pas une vraie boucle Forth. Je pense que ma prochaine étape sera donc de créer le mot BRANCH, qui modifie le registre IP.


Page 1 / 26 (suivant) »

Tous les tags

3d (15), 6502 (8), 6809 (1), 8bits (1), Affichage (24), AgonLight (2), Altaïr (1), Amstrad CPC (1), Apple (1), Aquarius (2), ASM (30), Atari (1), Atari 800 (1), Atari ST (2), Automatisation (4), BASIC (31), BASIC-80 (4), C (3), Calculs (1), CDC (1), Clion (1), cmake (1), Commodore (1), Commodore PET (1), Compression (4), CPU (1), Debug (5), Dithering (2), Divers (1), EF9345 (1), Émulation (7), Famicom (5), Forth (11), Game Jam (1), Hector (3), Histoire (1), Hooks (4), Huffman (1), i8008 (1), Image (17), Jeu (15), Jeu Vidéo (4), Livre (1), Logo (2), LZ (1), Machine virtuelle (2), Magazine (1), MAME (1), Matra Alice (3), MDLC (7), Micral (2), Motorola (1), MSX (1), Musée (2), Nintendo Switch (1), Nombres (3), Optimisation (1), Outils (3), Pascaline (1), Peertube (1), PHC-25 (2), Photo (2), Programmation (13), Python (1), RLE (1), ROM (15), RPUfOS (6), Salon (1), SC-3000 (1), Schéma (5), Synthèse (15), Tortue (1), Triceraprog (1), VG5000 (62), VIC-20 (1), Vidéo (1), Z80 (21), z88dk (1), ZX0 (1)

Les derniers articles

Forth sur 6502, épisode 8
Forth sur 6502, épisode 7
Forth sur 6502, épisode 6
Forth sur 6502, épisode 5
Forth sur 6502, épisode 4
Forth sur 6502, épisode 3
Forth sur 6502, épisode 2
Forth sur 6502
Compression de données, Huffman
Compression de données, le format ZX0

Atom Feed

Réseaux