74b1060427dbce1cfc4321e405ae19f8e2484f1b
[rrq/rrqforth.git] / machine.asm
1 ;;; This file define/describes the "machine"
2 ;;;
3 ;;; Abstract Machine:
4 ;;; https://en.wikibooks.org/wiki/X86_Assembly/X86_Architecture
5 ;;; 
6 ;;; General Purpose Registers ( * marks those used in syscalls )
7 ;;;  *rax = ( -, eax = ( -, ax = ( ah, al) )) "accumulator"
8 ;;;   rbx = ( -, ebx = ( -, bx = ( bh, bl) )) "base"
9 ;;;  *rcx = ( -, ecx = ( -, cx = ( ch, cl) )) "counter"
10 ;;;  *rdx = ( -, edx = ( -, dx = ( dh, dl) )) "data"
11 ;;;   rsp = ( -, esp = ( -, sp = ( -, spl) )) "stack pointer"
12 ;;;   rbp = ( -, ebp = ( -, bp = ( -, bpl) )) "stack base pointer"
13 ;;;  *rsi = ( -, esi = ( -, si = ( -, sil) )) "source"
14 ;;;  *rdi = ( -, edi = ( -, di = ( -, dil) )) "destination"
15 ;;;  *r8
16 ;;;  *r9
17 ;;;   r10
18 ;;;  *r11
19 ;;;   r12
20 ;;;   r13
21 ;;;   r14
22 ;;;   r15
23 ;;; clobbers rdi rsi rdx rcx r8 r9 r11
24 ;;; rax = syscall id
25 ;;;
26 ;;; Segment Registers
27 ;;;   SS "Stack Segment"
28 ;;;   CS "Code Segment"
29 ;;;   DS "Data Segment"
30 ;;;   ES "Extra Segment"
31 ;;;   FS "more Extra Segment"
32 ;;;   GS "more more Extra Segment"
33 ;;;
34 ;;; EFLAGS Register
35 ;;;   0,0,0,0,0,0,0,0,0,0,ID,VIP,VIF,AC,VM,RF,
36 ;;;   0,NT,[IOPL,IOPL],OF,DF,IF,TF,SF,ZF,0,AF,0,PF,1,CF
37 ;;; 
38 ;;; Instruction pointer
39 ;;;   EIP
40 ;;; 
41 ;;; Syscall allocations
42 ;;; clobbers rdi rsi rdx rcx r8 r9 r11
43 ;;; rax = syscall id
44 ;;;
45
46 ;;; ######################################################################
47
48 ;;; ============================================================
49 ;;; FORTH machine model
50 ;;; rsp = data stack pointer
51 ;;; rbp = return stack pointer
52 ;;; rsi = instruction pointer
53
54 ;;; ========================================
55 ;;; The pushr macro pushes x onto the return stack
56 ;;; The popr macro pops x from the return stack
57 macro pushr x {
58         sub rbp, 8
59         mov [rbp], x
60 }
61
62 macro popr x {
63         mov x, [rbp]
64         add rbp, 8
65 }
66
67 ;;; ========================================
68 ;;; The next macro "moves" execution to the next FORTH instruction,
69 ;;; using rsi as instruction pointer. It points to the doer field of a
70 ;;; word, which points to the assembly code that implements the
71 ;;; execution effect of the word. That doer code is entered with rsi
72 ;;; referring to the subsequent address in the colling word, and rax
73 ;;; referring to the doer field of the called word.
74
75 macro next {
76         lodsq                   ; mov rax, [rsi] + add rsi,8
77         jmp qword [rax]         ; goto code of that FORTH word (64 bit jump)
78 }
79
80 ;;; ========================================
81 ;;; The FORTH macro transitions to inline FORTH execution.
82 macro FORTH {
83         local forthcode
84         mov rsi,forthcode
85         next
86         ;; align 8
87 forthcode:
88 }
89
90 ;;; ========================================
91 ;;; The ENDFORTH macro transitions back to inline assembler after FORTH
92
93 macro ENDFORTH {
94         dq inline_code
95 }
96
97 ;;; ========================================
98 ;;; The DOFORTH lays out a single FORTH call
99
100 macro DOFORTH label {
101         FORTH
102         dq label
103         ENDFORTH
104 }
105
106         previous_word = 0       ; Used for chaining the words
107
108         IMMEDIATE = 1           ; optional flag (symbol)
109
110 ;;; ========================================
111 ;;; Macro WORD starts a FORTH word definition in this code.
112 ;;; The layout of a word is as follows:
113 ;;; TFA: [8 bytes] pointer to previous word in the word list
114 ;;;      [8 bytes] pointer to the word's CFA
115 ;;;      [8 bytes] a flags field
116 ;;;      [8 bytes] the length of the word's pname
117 ;;;      [varying] the word's pname
118 ;;;      [1 byte]  NUL -- making an asciiz of the pname
119 ;;;      ;;[? bytes] 0-7 bytes for address alignment to [disabled]
120 ;;;      [8 bytes] pointer to the word's TFA
121 ;;; OFF: [8 bytes] the DOES offset for the word
122 ;;; CFA: [8 bytes] pointer to the word's "doer" code
123 ;;; DFA: [? bytes] the word's data field
124
125 macro WORD label, name, doer, flags, previous, offset {
126         local pname
127         ;; align 8
128 label#_TFA:
129         ;; TFA
130         if previous eq
131             dq previous_word
132         else
133             dq previous
134         end if
135         previous_word = label#_TFA
136         ;; PFA
137         dq label#_CFA           ; link to CFA of word
138         dq flags + 0
139 label#_PFA:
140         dq pname - $ - 8
141         db name
142 pname:  db 0                    ; extra NUL byte
143         ;; align 8
144         dq label#_TFA           ; link to TFA of word
145 label#_OFF:
146         dq offset + 0           ; The DOES offset. Defaults to 0.
147         ;; also CFA = pointer to "doer"
148 label#_CFA:
149 label:
150         if doer eq
151             dq doforth
152         else
153             if doer in <fasm>
154                 dq label#_DFA
155             else
156                 dq doer
157             end if
158         end if
159         ;; DFA
160 label#_DFA:
161 }
162
163 macro tfa2cfa reg {
164         mov reg,qword [reg+8]
165 }
166 macro tfa2dfa reg {
167         tfa2cfa reg
168         add reg,8
169 }
170 macro tfa2pfa reg {
171         add reg,24
172 }
173 macro tfa2pname reg {
174         add reg,32
175 }
176 macro cfa2tfa reg {
177         sub reg,16
178         mov reg,qword [reg]
179 }
180 macro cfa2dfa reg {
181         add reg,8
182 }
183 macro dfa2cfa reg {
184         sub reg,8
185 }
186 macro dfa2tfa reg {
187         sub reg,24
188         mov reg,qword [reg]
189 }
190 macro pushpname rg {    ; ( reg -- chars* length )
191         add rg,8
192         push rg
193         sub rg,8
194         push qword [rg]
195 }
196 ;;; ========================================
197 ;;; The BLOCK macro lays out the length for a subsequent block to the
198 ;;; given label.
199 macro BLOCK endlabel {
200         local datastart
201         dq endlabel - datastart
202 datastart:
203         }
204
205 ;;; ========================================
206 ;;; The STRING macro lays out length cell and data for several string
207 ;;; components.
208 macro STRING [data] {
209 common
210         local datastart, dataend
211         dq dataend - datastart
212 datastart:
213 forward
214         db data
215 common
216 dataend:
217         }
218