home *** CD-ROM | disk | FTP | other *** search
/ Acorn User 3 / AUCD3.iso / funland / emulators / amiga / uae / Docs / README_PRO < prev    next >
Text File  |  1997-06-06  |  17KB  |  314 lines

  1. You can help to make this program better. If you fix bugs or implement new
  2. features, I'd be grateful if you send me patches. For a list of interesting
  3. projects, and for a brief summary on how UAE works, see below.
  4.  
  5. A few guidelines for anyone who wants to help:
  6. - Please contact me first before you implement major new features. Someone 
  7.   else might be doing the same thing already. This has already happened :-(
  8.   Even if no one else is working on this feature, there might be alternative
  9.   and better/easier/more elegant ways to do it.
  10. - If you have more than one Kickstart, try your code with each one.
  11. - Patches are welcome in any form, but diff -u or diff -c output is preferred.
  12.   If I get whole source files, the first thing I do is to run diff on it. You 
  13.   can save me some work here (and make my mailbox smaller).
  14.  
  15. Some possible projects, in order of estimated difficulty:
  16. - Someone running *BSD on a x86 might want to try using X86.S on such a
  17.   system. It's likely that only configure needs to be modified.
  18. - Add gamma correction
  19. - Repair support of the serial interface. Sending data seems to work,
  20.   receiving does not. Maybe this has to be implemented in a completely 
  21.   different way (a serial.device? If you do that, don't do it native. At least
  22.   not all of it. Amiga libraries shouldn't be implemented completely native
  23.   in UAE, the parts which are not speed critical should be Amiga native so
  24.   they can call other 68k code safely).
  25. - Someone with a 68020 data sheet might check whether all opcodes are
  26.   decoded correctly and whether all instructions really do what they are 
  27.   supposed to do (I'm pretty sure it's OK by now, but you never know...).
  28. - Add 2.0 packets to filesys.c
  29. - Multi-thread support is there now, it just needs someone to test it on a SMP
  30.   machine and to fix it so it improves speed instead of slowing the thing 
  31.   down.
  32. - Improve the Kickstart replacement to boot more demos.
  33. - Snapshots as in CPE. Will need to collect all the variables containing
  34.   important information. Fairly easy, but boring. (Use core dumps instead :-)
  35.   _If_ someone attempts this, please be more clever than the various CPC
  36.   emulators and dump state only at one fixed point in the frame, preferrably
  37.   the vsync point.
  38. - Find out why uae.device has to be mounted manually with Kick 1.3.
  39.   The problem seems to be that we don't have a handler for it. I _think_ what
  40.   we need is the seglist of the standard filesystem handler. Problem is,
  41.   DOS hasn't been started when the devices are initialized and so we can't get
  42.   to the DosBase->RootNode->FileHandlerSeg pointer, and then there is the
  43.   confusing matter of BCPL GlobVecs and other weird stuff...
  44. - Some incompatibilities might be fixed with user-modifiable fudge variables
  45.   the same way it's done in various C64 emulators.
  46. - With the new display code, it would probably be easier than before to
  47.   implement ECS resolutions - however, a lot of places rely on the OCS timing
  48.   parameters and display sizes.
  49. - Figure out a diskfile format that supports every possible non-standard
  50.   format.
  51. - Implement 68551 MMU. I have docs now. Not among the most necessary things.
  52.   Difficult, at least without using C++ exception handling.
  53. - Implement AGA support. Some bits and pieces exist.
  54. - Reimplement Amiga OS. (Well-behaved) Amiga programs could then be made
  55.   to use the X Window System as a "public screen". Of course, not all the
  56.   OS would have to be re-done, only Intuition/GFX/Layers (which is enough). 
  57.   [Started, look at gfxlib.c - not usable yet.]
  58. - Find some extremely clever ways to optimize the smart update methods. Some
  59.   ideas:
  60.   a) Always use memcmpy() to check for bitplane differences. If no differences
  61.      are found, see if BPLxDELAY got modified, if so, scroll.
  62.      Problems: 
  63.       * You'd still have to draw a few pixels around the DIW borders. Not very
  64.         hard.
  65.       * Scrolling with memcpy in video memory can be terribly slow (no, I
  66.         shouldn't have bought the cheaper video card with DRAMs)
  67.       * At least every 15 pixels a full update has to be done since the
  68.         bitplane pointers get updated after that. And that's with the slowest
  69.     scrolling - if the playfield scrolls faster, the benefit converges
  70.     against zero.
  71.      You could also do vertical scrolling tests, but similar problems arise - 
  72.      where should one check? One line above/below? What about faster
  73.      scrolling? You could use the bitplane pointers as hints, but with
  74.      double/triple buffering this gets problematic, too.
  75.      On the whole, I don't think it would be worth the effort, even if it
  76.      works very well for a few games.
  77.   b) Well, there is no b). If I thought of something I forgot it while
  78.      writing a).
  79. - Port it to Java and Emacs Lisp
  80. - A formal proof of correctness would be nice.
  81.  
  82.  
  83. Source file layout
  84.  
  85. src/      contains (mostly) machine-independent C code.
  86. include/  contains header files included by C code.
  87. md-*/     CPU and compiler dependent files, linked to machdep by configure
  88. od-*/     operating system dependent files, linked to osdep by configure
  89. td-*/     thread library dependent files, linked to threaddep by configure
  90. sd-*/     Sound code. sd-* is only for sound systems which are not OS specific
  91.           or for which no "od-*" directory exists. Linked to sounddep
  92. targets/  Contains header files which contain some information about which
  93.           options a specific port of UAE understands.
  94.  
  95.  
  96. Coding style
  97.  
  98. As long as your code is hidden in a file buried in md-*/ or od-*/ where I
  99. never have a look at it, you can probably get away with not following these
  100. guidelines. 
  101.  
  102. * Do not include CR characters.
  103. * Do not use GNU C extensions if you can't hide them in a macro or in a
  104.   system-specific file so that an alternative implementation is available
  105.   when GNU C is not used.
  106.   This applies to _all_ OS/CPU/compiler specific details. Basically, nothing
  107.   of that sort should appear in src/*.c (we're a bit away from that goal at
  108.   the moment, but it's getting better).
  109. * Make sure your code does not make assumption about type sizes other than
  110.   the minimum widths allowed by C. If you need specific type sizes, use the
  111.   uae_u32 type and its friends.
  112. * Set up your editor so that tab characters round up to the next position
  113.   where ((cursorx-1) % 8) == 0, i.e. 8 space tabs. Do not use 4 space tabs,
  114.   that makes the code awful to read on other machines and worse to edit.
  115. * Lines can be up to 132 characters wide. Use SVGATextMode for the Linux
  116.   console, or use a windowing system in a high resolution.
  117. * Indentation - look at some code in custom.c and try to follow it. Don't
  118.   use GNU 2-space-in-weird-places indentation, I find it awful. But _do_
  119.   follow the GNU rules for adding whitespace in expressions, and those for
  120.   breaking up multiple-line if statements.
  121.   Fixed indentation rules almost never make sense - break the rules if that
  122.   makes your code more readable.
  123.   Hint: Get jed from space.mit.edu, /pub/davis. It can indent your code
  124.   automatically. Put the following into your .jedrc, and it will come out
  125.   right:
  126.   C_INDENT        = 4;
  127.   C_BRACE        = 0;
  128.   C_BRA_NEWLINE        = 0;
  129.   C_Colon_Offset    = 1;
  130.   C_CONTINUED_OFFSET    = 4;
  131.  
  132.  
  133. How it works
  134.  
  135. Let's start with the memory emulation. All addressable memory is split into
  136. banks of 64K each. Each bank can define custom routines accessing bytes, 
  137. words, and longwords. All banks that really represent physical memory just 
  138. define these routines to write/read the specified amount of data to a chunk 
  139. of memory. This memory area is organized as an array of uae_u8, which means 
  140. that those parts of the emulator that want to access memory in a linear 
  141. fashion can get a (uae_u8 *) pointer and use it to circumvent the overhead of
  142. the put_*() and get_*() calls. That is done, for example, in the
  143. pfield_doline() function which handles screen refreshes.
  144. Memory banks that represent hardware registers (such as the custom chip bank
  145. at 0xDF0000) can trap reads/writes and take any necessary actions.
  146. In some places, this scheme is abused: The uae.device and unixfs.device are
  147. stored in a segment at 0xF00000 containing a ROMtag structure, so it is
  148. recognized at bootup. Since this is a ROM area, writes shouldn't occur
  149. normally and are therefore used to trap into emulation routines for these
  150. devices.
  151.  
  152. To provide a good emulation of graphical effects, only one thing is vital:
  153. Copper and playfield emulation have to be kept absolutely synchronous. If the
  154. copper writes to (say) a color register in a specific cycle, the playfield 
  155. hardware needs to use the new information in the next word of data it
  156. processes.
  157. UAE 0.1 used to call routines like do_pfield() and do_copper() each time the
  158. CPU emulator had finished an instruction. That was one of the reasons why it
  159. was so slow. Recent versions try to draw complete scanlines in one piece. This
  160. is possible if the copper does not write to any registers affecting the
  161. display during that scanline. Therefore, drawing the line is deferred until
  162. the last cycle of the line. However, sometimes a register which affects how
  163. the screen will look is modified before the end of the line (think of copper
  164. plasmas). That's what "struct decision thisline_decision" is for. It is
  165. initialized at the start of each line. During the line, whenever a vital
  166. register is changed, one of the decide_*() functions is called and may modify
  167. thisline_decision. There are several independent decisions:
  168.  - which DIW should be used
  169.  - where does data fetch start/stop (or is the line in the border altogether)
  170.  - where should sprites be drawn (note: the same sprite can appear more than
  171.    once on one scanline, see Turrican I world 3 levels 1 and 3 for the best
  172.    example)
  173.  - what are the playfield pointers at the start of DDF. Related, what data do
  174.    they point to.
  175.  - what are the playfield modulos at the end of DDF
  176.  - coppermagic with the colors is remembered for later use
  177.  - so is copper magic with the bitplane delay values. I used to think there
  178.    was no useful application for modifying BPLCON1 while data is being
  179.    displayed, but Sanity demos can make Amiga emulator programmers look real
  180.    old.
  181.  
  182. All of this is remembered while the raster line is processed by the hardware.
  183. After the line (at hsync), all the decisions are made if they weren't made
  184. before. At that point the line can be drawn by playfield_draw_line.
  185. Additionally, all the decisions from the previous displayed frame are saved
  186. and compared with the new ones, since often lines are not modified between
  187. frames. This saves a lot of redrawing work.
  188.  
  189. The CPU emulator no longer has to call all sorts of functions after each
  190. instruction. Instead, it keeps a list of events that are scheduled (timer
  191. interrupts, hsync and vsync events) and their "arrival time". Only the time
  192. for the next event is checked after each CPU instruction. If it's higher than
  193. the current cycle counter, the CPU can continue to execute.
  194.  
  195. Things that can't be supported with the current "decision" model:
  196.   - Changes in lores/hires mode during one line. Dunno whether that was ever
  197.     used in reality.
  198.   - Changes to the bitplane DMA bit during one line. Hardly useful and not
  199.     likely to be used. [but there is at least two programs which do ugly
  200.     things like that, and there are some hacks in UAE that make those programs
  201.     work (Magic 12 Ray of Hope 2 is one of these demos)]
  202.   - Changes in bitplane data during one line. If programs do this kind of
  203.     thing, it's most likely accidental and the program is broken. Can happen
  204.     with programs that use the blitter incorrectly, like all the Andromeda
  205.     demos.
  206.   - others? (fill in if you can think of anything)
  207.  
  208. All in all, it's unlikely that this causes compatibility problems. If it does,
  209. fudge values could be introduced (although that sort of thing gets messy
  210. quickly).
  211.  
  212.  
  213. * Native code vs. 68k code
  214.  
  215. It is possible to call native code from 68k code; autoconf.c has some routines
  216. which make setting up a call trap very easy. However, it is not as easy to
  217. call 68k code from native C code, at least not while Amiga Exec multitasking
  218. is running. You ask why?
  219.  
  220. Amiga process1 calls native function foo
  221. Native function foo calls some 68k function and goes into 68k mode
  222. Amiga context switch happens, process1 is put to sleep and process2 gets run.
  223. Amiga process2 calls native function foo
  224. Native function foo calls some 68k function and goes into 68k mode
  225. Amiga context switch happens, process2 is put to sleep and process1 gets run.
  226. Process 1 completes the 68k function called by foo and returns from 68k mode.
  227.  
  228. There. Now we are in function foo again. When it called the 68k code, process2
  229. was active. Now process1 is active, and the function we called in process2
  230. hasn't completed yet. What a mess.
  231.  
  232. To get around this, you need to do some stack magic. Code to do this exists,
  233. but it must be adapted for each port, since setting up a different stack is
  234. completely non-portable.
  235.  
  236.  
  237. * How multithreading in filesys.c works
  238.  
  239. AmigaOS is nice enough to start one processes for each mounted filesystem. All
  240. of these run in the 68k emulation code, i.e. in the main UAE thread. This is
  241. the reason why multithreading is desirable: if the main UAE thread blocks
  242. waiting for I/O, the CPU emulation can't continue to run. Since the Amiga OS
  243. is capable of multi-tasking, it is possible that other code could run until
  244. the I/O operation is complete. The most important bit of code that can run is
  245. the code that moves the mouse pointer - it's unpleasant if the pointer does
  246. not follow mouse movement during disk/CD accesses.
  247.  
  248. When a packet is received by the filesys.asm code, filesys_handler is called.
  249. This function always runs in the main UAE thread.
  250.  - In the single-threaded case, this function performs the action that was
  251.    requested, then returns 0 to indicate "action completed, reply packet".
  252.    Nothing else is performed.
  253.  - In the multi-threaded case, filesys_handler figures out which unit the
  254.    packet was for and sends the packet to the UAE thread responsible for
  255.    handling this unit. filesys_handler returns 0 to indicate: queue the
  256.    packet. Also, one (at that point unused) field in the packet is set to
  257.    0 to indicate that the action was not completed.
  258.  
  259. The latter case is the interesting one. The thread that got the packet does
  260. the following:
  261.  - perform the action as usual
  262.  - set the "command complete" field in the packet to -1.
  263.  - send a message to the AmigaOS (!) filesystem process. However, it can't do
  264.    that without some effort. We can't call 68k code from the emulator easily.
  265.    So we have to use an Amiga interrupt. The filesystem init code sets up an
  266.    Exec IntServer for the EXTER interrupt, and hsync_handler() checks
  267.    periodically whether the filesystem needs an interrupt and raises one if
  268.    necessary.
  269.    Only one dummy message is used per filesystem unit, which is allocated at
  270.    startup. This means that there must be some locking to prevent the unit
  271.    thread from sending the same message twice to the same port. To determine
  272.    whether the message is free, three counts are kept. "cmds_sent" is
  273.    incremented by the UAE thread whenever it has completed a command.
  274.    "cmds_acked" is set to the same value of cmds_sent at the point that the
  275.    interrupt handler got invoked and decided it must send a message. Finally,
  276.    cmds_complete is set to this value at the time the AmigaOS process receives
  277.    the dummy message. Whenever cmds_acked == cmds_complete, the dummy message
  278.    is free to be sent again.
  279.    
  280. The EXTER interrupt basically walks through the units, looks at the cmds_*
  281. fields and sends the dummy message to the Amiga filesystem process when
  282. possible and necessary.
  283.  
  284. When the Amiga filesystem process receives such a dummy message, it does the
  285. following:
  286.  - increment cmds_complete as described above.
  287.  - walk through the queue of unprocessed commands and see which ones now have
  288.    a status of -1, indicating that they are finished. These are removed from
  289.    the queue and replied to.
  290.  
  291.  
  292. * Calltraps at fixed locations
  293.  
  294. F0FF00: return from 68k mode.
  295. F0FF10: must have gotten lost somewhere ;)
  296. F0FF20: used by filesys.c to store away some information from the startup
  297.         packet.
  298. F0FF30: filesys_handler().
  299. F0FF40: startup_handler(), handles only the startup packet for each
  300.         filesystem.
  301. F0FF50: used by the EXTER interrupt which we set up for the filesystem.
  302. F0FF60: used by the uaectrl/uae-control programs (see uaelib.c)
  303. F0FF70: used by the task that gets set up for the mouse emulation.
  304.  
  305. * How the compiler works
  306.  
  307. .. yet to be written. To be decided, in fact.
  308.  
  309.  
  310. Portability
  311.  
  312. This section was out of date. I'll rewrite it.
  313. Some day.
  314.