home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / ai-faq / genetic / part3 < prev    next >
Encoding:
Internet Message Format  |  2001-04-12  |  56.7 KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!news.bu.edu!micro-heart-of-gold.mit.edu!nntp.club.cc.cmu.edu!usenet01.sei.cmu.edu!logbridge.uoregon.edu!server3.netnews.ja.net!server4.netnews.ja.net!fafnir.cf.ac.uk!scmdb
  2. From: David.Beasley@cs.cf.ac.uk (David Beasley)
  3. Newsgroups: comp.ai.genetic,comp.answers,news.answers
  4. Subject: FAQ: comp.ai.genetic part 3/6 (A Guide to Frequently Asked Questions)
  5. Supersedes: <part3_969480833@cs.cf.ac.uk>
  6. Followup-To: comp.ai.genetic
  7. Date: 11 Apr 2001 20:23:23 GMT
  8. Organization: Posted through the Joint Cardiff Computing Service, Wales, UK
  9. Lines: 1075
  10. Approved: news-answers-request@MIT.Edu
  11. Expires: 25 May 2001 20:22:54 GMT
  12. Message-ID: <part3_987020574@cs.cf.ac.uk>
  13. References: <part2_987020574@cs.cf.ac.uk>
  14. NNTP-Posting-Host: thrall.cs.cf.ac.uk
  15. X-Trace: fafnir.cf.ac.uk 987020603 29441 131.251.42.22 (11 Apr 2001 20:23:23 GMT)
  16. X-Complaints-To: abuse@cf.ac.uk
  17. NNTP-Posting-Date: 11 Apr 2001 20:23:23 GMT
  18. Summary: This is part 3 of a <trilogy> entitled "The Hitch-Hiker's Guide
  19.      to Evolutionary Computation". A periodically published list of Frequently
  20.      Asked Questions (and their answers) about Evolutionary Algorithms,
  21.      Life and Everything. It should be read by anyone who whishes to post
  22.      to the comp.ai.genetic newsgroup, preferably *before* posting.
  23. Originator:  scmdb@thrall.cs.cf.ac.uk
  24. Xref: senator-bedfellow.mit.edu comp.ai.genetic:21405 comp.answers:44994 news.answers:205230
  25.  
  26. Archive-name:   ai-faq/genetic/part3
  27. Last-Modified:  4/12/01
  28. Issue:          9.1
  29.  
  30. Important note: Do NOT send email to the cs.cf.ac.uk address above: it will 
  31.     be ignored. Corrections and other correspondence should be sent to 
  32.     david.beasley@iee.org
  33.  
  34. TABLE OF CONTENTS OF PART 3
  35.      Q2: What applications of EAs are there?
  36.  
  37.      Q3: Who is concerned with EAs?
  38.  
  39.      Q4: How many EAs exist? Which?
  40.      Q4.1: What about Alife systems, like Tierra and VENUS?
  41.  
  42.      Q5: What about all this Optimization stuff?
  43.  
  44. ----------------------------------------------------------------------
  45.  
  46. Subject: Q2: What applications of EAs are there?
  47.  
  48.      In   principle,   EAs  can  compute  any  computable  function,  i.e.
  49.      everything a normal digital computer can do.
  50.  
  51.      But EAs are especially badly suited for problems where efficient ways
  52.      of  solving  them  are  already  known,  (unless  these  problems are
  53.      intended to serve as benchmarks).  Special purpose  algorithms,  i.e.
  54.      algorithms  that  have  a  certain amount of problem domain knowledge
  55.      hard coded into them, will usually outperform EAs,  so  there  is  no
  56.      black  magic  in EC.  EAs should be used when there is no other known
  57.      problem solving strategy, and  the  problem  domain  is  NP-complete.
  58.      That's  where  EAs  come  into  play: heuristically finding solutions
  59.      where all else fails.
  60.  
  61.      Following  is  an  incomplete   (sic!)    list   of   successful   EA
  62.      applications:
  63.  
  64.  ARTIFICIAL LIFE
  65.      ARTIFICIAL  LIFE  (ALIFE)  systems  attempt  to  simulate the kind of
  66.      behaviour exhibited by real, living  creatures.  Not  all  Artificial
  67.      Life systems employ EVOLUTIONARY ALGORITHMs (see Q4.1).
  68.  
  69.      Framsticks
  70.  
  71.      Framsticks  is  a three-dimensional life SIMULATION project. Both the
  72.      physical  structure  of  creatures  and  their  control  systems  are
  73.      evolved.  Evolutionary  algorithms are used with SELECTION, CROSSOVER
  74.      and MUTATION.  Finite element methods are used for  simulation.  Both
  75.      spontaneous and directed EVOLUTIONs are possible.
  76.  
  77.      This  system  uses  the  standard  EA  framework  to evolve 3D agents
  78.      equipped with neural networks. It has proved to be an attractive tool
  79.      for  people who want to learn about the way evolutionary OPTIMIZATION
  80.      techniques work.
  81.  
  82.      This is shareware, but all the evolutionary  features  are  available
  83.      free.  The  project  is open, and developers can take part in it, and
  84.      also conduct their own experiments (i.e.   using  their  own  GENETIC
  85.      OPERATORs).   There  are  links  to  the scientific papers on the web
  86.      page, as well as the detailed program documentation. The software  is
  87.      quite general and can be used to study a range of problems, including
  88.      coevolution of body and brain.
  89.  
  90.      For more details, see: http://www.frams.poznan.pl/
  91.  
  92.  BIOCOMPUTING
  93.      Biocomputing, or Bioinformatics, is the field of biology dedicated to
  94.      the automatic analysis of experimental data (mostly sequencing data).
  95.      Several  approaches  to  specific  biocomputing  problems  have  been
  96.      described  that  involve  the  use of GA, GP and simulated annealing.
  97.      General information about biocomputing (software,  databases,  misc.)
  98.      can  be found on the server of the European Bioinformatics Institute:
  99.      http://www.ebi.ac.uk/ebi_home.html ENCORE has  a  good  selection  of
  100.      pointers  related  to  this subject.  VSCN provides a detailed online
  101.      course       on        bioinformatics:        http://www.techfak.uni-
  102.      bielefeld.de/bcd/Curric/welcome.html
  103.  
  104.      There  are  three  main  domains  to  which  GA  have been applied in
  105.      Bioinformatics: protein folding, RNA folding, sequence alignment.
  106.  
  107.      Protein Folding
  108.  
  109.      Proteins are one of the essential components of  any  form  of  life.
  110.      They  are  made of twenty different types of amino acid.  These amino
  111.      acids are chained together in order to  form  the  protein  that  can
  112.      contain  from  a  few  to  several thousands residues. In most of the
  113.      cases, the properties and the function of a protein are a  result  of
  114.      its  three  dimensional  structure.  It seems that in many cases this
  115.      structure is a direct consequence of the sequence. Unfortunately,  it
  116.      is  still  very  difficult/impossible to deduce the three dimensional
  117.      structure, knowing only the sequence.  A part  of  the  VSCN  on-line
  118.      bioinformatics  course  is  dedicated  to  the  use of GAs in Protein
  119.      Folding Prediction. It  contains  an  extensive  bibliography  and  a
  120.      detailed  presentation  of  the subject with LOTS of explanations and
  121.      on-line    papers.    The     URL     is:     http://www.techfak.uni-
  122.      bielefeld.de/bcd/Curric/ProtEn/contents.html
  123.  
  124.      Koza  [KOZA92]  gives  one  example of GP applied to Protein Folding.
  125.      Davis [DAVIS91] gives an example of DNA  conformation  prediction  (a
  126.      closely related problem) in his Handbook of GAs.
  127.  
  128.      RNA Folding
  129.  
  130.      Describing  the  tertiary  structure  of an RNA molecule, is about as
  131.      hard as for a protein,  but  describing  the  intermediate  structure
  132.      (secondary  structure)  is  somehow  easier because RNA molecules are
  133.      using the same pairing rules as DNA, (Watson and Crick base pairing).
  134.      There  exist deterministic algorithms that given a set of constraints
  135.      (rules), compute the more stable structure, but: (a) their  time  and
  136.      memory  requirement increase quadratically or more with the length of
  137.      the sequences, and (b) they require simplified rules.  Lots of effort
  138.      has  recently been put into applying GAs to this problem, and several
  139.      papers can be found (on-line if your institute  subscribes  to  these
  140.      journals):
  141.  
  142.      A genetic Algorithm Based Molecular Modelling Technique For RNA Stem-
  143.      loop Structures H. Ogata, Y. Akiyama and  M  Kanehisa,  Nucleic  Acid
  144.      Research, 1995, vol 23,3 419-426
  145.  
  146.      An  Annealing Mutation Operator in the GA for RNA folding B.A Shapiro
  147.      and J. C. Wu, CABIOS, 1996, vol 12, 3, 171-180
  148.  
  149.      The computer Simulation  of  RNA  Folding  Pathway  Using  a  Genetic
  150.      Algorithm  A.P.  Gultyaev,  F.D.H van Batenburg and C. W. A. Pleij in
  151.      Journal of Molecular Biology, 1995, vol 250 37-51
  152.  
  153.      Simulated Annealing  has  also  been  applied  successfully  to  this
  154.      problem:
  155.  
  156.      Description  of RNA folding by SA M. Schmitz and G. Steger in Journal
  157.      of Molecular Biology, 1995, 255, 245-266
  158.      Sequence Alignments
  159.  
  160.      Sequence Alignment is another important  problem  of  Bioinformatics.
  161.      The  aim  is to align together several related sequences (from two to
  162.      hundreds) given a cost function.  For  the  most  widely   used  cost
  163.      functions,  the  problem  has  been shown to be NP-complete.  Several
  164.      attempts have been made using SA:
  165.      Multiple Sequence Alignment Using SA J. Kim, Sakti Pramanik and  M.J.
  166.      Chung, CABIOS, 1994, vol 10, 4, 419-426
  167.  
  168.      Multiple  Sequence Alignment by Parallel SA M. Isshikawa, T. Koya and
  169.      al, CABIOS, 1993,vol 9, 3, 267-273
  170.  
  171.      SAM, software which uses Hidden Markov Models for  Multiple  Sequence
  172.      Alignment,  can  use  SA to train the model. Several papers have been
  173.      published on SAM.   The  software,  documentation  and  an  extensive
  174.      bibliography           can           be           found           in:
  175.      http://www.cse.ucsc.edu/research/compbio/sam.html
  176.  
  177.      More recently, various software using different  methods  like  Gibbs
  178.      sampling or GAs has been developed:
  179.  
  180.      A Gibbs Sampling Strategy for Multiple Alignment C.E. Lawrence, S. F.
  181.      Altschull and al, Science, October 1993, vol 262, 208-214
  182.  
  183.      SAGA: Sequence Alignment by Genetic Algorithm C. Notredame  and  D.G.
  184.      Higgins, Nucleic Acid Research, 1995, vol 24, 8,
  185.       1515-1524
  186.  
  187.      A   beta  release  of SAGA (along with the paper) is available on the
  188.      European   Bioinformatics    Institute    anonymous    FTP    server:
  189.      ftp.ebi.ac.uk/pub/software/unix/saga.tar.Z
  190.  
  191.  CELLULAR PROGRAMMING: Evolution of Parallel Cellular Machines
  192.      Nature  abounds  in systems involving the actions of simple, locally-
  193.      interacting  components,  that  give  rise  to   coordinated   global
  194.      behavior.   These collective systems have evolved by means of natural
  195.      SELECTION  to  exhibit  striking  problem-solving  capacities,  while
  196.      functioning  within a complex, dynamic ENVIRONMENT.  Employing simple
  197.      yet versatile parallel cellular  models,  coupled  with  EVOLUTIONARY
  198.      COMPUTATION  techniques,  cellular  programming  is  an  approach for
  199.      constructing man-made systems that exhibit  characteristics  such  as
  200.      those manifest by their natural counterparts.
  201.  
  202.      Parallel  cellular  machines  hold  potential both scientifically, as
  203.      vehicles for studying phenomena of interest in areas such as  complex
  204.      adaptive  systems  and  ARTIFICIAL  LIFE,  as  well  as  practically,
  205.      enabling  the   construction   of   novel   systems,   endowed   with
  206.      evolutionary,  reproductive, regenerative, and learning capabilities.
  207.  
  208.      Web site: http://lslwww.epfl.ch/~moshes/cp.html
  209.  
  210.      References:
  211.  
  212.      Sipper, M. (1997)  "Evolution  of  Parallel  Cellular  Machines:  The
  213.      Cellular Programming Approach", Springer-Verlag, Heidelberg.
  214.  
  215.      Sipper,  M.  (1996)  "Co-evolving  Non-Uniform  Cellular  Automata to
  216.      Perform Computations", Physica D, 92, 193-208.
  217.  
  218.      Sipper, M. and  Ruppin,  E.  (1997)  "Co-evolving  architectures  for
  219.      cellular machines", Physica D, 99, 428-441.
  220.  
  221.      Sipper,  M.  and  Tomassini,  M.  (1996)  "Generating Parallel Random
  222.      Number Generators By Cellular Programming", International Journal  of
  223.      Modern Physics C, 7(2), 181-190.
  224.      Sipper, M. (1997) "Evolving Uniform and Non-uniform Cellular Automata
  225.      Networks", in Annual Reviews of Computational  Physics,  D.  Stauffer
  226.      (ed)
  227.  
  228.  Evolvable Hardware
  229.      The  idea  of  evolving  machines, whose origins can be traced to the
  230.      cybernetics movement  of  the  1940s  and  the  1950s,  has  recently
  231.      resurged in the form of the nascent field of bio-inspired systems and
  232.      evolvable hardware. The field draws on ideas  from  the  EVOLUTIONARY
  233.      COMPUTATION   domain  as  well  as  on  novel  hardware  innovations.
  234.      Recently, the term evolware has been used to describe  such  evolving
  235.      ware,  with  current  implementations  centering  on  hardware, while
  236.      raising the possibility of using other forms in the future,  such  as
  237.      bioware.   The  inaugural  workshop, Towards Evolvable Hardware, took
  238.      place  in  Lausanne,  in  October  1995,  followed   by   the   First
  239.      International  Conference  on  Evolvable  Systems:  From  Biology  to
  240.      Hardware (ICES96) held in Japan, in October 1996. Another major event
  241.      in the field, ICES98, was held in Lausanne, Switzerland, in September
  242.      1998.
  243.  
  244.      References:
  245.  
  246.      Sipper, M. et al (1997) "A Phylogenetic, Ontogenetic, and  Epigenetic
  247.      View   of   Bio-Inspired  Hardware  Systems",  IEEE  Transactions  on
  248.      Evolutionary Computation, 1(1).
  249.  
  250.      Sanchez,  E.  and  Tomassini,  M.  (eds)  (1996)  "Towards  Evolvable
  251.      Hardware",  Springer-Verlag, Lecture Notes in Computer Science, 1062.
  252.  
  253.      Higuchi,  T.  et  al  (1997)  "Proceedings  of  First   International
  254.      Conference  on Evolvable Systems: From Biology to Hardware (ICES96)",
  255.      Springer-Verlag, Lecture Notes in Computer Science.
  256.  
  257.  GAME PLAYING
  258.      GAs can be used to  evolve  behaviors  for  playing  games.  Work  in
  259.      evolutionary  GAME  THEORY  typically  surrounds  the  EVOLUTION of a
  260.      POPULATION of players who meet randomly to play a game in which  they
  261.      each  must  adopt  one  of  a limited number of moves. (Maynard-Smith
  262.      1982).  Let's suppose it is just two moves,  X  and  Y.  The  players
  263.      receive  a reward, analogous to Darwinian FITNESS, depending on which
  264.      combination of moves occurs and which  move  they  adopted.  In  more
  265.      complicated models there may be several players and several moves.
  266.  
  267.      The  players  iterate such a game a series of times, and then move on
  268.      to a new partner. At the end of all such moves, the players will have
  269.      a cumulative payoff, their fitness.  This fitness can then be used to
  270.      generate a new population.
  271.  
  272.      The real key in using a  GA  is  to  come  up  with  an  encoding  to
  273.      represent  player's strategies, one that is amenable to CROSSOVER and
  274.      to MUTATION.  Possibilities are to suppose at each iteration a player
  275.      adopts  X with some probability (and Y with one minus such). A player
  276.      can thus be represented as a real number, or  a  bit-string  suitably
  277.      interpreted as a probability
  278.  
  279.      An  alternative  characterisation  is  to model the players as Finite
  280.      State Machines, or Finite Automata (FA). These can be though of as  a
  281.      simple  flow chart governing behaviour in the "next" play of the game
  282.      depending upon previous plays. For example:
  283.  
  284.       100 Play X
  285.       110 If opponent plays X go to 100
  286.       120 Play Y
  287.       130 If opponent plays X go to 100 else go to 120
  288.      represents a strategy that does whatever its opponent did  last,  and
  289.      begins  by  playing  X,  known as "Tit-For-Tat." (Axelrod 1982). Such
  290.      machines can readily be encoded as bit-strings. Consider the encoding
  291.      "1  0  1  0 0 1" to represent TFT.  The first three bits, "1 0 1" are
  292.      state 0. The first bit, "1" is interpreted as "Play  X."  The  second
  293.      bit,  "0"  is interpreted as "if opponent plays X go to state 1," the
  294.      third bit, "1", is interpreted as "if the opponent  plays  Y,  go  to
  295.      state  1."   State 1 has a similar interpretation. Crossing over such
  296.      bit-strings always yields valid strategies.
  297.      SIMULATIONs in the Prisoner's dilemma have been  undertaken  (Axelrod
  298.      1987, Fogel 1993, Miller 1989) of these machines.
  299.  
  300.      Alternative   representations  of  game  players  include  CLASSIFIER
  301.      SYSTEMs (Marimon, McGrattan and Sargent 1990, [GOLD89]), and  Neural-
  302.      networks  (Fogel and Harrald 1994), though not necessarily with a GA.
  303.      (Fogel  1993),  and  Fogel  and  Harrald  1994  use  an  Evolutionary
  304.      Program).  Chellapilla and Fogel (1999) have evolved a neural network
  305.      which can play checkers (draughts) at near expert level.
  306.  
  307.      Other methods of evolving a population can be found in Lindgren 1991,
  308.      Glance and Huberman 1993 and elsewhere.
  309.  
  310.      A  GA  for  playing  the  game  "Mastermind"  has  been produced. See
  311.      http://kal-el.ugr.es/mastermind
  312.  
  313.      References.
  314.  
  315.      Axelrod, R. (1987) ``The Evolution  of  Strategies  in  the  Repeated
  316.      Prisoner's Dilemma,'' in [DAVIS91]
  317.  
  318.      Axelrod,  R  (?) ``The Complexity of Cooperation'' (See the web site,
  319.      which     includes      code      to      implement      tournaments:
  320.      http://pscs.physics.lsa.umich.edu/Software/ComplexCoop.html )
  321.  
  322.      Chellapilla,  K. and Fogel, D.B. (1999) ``Evolution, neural networks,
  323.      games, and intelligence'' , Proc. IEEE, Sept., pp. 1471-1496.
  324.  
  325.      Miller, J.H. (1989) ``The Coevolution of  Automata  in  the  Repeated
  326.      Prisoner's Dilemma'' Santa Fe Institute Working Paper 89-003.
  327.  
  328.      Marimon,  Ramon, Ellen McGrattan and Thomas J. Sargent (1990) ``Money
  329.      as a Medium of Exchange in an Economy with  Artificially  Intelligent
  330.      Agents'' Journal of Economic Dynamics and Control 14, pp. 329--373.
  331.  
  332.      Maynard-Smith, (1982) Evolution and the Theory of Games, CUP.
  333.  
  334.      Lindgren, K. (1991) ``Evolutionary Phenomena in Simple Dynamics,'' in
  335.      [ALIFEI].
  336.  
  337.      Holland, J.H and John Miller (1990) ``Artificially Adaptive Agents in
  338.      Economic  Theory,''  American Economic Review: Papers and Proceedings
  339.      of the 103rd Annual Meeting of the  American  Economics  Association:
  340.      365--370.
  341.  
  342.      Huberman,  Bernado,  and  Natalie  S.  Glance  (1993)  "Diversity and
  343.      Collective  Action"   in   H.   Haken   and   A.   Mikhailov   (eds.)
  344.      Interdisciplinary Approaches to Nonlinear Systems, Springer.
  345.  
  346.      Fogel  (1993)  "Evolving Behavior in the Iterated Prisoner's Dilemma"
  347.      Evolutionary Computation 1:1, 77-97
  348.  
  349.      Fogel, D.B. and Harrald, P. (1994) ``Evolving  Complex  Behaviour  in
  350.      the  Iterated  Prisoner's Dilemma,'' Proceedings of the Fourth Annual
  351.      Meetings of the Evolutionary Programming Society, L.J. Fogel and A.W.
  352.      Sebald eds., World Science Press.
  353.  
  354.      Lindgren,  K. and Nordahl, M.G.  "Cooperation and Community Structure
  355.      in Artificial Ecosystems", Artificial Life, vol 1:1&2, 15-38
  356.      Stanley, E.A.,  Ashlock,  D.  and  Tesfatsion,  L.  (1994)  "Iterated
  357.      Prisoners  Dilemma  with Choice and Refusal of Partners in [ALIFEIII]
  358.      131-178
  359.  
  360.  JOB-SHOP SCHEDULING
  361.      The Job-Shop Scheduling  Problem  (JSSP)  is  a  very  difficult  NP-
  362.      complete problem which, so far, seems best addressed by sophisticated
  363.      branch and bound search techniques.   GA  researchers,  however,  are
  364.      continuing  to  make  progress  on  it.   (Davis  85)  started off GA
  365.      research on  the  JSSP,  (Whitley  89)  reports  on  using  the  edge
  366.      RECOMBINATION operator (designed initially for the TSP) on JSSPs too.
  367.      More recent work includes (Nakano 91),(Yamada & Nakano 92), (Fang  et
  368.      al.  93).   The  latter  three  report increasingly better results on
  369.      using GAs on fairly large benchmark JSSPs (from Muth & Thompson  63);
  370.      neither  consistently  outperform branch & bound search yet, but seem
  371.      well on the way. A crucial aspect  of  such  work  (as  with  any  GA
  372.      application)  is  the  method  used to encode schedules. An important
  373.      aspect of some of the recent work on this is that better results have
  374.      been  obtained  by  rejecting the conventional wisdom of using binary
  375.      representations  (as  in  (Nakano  91))  in  favor  of  more   direct
  376.      encodings.  In  (Yamada  & Nakano 92), for example, a GENOME directly
  377.      encodes operation completion times, while in (Fang et al. 93) genomes
  378.      represent  implicit instructions for building a schedule. The success
  379.      of these latter techniques, especially since their  applications  are
  380.      very  important  in  industry, should eventually spawn advances in GA
  381.      theory.
  382.  
  383.      Concerning the point of using GAs at all on hard job-shop  scheduling
  384.      problems,  the  same  goes here as suggested above for `Timetabling':
  385.      The  GA  approach  enables  relatively  arbitrary   constraints   and
  386.      objectives  to  be incorporated painlessly into a single OPTIMIZATION
  387.      method.  It  is  unlikely  that  GAs  will   outperform   specialized
  388.      knowledge-based  and/or  conventional  OR-based  approaches  to  such
  389.      problems in terms of raw solution quality,  however  GAs  offer  much
  390.      greater  simplicity  and flexibility, and so, for example, may be the
  391.      best method for quick high-quality solutions, rather than finding the
  392.      best  possible  solution at any cost. Also, of course, hybrid methods
  393.      will have a lot to offer, and GAs are far easier to parallelize  than
  394.      typical knowledge-based/OR methods.
  395.  
  396.      Similar  to  the  JSSP  is  the  Open Shop Scheduling Problem (OSSP).
  397.      (Fang et al. 93) reports an initial attempt at using  GAs  for  this.
  398.      Ongoing  results  from  the same source shows reliable achievement of
  399.      results within less than 0.23% of optimal on moderately  large  OSSPs
  400.      (so  far,  up  to  20x20), including an improvement on the previously
  401.      best known solution for a benchmark 10x10 OSSP. A simpler form of job
  402.      shop  problem  is the Flow-Shop Sequencing problem; recent successful
  403.      work on applying GAs to this includes (Reeves 93)."
  404.  
  405.      Other scheduling problems
  406.  
  407.      In contrast  to  job  shop  scheduling  some  maintenance  scheduling
  408.      problems  consider  which  activities  to  schedule  within a planned
  409.      maintenance period, rather than seeking to minimise  the  total  time
  410.      taken  by the activities. The constraints on which parts may be taken
  411.      out of service for  maintenance  at  particular  times  may  be  very
  412.      complex,  particularly as they will in general interact. Some initial
  413.      work is given in (Langdon, 1995).
  414.  
  415.      References
  416.  
  417.      Davis, L.  (1985)  "Job-Shop  Scheduling  with  Genetic  Algorithms",
  418.      [ICGA85], 136-140.
  419.  
  420.      Muth,  J.F. & Thompson, G.L. (1963) "Industrial Scheduling". Prentice
  421.      Hall, Englewood Cliffs, NJ, 1963.
  422.      Nakano, R.  (1991)  "Conventional  Genetic  Algorithms  for  Job-Shop
  423.      Problems", [ICGA91], 474-479.
  424.  
  425.      Reeves,  C.R.  (1993)  "A Genetic Algorithm for Flowshop Sequencing",
  426.      Coventry Polytechnic Working Paper, Coventry, UK.
  427.  
  428.      Whitley, D., Starkweather,  T.  &  D'Ann  Fuquay  (1989)  "Scheduling
  429.      Problems  and  Traveling  Salesmen:  The  Genetic  Edge Recombination
  430.      Operator", [ICGA89], 133-140.
  431.  
  432.      Fang, H.-L., Ross,  P.,  &  Corne  D.  (1993)  "A  Promising  Genetic
  433.      Algorithm  Approach  to Job-Shop Scheduling, Rescheduling & Open-Shop
  434.      Scheduling Problems", [ICGA93], 375-382.
  435.  
  436.      Yamada, T. & Nakano, R. (1992) "A  Genetic  Algorithm  Applicable  to
  437.      Large-Scale Job-Shop Problems", [PPSN92], 281-290.
  438.  
  439.      Langdon,  W.B.  (1995)  "Scheduling  Planned  Maintenance of the (UK)
  440.      National Grid", cs.ucl.ac.uk/genetic/papers/grid_aisb-95.ps
  441.  
  442.  MANAGEMENT SCIENCES
  443.      "Applications of EA in management science and closely related  fields
  444.      like organizational ecology is a domain that has been covered by some
  445.      EA researchers - with considerable bias towards scheduling  problems.
  446.      Since  I believe that EA have considerable potential for applications
  447.      outside  the  rather  narrow  domain  of   scheduling   and   related
  448.      combinatorial  problems,  I  started  collecting references about the
  449.      status quo of EA-applications in  management  science.   This  report
  450.      intends  to  make  available  my findings to other researchers in the
  451.      field. It is a short  overview  and  lists  some  230  references  to
  452.      current as well as finished research projects.  [..]
  453.  
  454.      "At  the end of the paper, a questionnaire has been incorporated that
  455.      may be used for this purpose. Other comments are also appreciated."
  456.  
  457.      --- from the Introduction of (Nissen 93)
  458.  
  459.      References
  460.  
  461.      Nissen, V. (1993) "Evolutionary Algorithms in Management Science:  An
  462.      Overview  and List of References", Papers on Economics and Evolution,
  463.      edited by the European Study Group for Evolutionary Economics.   This
  464.      report     is     also     avail.     via     anon.      FTP     from
  465.      ftp.gwdg.de/pub/msdos/reports/wi/earef.eps
  466.  
  467.      Boulding, K.E. (1991) "What is evolutionary economics?",  Journal  of
  468.      Evolutionary Economics, 1, 9-17.
  469.  
  470.  NON-LINEAR FILTERING
  471.      New  connections  between GENETIC ALGORITHMs and Non Linear Filtering
  472.      Theory have been established.  GAs  have  already  been  successfully
  473.      applied  to  a  large  class of non-linear filtering problems such as
  474.      RADAR / SONAR/ GPS signal processing.  This relatively new branch  of
  475.      GA  application  has  also  lead to new results on the convergence of
  476.      GAs: large deviations, fluctuations...
  477.  
  478.      Some preprints and references on this topic are available in the  web
  479.      page: http://www-sv.cict.fr/lsp/Delmoral/index.html
  480.  
  481.      The  new  results  also  points out some natural connections between:
  482.      genetic type algorithms,  information  theory,  non-linear  filtering
  483.      theory, interacting and branching particle systems.
  484.  
  485.  TIMETABLING
  486.      This  has  been addressed quite successfully with GAs.  A very common
  487.      manifestation of this kind of problem is the timetabling of exams  or
  488.      classes in Universities, etc.
  489.  
  490.      The  first application of GAs to the timetabling problem was to build
  491.      the schedule  of  the  teachers  in  an  Italian  high  school.   The
  492.      research,  conducted at the Department of Electronics and Information
  493.      of Politecnico di Milano, Italy, showed that a GA was as good as Tabu
  494.      Search,  and  better  than  simulated  annealing,  at finding teacher
  495.      schedules satisfying a number of  hard  and  soft  constraints.   The
  496.      software package developed is now in current use in some high schools
  497.      in Milano. (Colorni et al 1990)
  498.  
  499.      At  the  Department  of  Artificial   Intelligence,   University   of
  500.      Edinburgh, timetabling the MSc exams is now done using a GA (Corne et
  501.      al. 93, Fang 92). An example  of  the  use  of  GAs  for  timetabling
  502.      classes is (Abramson & Abela 1991).
  503.  
  504.      In  the  exam  timetabling  case,  the  FITNESS function for a GENOME
  505.      representing a timetable involves computing degrees of punishment for
  506.      various  problems  with  the timetable, such as clashes, instances of
  507.      students having to take  consecutive  exams,  instances  of  students
  508.      having  (eg)  three  or  more  exams  in one day, the degree to which
  509.      heavily-subscribed exams occur late in  the  timetable  (which  makes
  510.      marking harder), overall length of timetable, etc. The modular nature
  511.      of the fitness function has the key to the main potential strength of
  512.      using  GAs  for  this  sort of thing as opposed to using conventional
  513.      search and/or constraint programming methods. The  power  of  the  GA
  514.      approach  is  the  ease  with  which it can handle arbitrary kinds of
  515.      constraints and  objectives;  all  such  things  can  be  handled  as
  516.      weighted  components of the fitness function, making it easy to adapt
  517.      the GA to the  particular  requirements  of  a  very  wide  range  of
  518.      possible overall objectives . Very few other timetabling methods, for
  519.      example, deal with such objectives at all, which shows how  difficult
  520.      it  is  (without  GAs)  to  graft  the  capacity  to handle arbitrary
  521.      objectives onto the basic "find shortest- length  timetable  with  no
  522.      clashes"  requirement.  The  proper  way  to  weight/handle different
  523.      objectives in the fitness function in  relation  to  the  general  GA
  524.      dynamics remains, however, an important research problem!
  525.  
  526.      GAs thus offer a combination of simplicity, flexibility & speed which
  527.      competes very favorably with other approaches, but  are  unlikely  to
  528.      outperform   knowledge-based  (etc)  methods  if  the  best  possible
  529.      solution is required at any cost. Even then,  however,  hybridisation
  530.      may yield the best of both worlds; also, the ease (if the hardware is
  531.      available!)  of implementing GAs in parallel enhances the possibility
  532.      of  using  them for good, fast solutions to very hard timetabling and
  533.      similar problems.
  534.  
  535.      References
  536.  
  537.      Abramson & Abela (1991) "A Parallel Genetic Algorithm for Solving the
  538.      School  Timetabling  Problem",  Technical  Report,  Division of I.T.,
  539.      C.S.I.R.O,  April  1991.   (Division   of   Information   Technology,
  540.      C.S.I.R.O.,  c/o  Dept.  of  Communication  & Electronic Engineering,
  541.      Royal Melbourne Institute of  Technology,  PO  BOX  2476V,  Melbourne
  542.      3001, Australia)
  543.  
  544.      Colorni  A.,  M. Dorigo & V. Maniezzo (1990).  Genetic Algorithms And
  545.      Highly Constrained Problems: The Time-Table Case. Proceedings of  the
  546.      First International Workshop on Parallel Problem Solving from Nature,
  547.      Dortmund, Germany, Lecture Notes in Computer Science  496,  Springer-
  548.      Verlag,                                                        55-59.
  549.      http://iridia.ulb.ac.be/dorigo/dorigo/conferences/IC.01-PPSN1.ps.gz
  550.  
  551.      Colorni A., M. Dorigo & V. Maniezzo (1990).   Genetic  Algorithms:  A
  552.      New  Approach  to  the Time-Table Problem. NATO ASI Series, Vol.F 82,
  553.      COMBINATORIAL OPTIMIZATION,  (Ed.  M.Akguel  and  others),  Springer-
  554.      Verlag,                                                      235-239.
  555.      http://iridia.ulb.ac.be/dorigo/dorigo/conferences/IC.02-NATOASI90.ps.gz
  556.  
  557.      Colorni  A.,  M. Dorigo & V. Maniezzo (1990).  A Genetic Algorithm to
  558.      Solve  the  Timetable  Problem.    Technical   Report   No.   90-060,
  559.      Politecnico               di              Milano,              Italy.
  560.      http://iridia.ulb.ac.be/dorigo/dorigo/tec.reps/TR.01-TTP.ps.gz
  561.      Corne, D. Fang, H.-L. & Mellish, C. (1993) "Solving the Modular  Exam
  562.      Scheduling  Problem  with  Genetic  Algorithms".   Proc. of 6th Int'l
  563.      Conf.  on  Industrial  and  Engineering  Applications  of  Artificial
  564.      Intelligence & Expert Systems, ISAI.
  565.  
  566.      Fang,   H.-L.   (1992)   "Investigating   GAs  for  scheduling",  MSc
  567.      Dissertation,   University   of   Edinburgh   Dept.   of   Artificial
  568.      Intelligence, Edinburgh, UK.
  569.  
  570. ------------------------------
  571.  
  572. Subject: Q3: Who is concerned with EAs?
  573.  
  574.      EVOLUTIONARY  COMPUTATION  attracts  researchers  and people of quite
  575.      dissimilar disciplines, i.e.   EC  is  a  interdisciplinary  research
  576.      field:
  577.  
  578.  Computer scientists
  579.      Want  to  find  out  about the properties of sub-symbolic information
  580.      processing with EAs and about learning,  i.e.   adaptive  systems  in
  581.      general.
  582.  
  583.      They   also  build  the  hardware  necessary  to  enable  future  EAs
  584.      (precursors are already beginning  to  emerge)  to  huge  real  world
  585.      problems,  i.e. the term "massively parallel computation" [HILLIS92],
  586.      springs to mind.
  587.  
  588.  Engineers
  589.      Of many kinds want to exploit the capabilities of EAs on  many  areas
  590.      to solve their application, esp.  OPTIMIZATION problems.
  591.  
  592.  Roboticists
  593.      Want  to  build  MOBOTs (MOBile ROBOTs, i.e. R2D2's and #5's cousins)
  594.      that navigate through uncertain ENVIRONMENTs, without using  built-in
  595.      "maps".   The  MOBOTS  thus  have to adapt to their surroundings, and
  596.      learn what they can do "move-through-door" and what they can't "move-
  597.      through-wall" on their own by "trial-and-error".
  598.  
  599.  Cognitive scientists
  600.      Might view CFS as a possible apparatus to describe models of thinking
  601.      and cognitive systems.
  602.  
  603.  Physicists
  604.      Use EC hardware, e.g. Hillis' (Thinking Machine  Corp.'s)  Connection
  605.      Machine  to  model  real  world  problems  which include thousands of
  606.      variables, that run "naturally" in parallel, and thus can be modelled
  607.      more  easily  and  esp.   "faster"  on  a parallel machine, than on a
  608.      serial "PC" one.
  609.  
  610.  Biologists
  611.      Are finding EAs useful when it comes to  protein  folding  and  other
  612.      such bio-computational problems (see Q2).
  613.  
  614.      EAs  can  also  be used to model the behaviour of real POPULATIONs of
  615.      organisms.  Some biologists are hostile to modeling,  but  an  entire
  616.      community  of  Population  Biologists  arose  with  the 'evolutionary
  617.      synthesis' of the 1930's created by the polymaths R.A. Fisher, J.B.S.
  618.      Haldane,  and  S.  Wright.   Wright's SELECTION in small populations,
  619.      thereby avoiding  local  optima)  is  of  current  interest  to  both
  620.      biologists and ECers -- populations are naturally parallel.
  621.  
  622.      A  good  exposition  of  current  population  Biology  modeling is J.
  623.      Maynard Smith's text Evolutionary Genetics.  Richard Dawkin's Selfish
  624.      Gene and Extended Phenotype are unparalleled (sic!) prose expositions
  625.      of  evolutionary  processes.   Rob  Collins'  papers  are   excellent
  626.      parallel  GA  models of evolutionary processes (available in [ICGA91]
  627.      and by FTP from ftp.cognet.ucla.edu/pub/alife/papers/ ).
  628.  
  629.      As fundamental motivation, consider Fisher's comment:  "No  practical
  630.      biologist  interested  in  (e.g.) sexual REPRODUCTION would be led to
  631.      work out the detailed consequences experienced  by  organisms  having
  632.      three  or more sexes; yet what else should [s/]he do if [s/]he wishes
  633.      to understand why the sexes are, in fact, always
  634.       two?"  (Three sexes would make  for  even  weirder  grammar,  [s/]he
  635.      said...)
  636.  
  637.  Chemists
  638.      And  in particular biochemists and molecular chemists, are interested
  639.      in problems such as the conformational analysis of molecular clusters
  640.      and  related  problems in molecular sciences.  The application of GAs
  641.      to molecular systems has opened an interesting area of  research  and
  642.      the number of chemists involved in it increases day-by-day.
  643.  
  644.      Some typical research topics include:
  645.  
  646.      o  protein    folding;   o   conformational   analysis   and   energy
  647.     minimization; o docking algorithms for drug-design; o solvent site
  648.     prediction in macromolecules;
  649.      Several  papers  have  been  published in journals such as Journal of
  650.      Computational Chemistry and Journal of Computer-Aided Design.
  651.  
  652.      Some interesting WWW sites related to  the  applications  of  GAs  to
  653.      chemistry (or molecular science in general) include:
  654.  
  655.      o  http://garage.cps.msu.edu/projects/biochem/biochem.html  about GAs
  656.     in biochemistry (water site prediction,  drug-design  and  protein
  657.     folding);                                                        o
  658.     http://www.tc.cornell.edu/Edu/SPUR/SPUR94/Main/John.html about the
  659.     application  of GAs to the search of conformational energy minima;
  660.     o http://cmp.ameslab.gov/cmp/CMP_Theory/gsa/gen2.html By  using  a
  661.     GA in combiation with a Tight-binding model, David Deaven and Kai-
  662.     Ming Ho founded fullerene  cages  (including  C60)  starting  from
  663.     random coordinates.
  664.      See also Q2 for applications in biocomputing.
  665.  
  666.  Philosophers
  667.      and some other really curious people may also be interested in EC for
  668.      various reasons.
  669.  
  670. ------------------------------
  671.  
  672. Subject: Q4: How many EAs exist? Which?
  673.  
  674.  The All Stars
  675.      There  are  currently  3  main  paradigms  in  EA  research:  GENETIC
  676.      ALGORITHMs,   EVOLUTIONARY  PROGRAMMING,  and  EVOLUTION  STRATEGIEs.
  677.      CLASSIFIER SYSTEMs and GENETIC PROGRAMMING are OFFSPRING  of  the  GA
  678.      community.   Besides  this  leading  crop,  there  are numerous other
  679.      different approaches, alongside hybrid experiments, i.e. there  exist
  680.      pieces  of software residing in some researchers computers, that have
  681.      been described in papers in conference proceedings, and  may  someday
  682.      prove  useful  on certain tasks. To stay in EA slang, we should think
  683.      of these evolving strands as BUILDING BLOCKs,  that  when  recombined
  684.      someday,  will  produce  new  offspring  and  give  birth  to  new EA
  685.      paradigm(s).
  686.  
  687.      One such interesting offspring is the Memetic Algorithm.  This  is  a
  688.      hybrid  evolutionary  algorithm,  which  makes  use  of  local search
  689.      operators.               For               details,               see
  690.      http://www.densis.fee.unicamp.br/~moscato/memetic_home.html
  691.  
  692.  Promising Rookies
  693.      As  far  as  "solving complex function and COMBINATORIAL OPTIMIZATION
  694.      tasks" is concerned, Davis' work on real-valued  representations  and
  695.      adaptive operators should be mentioned (Davis 89). Moreover Whitley's
  696.      Genitor system incorporating ranking  and  "steady  state"  mechanism
  697.      (Whitley    89),    Goldberg's   "messy   GAs",   involves   adaptive
  698.      representations (Goldberg 91), and Eshelman's CHC algorithm (Eshelman
  699.      91).   For  real  FUNCTION OPTIMIZATION, Differential EVOLUTION seems
  700.      hard to beat in terms of convergence speed  as  well  as  simplicity:
  701.      With just three control variables, tuning is particularly easy to do.
  702.  
  703.      For  "the  design  of  robust  learning  systems",  i.e.  the   field
  704.      characterized  by  CFS,  Holland's (1986) CLASSIFIER SYSTEM, with its
  705.      state-of-the-art implementation CFS-C  (Riolo  88),  we  should  note
  706.      developments  in  SAMUEL  (Grefenstette  89), GABIL (De Jong & Spears
  707.      91), and GIL (Janikow 91).
  708.  
  709.      References
  710.  
  711.      Davis,  L.  (1989)  "Adapting  operator  probabilities   in   genetic
  712.      algorithms", [ICGA89], 60-69.
  713.  
  714.      De  Jong  K.A.  &  Spears  W. (1991) "Learning concept classification
  715.      rules using genetic algorithms". Proc. 12th IJCAI,  651-656,  Sydney,
  716.      Australia: Morgan Kaufmann.
  717.  
  718.      Dorigo  M.  &  E.  Sirtori (1991)."ALECSYS: A Parallel Laboratory for
  719.      Learning Classifier Systems". Proceedings of the Fourth International
  720.      Conference  on  Genetic  Algorithms, San Diego, California, R.K.Belew
  721.      and L.B.Booker (Eds.), Morgan Kaufmann, 296-302.
  722.  
  723.      Dorigo M. (1995). "ALECSYS and the AutonoMouse: Learning to Control a
  724.      Real  Robot by Distributed Classifier Systems". Machine Learning, 19,
  725.      3, 209-240.
  726.  
  727.      Eshelman, L.J. et al. (1991)  "Preventing  premature  convergence  in
  728.      genetic algorithms by preventing incest", [ICGA91], 115-122.
  729.  
  730.      Goldberg,  D. et al. (1991) "Don't worry, be messy", [ICGA91], 24-30.
  731.  
  732.      Grefenstette, J.J. (1989) "A system for learning  control  strategies
  733.      with genetic algorithms", [ICGA89], 183-190.
  734.  
  735.      Holland,  J.H.  (1986)  "Escaping  brittleness:  The possibilities of
  736.      general-purpose learning algorithms applied  to  parallel  rule-based
  737.      systems".   In R. Michalski, J. Carbonell, T. Mitchell (eds), Machine
  738.      Learning: An Artificial  Intelligence  Approach.  Los  Altos:  Morgan
  739.      Kaufmann.
  740.  
  741.      Janikow   C.  (1991)  "Inductive  learning  of  decision  rules  from
  742.      attribute-based examples:  A  knowledge-intensive  Genetic  Algorithm
  743.      approach". TR91-030, The University of North Carolina at Chapel Hill,
  744.      Dept. of Computer Science, Chapel Hill, NC.
  745.  
  746.      Riolo,  R.L.  (1988)  "CFS-C:  A  package   of   domain   independent
  747.      subroutines  for  implementing classifier systems in arbitrary, user-
  748.      defined  environments".   Logic  of  computers  group,  Division   of
  749.      computer science and engineering, University of Michigan.
  750.  
  751.      Whitley,  D.  et  al.  (1989)  "The  GENITOR  algorithm and selection
  752.      pressure: why rank-based allocation of reproductive trials is  best",
  753.      [ICGA89], 116-121.
  754.  
  755. ------------------------------
  756.  
  757. Subject: Q4.1: What about Alife systems, like Tierra and VENUS?
  758.  
  759.      None  of  these  are EVOLUTIONARY ALGORITHMs, but all of them use the
  760.      evolutionary metaphor as their "playing field".
  761.  
  762.  Tierra
  763.      Synthetic organisms have been created based on a computer metaphor of
  764.      organic  life in which CPU time is the ``energy'' resource and memory
  765.      is the ``material'' resource.  Memory is organized into informational
  766.      patterns  that  exploit  CPU  time  for  self-replication.   MUTATION
  767.      generates new forms, and EVOLUTION proceeds by natural  SELECTION  as
  768.      different GENOTYPEs compete for CPU time and memory space.
  769.  
  770.      Observation  of  nature  shows that evolution by natural selection is
  771.      capable of both OPTIMIZATION and creativity.   Artificial  models  of
  772.      evolution  have  demonstrated the optimizing ability of evolution, as
  773.      exemplified by the field of GENETIC ALGORITHMs.  The creative aspects
  774.      of evolution have been more elusive to model.  The difficulty derives
  775.      in part from a tendency of models  to  specify  the  meaning  of  the
  776.      ``genome''  of  the  evolving  entities, precluding new meanings from
  777.      emerging.  I will present a natural model of evolution  demonstrating
  778.      both  optimization  and  creativity,  in which the GENOME consists of
  779.      sequences of executable machine code.
  780.  
  781.      From a single rudimentary ancestral ``creature'', very quickly  there
  782.      evolve  parasites,  which  are  not  able  to  replicate in isolation
  783.      because they lack a large portion  of  the  genome.   However,  these
  784.      parasites  search  for the missing information, and if they locate it
  785.      in a nearby creature, parasitize the information from the neighboring
  786.      genome, thereby effecting their own replication.
  787.  
  788.      In  some  runs,  hosts  evolve immunity to attack by parasites.  When
  789.      immune hosts appear, they often increase  in  frequency,  devastating
  790.      the  parasite POPULATIONs.  In some runs where the community comes to
  791.      be dominated by immune hosts, parasites evolve that are resistant  to
  792.      immunity.
  793.  
  794.      Hosts  sometimes  evolve  a  response  to  parasites that goes beyond
  795.      immunity,  to  actual  (facultative)  hyper-parasitism.   The  hyper-
  796.      parasite  deceives  the  parasite  causing the parasite to devote its
  797.      energetic resources to  replication  of  the  hyper-parastie  genome.
  798.      This  drives the parasites to extinction.  Evolving in the absence of
  799.      parasites,  hyper-parasites  completely   dominate   the   community,
  800.      resulting  in  a relatively uniform community characterized by a high
  801.      degree   of   relationship   between   INDIVIDUALs.    Under    these
  802.      circumstances,  sociality evolves, in the form of creatures which can
  803.      only replicate in aggregations.
  804.  
  805.      The cooperative behavior of the  social  hyper-parasites  makes  them
  806.      vulnerable to a new class of parasites.  These cheaters, hyper-hyper-
  807.      parasites, insert themselves between cooperating social  individuals,
  808.      deceiving the social creatures, causing them to replicate the genomes
  809.      of the cheaters.
  810.  
  811.      The only genetic change imposed on the simulator is random bit  flips
  812.      in  the  machine  code  of the creatures.  However, it turns out that
  813.      parasites  are  very  sloppy  replicators.   They  cause  significant
  814.      RECOMBINATION  and  rearrangement  of  the genomes.  This spontaneous
  815.      sexuality is a powerful force for evolutionary change in the  system.
  816.  
  817.      One  of the most interesting aspects of this instance of life is that
  818.      the bulk of the evolution  is  based  on  adaptation  to  the  biotic
  819.      ENVIRONMENT rather than the physical environment.  It is co-evolution
  820.      that drives the system.
  821.  
  822.      --- "Tierra announcement" by Tom Ray (1991)
  823.   How to get Tierra?
  824.      Tierra is available (source and executables, for Unix  and  NT)  from
  825.      alife.santafe.edu/pub/SOFTWARE/Tierra
  826.       .
  827.  
  828.      Related work
  829.  
  830.      David Bennett <dmb@pfxcorp.com> reported in March 2000: Much new work
  831.      has   been   done    in    Tierra    since    1993.     Thomas    Ray
  832.      <tray@mail.nhn.ou.edu>  is  now  working in Japan.  I have been using
  833.      another similar system called Avida.  It has some advantages,  and  a
  834.      significant  body  of  research  results.  The  contact  for Avida is
  835.      <avida@krl.caltech.edu>.
  836.  
  837.      References
  838.  
  839.      Ray, T. S. (1991)  "Is it alive, or is it GA?" in [ICGA91], 527--534.
  840.  
  841.      Ray,  T.  S.  (1991)   "An  approach  to  the  synthesis of life." in
  842.      [ALIFEII], 371--408.
  843.  
  844.      Ray, T. S.  (1991)  "Population dynamics of  digital  organisms."  in
  845.      [ALIFEII].
  846.  
  847.      Ray,   T.   S.    (1991)   "Evolution  and  optimization  of  digital
  848.      organisms."  Scientific Excellence in Supercomputing:  The  IBM  1990
  849.      Contest Prize Papers, Eds. Keith R. Billingsley, Ed Derohanes, Hilton
  850.      Brown, III.  Athens, GA, 30602, The Baldwin Press, The University  of
  851.      Georgia.
  852.  
  853.      Ray,  T.  S.   (1992) "Evolution, ecology and optimization of digital
  854.      organisms."  Santa Fe Institute working paper 92-08-042.
  855.  
  856.      Ray, T. S.  "Evolution, complexity, entropy, and artificial reality."
  857.      submitted Physica D.
  858.  
  859.      Ray,  T.  S.   (1993) "An evolutionary approach to synthetic biology,
  860.      Zen and the art of creating life.  Artificial Life 1(1).
  861.  
  862.  VENUS
  863.      Steen Rasmussen's (et al.) VENUS I+II "coreworlds"  as  described  in
  864.      [ALIFEII]  and  [LEVY92],  are  inspired by A.K. Dewdney's well-known
  865.      article (Dewdney 1984). Dewdney proposed a game called  "Core  Wars",
  866.      in  which hackers create computer programs that battle for control of
  867.      a computer's "core" memory (Strack 93).  Since computer programs  are
  868.      just  patterns  of  information, a successful program in core wars is
  869.      one that replicates its pattern within the memory, so that eventually
  870.      most  of  the  memory  contains  its  pattern rather than that of the
  871.      competing program.
  872.  
  873.      VENUS is a modification of Core Wars in which the  Computer  programs
  874.      can  mutate, thus the pseudo assembler code creatures of VENUS evolve
  875.      steadily.  Furthermore  each  memory   location   is   endowed   with
  876.      "resources"  which,  like  sunshine  are  added at a steady state.  A
  877.      program must have sufficient resources in the regions  of  memory  it
  878.      occupies  in  order  to  execute.   The input of resources determines
  879.      whether the VENUS ecosystem is a "jungle" or a "desert."   In  jungle
  880.      ENVIRONMENTs,  Rasmussen  et al. observe the spontaneous emergence of
  881.      primitive "copy/split" organisms starting  from  (structured)  random
  882.      initial conditions.
  883.  
  884.      --- [ALIFEII], p.821
  885.  
  886.      Dewdney,  A.K.  (1984) "Computer Recreations: In the Game called Core
  887.      War Hostile Programs Engage in a Battle of Bits", Sci. Amer.  250(5),
  888.      14-22.
  889.      Farmer  &  Belin  (1992)  "Artificial  Life:  The  Coming Evolution",
  890.      [ALIFEII], 815-840.
  891.  
  892.      Rasmussen, et al. (1990) "The Coreworld: Emergence and  Evolution  of
  893.      Cooperative  Structures  in  a Computational Chemistry", [FORREST90],
  894.      111-134.
  895.  
  896.      Rasmussen,  et  al.  (1992)  "Dynamics   of   Programmable   Matter",
  897.      [ALIFEII], 211-254.
  898.  
  899.      Strack    (1993)    "Core    War   Frequently   Asked   Questions   (
  900.      rec.games.corewar    FAQ)"    Avail.    by    anon.      FTP     from
  901.      rtfm.mit.edu/pub/usenet/news.answers/games/corewar-faq.Z
  902.  
  903.  PolyWorld
  904.      Larry  Yaeger's  PolyWorld as described in [ALIFEIII] and [LEVY92] is
  905.      available          via          anonymous          FTP           from
  906.      alife.santafe.edu/pub/SOFTWARE/Polyworld/
  907.  
  908.      "The  subdirectories in this "polyworld" area contain the source code
  909.      for the PolyWorld ecological simulator, designed and written by Larry
  910.      Yaeger, and Copyright 1990, 1991, 1992 by Apple Computer.
  911.  
  912.      PostScript  versions  of  my ARTIFICIAL LIFE III technical paper have
  913.      now been added to the directory.  These should be directly  printable
  914.      from most machines.  Because some unix systems' "lpr" commands cannot
  915.      handle very large files (ours at least), I have split the paper  into
  916.      Yaeger.ALife3.1.ps and Yaeger.ALife3.2.ps.  These files can be ftp-ed
  917.      in "ascii" mode.  For unix users  I  have  also  included  compressed
  918.      versions  of  both these files (indicated by the .Z suffix), but have
  919.      left the uncompressed versions around for people connecting from non-
  920.      unix  systems.   I  have  not  generated  PostScript  versions of the
  921.      images, because they are color and the resulting files are  much  too
  922.      large  to  store,  retrieve,  or  print.   Accordingly, though I have
  923.      removed a Word-formatted version of the textual  body  of  the  paper
  924.      that  used  to  be  here, I have left a Word-formatted version of the
  925.      color images.  If you wish to acquire it, you will need  to  use  the
  926.      binary transfer mode to move it to first your unix host and then to a
  927.      Macintosh (unless Word on a PC can read it - I don't know),  and  you
  928.      may  need to do something nasty like use ResEdit to set the file type
  929.      and creator to match those of a standard Word document (Type =  WDBN,
  930.      Creator = MSWD).  [..]"
  931.  
  932.      --- from the README by Larry Yaeger <larryy@apple.com>
  933.  
  934.  General Alife repositories?
  935.      Also, all of the following FTP sites carry ALIFE related info:
  936.  
  937.      ftp.cognet.ucla.edu/pub/alife/                                      ,
  938.      life.anu.edu.au/pub/complex_systems/alife/                          ,
  939.      ftp.cogs.susx.ac.uk/pub/reports/csrp/   ,   xyz.lanl.gov/nlin-sys/  ,
  940.      alife.santafe.edu/pub/ .
  941.  
  942. ------------------------------
  943.  
  944. Subject: Q5: What about all this Optimization stuff?
  945.  
  946.      Just think of an OPTIMIZATION problem as a black box.  A large  black
  947.      box.  As  large as, for example, a Coca-Cola vending machine. Now, we
  948.      don't know anything about the inner workings of this  box,  but  see,
  949.      that  there  are some regulators to play with, and of course we know,
  950.      that we want to have a bottle of the real thing...
  951.  
  952.      Putting this everyday problem into a mathematical model,  we  proceed
  953.      as follows:
  954.  
  955.      (1) we  label all the regulators with x and a number starting from 1;
  956.      the result is a vector x, i.e.  (x_1,...,x_n),  where  n  is  the
  957.      number of visible regulators.
  958.  
  959.      (2) we must find an objective function, in this case it's obvious, we
  960.      want to get k bottles of the real thing, where k is equal  to  1.
  961.      [some  might  want  a  "greater or equal" here, but we restricted
  962.      ourselves to the visible regulators (we all know that sometimes a
  963.      "kick  in  the  right  place" gets use more than 1, but I have no
  964.      idea how to put this mathematically...)]
  965.  
  966.      (3) thus, in the language some mathematicians  prefer  to  speak  in:
  967.      f(x)  =  k  =  1. So, what we have here is a maximization problem
  968.      presented in a form we know from some  boring  calculus  lessons,
  969.      and   we   also   know  that  there  at  least  a  dozen  utterly
  970.      uninteresting techniques to solve problems presented this  way...
  971.  
  972.  What can we do in order to solve this problem?
  973.      We  can  either try to gain more knowledge or exploit what we already
  974.      know about the interior of the black box. If the  objective  function
  975.      turns  out  to  be smooth and differentiable, analytical methods will
  976.      produce the exact solution.
  977.  
  978.      If this turns out to be impossible, we  might  resort  to  the  brute
  979.      force  method  of  enumerating the entire SEARCH SPACE.  But with the
  980.      number of possibilities growing exponentially in  n,  the  number  of
  981.      dimensions  (inputs),  this  method  becomes infeasible even for low-
  982.      dimensional spaces.
  983.  
  984.      Consequently, mathematicians  have  developed  theories  for  certain
  985.      kinds  of  problems  leading  to specialized OPTIMIZATION procedures.
  986.      These  algorithms  perform  well  if  the  black  box  fulfils  their
  987.      respective  prerequisites.   For example, Dantzig's simplex algorithm
  988.      (Dantzig 66) probably  represents  the  best  known  multidimensional
  989.      method capable of efficiently finding the global optimum of a linear,
  990.      hence convex, objective function in a search space limited by  linear
  991.      constraints.   (A  USENET  FAQ on linear programming is maintained by
  992.      Professor   Robert   Fourer   <4er@iems.nwu.edu>   (and   "nonlinear-
  993.      programming-faq")  that  is  posted monthly to sci.op-research and is
  994.      mostly interesting to read.  It is also  available  from  http://www-
  995.      unix.mcs.anl.gov/otc/Guide/faq/linear-programming-faq.html )
  996.  
  997.      Gradient  strategies  are  no longer tied to these linear worlds, but
  998.      they smooth their world by exploiting the objective function's  first
  999.      partial  derivatives  one  has to supply in advance. Therefore, these
  1000.      algorithms rely on a locally linear internal model of the black  box.
  1001.  
  1002.      Newton   strategies   additionally   require   the   second   partial
  1003.      derivatives, thus building a quadratic internal model.  Quasi-Newton,
  1004.      conjugate  gradient  and  variable metric strategies approximate this
  1005.      information during the search.
  1006.  
  1007.      The deterministic  strategies  mentioned  so  far  cannot  cope  with
  1008.      deteriorations,  so  the search will stop if anticipated improvements
  1009.      no longer occur. In a multimodal ENVIRONMENT  these  algorithms  move
  1010.      "uphill"  from their respective starting points. Hence, they can only
  1011.      converge to the next local optimum.
  1012.  
  1013.      Newton-Raphson-methods might even diverge if  a  discrepancy  between
  1014.      their  internal assumptions and reality occurs.  But of course, these
  1015.      methods turn out to  be  superior  if  a  given  task  matches  their
  1016.      requirements.  Not relying on derivatives, polyeder strategy, pattern
  1017.      search and rotating coordinate search should also be  mentioned  here
  1018.      because  they  represent  robust  non-linear  optimization algorithms
  1019.      (Schwefel 81).
  1020.  
  1021.      Dealing with technical optimization problems, one will rarely be able
  1022.      to write down the objective function in a closed form.  We often need
  1023.      a SIMULATION model in order to grasp reality.  In general, one cannot
  1024.      even   expect   these   models   to  behave  smoothly.  Consequently,
  1025.      derivatives do not exist. That is why  optimization  algorithms  that
  1026.      can  successfully  deal  with  black  box-type  situations  have been
  1027.      developed. The increasing applicability is of course paid  for  by  a
  1028.      loss  of  "convergence  velocity,"  compared  to algorithms specially
  1029.      designed for the given problem.  Furthermore, the guarantee  to  find
  1030.      the global optimum no longer exists!
  1031.  
  1032.  But why turn to nature when looking for more powerful algorithms?
  1033.      In  the  attempt  to  create  tools for various purposes, mankind has
  1034.      copied, more often instinctively than geniously,  solutions  invented
  1035.      by  nature.  Nowadays, one can prove in some cases that certain forms
  1036.      or structures are not only well adapted to their ENVIRONMENT but have
  1037.      even reached the optimum (Rosen 67). This is due to the fact that the
  1038.      laws of nature have remained  stable  during  the  last  3.5  billion
  1039.      years.  For  instance,  at branching points the measured ratio of the
  1040.      diameters in a system of blood-vessels comes close to the theoretical
  1041.      optimum  provided  by  the laws of fluid dynamics (2^-1/3).  This, of
  1042.      course, only represents a  limited,  engineering  point  of  view  on
  1043.      nature. In general, nature performs adaptation, not optimization.
  1044.  
  1045.      The idea to imitate basic principles of natural processes for optimum
  1046.      seeking procedures emerged more than three decades  ago  (cf  Q10.3).
  1047.      Although  these  algorithms  have  proven  to  be  robust  and direct
  1048.      OPTIMIZATION tools, it is only in the last five years that they  have
  1049.      caught  the researchers' attention. This is due to the fact that many
  1050.      people still look at organic EVOLUTION as a giantsized game of  dice,
  1051.      thus  ignoring  the  fact  that  this  model of evolution cannot have
  1052.      worked: a human germ-cell comprises approximately 50,000 GENEs,  each
  1053.      of  which  consists  of about 300 triplets of nucleic bases. Although
  1054.      the four  existing  bases  only  encode  20  different  amino  acids,
  1055.      20^15,000,000,  ie  circa 10^19,500,000 different GENOTYPEs had to be
  1056.      tested in only circa 10^17 seconds, the age of our planet. So, simply
  1057.      rolling  the  dice  could  not have produced the diversity of today's
  1058.      complex living systems.
  1059.  
  1060.      Accordingly,  taking  random  samples   from   the   high-dimensional
  1061.      parameter  space  of an objective function in order to hit the global
  1062.      optimum must fail (Monte-Carlo search). But  by  looking  at  organic
  1063.      evolution  as  a  cumulative,  highly  parallel  sieving process, the
  1064.      results of which pass on slightly modified into the next  sieve,  the
  1065.      amazing   diversity   and  efficiency  on  earth  no  longer  appears
  1066.      miraculous. When building a model, the point is to isolate  the  main
  1067.      mechanisms  which  have  led  to  today's  world  and which have been
  1068.      subjected to evolution themselves.  Inevitably, nature  has  come  up
  1069.      with  a  mechanism  allowing  INDIVIDUALs  of one SPECIES to exchange
  1070.      parts of their genetic information (RECOMBINATION or CROSSOVER), thus
  1071.      being able to meet changing environmental conditions in a better way.
  1072.  
  1073.      Dantzig, G.B.  (1966)  "Lineare  Programmierung  und  Erweiterungen",
  1074.      Berlin: Springer. (Linear programming and extensions)
  1075.  
  1076.      Kursawe,  F.  (1994) " Evolution strategies: Simple models of natural
  1077.      processes?", Revue Internationale de Systemique, France (to  appear).
  1078.  
  1079.      Rosen,   R.  (1967)  "Optimality  Principles  in  Biologie",  London:
  1080.      Butterworth.
  1081.  
  1082.      Schwefel, H.-P. (1981) "Numerical Optimization of  Computer  Models",
  1083.      Chichester: Wiley.
  1084.  
  1085. ------------------------------
  1086.  
  1087.      Copyright  (c) 1993-2000 by J. Heitkoetter and D. Beasley, all rights
  1088.      reserved.
  1089.  
  1090.      This FAQ may be posted to any USENET newsgroup, on-line  service,  or
  1091.      BBS  as  long  as  it  is  posted  in  its entirety and includes this
  1092.      copyright statement.  This FAQ may not be distributed  for  financial
  1093.      gain.   This  FAQ  may  not  be included in commercial collections or
  1094.      compilations without express permission from the author.
  1095.  
  1096. End of ai-faq/genetic/part3
  1097. ***************************
  1098.  
  1099. -- 
  1100.  
  1101.