home *** CD-ROM | disk | FTP | other *** search
/ Danny Amor's Online Library / Danny Amor's Online Library - Volume 1.iso / html / faqs / faq / ai-faq / genetic.part6 < prev   
Encoding:
Text File  |  1995-07-25  |  58.4 KB  |  1,330 lines

  1. Subject: FAQ: comp.ai.genetic part 6/6 (A Guide to Frequently Asked Questions)
  2. Newsgroups: comp.ai.genetic,comp.answers,news.answers
  3. From: David.Beasley@cm.cf.ac.uk (David Beasley)
  4. Date: Tue, 20 Sep 94 09:08:05 GMT
  5.  
  6. Archive-name:   ai-faq/genetic/part6
  7. Last-Modified:  9/20/94
  8. Issue:          2.3
  9.  
  10. TABLE OF CONTENTS OF PART 6
  11.      Q21: What are Gray codes, and why are they used?
  12.  
  13.      Q22: What test data is available?
  14.  
  15.      Q42: What is Life all about?
  16.      Q42b: Is there a FAQ to this group?
  17.  
  18.      Q98: Are there any patents on EAs?
  19.  
  20.      Q99: A Glossary on EAs?
  21.  
  22. ----------------------------------------------------------------------
  23.  
  24. Subject: Q21: What are Gray codes, and why are they used?
  25.  
  26.      The correct spelling is "Gray"---not  "gray",  "Grey",  or  "grey"---
  27.      since Gray codes are named after the Frank Gray  who  patented  their
  28.      use for shaft encoders in 1953  [1].   Gray  codes  actually  have  a
  29.      longer history, and the inquisitive reader may want to  look  up  the
  30.      August, 1972,  issue  of  Scientific  American,  which  contains  two
  31.      articles of interest: one on the origin  of  binary  codes  [2],  and
  32.      another by Martin  Gardner  on  some  entertaining  aspects  of  Gray
  33.      codes [3].  Other references containing descriptions  of  Gray  codes
  34.      and more modern, non-GA, applications include the second  edition  of
  35.      Numerical  Recipes  [4],  Horowitz  and  Hill  [5],  Kozen  [6],  and
  36.      Reingold [7].
  37.  
  38.      A Gray code represents  each  number  in  the  sequence  of  integers
  39.      {0...2^N-1} as a binary string of length N  in  an  order  such  that
  40.      adjacent integers have Gray code representations that differ in  only
  41.      one bit position.  Marching through the  integer  sequence  therefore
  42.      requires flipping just one bit at a time.  Some  call  this  defining
  43.      property of Gray codes the "adjacency property" [8].
  44.  
  45.      Example (N=3):  The binary coding of {0...7} is {000, 001, 010,  011,
  46.      100, 101, 110, 111}, while one Gray coding is {000,  001,  011,  010,
  47.      110, 111, 101, 100}.  In essence, a Gray code takes a binary sequence
  48.      and shuffles  it  to  form  some  new  sequence  with  the  adjacency
  49.      property.  There exist,  therefore,  multiple  Gray  codings  or  any
  50.      given N.  The example shown here belongs to a  class  of  Gray  codes
  51.      that goes by the fancy name "binary-reflected Gray codes".  These are
  52.      the most  commonly  seen  Gray  codes,  and  one  simple  scheme  for
  53.      generationg such a Gray code sequence says, "start with all bits zero
  54.      and successively flip the right-most bit that produces a new string."
  55.  
  56.      Hollstien [9] investigated the use of GAs for optimizing functions of
  57.      two variables and claimed that  a  Gray  code  representation  worked
  58.      slightly better than the binary representation.  He attrributed  this
  59.      difference to the adjacency property of Gray codes.   Notice  in  the
  60.      above example that the step from three to four requires the  flipping
  61.      of all the bits in the binary representation.  In  general,  adjacent
  62.      integers in the binary representaion often lie many bit flips  apart.
  63.      This  fact makes it less likely that a MUTATION operator  can  effect
  64.      small changes for a binary-coded INDIVIDUAL.
  65.  
  66.      A Gray code representation seems to  improve  a  MUTATION  operator's
  67.      chances of making incremental improvements, and a  close  examination
  68.      suggests why.  In  a  binary-coded  string  of  length  N,  a  single
  69.      mutation in the most significant  bit  (MSB)  alters  the  number  by
  70.      2^(N-1).  In a Gray-coded string, fewer mutations lead  to  a  change
  71.      this large.  The user of Gray codes does, however, pay  a  price  for
  72.      this feature: those "fewer mutations" lead to  much  larger  changes.
  73.      In the Gray code illustrated above, for example, a single mutation of
  74.      the left-most bit changes a zero to a seven and vice-versa, while the
  75.      largest change a single mutation can make to a corresponding  binary-
  76.      coded INDIVIDUAL is always four.  One might still view this aspect of
  77.      Gray codes with some favor:  most  mutations  will  make  only  small
  78.      changes, while the occasional  mutation  that  effects  a  truly  big
  79.      change may initiate EXPLORATION of an  entirely  new  region  in  the
  80.      space of CHROMOSOMEs.
  81.  
  82.      The algorithm for converting between the binary-reflected  Gray  code
  83.      described above  and  the  standard  binary  code  turns  out  to  be
  84.      surprisingly simple to state.  First label the bits of a binary-coded
  85.      string B[i], where larger i's represent more  significant  bits,  and
  86.      similarly label the corresponding Gray-coded string G[i].  We convert
  87.      one to the other as follows:  Copy the most  significant  bit.   Then
  88.      for each smaller i  do  either  G[i] = XOR(B[i+1], B[i])---to convert
  89.      binary to  Gray---or B[i] = XOR(B[i+1], G[i])---to  convert  Gray  to
  90.      binary.
  91.  
  92.      One may easily implement the above algorithm in C.   Imagine  you  do
  93.      something like
  94.  
  95.       typedef unsigned short ALLELE;
  96.  
  97.      and then use type "allele" for each bit in your CHROMOSOME, then  the
  98.      following two functions will convert between  binary  and  Gray  code
  99.      representations.  You must pass them the address  of  the  high-order
  100.      bits for each of the two strings  as  well  as  the  length  of  each
  101.      string.  (See  the  comment  statements  for  examples.)   NB:  These
  102.      functions assume a chromosome arranged  as  shown  in  the  following
  103.      illustration.
  104.  
  105.      index:    C[9]                                                    C[0]
  106.            *-----------------------------------------------------------*
  107.      Char C:   |  1  |  1  |  0  |  0  |  1  |  0  |  1  |  0  |  0  |  0  |
  108.            *-----------------------------------------------------------*
  109.            ^^^^^                                                 ^^^^^
  110.            high-order bit                                  low-order bit
  111.  
  112.  C CODE
  113.      /* Gray <==> binary conversion routines */
  114.      /* written by Dan T. Abell, 7 October 1993 */
  115.      /* please send any comments or suggestions */
  116.      /* to dabell@quark.umd.edu */
  117.  
  118.      void gray_to_binary (Cg, Cb, n)
  119.      /* convert chromosome of length n from */
  120.      /* Gray code to binary representation */
  121.      allele    *Cg,*Cb;
  122.      int  n;
  123.      {
  124.       int j;
  125.  
  126.       *Cb = *Cg;               /* copy the high-order bit */
  127.       for (j = 0; j < n; j++) {
  128.            Cb--; Cg--;         /* for the remaining bits */
  129.            *Cb= *(Cb+1)^*Cg;   /* do the appropriate XOR */
  130.       }
  131.      }
  132.  
  133.      void binary_to_gray(Cb, Cg, n)
  134.      /* convert chromosome of length n from */
  135.      /* binary to Gray code representation */
  136.      allele    *Cb, *Cg;
  137.      int  n;
  138.      {
  139.       int j;
  140.  
  141.       *Cg = *Cb;               /* copy the high-order bit */
  142.       for (j = 0; j < n; j++) {
  143.            Cg--; Cb--;         /* for the remaining bits */
  144.            *Cg= *(Cb+1)^*Cb;   /* do the appropriate XOR */
  145.       }
  146.      }
  147.  
  148.      References
  149.  
  150.      [1]  F.  Gray,  "Pulse  Code  Communication", U. S. Patent 2 632 058,
  151.      March 17, 1953.
  152.  
  153.      [2] F. G. Heath, "Origins of the Binary  Code",  Scientific  American
  154.      v.227,n.2 (August, 1972) p.76.
  155.  
  156.      [3]   Martin   Gardner,  "Mathematical  Games",  Scientific  American
  157.      v.227,n.2 (August, 1972) p.106.
  158.  
  159.      [4] William H. Press, et al., Numerical Recipes in C, Second  Edition
  160.      (Cambridge University Press, 1992).
  161.  
  162.      [5]  Paul  Horowitz and Winfield Hill, The Art of Electronics, Second
  163.      Edition (Cambridge University Press, 1989).
  164.  
  165.      [6] Dexter Kozen, The Design and Analysis  of  Algorithms  (Springer-
  166.      Verlag, New York, NY, 1992).
  167.  
  168.      [7]  Edward  M.  Reingold, et al., Combinatorial Algorithms (Prentice
  169.      Hall, Englewood Cliffs, NJ, 1977).
  170.  
  171.      [8] David E. Goldberg, GENETIC ALGORITHMs  in  Search,  OPTIMIZATION,
  172.      and Machine Learning (Addison-Wesley, Reading, MA, 1989).
  173.  
  174.      [9]  R.  B.  Hollstien,  Artificial  Genetic  Adaptation  in Computer
  175.      Control Systems (PhD thesis, University of Michigan, 1971).
  176.  
  177. ------------------------------
  178.  
  179. Subject: Q22: What test data is available?
  180.  
  181.  TSP DATA
  182.      There is a TSP library (TSPLIB) available which has many  solved  and
  183.      semi-solved TSPs and different variants. The library is maintained by
  184.      Gerhard Reinelt <reinelt@ares.iwr.Uni-Heidelberg.de>. It is available
  185.      from          various          FTP          sites,         including:
  186.      softlib.cs.rice.edu:/pub/tsplib/tsblib.tar
  187.  
  188.  OTHER DATA
  189.      Information about Operational Research test problems in  any  of  the
  190.      areas  listed below can be obtained by emailing <o.rlibrary@ic.ac.uk>
  191.      with the body of the email message being just the word  "info".   The
  192.      files  in  OR-Library  are  also  available  via  anonymous  FTP from
  193.      mscmga.ms.ic.ac.uk:/pub/
  194.       . Instructions on how to use OR-Library can be  found  in  the  file
  195.      "paper.txt",   or   in   the   article:   J.E.Beasley,   "OR-Library:
  196.      distributing test  problems  by  electronic  mail",  Journal  of  the
  197.      Operational Research Society 41(11) (1990) pp1069-1072.
  198.  
  199.      File                    Problem area
  200.  
  201.      assigninfo.txt          Assignment problem
  202.      cspinfo.txt             Crew scheduling
  203.      deainfo.txt             Data envelopment analysis
  204.      gapinfo.txt             Generalised assignment problem
  205.      mipinfo.txt             Integer programming
  206.      lpinfo.txt              Linear programming
  207.                  Location:
  208.      capinfo.txt                     capacitated warehouse location
  209.      pmedinfo.txt                    p-median
  210.      uncapinfo.txt                   uncapacitated warehouse location
  211.      mknapinfo.txt                   Multiple knapsack problem
  212.      qapinfo.txt                     Quadratic assignment problem
  213.      rcspinfo.txt                    Resource constrained shortest path
  214.                  Scheduling:
  215.      flowshopinfo.txt                flow shop
  216.      jobshopinfo.txt                 job shop
  217.      openshopinfo.txt                open shop
  218.      scpinfo.txt             Set covering
  219.      sppinfo.txt             Set partitioning
  220.                  Steiner:
  221.      esteininfo.txt                  Euclidean Steiner problem
  222.      rsteininfo.txt                  Rectilinear Steiner problem
  223.      steininfo.txt                   Steiner problem in graphs
  224.      tspinfo.txt             Travelling salesman problem
  225.                  Two-dimensional cutting:
  226.      assortinfo.txt                  assortment problem
  227.      cgcutinfo.txt                   constrained guillotine
  228.      ngcutinfo.txt                   constrained non-guillotine
  229.      gcutinfo.txt                    unconstrained guillotine
  230.                  Vehicle routing:
  231.      areainfo.txt                    fixed areas
  232.      fixedinfo.txt                   fixed routes
  233.      periodinfo.txt                  period routing
  234.      vrpinfo.txt                     single period
  235.  
  236. ------------------------------
  237.  
  238. Subject: Q42: What is Life all about?
  239.  
  240.      42
  241.  
  242.      References
  243.  
  244.      Adams, D. (1979) "The Hitch Hiker's Guide to the Galaxy", London: Pan
  245.      Books.
  246.  
  247.      Adams, D. (1980) "The Restaurant at the End of the Universe", London:
  248.      Pan Books.
  249.  
  250.      Adams,  D.  (1982)  "Life,  the Universe and Everything", London: Pan
  251.      Books.
  252.  
  253.      Adams, D. (1984) "So long, and thanks for all the Fish", London:  Pan
  254.      Books.
  255.  
  256.      Adams, D. (1992) "Mostly Harmless", London: Heinemann.
  257.  
  258.  
  259. ------------------------------
  260.  
  261. Subject: Q42b: Is there a FAQ to this group?
  262.  
  263.      Yes.
  264.  
  265.  
  266. ------------------------------
  267. Subject: Q98: Are there any patents on EAs?
  268.  
  269.      Process  patents  have  been  issued  both  for  the  Bucket  Brigade
  270.      Algorithm (BBA) in CLASSIFIER SYSTEMs: U.S.  patent  #[..]  (to  John
  271.      Holland) and for GP: U.S. patent #4,935,877 (to John Koza).
  272.  
  273.      This  FAQ  does  not attempt to provide legal advice. However, use of
  274.      the Lisp code in the book [KOZA92] is freely  licensed  for  academic
  275.      use.  Although  those  wishing  to make commercial use of any process
  276.      should obviously consult any patent holders in question, it is pretty
  277.      clear  that  it's  not  in  anyone's  best  interests to stifle GA/GP
  278.      research and/or development. Commercial licenses much like those used
  279.      for  CAD  software  can  presumably  be obtained for the use of these
  280.      processes where necessary.
  281.  
  282.      Jarmo Alander's massive bibliography of GAs (see  Q10.8)  includes  a
  283.      (probably)  complete  list  of  all currently know patents.  There is
  284.      also a periodic posting on comp.ai.neural-nets by  Gregory  Aharonian
  285.      <srctran@world.std.com>  about  patents on Artificial Neural Networks
  286.      (ANNs).
  287.  
  288.  
  289. ------------------------------
  290.  
  291. Subject: Q99: A Glossary on EAs?
  292.  
  293.      1/5 SUCCESS RULE:
  294.       Derived by I. Rechenberg,  the  suggestion  that  when  Gaussian
  295.       MUTATIONs  are  applied  to real-valued vectors in searching for
  296.       the minimum of a function, a rule-of-thumb to attain good  rates
  297.       of  error  convergence  is  to  adapt  the STANDARD DEVIATION of
  298.       mutations to generate one superior solution out  of  every  five
  299.       attempts.
  300.  
  301.  A
  302.      ADAPTIVE BEHAVIOUR:
  303.       "...underlying  mechanisms  that allow animals, and potentially,
  304.       ROBOTs to adapt and survive in uncertain environments" --- Meyer
  305.       & Wilson (1991), [SAB90]
  306.  
  307.      AI:  See ARTIFICIAL INTELLIGENCE.
  308.  
  309.      ALIFE:
  310.       See ARTIFICIAL LIFE.
  311.  
  312.      ALLELE :
  313.       (biol) Each GENE is able to occupy only a particular region of a
  314.       CHROMOSOME, it's locus. At any given locus there may  exist,  in
  315.       the POPULATION, alternative forms of the gene. These alternative
  316.       are called alleles of one another.
  317.  
  318.       (EC) The value of a GENE.  Hence, for a  binary  representation,
  319.       each gene may have an ALLELE of 0 or 1.
  320.  
  321.      ARTIFICIAL INTELLIGENCE:
  322.       "...the  study  of  how to make computers do things at which, at
  323.       the moment, people are better" --- Elaine  Rich (1988)
  324.  
  325.      ARTIFICIAL LIFE:
  326.       Term coined by Christopher G.  Langton  for  his  1987  [ALIFEI]
  327.       conference.  In  the preface of the proceedings he defines ALIFE
  328.       as "...the study of simple computer generated hypothetical  life
  329.       forms, i.e.  life-as-it-could-be."
  330.  
  331.  B
  332.      BUILDING BLOCK:
  333.       (EC)  A  small,  tightly clustered group of GENEs which have co-
  334.       evolved  in  such  a  way  that  their  introduction  into   any
  335.       CHROMOSOME  will  be  likely  to  give increased FITNESS to that
  336.       chromosome.
  337.  
  338.       The "building block hypothesis" [GOLD89] states  that  GAs  find
  339.       solutions  by first finding as many BUILDING BLOCKs as possible,
  340.       and then combining them together to give the highest FITNESS.
  341.  
  342.  C
  343.      CENTRAL DOGMA:
  344.       (biol) The dogma that nucleic acids act  as  templates  for  the
  345.       synthesis  of  proteins,  but never the reverse. More generally,
  346.       the dogma that GENEs exert an influence over the form of a body,
  347.       but  the  form  of  a body is never translated back into genetic
  348.       code: acquired characteristics are not inherited. cf LAMARCKISM.
  349.  
  350.       (GA)  The  dogma  that  the  behaviour  of the algorithm must be
  351.       analysed using the SCHEMA THEOREM.
  352.  
  353.       (life in general) The dogma that this all is useful in a way.
  354.  
  355.       "You guys have a dogma. A certain irrational  set  of  believes.
  356.       Well,  here's  my  irrational  set  of  beliefs.  Something that
  357.       works."
  358.  
  359.       --- Rodney A. Brooks, [LEVY92]
  360.  
  361.      CFS: See CLASSIFIER SYSTEM.
  362.  
  363.      CHROMOSOME:
  364.       (biol) One of the chains of DNA  found  in  cells.   CHROMOSOMEs
  365.       contain  GENEs,  each  encoded as a subsection of the DNA chain.
  366.       Chromosomes are usually present in all  cells  in  an  organism,
  367.       even  though  only  a minority of them will be active in any one
  368.       cell.
  369.  
  370.       (EC) A datastructure which holds a `string' of task  parameters,
  371.       or  GENEs.   This  may  be stored, for example, as a binary bit-
  372.       string, or an array of integers.
  373.  
  374.      CLASSIFIER SYSTEM:
  375.       A system which takes a (set of) inputs, and produces a (set  of)
  376.       outputs  which  indicate  some classification of the inputs.  An
  377.       example might take inputs from sensors in a chemical plant,  and
  378.       classify  them  in  terms  of: 'running ok', 'needs more water',
  379.       'needs less water', 'emergency'. See Q1.4 for more  information.
  380.  
  381.      COMBINATORIAL OPTIMIZATION:
  382.       Some tasks involve combining a set of entities in a specific way
  383.       (e.g.  the task of building a house).  A  general  combinatorial
  384.       task  involves deciding (a) the specifications of those entities
  385.       (e.g. what size, shape, material to make the bricks  from),  and
  386.       (b)  the  way in which those entities are brought together (e.g.
  387.       the number of bricks, and  their  relative  positions).  If  the
  388.       resulting  combination  of  entities  can in some way be given a
  389.       FITNESS score, then COMBINATORIAL OPTIMIZATION is  the  task  of
  390.       designing  a  set  of  entities,  and  deciding how they must be
  391.       configured, so  as  to  give  maximum  fitness.  cf  ORDER-BASED
  392.       PROBLEM.
  393.  
  394.      COMMA STRATEGY:
  395.       Notation  originally  proposed  in  EVOLUTION STRATEGIEs, when a
  396.       POPULATION of "mu" PARENTs generates "lambda" OFFSPRING and  the
  397.       mu  parents are discarded, leving only the lambda INDIVIDUALs to
  398.       compete directly.  Such a process is written  as  a  (mu,lambda)
  399.       search.   The  process  of  only  competing  offspring then is a
  400.       "comma strategy." cf.  PLUS STRATEGY.
  401.  
  402.      CONVERGED:
  403.       A GENE is said to have CONVERGED when 95% of the CHROMOSOMEs  in
  404.       the  POPULATION  all  contain the same ALLELE for that gene.  In
  405.       some circumstances, a population can be said to  have  converged
  406.       when  all  genes  have  converged. (However, this is not true of
  407.       populations containing multiple SPECIES, for example.)
  408.  
  409.       Most people use "convergence" fairly loosely, to  mean  "the  GA
  410.       has  stopped  finding new, better solutions".  Of course, if you
  411.       wait long  enough,  the  GA  will  *eventually*  find  a  better
  412.       solution  (unless  you  have  already found the global optimum).
  413.       What people really mean is "I'm not willing to wait for  the  GA
  414.       to  find  a  new,  better  solution, because I've already waited
  415.       longer than I wanted to and it hasn't improved in ages."
  416.  
  417.       An interesting discussion on convergence by Michael Vose can  be
  418.       found      in      GA-Digest      v8n22,      available     from
  419.       ftp.aic.nrl.navy.mil:/pub/galist/digests/v8n22
  420.  
  421.      CONVERGENCE VELOCITY:
  422.       The rate of error reduction.
  423.  
  424.      COOPERATION:
  425.       The behavior of two or more INDIVIDUALs acting to  increase  the
  426.       gains of all participating individuals.
  427.  
  428.      CROSSOVER:
  429.       (EC)  A  REPRODUCTION  OPERATOR  which forms a new CHROMOSOME by
  430.       combining parts  of  each  of  two  `parent'  chromosomes.   The
  431.       simplest  form  is single-point CROSSOVER, in which an arbitrary
  432.       point in the chromosome is  picked.  All  the  information  from
  433.       PARENT  A  is  copied  from the start up to the crossover point,
  434.       then all the information  from  parent  B  is  copied  from  the
  435.       crossover point to the end of the chromosome. The new chromosome
  436.       thus gets the head of one parent's chromosome combined with  the
  437.       tail  of  the  other.   Variations exist which use more than one
  438.       crossover point, or combine information from  parents  in  other
  439.       ways.
  440.  
  441.       (biol)  A   complicated   process   whereby  CHROMOSOMEs,  while
  442.       engaged in the  production  of  GAMETEs,  exchange  portions  of
  443.       genetic material.  The result is that an almost infinite variety
  444.       of  gametes  may  be  produced.   Subsequently,  during   sexual
  445.       REPRODUCTION,  male and female gametes (i.e. sperm and ova) fuse
  446.       to  produce  a  new  cell  with  a  complete  set   of   DIPLOID
  447.       CHROMOSOMEs.
  448.  
  449.       In  [HOLLAND92]  the sentence "When sperm and ova fuse, matching
  450.       CHROMOSOMEs line up with one another and then cross over partway
  451.       along  their  length,  thus  swapping  genetic material" is thus
  452.       wrong, since these two activities occur in  different  parts  of
  453.       the  life  cycle.  [eds note:  If sexual REPRODUCTION (the  Real
  454.       Thing) worked like in GAs, then Holland would be right,  but  as
  455.       we  all  know,   it's   not   the  case.   We just encountered a
  456.       Freudian  slip  of  a  Grandmaster.  BTW:    even   the   German
  457.       translation  of   this  article  has  this  "bug", although it's
  458.       well-hidden by the translator.]
  459.  
  460.      CS:  See CLASSIFIER SYSTEM.
  461.  
  462.  D
  463.      DARWINISM:
  464.       (biol) Theory of EVOLUTION, proposed by Darwin,  that  evolution
  465.       comes    about    through    random   variation   of   heritable
  466.       characteristics, coupled with natural SELECTION (survival of the
  467.       fittest).  A  physical mechanism for this, in terms of GENEs and
  468.       CHROMOSOMEs, was discovered many years later. cf LAMARCKISM.
  469.  
  470.       (EC) Theory which inspired all branches of EC.
  471.  
  472.      DECEPTION:
  473.       The condition where the  combination  of  good  BUILDING  BLOCKs
  474.       leads   to  reduced  FITNESS,  rather  than  increased  fitness.
  475.       Proposed by [GOLD89] as a reason for the failure of GAs on  many
  476.       tasks.
  477.  
  478.      DIPLOID CHROMOSOME:
  479.       (biol)  A  CHROMOSOME  which  consists  of  a pair of homologous
  480.       chromosomes, i.e. two chromosomes containing the same  GENEs  in
  481.       the  same  sequence.  In sexually reproducing SPECIES, the genes
  482.       in one of the chromosomes will  have  been  inherited  from  the
  483.       father's GAMETE (sperm), while the genes in the other chromosome
  484.       are from the mother's gamete (ovum).
  485.  
  486.      DNA: (biol) Deoxyribonucleic Acid, a double stranded macromolecule of
  487.       helical  structure  (comparable  to  a  spiral  staircase). Both
  488.       single strands are linear,  unbranched  nucleic  acid  molecules
  489.       build  up  from  alternating  deoxyribose  (sugar) and phosphate
  490.       molecules. Each deoxyribose part  is  coupled  to  a  nucleotide
  491.       base,  which  is  responsible for establishing the connection to
  492.       the other strand of the DNA.  The  4  nucleotide  bases  Adenine
  493.       (A),  Thymine (T), Cytosine (C) and Guanine (G) are the alphabet
  494.       of the genetic information. The sequences of these bases in  the
  495.       DNA  molecule determines the building plan of any organism. [eds
  496.       note: suggested reading: James  D.  Watson  (1968)  "The  Double
  497.       Helix", London: Weidenfeld and Nicholson]
  498.  
  499.       (literature)  Douglas  Noel  Adams, contemporary Science Fiction
  500.       comedy writer. Published "The Hitch-Hiker's Guide to the Galaxy"
  501.       when  he  was  25 years old, which made him one of the currently
  502.       most  successful  British  authors.   [eds  note:  interestingly
  503.       Watson  was  also 25 years old, when he discovered the DNA; both
  504.       events are probably not interconnected; you might also  want  to
  505.       look  at:  Neil  Gaiman's  (1987)  "DON'T  PANIC -- The Official
  506.       Hitch-Hiker's Guide to the Galaxy companion", and of course  get
  507.       your  hands  on  the  wholly  remarkable FAQ in alt.fan.douglas-
  508.       adams]
  509.  
  510.      DNS: (biol) Desoxyribonukleinsaeure, German for DNA.
  511.  
  512.       (comp) The Domain Name System, a distributed database system for
  513.       translating    computer    names   (e.g.   lumpi.informatik.uni-
  514.       dortmund.de)   into   numeric   Internet,   i.e.    IP-addresses
  515.       (129.217.36.140)  and  vice-versa.   DNS allows you to hook into
  516.       the net without remembering long lists  of  numeric  references,
  517.       unless  your  system  administrator  has incorrectly set-up your
  518.       site's system.
  519.  
  520.  E
  521.      EC:  See EVOLUTIONARY COMPUTATION.
  522.  
  523.      ENCORE:
  524.       The EvolutioNary Computation REpository Network.  An network  of
  525.       anonymous  FTP  sites  holding  all manner of interesting things
  526.       related to EC.  The default "EClair" node is  at  the  Santa  Fe
  527.       Institute   (USA):  alife.santafe.edu:/pub/USER-AREA/EC/  mirror
  528.       sites   include   The   Chinese   University   of   Hong   Kong:
  529.       ftp.cs.cuhk.hk:/pub/EC/   The   University  of  Warwick  (United
  530.       Kingdom):      ftp.dcs.warwick.ac.uk:/pub/mirrors/EC/      EUnet
  531.       Deutschland  GmbH: ftp.Germany.EU.net:/pub/research/softcomp/EC/
  532.       and     The     California     Institute     of      Technology:
  533.       ftp.krl.caltech.edu:/pub/EC/ See Q15.3 for more information.
  534.  
  535.      ENVIRONMENT:
  536.       (biol)  That  which  surrounds  an  organism.  Can be 'physical'
  537.       (abiotic), or biotic.  In both, the organism  occupies  a  NICHE
  538.       which  influences  its  FITNESS within the total ENVIRONMENT.  A
  539.       biotic  environment  may  present   frequency-dependent  fitness
  540.       functions  within  a  POPULATION,  that  is,  the  fitness of an
  541.       organism's behaviour may depend upon how many  others  are  also
  542.       doing  it.   Over  several  GENERATIONs, biotic environments may
  543.       foster  co-evolution,  in  which  fitness  is  determined   with
  544.       SELECTION partly by other SPECIES.
  545.  
  546.      EP:  See EVOLUTIONARY PROGRAMMING.
  547.  
  548.      EPISTASIS:
  549.       (biol) A "masking" or "switching" effect among GENEs.  A biology
  550.       textbook says: "A gene is said to be epistatic when its presence
  551.       suppresses  the  effect  of  a gene at another locus.  Epistatic
  552.       genes are sometimes called inhibiting  genes  because  of  their
  553.       effect on other genes which are described as hypostatic."
  554.  
  555.       (EC)  When  EC  researchers  use  the  term  EPISTASIS, they are
  556.       generally referring to any  kind  of  strong  interaction  among
  557.       GENEs, not just masking effects. A possible definition is:
  558.  
  559.       EPISTASIS  is  the  interaction  between  different  GENEs  in a
  560.       CHROMOSOME.  It is the  extent  to  which  the  contribution  to
  561.       FITNESS of one gene depends on the values of other genes.
  562.  
  563.       Problems  with  little  or  no  EPISTASIS  are  trivial to solve
  564.       (hillclimbing is sufficient). But highly epistatic problems  are
  565.       difficult  to  solve,  even  for GAs.  High epistasis means that
  566.       BUILDING BLOCKs cannot form, and there will be DECEPTION.
  567.  
  568.      ES:  See EVOLUTION STRATEGY.
  569.  
  570.      EVOLUTION:
  571.       That process of change which is  assured  given  a  reproductive
  572.       POPULATION in which there are (1) varieties of INDIVIDUALs, with
  573.       some varieties being (2) heritable, of which some varieties  (3)
  574.       differ in FITNESS (reproductive success).
  575.  
  576.       "Don't assume that all people who accept EVOLUTION are atheists"
  577.  
  578.       --- Talk.origin FAQ
  579.  
  580.      EVOLUTION STRATEGIE:
  581.  
  582.      EVOLUTION STRATEGY:
  583.       A type of evolutionary algorithm developed in the early 1960s in
  584.       Germany.   It employs real-coded parameters, and in its original
  585.       form, it relied on  MUTATION  as  the  search  operator,  and  a
  586.       POPULATION  size of one. Since then it has evolved to share many
  587.       features  with  GENETIC   ALGORITHMs.    See   Q1.3   for   more
  588.       information.
  589.  
  590.      EVOLUTIONARILY STABLE STRATEGY:
  591.       A  strategy that does well in a POPULATION dominated by the same
  592.       strategy.  (cf Maynard Smith, 1974)
  593.  
  594.      EVOLUTIONARY COMPUTATION:
  595.       Encompasses methods of simulating EVOLUTION on a computer.   The
  596.       term  is  relatively new and represents an effort bring together
  597.       researchers who have been working in closely related fields  but
  598.       following  different  paradigms.   The  field  is  now  seen  as
  599.       including research in GENETIC ALGORITHMs, EVOLUTION  STRATEGIEs,
  600.       EVOLUTIONARY  PROGRAMMING, ARTIFICIAL LIFE, and so forth.  For a
  601.       good overview see the editorial introduction to Vol. 1, No. 1 of
  602.       "Evolutionary  Computation" (MIT Press, 1993).  That, along with
  603.       the papers in  the  issue,  should  give  you  a  good  idea  of
  604.       representative research.
  605.  
  606.      EVOLUTIONARY PROGRAMMING:
  607.       An  evolutionay  algorithm  developed  in the mid 1960s. It is a
  608.       stochastic OPTIMIZATION strategy, which is  similar  to  GENETIC
  609.       ALGORITHMs,  but  dispenses  with both "genomic" representations
  610.       and with CROSSOVER as a REPRODUCTION  OPERATOR.   See  Q1.2  for
  611.       more information.
  612.  
  613.  
  614.      EVOLUTIONARY SYSTEMS:
  615.       A  process  or system which employs the evolutionary dynamics of
  616.       REPRODUCTION, MUTATION, competition and SELECTION.  The specific
  617.       forms  of  these  processes  are  irrelevant  to  a system being
  618.       described as "evolutionary."
  619.  
  620.  
  621.      EXPECTANCY:
  622.       Or expected value.  Pertaining to a random  variable  X,  for  a
  623.       continuous random variable, the expected value is:
  624.       E(X) = INTEGRAL(-inf, inf) [X f(X) dX].
  625.       The  discrete expectation takes a similar form using a summation
  626.       instead of an integral.
  627.  
  628.      EXPLOITATION:
  629.       When traversing a SEARCH SPACE, EXPLOITATION is the  process  of
  630.       using information gathered from previously visited points in the
  631.       search space to determine which places might  be  profitable  to
  632.       visit  next.  An  example  is  hillclimbing,  which investigates
  633.       adjacent points in the search space, and moves in the  direction
  634.       giving   the   greatest   increase   in  FITNESS.   Exploitation
  635.       techniques are good at finding local maxima.
  636.  
  637.      EXPLORATION:
  638.       The process of visiting entirely new regions of a SEARCH  SPACE,
  639.       to  see  if  anything  promising  may  be  found  there.  Unlike
  640.       EXPLOITATION,  EXPLORATION  involves  leaps  into  the  unknown.
  641.       Problems  which  have  many  local  maxima can sometimes only be
  642.       solved by this sort of random search.
  643.  
  644.  F
  645.      FAQ: Frequently Asked Questions. See definition given near the top of
  646.       part 1.
  647.  
  648.      FITNESS:
  649.       (biol)  Loosely:  adaptedness.  Often measured as, and sometimes
  650.       equated to, relative reproductive success.  Also proportional to
  651.       expected  time  to extinction.  "The fit are those who fit their
  652.       existing ENVIRONMENTs and  whose  descendants  will  fit  future
  653.       environments."   (J.  Thoday,  "A  Century  of  Darwin",  1959).
  654.       Accidents of history are relevant.
  655.  
  656.       (EC) A value assigned to an INDIVIDUAL which reflects  how  well
  657.       the  individual solves the task in hand. A "fitness function" is
  658.       used to  map  a  CHROMOSOME  to  a  FITNESS  value.  A  "fitness
  659.       landscape"  is the hypersurface obtained by applying the fitness
  660.       function to every point in the SEARCH SPACE.
  661.  
  662.      FUNCTION OPTIMIZATION:
  663.       For a function which takes a set  of  N  input  parameters,  and
  664.       returns  a  single output value, F, FUNCTION OPTIMIZATION is the
  665.       task of finding the  set(s)  of  parameters  which  produce  the
  666.       maximum (or minimum) value of F. Function OPTIMIZATION is a type
  667.       of VALUE-BASED PROBLEM.
  668.  
  669.      FTP: File Transfer Protocol. A system which allows the  retrieval  of
  670.       files stored on a remote computer. Basic FTP requires a password
  671.       before access can be gained to the  remote  computer.  Anonymous
  672.       FTP   does   not   require  a  special  password:  after  giving
  673.       "anonymous" as the user name, any password will  do  (typically,
  674.       you  give  your email address at this point). Files available by
  675.       FTP are specified as <ftp-site-name>:<the-complete-filename> See
  676.       Q15.5.
  677.  
  678.      FUNCTION SET:
  679.       (GP)  The set of operators used in GP. These functions label the
  680.       internal (non-leaf) points of the parse trees that represent the
  681.       programs  in  the  POPULATION.  An example FUNCTION SET might be
  682.       {+, -, *}.
  683.  
  684.  G
  685.      GA:  See GENETIC ALGORITHM.
  686.  
  687.      GAME THEORY:
  688.       A mathematical theory originally developed for human games,  and
  689.       generalized  to  human  economics  and military strategy, and to
  690.       EVOLUTION in the theory of EVOLUTIONARILY STABLE STRATEGY.  GAME
  691.       THEORY  comes  into  it's own wherever the optimum policy is not
  692.       fixed, but depends upon the policy which is  statistically  most
  693.       likely to be adopted by opponents.
  694.  
  695.      GAMETE:
  696.       (biol)  Cells which carry genetic information from their PARENTs
  697.       for the purposes  of  sexual  REPRODUCTION.   In  animals,  male
  698.       GAMETEs are called sperm, female gametes are called ova. Gametes
  699.       have HAPLOID CHROMOSOMEs.
  700.  
  701.      GAUSSIAN DISTRIBUTION:
  702.       See NORMALLY DISTRIBUTED.
  703.  
  704.      GENE:
  705.       (EC) A subsection of a CHROMOSOME which  (usually)  encodes  the
  706.       value of a single parameter.
  707.  
  708.       (biol)  A unit of heredity. May be defined in different ways for
  709.       different purposes.  Molecular biologists sometimes use it in  a
  710.       more   abstract   sense.  Following  Williams  (cf  Q10.7)  `any
  711.       hereditary  information  for  which  there  is  a  favorable  or
  712.       unfavorable  SELECTION  bias  equal to several or many times its
  713.       rate of endogenous change.' cf CHROMOSOME.
  714.  
  715.      GENE-POOL:
  716.       The whole set of GENEs in a breeding POPULATION.   The  metaphor
  717.       on  which  the  term  is based de-emphasizes the undeniable fact
  718.       that genes actually go about in discrete bodies, and  emphasizes
  719.       the idea of genes flowing about the world like a liquid.
  720.  
  721.       "Everybody out of the GENE-POOL, now!"
  722.  
  723.       --- Author prefers to be anonymous
  724.  
  725.      GENERATION:
  726.       (EC) An iteration of the measurement of FITNESS and the creation
  727.       of a new POPULATION by means of REPRODUCTION OPERATORs.
  728.  
  729.      GENETIC ALGORITHM:
  730.       A type of  EVOLUTIONARY  COMPUTATION  devised  by  John  Holland
  731.       [HOLLAND92].    A   model   of  machine  learning  that  uses  a
  732.       genetic/evolutionary  metaphor.  Implementations  typically  use
  733.       fixed-length   character  strings  to  represent  their  genetic
  734.       information, together with a  POPULATION  of  INDIVIDUALs  which
  735.       undergo  CROSSOVER  and  MUTATION  in  order to find interesting
  736.       regions of the SEARCH SPACE.  See Q1.1 for more information.
  737.  
  738.      GENETIC DRIFT:
  739.       Changes in gene/allele frequencies in  a  POPULATION  over  many
  740.       GENERATIONs,   resulting  from  chance  rather  than  SELECTION.
  741.       Occurs most rapidly in small  populations.   Can  lead  to  some
  742.       ALLELEs   becoming   `extinct',   thus   reducing   the  genetic
  743.       variability in the population.
  744.  
  745.      GENETIC PROGRAMMING:
  746.       GENETIC ALGORITHMs applied to programs.  GENETIC PROGRAMMING  is
  747.       more  expressive  than fixed-length character string GAs, though
  748.       GAs are  likely  to  be  more  efficient  for  some  classes  of
  749.       problems.  See Q1.5 for more information.
  750.  
  751.      GENETIC OPERATOR:
  752.       A search operator acting on a coding structure that is analogous
  753.       to a GENOTYPE of an organism (e.g. a CHROMOSOME).
  754.  
  755.      GENOTYPE:
  756.       The  genetic  composition  of  an  organism:   the   information
  757.       contained in the GENOME.
  758.  
  759.      GENOME:
  760.       The entire collection of GENEs (and hence CHROMOSOMEs) possessed
  761.       by an organism.
  762.  
  763.      GLOBAL OPTIMIZATION:
  764.       The process by which a search  is  made  for  the  extremum  (or
  765.       extrema)  of  a  functional  which, in EVOLUTIONARY COMPUTATION,
  766.       corresponds to the FITNESS or error function  that  is  used  to
  767.       assess the PERFORMANCE of any INDIVIDUAL.
  768.  
  769.      GP:  See GENETIC PROGRAMMING.
  770.  
  771.  H
  772.      HAPLOID CHROMOSOME:
  773.       (biol)  A  CHROMOSOME  consisting of a single sequence of GENEs.
  774.       These are found in GAMETEs.  cf DIPLOID CHROMOSOME.
  775.  
  776.       In EC, it is usual for CHROMOSOMEs to be haploid.
  777.  
  778.      HARD SELECTION:
  779.       SELECTION acts on competing INDIVIDUALs.   When  only  the  best
  780.       available   individuals   are  retained  for  generating  future
  781.       progeny, this is termed "hard selection."   In  contrast,  "soft
  782.       selection"  offers  a  probabilistic  mechanism  for  maitaining
  783.       individuals to be PARENTs of future progeny  despite  possessing
  784.       relatively poorer objective values.
  785.  
  786.  I
  787.      INDIVIDUAL:
  788.       A  single  member  of  a  POPULATION.   In  EC,  each INDIVIDUAL
  789.       contains a CHROMOSOME  (or,  more  generally,  a  GENOME)  which
  790.       represents a possible solution to the task being tackled, i.e. a
  791.       single point in the SEARCH SPACE.  Other information is  usually
  792.       also stored in each individual, e.g. its FITNESS.
  793.  
  794.      INVERSION:
  795.       (EC)  A  REORDERING  operator  which  works by selecting two cut
  796.       points in a CHROMOSOME, and reversing the order of all the GENEs
  797.       between those two points.
  798.  
  799.  L
  800.      LAMARCKISM:
  801.       Theory  of  EVOLUTION  which preceded Darwin's. Lamarck believed
  802.       that evolution came about through the  inheritance  of  acquired
  803.       characteristics.  That is, the skills or physical features which
  804.       an INDIVIDUAL acquires during its lifetime can be passed  on  to
  805.       its  OFFSPRING.   Although  Lamarckian inheritance does not take
  806.       place in nature, the idea has been usefully applied by  some  in
  807.       EC.  cf DARWINISM.
  808.  
  809.      LCS: See LEARNING CLASSIFIER SYSTEM.
  810.  
  811.      LEARNING CLASSIFIER SYSTEM:
  812.       A  CLASSIFIER  SYSTEM which "learns" how to classify its inputs.
  813.       This often involves "showing" the system many examples of  input
  814.       patterns,  and their corresponding correct outputs. See Q1.4 for
  815.       more information.
  816.  
  817.  M
  818.      MIGRATION:
  819.       The transfer of (the GENEs  of)  an  INDIVIDUAL  from  one  SUB-
  820.       POPULATION to another.
  821.  
  822.      MOBOT:
  823.       MOBile ROBOT.  cf ROBOT.
  824.  
  825.      MUTATION:
  826.       (EC)  a  REPRODUCTION  OPERATOR  which forms a new CHROMOSOME by
  827.       making (usually small) alterations to the values of GENEs  in  a
  828.       copy of a single, PARENT chromosome.
  829.  
  830.  N
  831.      NICHE:
  832.       (biol)  In  natural ecosystems, there are many different ways in
  833.       which animals may survive (grazing, hunting, on the  ground,  in
  834.       trees,   etc.),   and   each  survival  strategy  is  called  an
  835.       "ecological niche."  SPECIES which occupy different NICHEs (e.g.
  836.       one eating plants, the other eating insects) may coexist side by
  837.       side without competition, in a stable way. But  if  two  species
  838.       occupying  the  same niche are brought into the same area, there
  839.       will be competition,  and  eventually  the  weaker  of  the  two
  840.       species  will  be  made  (locally)  extinct.  Hence diversity of
  841.       species depends on them occupying a diversity of niches  (or  on
  842.       geographical separation).
  843.  
  844.       (EC)  In  EC,  we  often  want  to  maintain  diversity  in  the
  845.       POPULATION.  Sometimes a FITNESS function may  be  known  to  be
  846.       multimodal, and we want to locate all the peaks. We may consider
  847.       each peak in the fitness function as analogous to a  NICHE.   By
  848.       applying   techniques   such  as  fitness  sharing  (Goldberg  &
  849.       Richardson, [ICGA87]), the  population  can  be  prevented  from
  850.       converging  on a single peak, and instead stable SUB-POPULATIONs
  851.       form at each  peak.  This  is  analogous  to  different  SPECIES
  852.       occupying different niches. See also SPECIES, SPECIATION.
  853.  
  854.      NORMALLY DISTRIBUTED:
  855.       A  random  variable  is  NORMALLY  DISTRIBUTED  if  its  density
  856.       function is described as
  857.       f(x)    =    1/sqrt(2*pi*sqr(sigma))    *    exp(-0.5*(x-mu)*(x-
  858.       mu)/sqr(sigma))
  859.       where  mu  is the mean of the random variable x and sigma is the
  860.       STANDARD DEVIATION.
  861.  
  862.  O
  863.      OBJECT VARIABLES:
  864.       Parameters that are directly involved in assessing the  relative
  865.       worth of an INDIVIDUAL.
  866.  
  867.      OFFSPRING:
  868.       An INDIVIDUAL generated by any process of REPRODUCTION.
  869.  
  870.      OPTIMIZATION:
  871.       The  process  of iteratively improving the solution to a problem
  872.       with respect to a specified objective function.
  873.  
  874.      ORDER-BASED PROBLEM:
  875.       A problem where the solution must be specified in  terms  of  an
  876.       arrangement  (e.g.  a  linear  ordering) of specific items, e.g.
  877.       TRAVELLING  SALESMAN  PROBLEM,  computer   process   scheduling.
  878.       ORDER-BASED  PROBLEMs  are a class of COMBINATORIAL OPTIMIZATION
  879.       problems in which  the  entities  to  be  combined  are  already
  880.       determined. cf VALUE-BASED PROBLEM.
  881.  
  882.      ONTOGENESIS:
  883.       Refers  to  a  single  organism,  and  means the life span of an
  884.       organism from it's birth to death.  cf PHYLOGENESIS.
  885.  
  886.  P
  887.      PANMICTIC POPULATION:
  888.       (EC, biol) A  mixed  POPULATION.   A  population  in  which  any
  889.       INDIVIDUAL  may  be  mated  with  any  other  individual  with a
  890.       probability which depends only on  FITNESS.   Most  conventional
  891.       evolutionary algorithms have PANMICTIC POPULATIONs.
  892.  
  893.       The  opposite  is a POPULATION divided into groups known as SUB-
  894.       POPULATIONs, where INDIVIDUALs may only mate with others in  the
  895.       same sub-population. cf SPECIATION.
  896.  
  897.      PARENT:
  898.       An  INDIVIDUAL  which takes part in REPRODUCTION to generate one
  899.       or more other individuals, known as OFFSPRING, or children.
  900.  
  901.  
  902.      PERFORMANCE:
  903.       cf FITNESS.
  904.  
  905.      PHENOTYPE:
  906.       The expressed traits of an INDIVIDUAL.
  907.  
  908.      PHYLOGENESIS:
  909.       Refers to  a  POPULATION  of  organisms.  The  life  span  of  a
  910.       POPULATION  of organisms from pre-historic times until today. cf
  911.       ONTOGENESIS.
  912.  
  913.      PLUS STRATEGY:
  914.       Notation originally proposed in  EVOLUTION  STRATEGIEs,  when  a
  915.       POPULATION  of "mu" PARENTs generates "lambda" OFFSPRING and all
  916.       mu and lambda  INDIVIDUALs  compete  directly,  the  process  is
  917.       written  as  a (mu+lambda) search.  The process of competing all
  918.       parents and offspring then is  a  "plus  strategy."  cf.   COMMA
  919.       STRATEGY.
  920.  
  921.      POPULATION:
  922.       A  group of INDIVIDUALs which may interact together, for example
  923.       by mating, producing OFFSPRING, etc. Typical POPULATION sizes in
  924.       EC range from 1 (for certain EVOLUTION STRATEGIEs)
  925.        to   many   thousands   (for  GENETIC  PROGRAMMING).   cf  SUB-
  926.       POPULATION.
  927.  
  928.  R
  929.      RECOMBINATION:
  930.       cf CROSSOVER.
  931.  
  932.      REORDERING:
  933.       (EC) A REORDERING operator  is  a  REPRODUCTION  OPERATOR  which
  934.       changes  the  order  of  GENEs in a CHROMOSOME, with the hope of
  935.       bringing related genes closer together, thereby facilitating the
  936.       production of BUILDING BLOCKs.  cf INVERSION.
  937.  
  938.      REPRODUCTION:
  939.       (biol,  EC)  The  creation  of a new INDIVIDUAL from two PARENTs
  940.       (sexual REPRODUCTION).  Asexual reproduction is the creation  of
  941.       a new individual from a single parent.
  942.  
  943.      REPRODUCTION OPERATOR:
  944.       (EC)  A  mechanism  which  influences  the  way in which genetic
  945.       information is passed on  from  PARENT(s)  to  OFFSPRING  during
  946.       REPRODUCTION.   REPRODUCTION  OPERATORs  fall  into  three broad
  947.       categories: CROSSOVER, MUTATION and REORDERING operators.
  948.  
  949.      REQUISITE VARIETY:
  950.       In GENETIC ALGORITHMs, when  the  POPULATION  fails  to  have  a
  951.       "requisite  variety" CROSSOVER will no longer be a useful search
  952.       operator because it will have a propensity to simply  regenerate
  953.       the PARENTs.
  954.  
  955.      ROBOT:
  956.       "The  Encyclopedia  Galactica  defines  a  ROBOT as a mechanical
  957.       apparatus designed to do the work of man. The marketing division
  958.       of  the  Sirius Cybernetics Corporation defines a robot as `Your
  959.       Plastic Pal Who's Fun To Be With'."
  960.  
  961.       --- Douglas Adams (1979)
  962.  
  963.  S
  964.      SAFIER:
  965.       An  EVOLUTIONARY  COMPUTATION  FTP  Repository,   now   defunct.
  966.       Superceeded by ENCORE.
  967.  
  968.      SCHEMA:
  969.       A  pattern  of  GENE  values  in a CHROMOSOME, which may include
  970.       `dont care' states. Thus in a  binary  chromosome,  each  SCHEMA
  971.       (plural  schemata)  can  be  specified  by  a string of the same
  972.       length as the chromosome, with each character one of {0, 1,  #}.
  973.       A particular chromosome is said to `contain' a particular schema
  974.       if it matches the schema (e.g. chromosome 01101  matches  schema
  975.       #1#0#).
  976.  
  977.       The `order' of a SCHEMA is the number of non-dont-care positions
  978.       specified, while the `defining length' is the  distance  between
  979.       the furthest two non-dont-care positions. Thus #1#0# is of order
  980.       2 and defining length 3.
  981.  
  982.      SCHEMA THEOREM:
  983.       Theorem devised by Holland [HOLLAND92] to explain the  behaviour
  984.       of  GAs.   In  essence,  it  says  that a GA gives exponentially
  985.       increasing  reproductive  trials  to  above  average   schemata.
  986.       Because each CHROMOSOME contains a great many schemata, the rate
  987.       of SCHEMA processing in the POPULATION is very high, leading  to
  988.       a phenomenon known as implicit parallelism. This gives a GA with
  989.       a population of size N  a  speedup  by  a  factor  of  N  cubed,
  990.       compared to a random search.
  991.  
  992.      SEARCH SPACE:
  993.       If the solution to a task can be represented by a set of N real-
  994.       valued parameters, then the job of finding this solution can  be
  995.       thought  of  as  a  search  in  an  N-dimensional space. This is
  996.       referred to simply as the SEARCH SPACE.  More generally, if  the
  997.       solution  to  a  task  can be represented using a representation
  998.       scheme, R, then the search space is  the  set  of  all  possible
  999.       configurations which may be represented in R.
  1000.      SEARCH OPERATORS:
  1001.       Processes  used  to  generate  new  INDIVIDUALs to be evaluated.
  1002.       SEARCH OPERATORS in GENETIC ALGORITHMs are  typically  based  on
  1003.       CROSSOVER  and  point  MUTATION.   Search operators in EVOLUTION
  1004.       STRATEGIEs and EVOLUTIONARY PROGRAMMING  typically  follow  from
  1005.       the  representation  of a solution and often involve Gaussian or
  1006.       lognormal perturbations when applied to real-valued vectors.
  1007.  
  1008.      SELECTION:
  1009.       The process by which some INDIVIDUALs in a POPULATION are chosen
  1010.       for REPRODUCTION, typically on the basis of favoring individuals
  1011.       with higher FITNESS.
  1012.  
  1013.      SELF-ADAPTATION:
  1014.       The inclusion of a mechanism  not  only  to  evolve  the  OBJECT
  1015.       VARIABLES   of   a   solution,   but  simultaneously  to  evolve
  1016.       information on how each solution will generate new OFFSPRING.
  1017.  
  1018.      SIMULATION:
  1019.       The act of modeling a natural process.
  1020.  
  1021.      SOFT SELECTION:
  1022.       The mechanism which allows inferior INDIVIDUALs in a  POPULATION
  1023.       a  non-zero  probability  of  surviving into future GENERATIONs.
  1024.       See HARD SELECTION.
  1025.  
  1026.      SPECIATION:
  1027.       (biol) The process whereby a new SPECIES comes about.  The  most
  1028.       common cause of SPECIATION is that of geographical isolation. If
  1029.       a SUB-POPULATION of a single species is separated geographically
  1030.       from  the  main  POPULATION  for a sufficiently long time, their
  1031.       GENEs will diverge  (either  due  to  differences  in  SELECTION
  1032.       pressures  in  different  locations,  or  simply  due to GENETIC
  1033.       DRIFT).  Eventually, genetic differences will be so  great  that
  1034.       members of the sub-population must be considered as belonging to
  1035.       a different (and new) species.
  1036.  
  1037.       SPECIATION is very important in evolutionary biology. Small SUB-
  1038.       POPULATIONs can evolve much more rapidly than a large POPULATION
  1039.       (because genetic changes don't take long to become fixed in  the
  1040.       population).  Sometimes,  this  EVOLUTION  will produce superior
  1041.       INDIVIDUALs which can outcompete,  and  eventually  replace  the
  1042.       SPECIES of the original, main population.
  1043.  
  1044.       (EC)  Techniques analogous to geographical isolation are used in
  1045.       a number of GAs.  Typically, the POPULATION is divided into SUB-
  1046.       POPULATIONs,  and  INDIVIDUALs  are  only  allowed  to mate with
  1047.       others in the same sub-population. (A small amount of  MIGRATION
  1048.       is performed.)
  1049.  
  1050.       This   produces  many  SUB-POPULATIONs  which  differ  in  their
  1051.       characteristics, and may be referred to as different  "species".
  1052.       This technique can be useful for finding multiple solutions to a
  1053.       problem, or simply maintaining diversity in the SEARCH SPACE.
  1054.  
  1055.       Most   biology/genetics   textbooks   contain   information   on
  1056.       SPECIATION.   A more detailed account can be found in "Genetics,
  1057.       Speciation and  the  Founder  Principle",  L.V.  Giddings,  K.Y.
  1058.       Kaneshiro  and  W.W.  Anderson  (Eds.),  Oxford University Press
  1059.       1989.
  1060.  
  1061.      SPECIES:
  1062.       (biol) There is  no  universally-agreed  firm  definition  of  a
  1063.       SPECIES.   A  species  may be roughly defined as a collection of
  1064.       living creatures,  having  similar  characteristics,  which  can
  1065.       breed  together  to  produce  viable  OFFSPRING similar to their
  1066.       PARENTs.  Members of one  species  occupy  the  same  ecological
  1067.       NICHE.   (Members  of  different species may occupy the same, or
  1068.       different niches.)
  1069.  
  1070.       (EC) In EC the definition of  "species"  is  less  clear,  since
  1071.       generally  it is always possible for a pair INDIVIDUALs to breed
  1072.       together.  It is probably safest to use this term  only  in  the
  1073.       context   of   algorithms   which   employ  explicit  SPECIATION
  1074.       mechanisms.
  1075.  
  1076.       (biol) The  existence  of  different  SPECIES  allows  different
  1077.       ecological NICHEs to be exploited. Furthermore, the existence of
  1078.       a variety of different species itself creates new  niches,  thus
  1079.       allowing room for further species. Thus nature bootstraps itself
  1080.       into almost limitless complexity and diversity.
  1081.  
  1082.       Conversely, the domination of one, or a small number of  SPECIES
  1083.       reduces  the  number  of  viable  NICHEs,  leads to a decline in
  1084.       diversity, and a reduction in  the  ability  to  cope  with  new
  1085.       situations.
  1086.  
  1087.       "Give any one species too much rope, and they'll fuck it up"
  1088.  
  1089.       --- Roger Waters, "Amused to Death", 1992
  1090.  
  1091.      STANDARD DEVIATION:
  1092.       A measurement for the spread of a set of data; a measurement for
  1093.       the variation of a random variable.
  1094.  
  1095.      STATISTICS:
  1096.       Descriptive measures of data; a field of mathematics  that  uses
  1097.       probability theory to gain insight into systems' behavior.
  1098.  
  1099.      STEPSIZE:
  1100.       Typically, the average distance in the appropriate space between
  1101.       a PARENT and its OFFSPRING.
  1102.  
  1103.      STRATEGY VARIABLE:
  1104.       Evolvable parameters that relate the distribution  of  OFFSPRING
  1105.       from a PARENT.
  1106.  
  1107.      SUB-POPULATION:
  1108.       A  POPULATION  may  be  sub-divided  into  groups, known as SUB-
  1109.       POPULATIONs, where INDIVIDUALs may only mate with others in  the
  1110.       same  group.  (This  technique  might  be  chosen  for  parallel
  1111.       processors).  Such  sub-divisions  may  markedly  influence  the
  1112.       evolutionary  dynamics of a population (e.g.  Wright's 'shifting
  1113.       balance' model).  Sub-populations  may  be  defined  by  various
  1114.       MIGRATION constraints: islands with limited arbitrary migration;
  1115.       stepping-stones   with   migration   to   neighboring   islands;
  1116.       isolation-by-distance  in  which each individual mates only with
  1117.       near neighbors. cf PANMICTIC POPULATION, SPECIATION.
  1118.  
  1119.      SUMMERSCHOOL:
  1120.       (USA) One of the most interesting things in the  US  educational
  1121.       system: class work during the summer break.
  1122.  
  1123.  T
  1124.      TERMINAL SET:
  1125.       (GP)  The  set  of  terminal  (leaf)  nodes  in  the parse trees
  1126.       representing the programs in the POPULATION.  A  terminal  might
  1127.       be a variable, such as X, a constant value, such as 42, (cf Q42)
  1128.       or a function taking no arguments, such as (move-north).
  1129.  
  1130.      TRAVELLING SALESMAN PROBLEM:
  1131.       The travelling salesperson has the task of visiting a number  of
  1132.       clients,  located  in different cities. The problem to solve is:
  1133.       in what order should the cities be visited in order to  minimise
  1134.       the total distance travelled (including returning home)? This is
  1135.       a classical example of an ORDER-BASED PROBLEM.
  1136.  
  1137.      TSP: See TRAVELLING SALESMAN PROBLEM.
  1138.  
  1139.  U
  1140.      USENET:
  1141.       "Usenet is like a herd of performing elephants with diarrhea  --
  1142.       massive, difficult to redirect, awe-inspiring, entertaining, and
  1143.       a source of mind-boggling amounts of excrement  when  you  least
  1144.       expect it."
  1145.  
  1146.       --- Gene Spafford (1992)
  1147.  
  1148.  V
  1149.      VALUE-BASED PROBLEM:
  1150.       A problem where the solution must be specified in terms of a set
  1151.       of real-valued parameters.  FUNCTION OPTIMIZATION  problems  are
  1152.       of this type.  cf SEARCH SPACE, ORDER-BASED PROBLEM.
  1153.  
  1154.      VECTOR OPTIMIZATION:
  1155.       Typically,  an  OPTIMIZATION problem wherein multiple objectives
  1156.       must be satisfied.
  1157.  
  1158.  Z
  1159.      ZEN NAVIGATION:
  1160.       A methodology with tremendous propensity to get  lost  during  a
  1161.       hike  from  A  to  B.  ZEN NAVIGATION simply consists in finding
  1162.       something that looks as if it knew where  it  is  going  to  and
  1163.       follow   it.    The  results  are  more  often  surprising  than
  1164.       successful, but it's usually being worth for the sake of the few
  1165.       occasions when it is both.
  1166.  
  1167.       Sometimes  ZEN  NAVIGATION  is  referred to as "doing scientific
  1168.       research," where A is a state of mind being considered  as  pre-
  1169.       PhD,  and  B (usually a different) state of mind, known as post-
  1170.       PhD. While your time spent in state C, somewhere inbetween A and
  1171.       B, is usually referred to as "being a nobody."
  1172.  
  1173.  
  1174. ACKNOWLEDGMENTS
  1175.      Finally, credit where credit is due. I'd like to thank all the people
  1176.      who helped in assembling this  guide,  and  their  patience  with  my
  1177.      "variations  on  English  grammar".  In  the  order  I received their
  1178.      contributions, thanks to:
  1179.  
  1180.  Contributors,
  1181.      Lutz  Prechelt  (University  of  Karlsruhe)  the  comp.ai.neural-nets
  1182.      FAQmeister,  for  letting  me  strip  several  ideas  from "his" FAQ.
  1183.      Ritesh "peace" Bansal (CMU) for  lots  of  comments  and  references.
  1184.      David   Beasley   (University  of  Wales)  for  a  valuable  list  of
  1185.      publications (Q12), and many further additions.  David  Corne,  Peter
  1186.      Ross,   and  Hsiao-Lan  Fang  (University  of  Edinburgh)  for  their
  1187.      TIMETABLING and JSSP entries.   Mark  Kantrowitz  (CMU)  for  mocking
  1188.      about  this-and-that, and being a "mostly valuable" source concerning
  1189.      FAQ maintenance; parts of A11  have  been  stripped  from  "his"  ai-
  1190.      faq/part4  FAQ; Mark also contributed the less verbose ARCHIVE SERVER
  1191.      infos.  The texts of Q1.1, Q1.5, Q98 and  some  entries  of  Q99  are
  1192.      courtesy  by  James  Rice  (Stanford  University),  stripped from his
  1193.      genetic-programming FAQ (Q15).  Jonathan  I.  Kamens  (MIT)  provided
  1194.      infos  on  how-to-hook-into  the  USENET FAQ system.  Una Smith (Yale
  1195.      University) contributed the better parts of  the  Internet  resources
  1196.      guide   (Q15.5).    Daniel   Polani   (Gutenberg  University,  Mainz)
  1197.      "contributed"  the  Alife  II  Video  proceedings  info.   Jim  McCoy
  1198.      (University  of  Texas)  reminded  me  of the GP archive he maintains
  1199.      (Q20).  Ron Goldthwaite (UC Davis) added definitions of  Environment,
  1200.      Evolution, Fitness, and Population to the glossary, and some thoughts
  1201.      why  Biologists  should  take  note  of  EC  (Q3).   Joachim   Geidel
  1202.      (University  of  Karlsruhe)  sent a diff of the current "navy server"
  1203.      contents and the software survey, pointing to "missing links"  (Q20).
  1204.      Richard Dawkins "Glossary" section of "The extended phenotype" served
  1205.      for many new entries, too numerous to mention here (Q99).  Mark Davis
  1206.      (New   Mexico  State  University)  wrote  the  part  on  Evolutionary
  1207.      Programming (Q1.2).  Dan Abell (University of  Maryland)  contributed
  1208.      the  section on efficient greycoding (Q21).  Walter Harms (University
  1209.      of Oldenburg) commented on introductory  EC  literature.   Lieutenant
  1210.      Colonel  J.S.  Robertson (USMA, West Point), for providing a home for
  1211.      this     subversive     posting     on     their      FTP      server
  1212.      euler.math.usma.edu/pub/misc/GA  Rosie O'Neill for suggesting the PhD
  1213.      thesis entry (Q10.11).  Charlie Pearce (University of Nottingham) for
  1214.      critical  remarks  concerning  "tables";  well,  here  they  are!  J.
  1215.      Ribeiro Filho (University College London) for the pointer to the IEEE
  1216.      Computer  GA  Software  Survey;  the  PeGAsuS  description  (Q20) was
  1217.      stripped from it.  Paul Harrald for the entry on game playing (Q2).
  1218.  
  1219.  Reviewers,
  1220.      Robert Elliott Smith (The University of Alabama)  reviewed  the  TCGA
  1221.      infos  (Q14),  and Nici Schraudolph (UCSD) first unconsciously, later
  1222.      consciously, provided about 97% of Q20* answers.  Nicheal Lynn Cramer
  1223.      (BBN) adjusted my historic view of GP genesis.  David Fogel (ORINCON)
  1224.      commented and helped on this-and-that (where this-and-that is closely
  1225.      related  to  EP),  and provided many missing entries for the glossary
  1226.      (Q99).  Kazuhiro M. Saito (MIT) and  Mark  D.  Smucker  (Iowa  State)
  1227.      caught  my  favorite  typo(s).   Craig  W. Reynolds was the first who
  1228.      solved one of the well-hidden puzzles in the FAQ, and also added some
  1229.      valuable  stuff.   Joachim  Born  (TU  Berlin)  updated the Evolution
  1230.      Machine (EM) entry and provided the pointer to the Bionics  technical
  1231.      report  ftp  site  (Q14).   Pattie  Maes (MIT Media Lab) reviewed the
  1232.      ALIFE IV additions to the list of conferences (Q12).  Scott D. Yelich
  1233.      (Santa Fe Institute) reviewed the SFI connectivity entry (Q15).  Rick
  1234.      Riolo (MERIT) reviewed  the  CFS-C  entry  (Q20).   Davika  Seunarine
  1235.      (Acadia  Univ.)   for smoothing out this and that.  Paul Field (Queen
  1236.      Mary and Westfield  College)  for  correcting  typos,  and  providing
  1237.      insights into the blindfold pogo-sticking nomads of the Himalayas.
  1238.  
  1239.  and Everybody...
  1240.      Last  not  least  I'd like to thank Hans-Paul Schwefel, Thomas Baeck,
  1241.      Frank Kursawe, Guenter Rudolph for their contributions, and the  rest
  1242.      of the Systems Analysis Research Group for wholly remarkable patience
  1243.      and almost incredible unflappability during my various extravangances
  1244.      and ego-trips during my time (1990-1993) with this group.
  1245.  
  1246.      It was a tremendously worthwhile experience. Thanks!
  1247.  
  1248.  
  1249.  
  1250.  
  1251.  
  1252.  
  1253.  
  1254.        "And all our yesterdays have lighted fools; the way to dusty death;
  1255.     out, out brief candle; life's but a walking shadow; a poor player;
  1256.       that struts and gets his hour upon the stage; and then is heared
  1257.        no more; it is a tale; told by an idiot, full of sound an fury,
  1258.                               signifying nothing."
  1259.  
  1260.                           --- Shakespeare, Macbeth
  1261.  
  1262.  
  1263.  
  1264. EPILOGUE
  1265.               "Natural selection is a mechanism for generating
  1266.                  an exceedingly high degree of improbability."
  1267.  
  1268.                   --- Sir Ronald Aylmer Fisher (1890-1962)
  1269.  
  1270.  
  1271.      This is a GREAT quotation, it sounds like something directly out of a
  1272.     turn of the century Douglas Adams: Natural selection: the original
  1273.                         "Infinite Improbability Drive"
  1274.  
  1275.              --- Craig Reynolds, on reading the previous quote
  1276.  
  1277.      "`The Babel fish,'  said  The  Hitch  Hiker's  Guide  to  the  Galaxy
  1278.      quietly,  `is  small,  yellow and leech-like, and probably the oddest
  1279.      thing in the Universe.  It feeds on  brainwave  energy  received  not
  1280.      from  his  own  carrier  but  from  those  around  it. It absorbs all
  1281.      unconscious mental frequencies from this brainwave energy to  nourish
  1282.      itself  with.   It  then  excretes  into  the  mind  of its carrier a
  1283.      telepathic  matrix  formed  by  combining   the   conscious   thought
  1284.      frequencies  with  nerve signals picked up from the speech centers of
  1285.      the brain which has supplied them.  The practical upshot of all  this
  1286.      is  that  if  you  stick  a  Babel fish in your ear you can instantly
  1287.      understand anything said to you in any form of language.  The  speech
  1288.      patterns you actually hear decode the brainwave matrix which has been
  1289.      fed into your mind by your Babel fish.  `Now it is such  a  bizarrely
  1290.      improbable  coincidence  than anything so mindbogglingly useful could
  1291.      have evolved purely by chance that some thinkers have chosen  to  see
  1292.      it  as a final and clinching proof of the non-existence of God.  `The
  1293.      argument goes something  like  this:  ``I  refuse  to  prove  that  I
  1294.      exist,''  says  God, ``for proof denies faith, and without faith I am
  1295.      nothing.''  ``But,'' says Man, ``The Babel fish is  a  dead  giveaway
  1296.      isn't  it?  It could not have evolved by chance. It proves you exist,
  1297.      and so therefore, by your own  arguments,  you  don't.  QED.''   ``Oh
  1298.      dear,'' says God, ``I hadn't thought of that,'' and promptly vanishes
  1299.      in a puff of logic.  ``Oh, that was easy,''  says  Man,  and  for  an
  1300.      encore  goes  on to prove that black is white and gets himself killed
  1301.      on the next zebra crossing."
  1302.  
  1303.                           --- Douglas Adams (1979)
  1304.  
  1305.      "Well, people; I really wish this thingie to turn into a paper babel-
  1306.      fish  for  all  those  young ape-descended organic life forms on this
  1307.      crazy planet, who don't have any clue about what's going on  in  this
  1308.      exciting  "new"  research  field,  called  Evolutionary  Computation.
  1309.      However, this is just a start, I  need  your  help  to  increase  the
  1310.      usefulness  of  this  guide,  especially its readability for natively
  1311.      English speaking folks;  whatever  it  is:  I'd  like  to  hear  from
  1312.      you...!"
  1313.  
  1314.                                --- The Editor,
  1315.                           Joerg Heitkoetter (1993)
  1316.  
  1317.            "Parents of young organic life forms should be warned, that
  1318.        paper babel-fishes can be harmful, if stuck too deep into the ear."
  1319.  
  1320.                         --- Encyclopedia Galactica
  1321.  
  1322.  
  1323.  
  1324.  
  1325. ------------------------------
  1326.  
  1327. End of ai-faq/genetic/part6
  1328. ***************************
  1329.  
  1330.