home *** CD-ROM | disk | FTP | other *** search
/ Crawly Crypt Collection 2 / crawlyvol2.bin / apps / science / c_gineer / readme < prev   
Text File  |  1987-04-22  |  18KB  |  396 lines

  1.  
  2.    p C - G I N E E R q        In the forseeable future problem-
  3.    p Version 4.03 PD q        solving  computer  programs  with 
  4.    p  © 1992 by      q        intelligence features will aquire 
  5.    p     Ph. Kraft   q        similar importance for chemistry.   
  6.                                
  7.                                         I. Ugi in [1]                
  8.  
  9.  
  10.    Um Mißverständnissen vorzubeugen, C-GINEER steht für "Connectivity
  11.    Generator", wobei sich zwar die Schreibweise an "engineer" anlehnt,
  12.    das Programm sich aber weder an Maschinisten, noch an Techniker oder
  13.    gar (militärische) Pioniere (lt. Englisch-Deutsch-Wörterbuch) wendet.
  14.         
  15.    Es handelt sich vielmehr um ein Programm zur einfachen Erstellung
  16.    chemischer Strukturformeln  -  um einen 2D-Strukturformeleditor auf
  17.    Basis von Atom-Connectivity-Matrices (ACM, [2]) und wenn überhaupt
  18.    ist letzteres die einzige Form von 'Pioniertum' in diesem Programm.
  19.  
  20.    Atom-Connectivity-Matrices  - auch als 'Adjazenzmatrizen' oder 'topo-
  21.    logische Matrizen' bezeichnet [1] -  wurden 1963 von L. Spialter [2]
  22.    als mathematisches Modell zur Beschreibung chemischer Strukturen ein-
  23.    geführt und bilden heute das Fundament von Synthese-Design-Programmen
  24.    ( wie LHASA [3], SECS [4] und CAMEO [5] ), bei der 'Structure-Activity-
  25.    Relationship' (SAR) und 'Structure Property Relationship' (SPR) ( etwa
  26.    ADAPT [6] ), für Substruktur-Recherchen in Datenbanken und finden auch 
  27.    Verwendung in Nomenklatur-Programmen. 
  28.   
  29.  
  30.    Die ACM  A=[a(i,j)]  einer durchnummerierten Verbindung mit n-Atomen 
  31.    ist eine quadratische (n,n)-Matrix, in deren Hauptdiagonale die Atom-
  32.    symbole stehen. Für die Außerdiagonal-Elemente gilt:
  33.  
  34.         a(i,j) = 0 ,  wenn keine formale chemische Bindung zwischen 
  35.                       den Atomen C(i) und C(j) besteht.
  36.  
  37.         a(i,j) = 1 ,  bei C(i)-C(j) (Einfachbindung)
  38.  
  39.         a(i,j) = 2 ,  bei C(i)=C(j) (Doppelbindung)
  40.  
  41.         a(i,j) = 3 ,  bei C(i)≡C(j) (Dreifachbindung)
  42.  
  43.    Darüberhinaus gilt in C-GINEER (zur Stereodifferenzierung) bezogen 
  44.    auf den Eintrag im 'oberen außerdiagonalen Dreieck' der ACM:
  45.  
  46.         a(i,j) = 5 ,  gestrichelter Keil von C(i) nach C(j) zulaufend
  47.         a(i,j) = 6 ,  gestrichelter Keil von C(i) nach C(j) ausweitend
  48.  
  49.         a(i,j) = 7 ,  ausgefüllter Keil von C(i) nach C(j) zulaufend
  50.         a(i,j) = 8 ,  ausgefüllter Keil von C(i) nach C(j) ausweitend    
  51.  
  52.    Für zukünftige Versionen ist geplant:
  53.  
  54.         a(i,j) = 4 ,  für delokalisierte π-Elektronensysteme
  55.         a(i,j) = 9 ,  für koodinative Bindungen in Komplexen
  56.  
  57.  
  58.  p  Hinweis: Das Verständnis der ACM-Struktur ist keine Voraussetzung   q
  59.  p  für die Benutzung des Programmes. Die Atom-Connectivity-Matrix ist  q
  60.  p  lediglich das interne Speicher- und Dateiformat von C-GINEER.       q
  61.  
  62.    Die Verwendung der ACM in einem 2D-Zeichenprogramm bringt aber neben 
  63.    der Übereinstimmung in den Datenstrukturen mit Synthese-Design- und 
  64.    SAR / SPR -Programmen eine Reihe von neuen Möglichkeiten in C-GINEER.
  65.  
  66.  
  67.  ****************************************************************************
  68.  *                                                                          *
  69.  *  Der zu dieser Anleitung gehörende Ordner C_GINEER.403 inkl. Inhalt ist  *
  70.  *  Public Domain, also frei kopierbar. Er darf daher nicht verkauft oder   *
  71.  *  vertrieben werden, und nur komplett kopiert werden.                     *
  72.  *                                                                          *
  73.  ****************************************************************************
  74.  
  75.  
  76.  C - G I N E E R   4 . 0 3   P D 
  77.  
  78.  
  79.  Zum Zeichnen von Formeln...
  80.  
  81.  linke Maustaste gedrückt halten, Bindung ausziehen und justieren, dann
  82.  Maustaste freigeben. Innerhalb des kürzesten Bindungsabstandes erfolgt
  83.  Anbindung an das nächstliegendste Atom.
  84.  
  85.  Bei gedrückter rechter Maustaste läßt sich die Formel verschieben.
  86.  
  87.  Das Menü wird nach dem Zeichnen durch Anklicken der Menüleiste aktiviert
  88.  (dies verhindert Überschneidungen bei der Bildschirmrestauration), der
  89.  Funkionsaufruf über die Tastaturcodes ist hingegen immer möglich.   
  90.  
  91.  Folgende Zeichenmodi sind vorhanden:
  92.  
  93.  
  94.  Norm mode - Bindungslängen und Bindungswinkel (letztere bezogen auf 
  95.              Winkel, die beim Zeichnen von Fünf- oder Sechsecken häufig 
  96.              vorkommen) werden in diesem Modus beim Zeichnen normiert.
  97.  
  98.  Bind mode - Bindungslängen und Bindungswinkel sind frei und entsprechen
  99.              der ausgezogenen Linie. Innerhalb des Snap-Radius ist hierin
  100.              die 'Überbrückung' entfernter Atome möglich. 
  101.   
  102.  Text mode - Um Heteroatome in die ACM einzuführen klickt man das ent-
  103.              sprechende Atom an und gibt das Symbol (nur C,O,H,N,S,P) ein,
  104.              befindet man sich nicht innerhalb des kleinsten Bindungsradius
  105.              ist die Eingabe von Kommentaren oder Summenformeln möglich,
  106.              wobei Zahlen unmittelbar nach Buchstaben automatisch als
  107.              Subscript gesetzt werden. Nach Abschluß der Eingabe wird der
  108.              Cursor automatisch um eine Zeile nach unten gesetzt. Der
  109.              Kommentartext wird nicht als ACM verwaltet, im Gegensatz zu den
  110.              Atomsymbolen ist eine Korrektur nur durch Überschreiben (auch 
  111.              mit Spaces) und das Abspeichern nur im .PIC-Format möglich.
  112.  
  113.  
  114.  Doppel- und Dreifachbindungen...
  115.  
  116.  werden einfach dadurch generiert, daß man die betreffende Bindung einmal
  117.  (für Doppelbindungen) oder zweimal (für Dreifachbindungen) darüber-
  118.  zeichnet, beim dritten Mal erhält man die wieder eine Einfachbindung.
  119.  
  120.  Stereochemische Differenzierungen...
  121.  
  122.  lassen sich durch Einfügen von filled wedges (ausgefüllten Keilen) oder
  123.  von stroke wedges (Strichkeilen) treffen.
  124.  
  125.  
  126.  
  127.  In der Menüleiste ist der Reihe nach aufgeführt:
  128.     
  129.     p  C-GINEER   File   Matrices   Params.   Geometr.   SAR / SPR  q
  130.  
  131.  
  132.  Unter den jeweiligen Menüleisten-Punkten erscheinen folgende Operationen:
  133.  
  134.  
  135.  C-GINEER        Hierunter findet sich eine kurze Programm-p Information q
  136.                  p help q und eventuell vorhandene Accessories.
  137.  
  138.  
  139.  File            Enthält die Unterpunkte:
  140.   
  141.                  p Merge .ACM  [C]m q
  142.                  p Open  .EM   [C]o q         
  143.                  p Save  .ACM  [C]a q 
  144.                  p Save  .EM   [C]s q 
  145.                  p Load  .PIC  [C]l q        
  146.                  p Save  .PIC  [C]p q
  147.  
  148.                  Es kann in folgenden Formaten geladen und gespeichert
  149.                  (mit Back-up) werden:
  150.           
  151.                  .ACM   Atom Connectivity Matrix  
  152.                  .BAC   Back-up of Atom Connectivity Matrix
  153.                  .EM    Ensemble of Molecules 
  154.                  .BEM   Back-up Ensemble of Molecules             
  155.                  .PIC   Screen- bzw. Doodle-Format 
  156.  
  157.                  Das Laden und Speichern im Screen- bzw. Doodle-Format
  158.                  erfolgt ohne Back-up und ermöglicht die Übernahme der
  159.                  erstellten Formeln in andere Zeichenprogramme.
  160.  
  161.  
  162.  Matrices        Dieser Menüpunkt enthält einen Stack
  163.  
  164.                  p ACM[1]   F1  q
  165.                  p ACM[2]   F2  q
  166.                  p ACM[3]   F3  q
  167.                  p ACM[4]   F4  q
  168.                  p ACM[5]   F5  q
  169.                  p ACM[6]   F6  q
  170.                  p ACM[7]   F7  q
  171.                  p ACM[8]   F8  q
  172.                  p ACM[9]   F9  q
  173.                  p ACM[10]  F10 q
  174.  
  175.                  der anzeigt, welche ACMs des EM belegt sind und welche
  176.                  die jeweils aktuelle ACM  - mit einem Häckchen gekenn-
  177.                  zeichnet -  ist. Die Graphikoperationen wirken nur auf 
  178.                  dieses ACM. Durch Anklicken der Einträge kann man die 
  179.                  aktuelle ACM bestimmen. Die Auswahl ist außerdem durch
  180.                  Anklicken der Formel mit der rechten Maustaste möglich.
  181.                  Beim Zeichnen wird jeweils die ACM aktualisiert, die am
  182.                  nächsten liegt, es sei denn sie liegt außerhalb des Snap-
  183.                  Radius. In diesem Fall wird eine neue ACM geöffnet.
  184.  
  185.                  Die 10 ACMs in der Version 4.03 sind (50,50)-Matrizen
  186.                  mit zusammen 25000 Einträgen entsprechend 500 Atomen.
  187.                  Größere Schemata müssen als .PIC-Datei zwischenge-
  188.                  speichert werden. 
  189.                 
  190.                  Für SAR / SPR -Korrelationen sind definiert nummerierte
  191.                  ACMs nötig. Die Sortierung und Durchnummerierung der 
  192.                  Matrizen kann in C-GINEER entweder durch den vom Chemical
  193.                  Abstracts Service (CAS) benutzten MORGAN-Algorithmus [7],
  194.                  programmiert nach [8] und konvergent erweitert, über den
  195.                  Menüpunkt p Morgan sort [A]m q oder durch einen für 
  196.                  dieses Programm entwickelten Algorithmus p Canonical q
  197.                  p form [A]c q erfolgen. Eine kanonische Form ist nach
  198.                  [9] jede für ein spezielles Problem (hier die Geruchs-
  199.                  bestimmung) standartisierte Matrix. Der Algorithmus geht
  200.                  etwa folgendermaßen vor:
  201.  
  202.                  - Suche die polarste oder weitverzweigteste Stelle in
  203.                    der Verbindung (letzteres analog zum MORGAN-Algorithmus)
  204.                
  205.                  - Durchlaufe von dort ausgehend zuerst die am wenigsten 
  206.                    verzweigten (charakteristischen) Reste und gehe dann
  207.                    zur 'nächstweitverzweigten' Stelle -> Iteration...
  208.                          
  209.                  Mit dem Menüeintrag p Numbering # q kann man sich die
  210.                  jeweils aktuelle (sortierte bzw. unsortierte) Numerierung
  211.                  der Atome ansehen. Mit dem Menüpunkt p Print | q die
  212.                  jeweils aktuelle ACM ausdrucken.
  213.  
  214.                  Mit p Duplicate ins q wird die jeweils aktuelle Formel
  215.                  und ihre ACM vervielfältigt, mit p Delete... last atom q
  216.                  p undo q kann man den jeweils letzten Eintrag in die 
  217.                  AC-Matrix löschen (entspricht bei nichtsortierten Ver-
  218.                  bindungen der zuletzt gezeichneten Bindung) und mit dem
  219.                  Menüpunkt p Delete... AC-matrix del q die ganze Formel
  220.                  und ihre ACM aus dem Stack entfernen.
  221.  
  222.                  Den ganzen Stack und die gesamte Zeichenebene (d.h. inkl.
  223.                  geladener .PIC-Dateien) kann man über p Clear stack q
  224.                  p clr q leeren.                    
  225.  
  226.  
  227.  Params.         Hier sind die bereits beschriebenen Zeichenmodi aufgeführt:
  228.  
  229.                  p  Norm mode    [A]n      q
  230.                  p  Bind mode    [A]b      q
  231.                  p  Text mode    [A]t      q
  232.                  p------------------------ q
  233.                  p  Insert...              q
  234.                  p    Filled wedge  [A]f   q
  235.                  p    Stroke wedge  [A]s   q ,
  236.      
  237.                  die jeweils angewählt werden können. Sonderzeichen im
  238.                  'Text mode' sind über 'Control' A und Eingabe des ASCII-
  239.                  Codes zugänglich. Zu den Insert...-Funktionen bleibt noch 
  240.                  anzumerken, daß die betreffende Bindung bereits gezeichnet
  241.                  sein muß und sowohl Anfangs- als auch Zielpunkt des ausge-
  242.                  zogenen Keils innerhalb des Snap-Radius liegen müssen. Die
  243.                  Keile werden vom Anfangs- zum Zielpunkt ausweitend dar-
  244.                  gestellt und lassen sich durch 'Darüberzeichnen' mit der-
  245.                  selben Keilform wieder löschen bzw. variiren.
  246.                               
  247.                  Für Normwinkel hat man die Auswahl zwischen...
  248.                   
  249.                  p Norm angles for ...      q
  250.                  p   Pentagon          [A]p q  
  251.                  p   Hexagon           [A]h q ,
  252.  
  253.                  der Normierung auf Winkel die häufig in Fünf- oder Sechs-
  254.                  ecken auftreten. Die Wahl dieser Normwinkel ist jedoch
  255.                  auch beim Zeichnen anderer Strukturen nützlich, so wurde
  256.                  die Cyclohexan-Sesselform in der Formel-Bibliothek im
  257.                  Pentagon-Modus gezeichnet. 
  258.  
  259.                  Die drei Bindungslängen auf die im Norm-Modus normiert
  260.                  wird lassen sich über p Input bond lengths [A]i q frei
  261.                  wählen. Es erscheint eine Box die über die Maus oder die
  262.                  Tastatur bzw. den rechten Zahlenblock bedient werden kann.
  263.                  Hierbei entspricht die Backspace-Taste dem ' <- '-Feld, 
  264.                  die Delete-Taste dem 'Clr'-Feld und die Return/Enter-
  265.                  Taste dem 'Enter'-Feld. 
  266.           
  267.                  Über p Screen switch  tab q läßt sich einstellen, ob
  268.                  ständig zwischen physikalischem und logischem Bildschirm
  269.                  (auf Kosten von etwas Rechenzeit) hin- und hergeschaltet
  270.                  werden soll oder die Ausgaben direkt erfolgen sollen. Bei 
  271.                  Verwendung von Großbildschirmen sollte 'Screen switch'
  272.                  nicht aktiviert werden!
  273.                  
  274.                  Außerdem läßt sich mit p Show matrices ^ q wählen, ob
  275.                  die jeweils aktuelle ACM in der linken oberen Bildschirm-
  276.                  ecke eingeblendet werden soll oder nicht.
  277.  
  278.  
  279.  Geometr.        p Draw formula with left mouse q
  280.                  p button / Transfer with right q
  281.  
  282.                  Unter diesem Menüpunkt sind die geometrischen Operationen
  283.                  aufgeführt, die auf die gezeichnete Struktur wirken, aber
  284.                  ihre ACM unverändert lassen:
  285.  
  286.                  p Rotate formula ...        q
  287.                  p   clockwise         +     q
  288.                  p   - slightly        [S]+  q
  289.                  p   counterclockwise  -     q
  290.                  p   - slightly        [S]-  q
  291.  
  292.                  Rotation der Formel im oder gegen den Uhrzeigersinn mit
  293.                  dem Inkrement 15° und dem Shift-Inkrement 3°.
  294.  
  295.                  p Mirror ...         q
  296.                  p   horizontal  [S]h q 
  297.                  p   vertical    [S]v q
  298.  
  299.                  Spiegelung der Formel an einer horizontalen oder einer
  300.                  vertikal verlaufenden Achse.
  301.  
  302.                  p Enlarge formula  < q
  303.                  p Shrink  formula  > q
  304.  
  305.                  Vergrößerung bzw. Verkleinerung der Formel um je 10 %.
  306.  
  307.                  p EPSON™ hardcopy  ~ q
  308.  
  309.                  Vergrößerte Hardcopy des Zeichenbereiches im EPSON™-Modus.
  310.  
  311.  
  312.  SAR / SPR       Hierunter steht eine SAR / SPR - Routine zur Geruchs-
  313.                  bestimmung nach Strukturmerkmalen p Odor description q
  314.                  p [S]o q ,  die an die verwendete kanonische Form an-
  315.                  gepaßt wurde, Keilbindungen werden jedoch nicht erkannt.
  316.                  Wenn eine Zuordnung möglich ist, so wird eine Duftbe-
  317.                  schreibung zurückgegeben. Beispiele für Riechstoff-Dateien:     
  318.  
  319.                  TAB_2_8.ACM   TAB_4_3.ACM   TAB_4_4.ACM   TAB_4_10.ACM
  320.                 
  321.                  Andere Programme lassen sich - bei ausreichendem Speicher-
  322.                  platz - über p Execute [C]e q von C_GINEER aus starten.
  323.  
  324.  
  325.  Im Ordner C_GINEER.403 stehen folgende Bibliotheks- und Beispieldateien:
  326.  
  327.  
  328.   Ordner        \ ... \  Dateien  
  329.  
  330.  ============================================================================
  331.  
  332.   EXAMPLE       \ EXAMPLE.PIC,  EXAMPLE.EM, 
  333.                   EXAMPLE1.ACM, EXAMPLE2.ACM, EXAMPLE3.ACM       
  334.  
  335.   LIBRARY -------------------------------------------------------------------
  336.  
  337.   \ TABLE_1.LIB \ TABLE_1.PIC,  TABLE_1.EM,   TAB_1_1.ACM ... TAB_1_10.ACM  
  338.  
  339.   \ TABLE_2.LIB \ TABLE_2.PIC,  TABLE_2.EM,   TAB_2_1.ACM ... TAB_2_10.ACM
  340.  
  341.   \ TABLE_3.LIB \ TABLE_3.PIC,  TABLE_3.EM,   TAB_3_1.ACM ... TAB_3_10.ACM
  342.  
  343.   \ TABLE_4.LIB \ TABLE_4.PIC,  TABLE_4.EM,   TAB_4_1.ACM ... TAB_4_10.ACM
  344.  
  345.   \ TABLE_5.LIB \ TABLE_5.PIC,  TABLE_5.EM,   TAB_5_1.ACM ... TAB_5_10.ACM
  346.  
  347.  ============================================================================               
  348.  
  349.  
  350.  Literatur:      [1] I. Ugi et. al., 
  351.                      The Deductive Solution of Chemical Problems 
  352.                      by Computer Programms ...
  353.                      Pure & Appl. Chem. 50, 1303 (1978).
  354.  
  355.                  [2] L. Spialter, 
  356.                      The Atom Connectivity Matrix (ACM) and
  357.                      its Characteristic Polynomial (ACMCP) ... 
  358.                      J. Am. Chem. Soc. 85 (1963), 2012.
  359.                       
  360.                  [3] LHASA - Logic and Heuristics Applied to
  361.                              Synthetic Analysis
  362.  
  363.                      E.J. Corey, W.T. Wipke, Science 166, 178 (1969),
  364.                      sowie J. Am. Chem. Soc. 94 (1972), 421.
  365.                      
  366.                  [4] SECS - Simulation and Evaluation of                   
  367.                             Chemical Synthesis
  368.                   
  369.                      W.T. Wipke et al.,
  370.                      J. Am. Chem. Soc. 98 (1976), 8107.
  371.  
  372.                  [5] CAMEO - Computer Assisted Mechanistic Evaluation
  373.                              of Organic Reactions
  374.                         
  375.                      W.L. Jorgensen et al., J. Org. Chem. 45 (1980),
  376.                      2043, ibid. 54 (1989), 2058.    
  377.  
  378.                  [6] ADAPT - Automated data analysis and pattern 
  379.                              recognition toolkit
  380.  
  381.                      A.J. Stuper, P.C. Jurs, J. Chem. Inform. Comput.
  382.                      Sci. 16 (1976), 99. Eine interessante Anwendung:
  383.  
  384.                      P.C. Jurs et. al., Correlation of Odor Intensities 
  385.                      with Structural Properties of Odorants, 
  386.                      Chemical Senses 14 (1989), 281.
  387.  
  388.                  [7] H.L. Morgan, J. Chem. Doc. 5 (1965), 107.
  389.  
  390.                  [8] W.T. Wipke et al., J. Am. Chem. Soc. 96 (1974), 4834.   
  391.  
  392.                  [9] J. Blair, J. Gasteiger, C. Gillespie, P.D. Gillespie,
  393.                      I. Ugi, Tetrahedron 30 (1974), 1845.
  394.  
  395.  
  396.