home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
Crawly Crypt Collection 2
/
crawlyvol2.bin
/
apps
/
science
/
c_gineer
/
readme
< prev
Wrap
Text File
|
1987-04-22
|
18KB
|
396 lines
p C - G I N E E R q In the forseeable future problem-
p Version 4.03 PD q solving computer programs with
p © 1992 by q intelligence features will aquire
p Ph. Kraft q similar importance for chemistry.
I. Ugi in [1]
Um Mißverständnissen vorzubeugen, C-GINEER steht für "Connectivity
Generator", wobei sich zwar die Schreibweise an "engineer" anlehnt,
das Programm sich aber weder an Maschinisten, noch an Techniker oder
gar (militärische) Pioniere (lt. Englisch-Deutsch-Wörterbuch) wendet.
Es handelt sich vielmehr um ein Programm zur einfachen Erstellung
chemischer Strukturformeln - um einen 2D-Strukturformeleditor auf
Basis von Atom-Connectivity-Matrices (ACM, [2]) und wenn überhaupt
ist letzteres die einzige Form von 'Pioniertum' in diesem Programm.
Atom-Connectivity-Matrices - auch als 'Adjazenzmatrizen' oder 'topo-
logische Matrizen' bezeichnet [1] - wurden 1963 von L. Spialter [2]
als mathematisches Modell zur Beschreibung chemischer Strukturen ein-
geführt und bilden heute das Fundament von Synthese-Design-Programmen
( wie LHASA [3], SECS [4] und CAMEO [5] ), bei der 'Structure-Activity-
Relationship' (SAR) und 'Structure Property Relationship' (SPR) ( etwa
ADAPT [6] ), für Substruktur-Recherchen in Datenbanken und finden auch
Verwendung in Nomenklatur-Programmen.
Die ACM A=[a(i,j)] einer durchnummerierten Verbindung mit n-Atomen
ist eine quadratische (n,n)-Matrix, in deren Hauptdiagonale die Atom-
symbole stehen. Für die Außerdiagonal-Elemente gilt:
a(i,j) = 0 , wenn keine formale chemische Bindung zwischen
den Atomen C(i) und C(j) besteht.
a(i,j) = 1 , bei C(i)-C(j) (Einfachbindung)
a(i,j) = 2 , bei C(i)=C(j) (Doppelbindung)
a(i,j) = 3 , bei C(i)≡C(j) (Dreifachbindung)
Darüberhinaus gilt in C-GINEER (zur Stereodifferenzierung) bezogen
auf den Eintrag im 'oberen außerdiagonalen Dreieck' der ACM:
a(i,j) = 5 , gestrichelter Keil von C(i) nach C(j) zulaufend
a(i,j) = 6 , gestrichelter Keil von C(i) nach C(j) ausweitend
a(i,j) = 7 , ausgefüllter Keil von C(i) nach C(j) zulaufend
a(i,j) = 8 , ausgefüllter Keil von C(i) nach C(j) ausweitend
Für zukünftige Versionen ist geplant:
a(i,j) = 4 , für delokalisierte π-Elektronensysteme
a(i,j) = 9 , für koodinative Bindungen in Komplexen
p Hinweis: Das Verständnis der ACM-Struktur ist keine Voraussetzung q
p für die Benutzung des Programmes. Die Atom-Connectivity-Matrix ist q
p lediglich das interne Speicher- und Dateiformat von C-GINEER. q
Die Verwendung der ACM in einem 2D-Zeichenprogramm bringt aber neben
der Übereinstimmung in den Datenstrukturen mit Synthese-Design- und
SAR / SPR -Programmen eine Reihe von neuen Möglichkeiten in C-GINEER.
****************************************************************************
* *
* Der zu dieser Anleitung gehörende Ordner C_GINEER.403 inkl. Inhalt ist *
* Public Domain, also frei kopierbar. Er darf daher nicht verkauft oder *
* vertrieben werden, und nur komplett kopiert werden. *
* *
****************************************************************************
C - G I N E E R 4 . 0 3 P D
Zum Zeichnen von Formeln...
linke Maustaste gedrückt halten, Bindung ausziehen und justieren, dann
Maustaste freigeben. Innerhalb des kürzesten Bindungsabstandes erfolgt
Anbindung an das nächstliegendste Atom.
Bei gedrückter rechter Maustaste läßt sich die Formel verschieben.
Das Menü wird nach dem Zeichnen durch Anklicken der Menüleiste aktiviert
(dies verhindert Überschneidungen bei der Bildschirmrestauration), der
Funkionsaufruf über die Tastaturcodes ist hingegen immer möglich.
Folgende Zeichenmodi sind vorhanden:
Norm mode - Bindungslängen und Bindungswinkel (letztere bezogen auf
Winkel, die beim Zeichnen von Fünf- oder Sechsecken häufig
vorkommen) werden in diesem Modus beim Zeichnen normiert.
Bind mode - Bindungslängen und Bindungswinkel sind frei und entsprechen
der ausgezogenen Linie. Innerhalb des Snap-Radius ist hierin
die 'Überbrückung' entfernter Atome möglich.
Text mode - Um Heteroatome in die ACM einzuführen klickt man das ent-
sprechende Atom an und gibt das Symbol (nur C,O,H,N,S,P) ein,
befindet man sich nicht innerhalb des kleinsten Bindungsradius
ist die Eingabe von Kommentaren oder Summenformeln möglich,
wobei Zahlen unmittelbar nach Buchstaben automatisch als
Subscript gesetzt werden. Nach Abschluß der Eingabe wird der
Cursor automatisch um eine Zeile nach unten gesetzt. Der
Kommentartext wird nicht als ACM verwaltet, im Gegensatz zu den
Atomsymbolen ist eine Korrektur nur durch Überschreiben (auch
mit Spaces) und das Abspeichern nur im .PIC-Format möglich.
Doppel- und Dreifachbindungen...
werden einfach dadurch generiert, daß man die betreffende Bindung einmal
(für Doppelbindungen) oder zweimal (für Dreifachbindungen) darüber-
zeichnet, beim dritten Mal erhält man die wieder eine Einfachbindung.
Stereochemische Differenzierungen...
lassen sich durch Einfügen von filled wedges (ausgefüllten Keilen) oder
von stroke wedges (Strichkeilen) treffen.
In der Menüleiste ist der Reihe nach aufgeführt:
p C-GINEER File Matrices Params. Geometr. SAR / SPR q
Unter den jeweiligen Menüleisten-Punkten erscheinen folgende Operationen:
C-GINEER Hierunter findet sich eine kurze Programm-p Information q
p help q und eventuell vorhandene Accessories.
File Enthält die Unterpunkte:
p Merge .ACM [C]m q
p Open .EM [C]o q
p Save .ACM [C]a q
p Save .EM [C]s q
p Load .PIC [C]l q
p Save .PIC [C]p q
Es kann in folgenden Formaten geladen und gespeichert
(mit Back-up) werden:
.ACM Atom Connectivity Matrix
.BAC Back-up of Atom Connectivity Matrix
.EM Ensemble of Molecules
.BEM Back-up Ensemble of Molecules
.PIC Screen- bzw. Doodle-Format
Das Laden und Speichern im Screen- bzw. Doodle-Format
erfolgt ohne Back-up und ermöglicht die Übernahme der
erstellten Formeln in andere Zeichenprogramme.
Matrices Dieser Menüpunkt enthält einen Stack
p ACM[1] F1 q
p ACM[2] F2 q
p ACM[3] F3 q
p ACM[4] F4 q
p ACM[5] F5 q
p ACM[6] F6 q
p ACM[7] F7 q
p ACM[8] F8 q
p ACM[9] F9 q
p ACM[10] F10 q
der anzeigt, welche ACMs des EM belegt sind und welche
die jeweils aktuelle ACM - mit einem Häckchen gekenn-
zeichnet - ist. Die Graphikoperationen wirken nur auf
dieses ACM. Durch Anklicken der Einträge kann man die
aktuelle ACM bestimmen. Die Auswahl ist außerdem durch
Anklicken der Formel mit der rechten Maustaste möglich.
Beim Zeichnen wird jeweils die ACM aktualisiert, die am
nächsten liegt, es sei denn sie liegt außerhalb des Snap-
Radius. In diesem Fall wird eine neue ACM geöffnet.
Die 10 ACMs in der Version 4.03 sind (50,50)-Matrizen
mit zusammen 25000 Einträgen entsprechend 500 Atomen.
Größere Schemata müssen als .PIC-Datei zwischenge-
speichert werden.
Für SAR / SPR -Korrelationen sind definiert nummerierte
ACMs nötig. Die Sortierung und Durchnummerierung der
Matrizen kann in C-GINEER entweder durch den vom Chemical
Abstracts Service (CAS) benutzten MORGAN-Algorithmus [7],
programmiert nach [8] und konvergent erweitert, über den
Menüpunkt p Morgan sort [A]m q oder durch einen für
dieses Programm entwickelten Algorithmus p Canonical q
p form [A]c q erfolgen. Eine kanonische Form ist nach
[9] jede für ein spezielles Problem (hier die Geruchs-
bestimmung) standartisierte Matrix. Der Algorithmus geht
etwa folgendermaßen vor:
- Suche die polarste oder weitverzweigteste Stelle in
der Verbindung (letzteres analog zum MORGAN-Algorithmus)
- Durchlaufe von dort ausgehend zuerst die am wenigsten
verzweigten (charakteristischen) Reste und gehe dann
zur 'nächstweitverzweigten' Stelle -> Iteration...
Mit dem Menüeintrag p Numbering # q kann man sich die
jeweils aktuelle (sortierte bzw. unsortierte) Numerierung
der Atome ansehen. Mit dem Menüpunkt p Print | q die
jeweils aktuelle ACM ausdrucken.
Mit p Duplicate ins q wird die jeweils aktuelle Formel
und ihre ACM vervielfältigt, mit p Delete... last atom q
p undo q kann man den jeweils letzten Eintrag in die
AC-Matrix löschen (entspricht bei nichtsortierten Ver-
bindungen der zuletzt gezeichneten Bindung) und mit dem
Menüpunkt p Delete... AC-matrix del q die ganze Formel
und ihre ACM aus dem Stack entfernen.
Den ganzen Stack und die gesamte Zeichenebene (d.h. inkl.
geladener .PIC-Dateien) kann man über p Clear stack q
p clr q leeren.
Params. Hier sind die bereits beschriebenen Zeichenmodi aufgeführt:
p Norm mode [A]n q
p Bind mode [A]b q
p Text mode [A]t q
p------------------------ q
p Insert... q
p Filled wedge [A]f q
p Stroke wedge [A]s q ,
die jeweils angewählt werden können. Sonderzeichen im
'Text mode' sind über 'Control' A und Eingabe des ASCII-
Codes zugänglich. Zu den Insert...-Funktionen bleibt noch
anzumerken, daß die betreffende Bindung bereits gezeichnet
sein muß und sowohl Anfangs- als auch Zielpunkt des ausge-
zogenen Keils innerhalb des Snap-Radius liegen müssen. Die
Keile werden vom Anfangs- zum Zielpunkt ausweitend dar-
gestellt und lassen sich durch 'Darüberzeichnen' mit der-
selben Keilform wieder löschen bzw. variiren.
Für Normwinkel hat man die Auswahl zwischen...
p Norm angles for ... q
p Pentagon [A]p q
p Hexagon [A]h q ,
der Normierung auf Winkel die häufig in Fünf- oder Sechs-
ecken auftreten. Die Wahl dieser Normwinkel ist jedoch
auch beim Zeichnen anderer Strukturen nützlich, so wurde
die Cyclohexan-Sesselform in der Formel-Bibliothek im
Pentagon-Modus gezeichnet.
Die drei Bindungslängen auf die im Norm-Modus normiert
wird lassen sich über p Input bond lengths [A]i q frei
wählen. Es erscheint eine Box die über die Maus oder die
Tastatur bzw. den rechten Zahlenblock bedient werden kann.
Hierbei entspricht die Backspace-Taste dem ' <- '-Feld,
die Delete-Taste dem 'Clr'-Feld und die Return/Enter-
Taste dem 'Enter'-Feld.
Über p Screen switch tab q läßt sich einstellen, ob
ständig zwischen physikalischem und logischem Bildschirm
(auf Kosten von etwas Rechenzeit) hin- und hergeschaltet
werden soll oder die Ausgaben direkt erfolgen sollen. Bei
Verwendung von Großbildschirmen sollte 'Screen switch'
nicht aktiviert werden!
Außerdem läßt sich mit p Show matrices ^ q wählen, ob
die jeweils aktuelle ACM in der linken oberen Bildschirm-
ecke eingeblendet werden soll oder nicht.
Geometr. p Draw formula with left mouse q
p button / Transfer with right q
Unter diesem Menüpunkt sind die geometrischen Operationen
aufgeführt, die auf die gezeichnete Struktur wirken, aber
ihre ACM unverändert lassen:
p Rotate formula ... q
p clockwise + q
p - slightly [S]+ q
p counterclockwise - q
p - slightly [S]- q
Rotation der Formel im oder gegen den Uhrzeigersinn mit
dem Inkrement 15° und dem Shift-Inkrement 3°.
p Mirror ... q
p horizontal [S]h q
p vertical [S]v q
Spiegelung der Formel an einer horizontalen oder einer
vertikal verlaufenden Achse.
p Enlarge formula < q
p Shrink formula > q
Vergrößerung bzw. Verkleinerung der Formel um je 10 %.
p EPSON™ hardcopy ~ q
Vergrößerte Hardcopy des Zeichenbereiches im EPSON™-Modus.
SAR / SPR Hierunter steht eine SAR / SPR - Routine zur Geruchs-
bestimmung nach Strukturmerkmalen p Odor description q
p [S]o q , die an die verwendete kanonische Form an-
gepaßt wurde, Keilbindungen werden jedoch nicht erkannt.
Wenn eine Zuordnung möglich ist, so wird eine Duftbe-
schreibung zurückgegeben. Beispiele für Riechstoff-Dateien:
TAB_2_8.ACM TAB_4_3.ACM TAB_4_4.ACM TAB_4_10.ACM
Andere Programme lassen sich - bei ausreichendem Speicher-
platz - über p Execute [C]e q von C_GINEER aus starten.
Im Ordner C_GINEER.403 stehen folgende Bibliotheks- und Beispieldateien:
Ordner \ ... \ Dateien
============================================================================
EXAMPLE \ EXAMPLE.PIC, EXAMPLE.EM,
EXAMPLE1.ACM, EXAMPLE2.ACM, EXAMPLE3.ACM
LIBRARY -------------------------------------------------------------------
\ TABLE_1.LIB \ TABLE_1.PIC, TABLE_1.EM, TAB_1_1.ACM ... TAB_1_10.ACM
\ TABLE_2.LIB \ TABLE_2.PIC, TABLE_2.EM, TAB_2_1.ACM ... TAB_2_10.ACM
\ TABLE_3.LIB \ TABLE_3.PIC, TABLE_3.EM, TAB_3_1.ACM ... TAB_3_10.ACM
\ TABLE_4.LIB \ TABLE_4.PIC, TABLE_4.EM, TAB_4_1.ACM ... TAB_4_10.ACM
\ TABLE_5.LIB \ TABLE_5.PIC, TABLE_5.EM, TAB_5_1.ACM ... TAB_5_10.ACM
============================================================================
Literatur: [1] I. Ugi et. al.,
The Deductive Solution of Chemical Problems
by Computer Programms ...
Pure & Appl. Chem. 50, 1303 (1978).
[2] L. Spialter,
The Atom Connectivity Matrix (ACM) and
its Characteristic Polynomial (ACMCP) ...
J. Am. Chem. Soc. 85 (1963), 2012.
[3] LHASA - Logic and Heuristics Applied to
Synthetic Analysis
E.J. Corey, W.T. Wipke, Science 166, 178 (1969),
sowie J. Am. Chem. Soc. 94 (1972), 421.
[4] SECS - Simulation and Evaluation of
Chemical Synthesis
W.T. Wipke et al.,
J. Am. Chem. Soc. 98 (1976), 8107.
[5] CAMEO - Computer Assisted Mechanistic Evaluation
of Organic Reactions
W.L. Jorgensen et al., J. Org. Chem. 45 (1980),
2043, ibid. 54 (1989), 2058.
[6] ADAPT - Automated data analysis and pattern
recognition toolkit
A.J. Stuper, P.C. Jurs, J. Chem. Inform. Comput.
Sci. 16 (1976), 99. Eine interessante Anwendung:
P.C. Jurs et. al., Correlation of Odor Intensities
with Structural Properties of Odorants,
Chemical Senses 14 (1989), 281.
[7] H.L. Morgan, J. Chem. Doc. 5 (1965), 107.
[8] W.T. Wipke et al., J. Am. Chem. Soc. 96 (1974), 4834.
[9] J. Blair, J. Gasteiger, C. Gillespie, P.D. Gillespie,
I. Ugi, Tetrahedron 30 (1974), 1845.