home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 24 DOS / 24-DOS.zip / proanaly.zip / README.TXT < prev    next >
Text File  |  1996-08-08  |  10KB  |  238 lines

  1. -------------------------------------------------------------------
  2. PROANALYST: QUANTITATIVE STRUCTURE-ACTIVITY RELATIONSHIPS IN
  3. PROTEINS, PROTEIN ENGINEERING, PATTERNS RECOGNITION IN COMBINATORIAL
  4. LIBRARIES, PHYSICO-CHEMICAL AND ALPHABETICAL ANALYSIS IN MULTIPLE
  5. SEQUENCE ALIGNMENTS AND 3D STRUCTURE (VER 1.02)
  6. -------------------------------------------------------------------
  7.  
  8. COPYRIGHT (C) 1996 Vladimir Ivanisenko, Alexey Eroshkin, all rights reserved.
  9.  
  10. State Research Center of Virology and Biotechnology "Vector" Koltsovo,
  11. Novosibirsk Region, 633159 Russia
  12. E.mail: salex@vector.nsk.su, eroshkin@vector.nsk.su
  13.  
  14. All Trademarks and Registered Names are acknowledged in this document.
  15.  
  16. The files required to run PROANALYST are distributed in the form of a
  17. single compressed file. Create a directory "PANALYST" in your hard disk,
  18. for example, C.  Copy PANALYS$ to the directory and type PANALYS$ to
  19. unpack the program.
  20.  
  21. PROANALYST is an easy-to-use, state-of-the-art MSDOS application for
  22. studying the relationships between structure and activity in
  23. protein/peptide families.
  24.  
  25. You are free to use, copy and distribute this version to people you think
  26. may have interest to it IF: NO FEE IS CHARGED FOR USE, COPYING OR
  27. DISTRIBUTION. In this demo version print and save are disabled; the
  28. number of analyzed proteins is limited by 15.
  29.  
  30. This program is provided without any warranty, expressed or implied to
  31. you or any other person.  The authors will not be liable for incidental,
  32. consequential or other damages arising through the use of this software.
  33.  
  34. You can copy the programs and give copies to other people.
  35. However please note the following points: 
  36. a. The copyright of the program remains with the authors.
  37. b. Please acknowledge the program in any publications of
  38.    research for which they are used.
  39. c. If you transfer the program you must do so in unmodified form.
  40.  
  41. PROANALYST:
  42.  
  43. - has data converter from several protein sequence formats;
  44. - finds sites (in multiple alignment and 3D structure) influencing
  45. protein activity;
  46. - finds relationships between protein site structural characteristics and
  47. protein activities;
  48. - investigates structural differences between proteins divided by
  49. functional, evolutionary or other criteria (e.g. relates genotype to 
  50. phenotype);
  51. - investigates physico-chemical factors related with activity changes in
  52. a set of mutant proteins (including multiple physico-chemical factors);
  53. - simulates protein-engineering experiments and predicts activity of
  54. mutant protein;
  55. - searches motifs and patterns in combinatorial libraries 
  56. (peptide and phage-displayed libraries);
  57. - makes protein stereo pictures with sites highlighted;
  58. - provides linear correlation analysis, multiple linear regression
  59. analysis, discriminant analysis, ANOVA (analysis of variance),
  60. alphabetical analysis, profile;
  61. - maps all obtained results on 3D structure;
  62. - makes multiple alignment visualization and editing.
  63.  
  64.  
  65.        PROANALYST IS USEFUL:
  66.  
  67.      - for chemists and biochemists making the investigations in 
  68.        the field of protein structure-function and structure-activity 
  69.        analysis;
  70.  
  71.      - for protein engineers trying to improve some protein properties;
  72.  
  73.      - for molecular biologists that need to get sense from 
  74.        multiple protein alignments; 
  75.  
  76.      - for those who are interested in protein evolution and  
  77.        protein structure predictions; 
  78.  
  79.      - for those who need good color protein 3D pictures
  80.        with marking different sites; 
  81.  
  82.      - for students in any field of PROTEIN SCIENCE that need to 
  83.        know what is protein primary, secondary and tertiary 
  84.        structures; hydrophilicity and flexibility of protein 
  85.        segment; multiple alignments and sequences variability; 
  86.        functional and activity-modulating sites; hydrophobic 
  87.        moments; profiles of averages and variations; regression 
  88.        and discriminant analysis and many other important things.  
  89.  
  90.      - for all persons who are interested in comparative protein 
  91.        sequence analysis.
  92.  
  93.      PROANALYST has:
  94.  
  95.      - simple user interface to facilitate the data analysis and 
  96.        design;
  97.      - simple graphics to facilitate the data understanding;
  98.      - data examples with some protein family sequences and structures;
  99.      - data files of amino acid physico-chemical and other 
  100.        properties commonly used in protein analysis;
  101.      - the great number of service programs to help you in your
  102.        research;
  103.      - complete manual and help system.
  104.  
  105. REQUIREMENTS
  106.  
  107. PROANALYST runs on the IBM  PC  family  of  computers.  
  108. PROANALYST requires DOS 3.30 or higher and at least 550K of RAM; it will
  109. run on any 80-column monitor but graphics require EGA/VGA monitor.  A
  110. hard disk is recommended for enhancing performance of the program. 
  111.  
  112. THE PROGRAM'S MAIN FILES: 
  113.  
  114. README   TXT - this file
  115. MANUAL   TXT - manual to PROANALYST    
  116. HELP     HLP - help-file     
  117. HELP1    EXE - program for on-line help
  118. EXAMPLES TXT - step-by-step instruction to PROANALYST
  119. PANALYST EXE - main program     
  120. CONVERT  EXE - the program for data conversion from CLUSTAL, SWISS-PROT,
  121.                PIR, GCG files to PROANALYST format
  122. CONVERT  DOC - documentation for CONVERT
  123. PROPERTY PPT - 19 useful phys.-chem. properties of amino acid residues    
  124. KIDERA   PPT - 10 normalized Kidera's phys.-chem. properties of aa    
  125. PROGRAPH PPT - phys.-chem. properties of aa (from PROFILEGRAPH, K.Hofmann)    
  126. M2_RS    ACT - 3 files with data example of influenza A virus M(2) protein  
  127. M2_RS    ALI     
  128. M2_RS    SEQ     
  129. ANTIMICR ACT - 3 files with data example of antimicrobial peptides   
  130. ANTIMICR ALI     
  131. ANTIMICR SEQ     
  132. IFN      ACT - 3 files with data example of interferon-alpha  
  133. IFN      SEQ  
  134. IFN      ALI
  135. IFN      EXP - amino acid exposure and secondary structure (optional)
  136. IFN      PDB - interferon 3D structure 
  137. DE1      ACT - 3 files with data example of disintegrins
  138. DE1      SEQ
  139. DE1      ALI
  140. LIBRARY  ACT - 3 files with data example of phage-display library
  141. LIBRARY  SEQ
  142. LIBRARY  ALI
  143. ALN (subdirectory) - 50 aligned protein families.
  144.  
  145.  
  146. HOW TO START
  147.  
  148. To investigate the protein (or peptide) family of your interest you
  149. should prepare 3 files with protein names (*.seq), protein activities or
  150. grouping (*.act) and aligned sequences (*.ali) in the current directory.
  151. The data preparation can be made with the using of program CONVERT (see
  152. CONVERT.DOC) or any text editor.  See the formats in the MANUAL or in
  153. the files with the examples. Simple editor and viewer are present also
  154. in PROANALYST and CONVERT.
  155.  
  156. To use the program follow the steps: 
  157.  
  158. - start the program; 
  159.  
  160. - select earlier prepared protein family; 
  161.  
  162. - select sequences of the family you are going to investigate; 
  163.  
  164. - select a file with required physico-chemical properties of amino acids 
  165.   (necessary for regression and discriminant analysis);
  166.  
  167. - select amino acid physico-chemical properties being interested; 
  168.  
  169. - select protein 3D structure (if available); 
  170.  
  171. - go to menu item PREPARE DATA; 
  172.  
  173. - define an investigated fragment (or up to 8 fragments); 
  174.  
  175. and so on.
  176.  
  177. All other information you'll get from MANUAL.TXT or EXAMPLES.TXT files or
  178. from HELP system (press key F1) or simply with the using of trial-error
  179. method.
  180.  
  181. If  you  have  problems  running PROANALYST please consult the manual 
  182. or examples carefully to see if they can help.  If you still need
  183. advice then please contact the authors by e-mail.
  184.  
  185. Ask authors for complete updated version and:
  186.  
  187. ADDITIONAL NEW SOFTWARE TOOLS:
  188.  
  189. ProMSED: Protein Multiple Sequence Editor (for MS Windows 3.x/95)
  190.  
  191. o automatic (Clustal V algorithm) and manual multiple protein sequences
  192. alignment;
  193. o sequences import and export in different formats;
  194. o no limits on number and length of sequences except those imposed by
  195. current computer memory;
  196. o interactive alignment of selected protein subset or selected regions;
  197. o flexible visualization and edition of alignment (Word for Windows
  198. style);
  199. o amino acid coloring to facilitate understanding protein
  200. physico-chemical, structural, evolutionary and other features.
  201.  
  202.  
  203. ProAnWin: Windows version of ProAnalyst with multiple protein
  204. sequence alignment (for MS Windows 3.x/95)
  205.  
  206. o data input from main protein sequence formats (SWISS-PROT, PIR, FASTA,
  207. GCG, CLUSTAL);
  208. o databases of more then 50 amino acid physico-chemical properties;
  209. o reads 3D protein structure in PDB format;
  210. o flexible input of user-defined protein activities, properties or
  211. related phenotypes;
  212. o multiple protein sequences alignment (Clustal V algorithm);
  213. o threading multiple sequence alignment onto known 3-dimensional
  214. structure;
  215. o searching sites influencing protein activity and analyzing
  216. relationships between protein site structural characteristics and protein
  217. activities (properties or related phenotypes);
  218. o multiple linear regression analysis of structure-activity
  219. relationships;
  220. o genotype -- phenotype correlation analysis (e.g., in studying virus
  221. drug resistance);
  222. o investigation of physico-chemical factors related with activity or
  223. property changes in mutant proteins;
  224. o flexible visualization of protein 3D structures with sites highlighted;
  225. o activity, property or phenotype prediction;
  226. o output of all obtained results into text file.
  227.  
  228.  
  229. PROANAL3: Protein structure-activity analysis, analysis of
  230. physico-chemical properties variations and conservations (for MS DOS)
  231.  
  232. o main features of ProAnalyst with nonlinear analysis of protein
  233. structure-activity relationships;
  234. o enhanced physico-chemical profiles for protein features prediction
  235. (functional and variable sites, secondary structures, amphipathic
  236. helices, antigenic sites, etc.).
  237.  
  238.