home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / bionet / announce / 321 < prev    next >
Encoding:
Internet Message Format  |  1993-01-25  |  6.2 KB

  1. Path: sparky!uunet!biosci!carson.u.washington.edu
  2. From: henikoff@carson.u.washington.edu (Steven Henikoff)
  3. Newsgroups: bionet.announce
  4. Subject: New release of the Blocks Database for searching
  5. Message-ID: <1k19eoINN48v@shelley.u.washington.edu>
  6. Date: 25 Jan 93 17:53:28 GMT
  7. Sender: kristoff@net.bio.net
  8. Distribution: bionet
  9. Organization: University of Washington, Seattle
  10. Lines: 96
  11. Approved: bionews-moderator@net.bio.net
  12.  
  13.  
  14.         ___________               ___________               ___________ 
  15.        |\ __________\            |___________|            /__________ /|
  16.        | |           |           |           |           |           | |
  17.        | | **********|           |***********|           |********** | |
  18.        | | * BLOCKS  |           |   E-MAIL  |           |SEARCHER * | |
  19.        | | **********|           |***********|           |********** | |
  20.         \|___________|___________|___________|___________|___________|/
  21.                      |\ __________\         /__________ /|
  22.                      | |           |       | Copyright | |
  23.                      | |   S Agus  |       |    Fred   | |
  24.                      | |JG Henikoff|       | Hutchinson| |
  25.                      | | S Henikoff|       |   Center  | |
  26.                       \|___________|       |____1993___|/
  27.  
  28. Release 6.0 of the Blocks Database is now available for searching. Blocks are 
  29. short multiply aligned ungapped segments corresponding to the most highly 
  30. conserved regions of proteins. A database of blocks has been constructed by 
  31. successive application of the automated PROTOMAT system to individual entries
  32. in the PROSITE catalog of protein groups keyed to the SWISS-PROT protein 
  33. sequence databank. The rationale behind searching a database of blocks is 
  34. that information from multiply aligned sequences is present in a concentrated
  35. form, reducing background and increasing sensitivity to distant 
  36. relationships. If a particular block scores highly, it is possible that the 
  37. sequence is related to the group of sequences the block represents. 
  38. Typically, a group of proteins has more than one region in common and their 
  39. relationship is represented as a series of blocks separated by unaligned 
  40. regions. If a second block for a group also scores highly in the search, the 
  41. evidence that the sequence is related to the group is strengthened, and is 
  42. further strengthened if a third block also scores it highly, and so on. The 
  43. new database consists of 2302 blocks based on 619 protein groups documented 
  44. in Prosite 10.00, which is keyed to Swiss-Prot 24. This represents an 11% 
  45. increase in the number of groups over the previous release based on Prosite 
  46. 9.00 keyed to Swiss-Prot 22.
  47.  
  48. For a detailed help file, send a blank e-mail message as follows:
  49.  
  50. To: blocks@howard.fhcrc.org
  51. Subject: help
  52.  
  53. Or just send a protein or DNA sequence in FASTA, Genepro, GenBank, EMBL,
  54. SWISS-PROT, or PIR formats (DNA is automatically translated in all 6 reading
  55. frames for searching). Here is an example of a protein query in FASTA format:
  56.  
  57. To: blocks@howard.fhcrc.org
  58. Subject:
  59. >YCZ2_YEAST   Hypothetical 40.1 KD protein in HMR 3' region
  60. MKAVVIEDGKAVVKEGVPIPELEEGFVLIKTLAVAGNPTDWAHIDYKVGPQGSILGCDAA
  61. GQIVKLGPAVDPKDFSIGDYIYGFIHGSSVRFPSNGAFAEYSAISTVVAYKSPNELKFLG
  62. EDVLPAGPVRSLEGAATIPVSLTTAGLVLTYNLGLNLKWEPSTPQRNGPILLWGGATAVG
  63. QSLIQLANKLNGFTKIIVVASRKHEKLLKEYGADQLFDYHDIDVVEQIKHKYNNISYLVD
  64. CVANQNTLQQVYKCAADKQDATVVELTNLTEENVKKENRRQNVTIDRTRLYSIGGHEVPF
  65. GGITFPADPEARRAATEFVKFINPKISDGQIHHIPARVYKNGLYDVPRILEDIKIGKNSG
  66. EKLVAVLN
  67.  
  68. For any group represented in the current database, the blocks and full 
  69. Prosite documentation can be obtained by sending the command 'GET BL?????' 
  70. in the subject line of a blank message. For example, 'get bl00044' retrieves
  71. the block(s), PROSITE.DAT and PROSITE.DOC entries for Prosite group PS00044.
  72.  
  73. The Blocks database also has been used to construct amino acid substitution
  74. matrices, referred to as the 'BLOSUM' (for BLOcks SUbstitution Matrices)
  75. series. We have obtained improved results using the FASTA, BLASTP and other
  76. programs with these matrices (see Henikoff, S & Henikoff, J.G. "Amino acid
  77. substitution matrices from protein blocks" PNAS 89:10915-10919). The single
  78. best overall matrix, BLOSUM 62, is recommended for general use. Here is 
  79. BLOSUM 62 formatted for use with BLAST:
  80. ------------------------------cut here---------------------------------------
  81. #  BLAST version of BLOSUM 62 matrix made from BLOCKS v. 5.0 and 
  82. #  scaled in half-bits. B, Z and X columns are based on amino acid 
  83. #  frequencies from SwissProt 22. * column uses minimum score.
  84.  A  R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V  B  Z  X  *
  85.  4 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  1  0 -3 -2  0 -2 -1  0 -4 
  86. -1  5  0 -2 -3  1  0 -2  0 -3 -2  2 -1 -3 -2 -1 -1 -3 -2 -3 -1  0 -1 -4 
  87. -2  0  6  1 -3  0  0  0  1 -3 -3  0 -2 -3 -2  1  0 -4 -2 -3  3  0 -1 -4 
  88. -2 -2  1  6 -3  0  2 -1 -1 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3  4  1 -1 -4 
  89.  0 -3 -3 -3  9 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1 -3 -3 -2 -4 
  90. -1  1  0  0 -3  5  2 -2  0 -3 -2  1  0 -3 -1  0 -1 -2 -1 -2  0  3 -1 -4 
  91. -1  0  0  2 -4  2  5 -2  0 -3 -3  1 -2 -3 -1  0 -1 -3 -2 -2  1  4 -1 -4 
  92.  0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3 -1 -2 -1 -4 
  93. -2  0  1 -1 -3  0  0 -2  8 -3 -3 -1 -2 -1 -2 -1 -2 -2  2 -3  0  0 -1 -4 
  94. -1 -3 -3 -3 -1 -3 -3 -4 -3  4  2 -3  1  0 -3 -2 -1 -3 -1  3 -3 -3 -1 -4 
  95. -1 -2 -3 -4 -1 -2 -3 -4 -3  2  4 -2  2  0 -3 -2 -1 -2 -1  1 -4 -3 -1 -4 
  96. -1  2  0 -1 -3  1  1 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2  0  1 -1 -4 
  97. -1 -1 -2 -3 -1  0 -2 -3 -2  1  2 -1  5  0 -2 -1 -1 -1 -1  1 -3 -1 -1 -4 
  98. -2 -3 -3 -3 -2 -3 -3 -3 -1  0  0 -3  0  6 -4 -2 -2  1  3 -1 -3 -3 -1 -4 
  99. -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2 -2 -1 -2 -4 
  100.  1 -1  1  0 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  1 -3 -2 -2  0  0  0 -4 
  101.  0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  1  5 -2 -2  0 -1 -1  0 -4 
  102. -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  1 -4 -3 -2 11  2 -3 -4 -3 -2 -4 
  103. -2 -2 -2 -3 -2 -1 -2 -3  2 -1 -1 -2 -1  3 -3 -2 -2  2  7 -1 -3 -2 -1 -4 
  104.  0 -3 -3 -3 -1 -2 -2 -3 -3  3  1 -2  1 -1 -2 -2  0 -3 -1  4 -3 -2 -1 -4 
  105. -2 -1  3  4 -3  0  1 -1  0 -3 -4  0 -3 -3 -2  0 -1 -4 -3 -3  4  1 -1 -4 
  106. -1  0  0  1 -3  3  4 -2  0 -3 -3  1 -1 -3 -1  0 -1 -3 -2 -2  1  4 -1 -4 
  107.  0 -1 -1 -1 -2 -1 -1 -1 -1 -1 -1 -1 -1 -1 -2  0  0 -2 -1 -1 -1 -1 -1 -4 
  108. -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4  1 
  109.