home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / bionet / molbio / genbank / 593 < prev    next >
Encoding:
Internet Message Format  |  1992-12-23  |  4.1 KB

  1. Xref: sparky bionet.molbio.genbank:593 bionet.molbio.embldatabank:63
  2. Path: sparky!uunet!cis.ohio-state.edu!zaphod.mps.ohio-state.edu!darwin.sura.net!gatech!usenet.ins.cwru.edu!agate!biosci!daresbury!bioftp.unibas.ch!comp.bioz.unibas.ch!rdoelz
  3. From: rdoelz@comp.bioz.unibas.ch [remote] (Reinhard Doelz)
  4. Newsgroups: bionet.molbio.genbank,bionet.molbio.embldatabank
  5. Subject: Re: EMBL <> GenBank
  6. Message-ID: <1992Dec23.193147.21458@comp.bioz.unibas.ch>
  7. Date: 23 Dec 92 19:31:47 GMT
  8. References: <1992Dec22.142144.18782@husc3.harvard.edu> <1992Dec22.220954.563@nlm.nih.gov> <1992Dec23.081643.11004@comp.bioz.unibas.ch> <1992Dec23.160654.60156@embl-heidelberg.de>
  9. Sender: usenet@comp.bioz.unibas.ch (NEWS transaction account)
  10. Reply-To: doelz@urz.unibas.ch
  11. Organization: EMBnet Switzerland [BASEL]
  12. Lines: 63
  13. Nntp-Posting-Host: biox.embnet.unibas.ch
  14.  
  15. In article <1992Dec23.160654.60156@embl-heidelberg.de>, stoehr@embl-heidelberg.de writes:
  16. |> In article <1992Dec23.081643.11004@comp.bioz.unibas.ch>,
  17. |> doelz@comp.bioz.unibas.ch (Reinhard Doelz) writes:
  18. |> > 
  19. |> > It has been brought to our attention by one of our customers that there 
  20. |> > are currently thousands (!) of these cases. In contrast to the original 
  21. |> > assumption that Genbank 74 will now be sort of identical to EMBL 33, I 
  22. |> > can only warn all of you who trusted in this rather than trying it out. 
  23. |> > 
  24. |> 
  25. |> Firstly, the assumption that GenBank 74 should be 'sort of identical' to
  26. |> EMBL 33 is false (depending on how identical 'sort of' means). The two
  27. |> databases are made at different times.
  28.  
  29. Sorry if this sounds misleading  - I trusted in the release notes stating 
  30. "New and updated sequence data from the latest GenBank and  DDBJ  releases
  31. have been  incorporated  into  this release." Freeze date EMBL 
  32. Release 33 on 8 November 1992, GENBANK 74 on 17 November 1992 - 
  33. I thought that this would imply the most recent daily updates from 
  34. GENBANK also to be in EMBL and vice versa. 
  35.  
  36. |> We do not yet have Genbank 74 here: when we do, as for other quarterly
  37. |> releases, we determine what we are missing and work to include it all in the
  38. |> EMBL database. I'm surprised at the figure of 10,000, as I believe that when
  39. |> we made EMBL 33 that all acc#'s from the previous GenBank release were in.
  40. |> Another current difference is the accession numbers beginning with 'S' (about
  41. |> 3000 according to your figures) which we do not include in EMBL yet - but
  42. |> that's a different story.
  43.  
  44. I used the -exclude flag in the GCG software to compute the numbers that I 
  45. quoted. The entry number is surprising to me also, and I just hope that 
  46. there is an error in my procedures. 
  47.  
  48. With respect to the numbers; I have taken the daily EMBL updates (as of Dec 20
  49. at EMBL creation), and the GENBANK 74 release files (not their daily updates), 
  50. and came up with 8141 entries of EMBL, resembling 8540 accession numbers. 
  51. (This is for both new entries from EMBL and GENBANK as sent by EMBL in 
  52. EMBL format. If I look at how many entries are in GENBANK 74 not in 
  53. EMBL 33 (containing 5698 AN), and subtract those which are unique to EMBL, it 
  54. appears that EMBL updates contain 2591 entries which are in GENBANK 74 
  55. (according to 2612 Accession Numbers). That still leaves us with a 
  56. considerable number of discrepancies. 
  57. |> 
  58. |> Regards,
  59. |> Peter Stoehr
  60. |> EMBL Data Library
  61.  
  62. Your work is most appreciated, and I encourage you to keep up the good 
  63. work. I didn't want to make any negative statements on quality in general, 
  64. just point out that the exclusion sets are still a need. 
  65.  
  66. Regards 
  67. Reinhard 
  68.  
  69. -- 
  70. +----------------------------------+-------------------------------------+
  71. |    Dr. Reinhard Doelz            | RFC     doelz@urz.unibas.ch         |
  72. |      Biocomputing                | DECNET  20579::48130::doelz         |
  73. |Biozentrum der Universitaet       | X25     022846211142036::doelz      |
  74. |   Klingelbergstrasse 70          | FAX     x41 61 261- 6760 or 267- 2078     
  75. |     CH 4056 Basel                | TEL     x41 61 267- 2076 or 2247    |   
  76. +------------- bioftp.unibas.ch is the SWISS EMBnet node ----------------+
  77.                -----------------------------------------
  78.