home *** CD-ROM | disk | FTP | other *** search
/ The Unsorted BBS Collection / thegreatunsorted.tar / thegreatunsorted / texts / txtfiles_misc / human_ge.pro < prev    next >
Text File  |  1995-01-03  |  130KB  |  2,693 lines

  1. Table of Contents
  2.  
  3. Foreword and Preface
  4.  
  5. Introduction
  6.      History of the Human Genome Project     
  7.      DOE-NIH Coordination     
  8.      Scientific Five-Year Goals of the U.S. Human Genome Project 
  9.  
  10. Highlights of Research Progress
  11.      Mapping   
  12.      Informatics    
  13.      Sequencing     
  14.      Activities Addressing Ethical, Legal, and Social Issues Related to
  15.       Human Genome Project Data     
  16.       Technology Transfer and Industrial Collaboration  
  17.  
  18. Human Genome Center Research Narratives
  19.      Lawrence Berkeley Laboratory  
  20.      Lawrence Livermore National Laboratory  
  21.      Los Alamos National Laboratory     
  22.  
  23. Program Management Infrastructure
  24.      DOE OHER Mission    
  25.      Program Management Task Group 
  26.      Field Coordination 
  27.       Human Genome Coordinating Committee     
  28.       Human Genome Management Information System   
  29.       Human Genome Distinguished Postdoctoral Fellowships 
  30.      Resource Allocation 
  31.      Interagency Coordination 
  32.       Joint DOE-NIH Activities 
  33.            Joint Mapping Working Group   
  34.            Joint Informatics Task Force  
  35.            Joint Sequencing Working Group     
  36.            Joint Working Group on Ethical, Legal, and Social Issues    
  37.            Joint Working Group on the Mouse   
  38.      Other U.S. Genome Research    
  39.       U.S. Department of Agriculture     
  40.       National Science Foundation   
  41.       Howard Hughes Medical Institute    
  42.  
  43. International Coordination
  44.      HUGO: Worldwide Genome Research Coordination 
  45.      UNESCO: Promoting the Interests of Developing Countries 
  46.  
  47. Search Abstracts of DOE-Funded Research
  48.  
  49.       You may search by Author Name, Address, or any word that appears 
  50.       in the abstract.  You may narrow your search by using the boolean 
  51.       operators (and. or, not) or by phrase searches (".....").  
  52.       For example - if you want to see all the mouse work funded by the 
  53.       DOE Genome projuct simply search for 
  54.  
  55.       mouse
  56.  
  57.       But if you want to see only the mouse projects that have proposed 
  58.       to use Fluorescence In Situ Hybridization (FISH) search for:
  59.  
  60.       mouse and fish
  61.  
  62.       this will narrow the results dramatically.
  63.  
  64.  
  65. Appendices
  66.      A. Primer on Molecular Genetics    
  67.      B. Conferences, Meetings, and Workshops Sponsored by DOE 
  68.      C. Members of the DOE Health and Environmental Research
  69.       Advisory Committee  
  70.      D. Members of the DOE-NIH Joint Working Groups    
  71.      E. Glossary
  72.     
  73.      Index to Principal and Coinvestigators Listed in Abstracts  
  74.      Acronym List
  75.  
  76.  
  77.  
  78. Foreword
  79.  
  80. Acquiring complete knowledge of the organization, structure, and
  81. function of the human genome_the master blueprint of each of
  82. us_is the broad aim of the Human Genome Project. It is a new kind
  83. of program in biology, both in its size and focus on a limited
  84. set of goals and in its dependence on the development and use of
  85. technology. The coordinated U.S. Human Genome Project was
  86. officially initiated by the Department of Energy (DOE) Office of
  87. Health and Environmental Research and the National Institutes of
  88. Health (NIH) National Center for Human Genome Research (NCHGR) in
  89. FY 1991 with the publication in April 1990 of Understanding Our
  90. Genetic Inheritance; The U.S. Human Genome Project: The First
  91. Five Years 1991-1995. The DOE effort, which began very modestly
  92. almost 4 years before, is now over 5 years old. Taking stock of
  93. what has been done and what remains to be done is particularly
  94. appropriate at this time.
  95.  
  96. That the ambitious scientific goal of the Human Genome Project
  97. can now be imagined is the result of the revolution occurring in
  98. biology during the last 20 years. Modern biological science has
  99. achieved a profound but still quite incomplete level of
  100. understanding of how the diversity of all living things is
  101. determined. This insight, along with scientific and technical
  102. advances in other fields, has brought unprecedented power both in
  103. being able to analyze and manipulate genetic structures and to
  104. use and store large quantities of genetic information. DOE is
  105. uniquely positioned to bring together expertise in physics,
  106. chemistry, engineering, and computer science to help solve
  107. fundamental biological problems and to exploit exciting
  108. opportunities presented by the Human Genome Project. Genome
  109. research will also contribute to the department's role in
  110. providing the scientific foundation for understanding the health
  111. effects of radiation and of chemical insults to the genome.
  112.  
  113. The DOE program stresses mapping, the development of sequencing
  114. technologies and instrumentation, and informatics. Informatics
  115. refers to computational approaches in acquiring, storing,
  116. distributing, analyzing, and manipulating vast amounts of mapping
  117. and sequence data that will result from the project. Another
  118. important program component studies the ethical, legal, and
  119. social issues arising from use of the generated data,
  120. particularly in the privacy and confidentiality of genetic
  121. information. Cutting across all DOE biological and environmental
  122. research programs are several science education activities.
  123.  
  124. The Human Genome Project is a closely cooperative activity
  125. between NIH and DOE. NCHGR is an important and essential
  126. participant. Internationally, the formation of the Human Genome
  127. Organization and the establishment of national genome projects by
  128. an increasing number of countries indicate the fascination and
  129. promise of this effort on the collective imaginations of many
  130. nations. In addition to the inherent excitement about increased
  131. knowledge of human life, the project offers the promise of many
  132. new opportunities for benefiting humanity through the development
  133. of new diagnostics, pharmaceuticals, and therapies for a
  134. multitude of human diseases; a wide range of improvements will
  135. flow from other biotechnology advances. Further expected benefits
  136. include improved risk assessment for individuals and populations
  137. exposed to agents that impact genetic material, as well as
  138. possible applications of the data to environmental and
  139. remediation issues.
  140.  
  141. To be successful, the program must continue to focus on clear
  142. objectives for mapping and sequencing and to incorporate the flow
  143. of technological developments into the efforts of all working
  144. laboratories. Strategies must be planned carefully and in a
  145. comprehensive fashion as the next phase begins, in which mapping
  146. and sequencing results proliferate and technologies mature.
  147. Planning must be project-wide and include interagency planning at
  148. ever-earlier stages.
  149.  
  150. This report describes the status of the DOE Human Genome Program
  151. and its accomplishments to date. Research highlights are noted
  152. from the program as a whole and from the three principal DOE
  153. human genome centers at Lawrence Berkeley Laboratory, Lawrence
  154. Livermore National Laboratory, and Los Alamos National
  155. Laboratory. These national laboratory facilities of DOE have been
  156. especially successful because they are organized to focus
  157. efforts, foster interdisciplinary projects, and use advanced
  158. technologies, some developed for other purposes, toward program
  159. goals. Essential work is also reported from 41 different research
  160. universities. Remarkable progress has been made in advanced
  161. instrumentation and informatics.
  162.  
  163. A further indication of the increasing development of the DOE
  164. program is the simple statistic that the 1989-90 report had 157
  165. pages and included 57 abstracts of work involving 211 scientists.
  166. The current program report contains over 240 pages and includes
  167. more than 150 abstracts of work involving over 400 investigators,
  168. essentially a doubling of DOE program size.
  169.  
  170. The Human Genome Project ultimately will create scientific
  171. resources for the next wave of advances in biology and medicine.
  172. As the project is completed, accomplishments will dwarf those
  173. that have occurred in the biological sciences since the advent of
  174. recombinant DNA technologies. By the same token, the ethical and
  175. social consequences of the uses of this new knowledge must be
  176. considered as the knowledge is acquired; if this knowledge is
  177. responsibly obtained and applied, the next decade of biological
  178. research will be history's most fruitful and rewarding by any
  179. measure.
  180.  
  181.  
  182.  
  183. David J. Galas, Associate Director
  184. Office of Health and Environmental Research
  185. Office of Energy Research
  186. U.S. Department of Energy
  187.  
  188. Preface
  189.  
  190. This is the third report summarizing the Department of Energy
  191. (DOE) Human Genome Program, its content, progress, and
  192. accomplishments. Since the program's conception in 1986 and
  193. initiation in 1987 by the DOE Office of Health and Environmental
  194. Research (OHER), its broad objectives have rapidly gained both
  195. national and international support. The program has made
  196. important strides in the development and application of
  197. technologies and tools that are required for the cost-effective
  198. characterization of the molecular nature of the human genome.
  199.  
  200. This country's Human Genome Project is jointly administered by
  201. OHER and the National Center for Human Genome Research of the
  202. National Institutes of Health. A successful effort to
  203. characterize the molecular nature of human inheritance will
  204. require continuing international cooperation involving scientists
  205. from many countries. A number of other nations have begun
  206. substantial efforts to map and sequence the human genome and
  207. those of key model organisms. Although intellectual property
  208. issues threaten some aspects of international cooperation,
  209. increasing exchange of information has led to more involvement of
  210. the international community in discovery, acceleration of the
  211. pace of the research, and increased cost-effectiveness.
  212. International communication is facilitated by regular meetings to
  213. update the maps of individual chromosomes and by contributions to
  214. databases such as the Genome Data Base and nucleic acid sequence
  215. databanks. Through such databases a worldwide data aggregation
  216. and distribution system is being developed to exchange
  217. information regarding the genome.
  218.  
  219. Aided by funding from the Human Genome Project, serious study is
  220. under way on ethical, legal, and social issues that are becoming
  221. more urgent because of the rapid growth in knowledge of human
  222. genetics. It is important to develop and disseminate deeper and
  223. more widespread understanding of these dynamic issues and of the
  224. choices available for families, the law, and society. An educated
  225. public is required to make intelligent choices in this area. The
  226. national genome project is now the largest provider of funds for
  227. study of such issues.
  228.  
  229. A key to the long-term success of the program is the initial
  230. phase of intensive resource and technology development that
  231. requires input and involvement from many scientific and
  232. engineering disciplines. Exciting contributions have already been
  233. made to biomedical knowledge and biotechnology, and such advances
  234. are certain to continue at an ever-increasing rate. Announcements
  235. of discovery of important disease genes have become commonplace.
  236. Within 10 years nearly all the perhaps 100,000 genes that make up
  237. the human genome are likely to be found. Within 15 years the
  238. program is expected to culminate in a reference DNA sequence of
  239. the entire genome.
  240.  
  241. Never has such a mass of data flowed into biology and medicine.
  242. An understanding of how genetic variations account for much of
  243. the richness and adventure of human diversity will be greatly
  244. increased. More practically, there can be little doubt of
  245. tremendous payoffs in terms of diagnoses and, ultimately,
  246. specific therapies for many human diseases.
  247.  
  248. Moreover, new technologies and rapidly developing analytical
  249. tools to characterize the human genome will have widespread
  250. impact beyond human health. They will find application in
  251. revealing the genetic inheritance of many organisms of potential
  252. scientific and commercial interest and will provide an important
  253. stimulus to broaden and deepen the impact of modern biology in
  254. areas such as energy, environmental protection and waste
  255. treatment, agriculture, and the materials sciences.
  256.  
  257. Of particular importance is the facile access to proteins that
  258. rapidly follows discovery of their genes. As a result of genome
  259. projects, we will soon be in a position to begin the systematic
  260. large-scale characterization of proteins and their structure. The
  261. interplay of molecular biology, structural studies,
  262. high-performance computing, and advanced molecular graphics will
  263. certainly lead to an understanding of macromolecular
  264. structure-function relationships. The scientific and economic
  265. implications of such a predictive understanding cannot be
  266. overestimated. It is the key to full realization of the potential
  267. of modern biology.
  268.  
  269. Intense X-ray light and neutrons produced by unique, large, and
  270. expensive machines (synchrotrons and reactors) at DOE
  271. laboratories are important national resources for the
  272. determination of biological structure and, hence, for the
  273. national effort in biotechnology. A central goal of OHER is to
  274. provide access to these machines by making facilities and
  275. technical support available to structural-biology users, a need
  276. that has been projected to increase tenfold in the next several
  277. years.
  278.  
  279. Finally, as Robert Sinsheimer elegantly pointed out in The FASEB
  280. Journal (November 1991), the Human Genome Project is an epic
  281. venture of discovery that will in time clarify many endlessly and
  282. fruitlessly debated mysteries of human nature. With this project
  283. we are launched upon a new stage of the age-old quest to
  284. illuminate the record of the human past_the prehistory of our
  285. species as recorded in the genetic script or blueprint for our
  286. being. When complete, the project will have provided us with an
  287. unprecedented resource_the complete text of our genetic
  288. endowment. It will be seen as a turning point in human history.
  289.  
  290.  
  291.  
  292. David A. Smith, Director
  293. Health Effects and Life Sciences Research Division
  294. Office of Health and Environmental Research
  295. Office of Energy Research
  296. U.S. Department of Energy
  297. Acknowledgements
  298.  
  299. The DOE Office of Health and Environmental Research gratefully
  300. acknowledges the contributions made by genome research grantees
  301. and contractors in submitting abstracts, photographs, captions,
  302. and narratives. The Human Genome Management Information System at
  303. Oak Ridge National Laboratory (managed by Martin Marietta Energy
  304. Systems, Inc., for the U.S. Department of Energy under contract
  305. DE-AC05-84OR21400) collected and organized the information,
  306. prepared the manuscript, and implemented the design and
  307. production of this publication.
  308.  
  309.  
  310.  
  311.  
  312. Introduction
  313.  
  314. The U.S. Human Genome Project is the national coordinated 15-year
  315. effort to characterize all the human genetic material_the
  316. genome_by improving existing human genetic maps, constructing
  317. physical maps of entire chromosomes, and ultimately determining
  318. the complete sequence of the deoxyribonucleic acid (DNA) subunits
  319. in the human genome. Parallel studies are being carried out on
  320. selected model organisms to facilitate the interpretation of
  321. human gene function. The ultimate goal of the U.S. project is to
  322. discover all of the more than 100,000 human genes and render them
  323. accessible for further biological study.
  324.  
  325. Current technology could probably be used to attain the
  326. objectives of the Human Genome Project, but the cost and time
  327. required would be unacceptable. For this reason, a major feature
  328. of the first 10 years of the project is to optimize existing
  329. methods and develop new technology to increase efficiency in DNA
  330. mapping and sequencing by 1 or 2 orders of magnitude. The genome
  331. will eventually be sequenced using continually evolving
  332. technologies and revolutionary methods not in existence today.
  333.  
  334. Information obtained as part of the Human Genome Project will
  335. dramatically change almost all biological and medical research
  336. and dwarf the catalog of current genetic knowledge. In addition,
  337. both the methods and the data developed as part of the project
  338. are likely to benefit investigations of many other genomes,
  339. including a large number of commercially important plants and
  340. animals.
  341.  
  342. For more information on the science of genomics, see Appendix A,
  343. "Primer on Molecular Genetics," p. 191. Terms are defined in the
  344. Glossary, p. 229. An acronym list is on the inside back cover.
  345.  
  346.  
  347. History of the DOE Human Genome Program
  348.  
  349. A brief history of the U.S. Department of Energy (DOE) Human
  350. Genome Program will be useful in a discussion of the objectives
  351. of the DOE program as well as those of the collaborative U.S.
  352. Human Genome Project. The Office of Health and Environmental
  353. Research (OHER) of DOE and its predecessor agencies_the Atomic
  354. Energy Commission and the Energy Research and Development
  355. Administration_have long sponsored research into genetics, both
  356. in microbial systems and in mammals, including basic studies on
  357. genome structure, replication, damage, and repair and the
  358. consequences of genetic mutations.
  359.  
  360. In 1984, OHER and the International Commission on Protection
  361. Against Environmental Mutagens and Carcinogens cosponsored a
  362. conference in Alta, Utah, which highlighted the growing roles of
  363. recombinant DNA technologies. Substantial portions of the
  364. meeting's proceedings were incorporated into the Congressional
  365. Office of Technology Assessment report, Technologies for
  366. Detecting Heritable Mutations in Humans, in which the value of a
  367. reference sequence of the human genome was recognized.
  368.  
  369. Acquisition of such a reference sequence was, however, far beyond
  370. the capabilities of biomedical research resources and
  371. infrastructure existing at that time. Although the small genomes
  372. of several microbes had been mapped or partially sequenced, the
  373. detailed mapping and eventual sequencing of 24 distinct human
  374. chromosomes (22 autosomes and the sex chromosomes X and Y) that
  375. together comprise an estimated 3 billion subunits was a task some
  376. thousandsfold larger.
  377.  
  378. DOE OHER was already engaged in several multidisciplinary
  379. projects contributing to the nation's biomedical capabilities,
  380. including the GenBankr DNA sequence repository, which was
  381. initiated and sustained by DOE computer and data-management
  382. expertise. Several major user facilities supporting
  383. microstructure research were developed and are maintained by DOE
  384. (see box, p. 55). Unique chromosome-processing resources and
  385. capabilities were in place at Los Alamos National Laboratory and
  386. Lawrence Livermore National Laboratory. Among these were the
  387. fluorescence-activated cell sorter (FACS) systems to purify human
  388. chromosomes within the National Laboratory Gene Library Project
  389. for the production of libraries of DNA clones. The availability
  390. of these monochromosomal libraries opened an important path_a
  391. practical means of subdividing the huge total genome into 24 much
  392. more manageable components.
  393.  
  394. With these capabilities, OHER began in 1986 to consider the
  395. feasibility of a dedicated human genome program. Leading
  396. scientists were invited to the March 1986 international
  397. conference at Santa Fe, New Mexico, to assess the desirability
  398. and feasibility of implementing such a project. With virtual
  399. unanimity, participants agreed that ordering and eventually
  400. sequencing DNA clones representing the human genome were
  401. desirable and feasible goals. With the receipt of this
  402. enthusiastic response, OHER initiated several pilot projects.
  403. Program guidance was further sought from the DOE Health Effects
  404. Research Advisory Committee (HERAC, see Appendix C for a list of
  405. current members).
  406.  
  407.  
  408. The HERAC Recommendation. The April 1987 HERAC report recommended
  409. that DOE and the nation commit to a large, multidisciplinary,
  410. scientific, and technological undertaking to map and sequence the
  411. human genome. DOE was particularly well suited to focus on
  412. resource and technology development, the report noted; HERAC
  413. further recommended a leadership role for DOE because of its
  414. demonstrated expertise in managing complex and long-term
  415. multidisciplinary projects involving both the development of new
  416. technologies and the coordination of efforts in industries,
  417. universities, and its own laboratories. Evolution of the nation's
  418. Human Genome Project further benefited from a 1988 study by the
  419. National Research Council (NRC) entitled Mapping and Sequencing
  420. the Human Genome, which recommended that the United States
  421. support this research effort and presented an outline for a
  422. multiphase plan.
  423.  
  424.  
  425. DOE-NIH Coordination
  426.  
  427. The National Institutes of Health (NIH) was a necessary
  428. participant in the large-scale effort to map and sequence the
  429. human genome because of its long history of support for
  430. biomedical research and its vast community of scientists. This
  431. was confirmed by the NRC report, which recommended a major role
  432. for NIH. In 1987, under the leadership of Director James
  433. Wyngaarden, NIH established the Office of Genome Research in the
  434. Director's Office. In 1989 this office became the National Center
  435. for Human Genome Research (NCHGR), directed by James D. Watson.
  436. After Watson's resignation in April 1992, Michael Gottesman was
  437. appointed NCHGR Acting Director.
  438.  
  439. In addition to extramural support for research projects in
  440. physical mapping and the development of index linkage markers and
  441. technology, NIH also provides support for genetic mapping based
  442. on family studies and, following NRC recommendations, for studies
  443. on several relevant model organisms. DOE-supported genome
  444. research is focused almost exclusively on the human genome
  445. through support of large-scale physical mapping, resource and
  446. instrumentation technology development, and improvements in
  447. computational and database capabilities and research
  448. infrastructure. A significant portion of the DOE Human Genome
  449. Program is allocated to the DOE national laboratories.
  450.  
  451. In several important areas, DOE and NIH cooperate to support
  452. critical resources such as the Genome Data Base (GDB) at Johns
  453. Hopkins University. Cofunded since 1991 as the central
  454. international repository of human chromosome mapping data, GDB is
  455. expected to receive supporting funds from other nations. DOE and
  456. NIH also cooperate to support joint workshops; a number of
  457. ethical, legal, and social issues projects; and the Human Genome
  458. News newsletter.
  459.  
  460. Joint task groups under the DOE-NIH Joint Subcommittee on the
  461. Human Genome meet periodically to define program needs and
  462. develop recommendations for their parent DOE and NIH committees.
  463. OHER and NCHGR cosponsor workshops and meetings of the task
  464. groups on mapping; sequencing; informatics; the use of the mouse
  465. as a mammalian model; and_in a departure from most scientific
  466. programs_ethical, legal, and social issues related to data
  467. produced in the project.
  468.  
  469. Many other highlights of the DOE OHER program follow in the
  470. succeeding sections of this report, including reports from the
  471. human genome centers; further details of program infrastructure,
  472. management, and coordination; resource allocation; and abstracts
  473. of individual research projects.
  474.  
  475.  
  476.  
  477.  
  478. Scientific Five-Year Goals of the U.S. Human Genome Project from
  479. the NIH-DOE Five Year Plan* [Implemented October 1, 1990 (FY
  480. 1991)]
  481.  
  482. 1. Mapping and Sequencing the Human Genome
  483.  
  484. Genetic Mapping
  485.  
  486.      Complete a fully connected human genetic map with markers
  487.      spaced an average of 2 to 5 cM apart. Identify each marker
  488.      by a sequence tagged site (STS).
  489.      
  490. Physical Mapping
  491.  
  492.      Assemble STS maps of all human chromosomes with the goal of
  493.      having markers spaced at approximately 100,000-bp intervals.
  494.      
  495.      Generate overlapping sets of cloned DNA or closely spaced
  496.      unambiguously ordered markers with continuity over lengths
  497.      of 2 Mb for large parts of the human genome.
  498.      
  499. DNA Sequencing
  500.  
  501.      Improve current and develop new methods for DNA sequencing
  502.      that will allow large-scale sequencing of DNA at a cost of
  503.      $0.50 per base pair.
  504.      Determine the sequence of an aggregate of 10 Mb of human DNA
  505.      in large continuous stretches in the course of technology
  506.      development and validation.
  507.  
  508. 2. Model Organisms
  509.  
  510.      Prepare a mouse genome genetic map based on DNA markers.
  511.      Start physical mapping on one or two chromosomes.
  512.      
  513.      Sequence an aggregate of about 20 Mb of DNA from a variety
  514.      of model organisms, focusing on stretches that are 1 Mb
  515.      long, in the course of developing and validating new and
  516.      improved DNA sequencing technology.
  517.      
  518. 3. Informatics_Data Collection and Analysis
  519.  
  520.      Develop effective software and database designs to support
  521.      large-scale mapping and sequencing projects.
  522.      
  523.      Create database tools that provide easy access to up-to-date
  524.      physical mapping, genetic mapping, chromosome mapping, and
  525.      sequencing information and allow ready comparison of the
  526.      data in these several data sets.
  527.      
  528.      Develop algorithms and analytical tools that can be used in
  529.      the interpretation of genomic information.
  530.      
  531. 4. Ethical, Legal, and Social Considerations
  532.  
  533.      Develop programs directed toward understanding the ethical,
  534.      legal, and social implications of Human Genome Project data.
  535.      Identify and define the major issues and develop initial
  536.      policy options to address them.
  537.      
  538. 5. Research Training
  539.  
  540.      Support research training of pre- and postdoctoral fellows
  541.      starting in FY 1990. Increase the number of trainees
  542.      supported until a steady state of about 600 per year is
  543.      reached by the fifth year.
  544.      
  545.      Examine the need for other types of research training in the
  546.      next year (FY 1991).
  547.      
  548. 6. Technology Development
  549.  
  550.      Support automated instrumentation and innovative and
  551.      high-risk technological developments as well as improvements
  552.      in current technology to meet the needs of the genome
  553.      project as a whole.
  554.      
  555. 7. Technology Transfer
  556.  
  557.      Enhance the already close working relationships with
  558.      industry.
  559.      
  560.      Encourage and facilitate the transfer of technologies and of
  561.      medically important information to the medical community.
  562.      
  563.      
  564. *Understanding Our Genetic Inheritance; The U.S. Human Genome
  565. Project: The First Five Years FY 1991-1995, DOE/ER-0452P, U.S.
  566. Department of Health and Human Services and U.S. Department of
  567. Energy, April 1990.
  568.  
  569.  
  570.  
  571.  
  572.  
  573. Highlights of Research Progress
  574.  
  575. Mapping
  576.  
  577. A major goal for DOE and NIH, as stated in the Five Year Plan (p.
  578. 5) for the Human Genome Project officially implemented in FY
  579. 1991, is to develop refined physical maps of chromosomes.
  580. Increasingly detailed maps will provide biomedical scientists
  581. with rapid access to important areas on chromosomes through their
  582. specific markers and ordered sets of DNA clones.
  583.  
  584. Page numbers for research abstracts of investigators noted in
  585. parentheses can be located in the "Index to Principal and
  586. Coinvestigators Listed in Abstracts," p. 243.
  587.  
  588.  
  589. Physical Map Construction
  590.  
  591. DOE sponsors both extensive physical mapping studies and
  592. supportive resource and technology development. Physical mapping
  593. of chromosomes 5, 11, 16, 17, 19, 21, 22, and X has been or is
  594. being supported directly. Increasingly detailed maps facilitate
  595. access to important chromosomal loci through their constituent
  596. markers and ordered DNA clones.
  597.  
  598. The earliest concerted mapping efforts began on chromosome 16 at
  599. the Los Alamos National Laboratory (LANL) Center for Human Genome
  600. Studies and on chromosome 19 at the Lawrence Livermore National
  601. Laboratory (LLNL) Human Genome Center. These efforts have
  602. achieved excellent progress (see detailed narratives, pp. 46 and
  603. 36, respectively) through the development of effective
  604. multidisciplinary teams and efficient methods for generating
  605. clone "fingerprints." The fingerprints provide data for
  606. recognizing clone pairs that overlap, facilitating the
  607. construction of increasingly larger sets of overlapping clones,
  608. called contigs. Approximately 90% of chromosomes 16 and 19 is now
  609. represented by fingerprinted clones, and multiclone contigs span
  610. at least 80% of their length. Initial contig assembly
  611. methodologies are complemented by strategies designed to finish
  612. the physical maps and align them with genetic maps. This
  613. progress, together with the many contributions from other
  614. research groups (presented in the Abstracts section of this
  615. report), shows that resources and technologies required to
  616. achieve the mapping goals stated in the Five Year Plan are
  617. rapidly being realized.
  618.  
  619.  
  620. National Laboratory Gene Library Project (NLGLP)
  621.  
  622. Among the resources most crucial to mapping progress are the
  623. libraries of clones representing each of the human chromosomes.
  624. Their availability reduces the total genome map ping effort to 24
  625. smaller, more-manageable mapping projects. This
  626. chromosome-specific clone library production from physically
  627. purified chromosomes depends on the unique LANL and LLNL
  628. chromosome-sorting facilities maintained through the DOE NLGLP.
  629. These library resources are either distributed from the
  630. laboratories or through the American Type Culture Collection. As
  631. of December 1991 over 620 chromosome-specific libraries were
  632. distributed as resources for entire chromosome mapping efforts
  633. and for more-selective gene hunts. Current library production is
  634. focused on the needs of the major chromosome mapping projects (L.
  635. Deaven, LANL; P. de Jong, LLNL).
  636.  
  637.  
  638. Recombinant Clone Types
  639.  
  640. Other biological resources are also being developed to further
  641. chromosome mapping progress. These resources include several
  642. useful genetic elements or recombinant DNAs and their cellular
  643. hosts. The largest elements are the intact, single human
  644. chromosomes maintained in somatic cell hybrids, such as single
  645. human chromosome/hamster-host cell hybrids. They are valuable for
  646. sorting out the human chromosomes for construction of
  647. single-chromosome libraries. Insert sizes of recombinants range
  648. from millions to a few hundred bases. Recombinant cosmid clones
  649. with 40- to 50-kb human DNA inserts predominated in the early
  650. contig-building efforts and continue to be a basic resource
  651. (refer to Abstracts: Resource Development, p. 82).
  652.  
  653.  
  654. Monochromosomal Yeast Artificial Chromosomes (YACs)
  655.  
  656. YACs with inserts of 200 kb and larger, whose initial development
  657. was pioneered with NIH support, are now widely used in physical
  658. mapping projects. The recently developed capability to produce
  659. YACs from flow-sorted chromosomes is making available
  660. mono-chromosomal YAC libraries to speed mapping projects (M.
  661. McCormick, L. Deaven, and R. Moyzis, LANL). These libraries are
  662. made up of YACs containing human DNA inserts. This contrasts with
  663. libraries made from somatic cell hybrids, which are made up of
  664. YACs that contain mostly nonhuman DNA inserts.
  665.  
  666.  
  667. Clone Library Array and Analysis
  668.  
  669. When user laboratories maintain clone libraries in the same
  670. arrayed-format addressing system, the information obtained from
  671. these libraries is maximized because the accumulated data from
  672. different laboratories can be readily combined. The tedious task
  673. of arraying thousands of DNA clones has been greatly alleviated
  674. through the development and implementation of automated or
  675. robotic processing systems (T. Beugelsdijk and P. Medvick, LANL;
  676. J. Jaklevic, Lawrence Berkeley Laboratory (LBL); and A. Olsen,
  677. LLNL). These systems are being increasingly utilized in clone
  678. analyses and in comparisons needed for overlap detection.
  679.  
  680.  
  681. Multiplexed Clone Overlap Detection
  682.  
  683. Overlap detection of sequence homologies by DNA hybridization is
  684. speeded by multiplexing strategies in which the processing of
  685. pools of clones or their derivative probes replaces the more
  686. tedious analysis of individual clones. Multiplexing was first
  687. implemented by the chromosome 11 mapping group (G. Evans, Salk
  688. Institute for Biological Studies). Several second-generation
  689. multiplexing schemes are now being implemented to speed overlap
  690. detection both within libraries and between members of different
  691. types of libraries (J. F. Cheng, LBL; P. de Jong, LLNL).
  692.  
  693. Messenger RNA/cDNAs Used To Generate Sequence Tagged Sites (STSs)
  694.  
  695. STS marking of DNA clones provides a common language for uniting
  696. the results obtained with different types of recombinant DNAs and
  697. varied approaches to map generation. An STS is a short, unique
  698. DNA sequence (generally 100 to 300 bp) that distinguishes a
  699. chromosomal locus. The STS segment can be selectively amplified
  700. within the entire genome by the polymerase chain reaction to
  701. provide an identifying tag for any DNA clone containing the site.
  702. DOE is emphasizing the use of STSs for expressed genes, as
  703. represented by their derivative cDNAs. Mapping these STSs onto
  704. contigs and to their chromosomal loci is thus rapidly placing
  705. genes on the developing chromosome maps (refer to Abstracts:
  706. Resource Development, p. 82).
  707.  
  708.  
  709. Microdissection Libraries
  710.  
  711. Chromosome microdissection can facilitate region-specific mapping
  712. efforts, such as the localized ordering of clones on the much
  713. longer chromosomes, by identifying sets of clones derived from
  714. the specific region. Region-specific probes can also serve in the
  715. identification of locally expressed genes by selectively
  716. displaying their counterparts within complex cDNA libraries
  717. (F.-T. Kao, Eleanor Roosevelt Institute).
  718.  
  719.  
  720. Libraries of Hybrid Somatic Cells with Partial Human Chromosomes
  721.  
  722. Aberrant chromosomes arising from rearrangement processes can be
  723. moved into host rodent cells, providing for the maintenance of a
  724. human subchromosomal segment. A large hybrid set has been
  725. assembled for chromosome 16 (G. Sutherland, Adelaide Children's
  726. Hospital, South Australia). These partial chromosomes together
  727. define over 100 chromosomal segment "bins" to which clones,
  728. contigs, and other DNA markers can be assigned by DNA
  729. hybridization tests. This resource system is greatly speeding the
  730. completion of the chromosome 16 map.
  731.  
  732.  
  733. Fluorescence In Situ Hybridization (FISH)
  734.  
  735. The previous mapping of DNA clones by FISH onto metaphase
  736. chromosomes has now been extended to the much less condensed
  737. interphase and pronuclear DNAs. Mapping onto less-condensed
  738. chromosomes increases spatial resolution and the capacity to
  739. order closely spaced markers. As a component of evolving mapping
  740. strategies, FISH is serving to locate and orient cosmid contigs
  741. on intact chromosomes and measure distances between the cosmids
  742. as well as to mapped cDNAs. (J. Gray, University of California;
  743. J. Korenberg, Cedars-Sinai Medical Center; B. Trask, LLNL).
  744.  
  745.  
  746. Fragile X Locus Cloned
  747.  
  748. The fragile X locus has been cloned and its mode of action is
  749. being characterized (C. T. Caskey and D. L. Nelson, Baylor
  750. College of Medicine; and collaborators). Fragile X syndrome may
  751. be the most common form of inherited mental retardation. About 1
  752. in 1500 males and 1 in 2500 females are affected by the syndrome,
  753. which is caused by a high mutation frequency at the fragile X
  754. locus.
  755.  
  756.  
  757. Myotonic Dystrophy Locus Cloned
  758.  
  759. The gene responsible for myotonic dystrophy, an autosomal
  760. dominant disease, has been identified and cloned. The structural
  761. defect is characterized by a tandemly repeated segment of DNA
  762. within or close to the coding region on 19q13.3. The extent of
  763. the amplified region appears to be associated with the severity
  764. of the disease (C. T. Caskey, Baylor College of Medicine; P. de
  765. Jong and A. Carrano, LLNL; and collaborators).
  766.  
  767.  
  768. Informatics
  769.  
  770. Multiple informatics capabilities will be crucial to the
  771. successful application of data derived from the genome project.
  772. Informatics expertise, software, and hardware are being developed
  773. in the following areas: chromosome map assembly, databases, DNA
  774. sequence analysis, and laboratory automation.
  775.  
  776.  
  777. Map Assembly
  778.  
  779. Algorithms for automatically assembling physical maps from cloned
  780. fingerprint data have been further improved (E. Branscomb, LLNL;
  781. M. Cinkosky, V. Faber, J. Fickett, and D. Torney, LANL).
  782.  
  783. Software permitting fast parallel computations on multiple
  784. computers was developed to speed computation-intensive mapping
  785. analyses
  786. (E. Branscomb, LLNL).
  787.  
  788. A computer communication and interrogation system is being
  789. assembled to minimize redundancy during the production of STS
  790. chromosomal markers from cDNAs. Participating laboratories will
  791. rapidly query distant databases to determine the novelty of a
  792. candidate mRNA/cDNA before further pursuing the STS-generation
  793. process.
  794.  
  795.  
  796. Databases
  797.  
  798. Graphical interfaces for mapping databases were constructed to
  799. display several different types of aligned chromosomal data and
  800. provide expandable views [R. Douthart, Pacific Northwest
  801. Laboratory (PNL); J. Fickett, LANL; S. Lewis, Lawrence Berkeley
  802. Laboratory (LBL); R. Overbeek, Argonne National Laboratory
  803. (ANL)].
  804.  
  805. The electronic Laboratory Notebook database and similar databases
  806. are being continuously expanded to include new data types as
  807. mapping strategies evolve (J. Fickett, LANL).
  808.  
  809. The internationally available Genome Data Base (GDB), housed at
  810. Johns Hopkins University and cofunded since September 1991 by DOE
  811. and NIH, is the primary reference data-base for human chromosome
  812. mapping data produced in the United States and abroad. The
  813. organizational structure of GDB is shown on the opposite page (P.
  814. Pearson, GDB).
  815.  
  816. In a collaboration between LLNL and GDB, computer system
  817. interfaces have been devised for automatically transferring large
  818. amounts of data from mapping centers to GDB for integration into
  819. and updating of chromosome maps.
  820.  
  821. Enhancements of the GenBankr DNA sequence database located at
  822. LANL continue. Primarily supported by NIH with contributions from
  823. DOE, GenBank exchanges data daily with European and Japanese
  824. databases. GenBank has expanded its electronic data-publishing
  825. facilities and has reached agreements with a number of journals
  826. to facilitate electronic publication of large volumes of DNA
  827. sequence data (J. Cassatt, NIH).
  828.  
  829.  
  830. Sequence Analysis
  831.  
  832. gm, developed at New Mexico State University, is the first DNA
  833. sequence analysis algorithm capable of recognizing and ordering
  834. the set of protein-coding regions (exons) from among the
  835. noncoding regions (introns) comprising a gene, rather than
  836. predicting isolated protein-coding sequences. gm has been
  837. distributed to laboratories worldwide (C. Fields, now at NIH, and
  838. C. Soderlund, now at LANL).
  839.  
  840. Gene Recognition and Analysis Internet Link (GRAIL), a novel
  841. neural network-based algorithm for identifying exons within DNA
  842. sequences, is online at Oak Ridge National Laboratory (ORNL) to
  843. serve the biological community by automatically analyzing
  844. sequences. From a number of examples, this artificial
  845. intelligence system learns several distinct sequence
  846. characteristics through which exons can be recognized. GRAIL
  847. automatically accepts input sequences sent to ORNL over Internet
  848. and returns the output analysis to the sender (R. Mural and E.
  849. Uberbacher, ORNL).
  850.  
  851.  
  852. Laboratory Automation
  853.  
  854. Advances continue in the linking of laboratory instruments
  855. directly to data-acquisition computers and analysis software at
  856. the LANL, LLNL, and LBL human genome centers.
  857.  
  858.  
  859. Sequencing
  860.  
  861. The DOE Human Genome Program has supported both evolutionary
  862. (incremental, gel-based) improvements to classical sequencing
  863. methods and several revolutionary (completely novel, gel-less)
  864. technologies. Steady advances have occurred in the evolutionary
  865. area with the implementation of automated sample preparation,
  866. multiplex sequencing, and strategies that minimize the need for
  867. prior subcloning.
  868.  
  869.  
  870. Gel Sequencing Approaches
  871.  
  872. Multiplex sequencing systems have matured enough for transfer to
  873. the commercial sector (G. Church, Harvard Medical School; R.
  874. Gesteland, University of Utah).
  875.  
  876. The readout of multiplexed gels and blots using stable isotopes
  877. as nucleic acid labels has the potential to increase sequencing
  878. speeds by at least a factor of 10 because resonance ionization
  879. mass spectroscopy is capable of differentiating many isotopes (H.
  880. Arlinghaus, Atom Sciences, Inc.; K. B. Jacobson, ORNL).
  881.  
  882. Chemiluminescent label systems are now substituting for the
  883. less-desirable radioactive labels in many applications (I.
  884. Bronstein, Tropix, Inc.).
  885.  
  886. Systems have been developed to retain chromosome continuity
  887. information by bypassing the customary subcloning step in the
  888. sequencing of recombinant DNAs (D. Berg, Washington University;
  889. C. Berg and L. Strausbaugh, University of Connecticut; J. Dunn
  890. and F. Studier, Brookhaven National Laboratory; R. Gesteland and
  891. R. Weiss, University of Utah).
  892.  
  893. Fractionation speeds on capillary and very thin slab gels are
  894. 10-fold faster than on traditional thick gels (N. Dovichi,
  895. University of Alberta, Canada; B. Karger, Northeastern
  896. University; L. Smith, University of Wisconsin).
  897.  
  898. The fluorescence/luminescence detection of fractionated nucleic
  899. acids has been significantly improved to allow detection of the
  900. smaller amounts of DNA loaded on capillary and thin slab gels (N.
  901. Dovichi, University of Alberta; R. Mathies, University of
  902. California; E. Yeung, Ames Laboratory).
  903.  
  904. Over 300 kb have been sequenced from human and mouse T-cell
  905. receptors, providing fundamental new insights into the molecular
  906. biology of the immune response (L. Hood and T. Hunkapiller,
  907. California Institute of Technology).
  908.  
  909.  
  910. Gel-less Sequencing Technologies
  911.  
  912. The technology for interrogating or sequencing clones by
  913. hybridization with short oligomers has passed a second
  914. proof-of-concept test. Three unknown DNA fragments were fully and
  915. accurately sequenced (R. Crkvenjakov and R. Drmanac, ANL).
  916.  
  917. In research and development for single-molecule sequencing by
  918. processive nucleotide release, the capacity to detect single
  919. nucleotides by laser-induced fluorescence has been demonstrated
  920. (R. Keller and J. Jett, LANL).
  921.  
  922. Progress is being made in developing methods to sequence DNA
  923. using lasers coupled to a mass spectrometer. The great advantage
  924. of these approaches is that the mass spectrum can be acquired in
  925. milliseconds (C. Chen, ORNL; J. Jaklevic, W. Benner, and J. Katz,
  926. LBL; L. Smith and B. Chait, University of Wisconsin; R. Smith,
  927. PNL; P. Williams and N. Woodbury, Arizona State University).
  928.  
  929.  
  930. Activities Addressing Ethical, Legal, and Social Issues Related
  931. to Human Genome Project Data
  932.  
  933. In FY 1991, DOE activities on ethical, legal, and social issues
  934. (ELSI) included two conferences, three education projects, and
  935. three research projects. The first conference, Justice and the
  936. Human Genome, held in November 1991 at the University of Illinois
  937. College of Medicine, considered discrimination that could result
  938. from the use of genetic information about ethnic and other
  939. groups. The second conference, held in March 1992 at the Texas
  940. Medical Center Institute of Religion, focused on Genetics,
  941. Religion, and Ethics.
  942.  
  943. The three education projects on the science and the societal
  944. implications of data produced in the Human Genome Project, listed
  945. with their preparers, include (1) a module to be developed and
  946. distributed to all U.S. high school biology teachers (Biological
  947. Sciences Curriculum Study); (2) an educational television series,
  948. "Medicine at the Crossroads," which will address the role of
  949. genetics in understanding and treating disease (WNET, New York,
  950. cofunded with NIH and the National Science Foundation); and (3) a
  951. program of hands-on workshops for public officials and other
  952. nonscientists (Cold Spring Harbor Laboratory).
  953.  
  954. The three ongoing research projects, listed with the institutions
  955. developing them, are (1) a study of ethical issues arising from
  956. the rapid proliferation of genetic tests that can predict future
  957. disease in otherwise healthy individuals [National Academy of
  958. Sciences (NAS) Institute of Medicine, cofunded with NIH]; (2) a
  959. legal study of confidentiality protection for genetic data
  960. (Shriver Center); and (3) a study to consider problems in funding
  961. young investigators in biological and biomedical sciences (NAS).
  962.  
  963. In its first 2 years, the DOE Human Genome Program funded a
  964. variety of ELSI activities, noted above. To avoid being spread
  965. too thinly, the ELSI component of the DOE Program now focuses on
  966. confidentiality and privacy concerns raised by increased genetic
  967. data about individuals. This sensitive, personal information,
  968. which may predict disorders before symptoms occur or treatments
  969. are available, can affect a person's self-image, employability,
  970. status in the eyes of others, and ability to obtain health
  971. insurance. Since genetic knowledge can also lead to better
  972. understanding of disease causation and to more-accurate
  973. assessments of environmental affronts, a balance must be achieved
  974. between the health of the public and the privacy interests of the
  975. individual.
  976.  
  977. The DOE Human Genome Program is funding six new projects covering
  978. ELSI activities in research and education. One of the three
  979. projects investigating genetic discrimination will compare two
  980. states (Florida and Georgia), contrasting their genetic testing,
  981. screening, and counseling programs and the impact on different
  982. ethnic and socioeconomic communities. Another will examine the
  983. impact of two genetic conditions (cystic fibrosis and sickle cell
  984. disease) on African-Americans and Caucasians. A third will
  985. identify particular social institutions that may engage in
  986. discrimination and will consider whether the discrimination, if
  987. present, is the result of ignorance or systematic policy. A
  988. fourth project will explore in detail (a) the effect of genetic
  989. knowledge on the right of privacy and (b) the uses of genetic
  990. information in public health planning. A fifth project will
  991. develop a program of educational workshops for secondary and high
  992. school science teachers, focused on both the science and the
  993. ethical, legal, and social issues arising from data generated by
  994. human genome research. A six the project will involve a second
  995. educational television series, "The Secret of Life" (WGBH,
  996. Boston), which will address the current revolution in molecular
  997. biology and genetics.
  998.  
  999. Other activities include conferences on Genes and Human Behavior:
  1000. A New Era? (October 1991); Computers, Freedom, and Privacy (March
  1001. 1992); and Science, Technology, and Ethical Responsibility
  1002. (scheduled for June 1992).
  1003.  
  1004. While very challenging issues are raised by genome research,
  1005. solutions are not simple; defensible rights often exist on both
  1006. sides of any issue. Further research is needed, as well as
  1007. activities to promote public awareness and assist in policy
  1008. development. Also, with the increasing use of computers to
  1009. assemble, store, and organize data (including genetic data) into
  1010. large databases, the issues of security and access control become
  1011. more acute. To begin reorienting and better defining the scope of
  1012. ELSI activities in the DOE program, the DOE-NIH Joint ELSI
  1013. Working Group has established a collaborative effort on privacy
  1014. to identify an ELSI research agenda and develop a more detailed
  1015. approach to some of these concerns.
  1016.  
  1017.  
  1018. Technology Transfer and Industrial Collaboration
  1019.  
  1020. Technology transfer, considered one of the three most important
  1021. facets of the DOE mission (along with meeting the nation's
  1022. defense and energy needs), is enhancing U.S. investment in
  1023. research and technological competitiveness. By creating new
  1024. products, markets, and jobs, the rapid deployment of technology
  1025. from the research laboratory to the marketplace can play an
  1026. important role in vitalizing the U.S. economy. A vast potential
  1027. exists for commercial development of genome resources and
  1028. technology; applications to clinical medicine have already begun.
  1029.  
  1030. All participants in the Human Genome Program are encouraged to
  1031. engage in active collaborations with the private sector and
  1032. transfer their resources and technologies for commercial
  1033. development.
  1034.  
  1035. Each national laboratory has a technology transfer office. The
  1036. LLNL, LBL, and LANL human genome centers provide a variety of
  1037. opportunities for collaborations on joint projects or for
  1038. obtaining direct access to technology. They are also exploring
  1039. additional ways to increase cooperation with the private sector;
  1040. a number of interactive projects are now under way, and
  1041. additional interactions are in the preliminary stages. In some
  1042. instances, private industries are marketing technologies
  1043. developed at DOE-sponsored research laboratories and are
  1044. providing research funds or other resources to the centers; other
  1045. collaborative programs involve joint development of technologies
  1046. and their applications to achieve project goals.
  1047.  
  1048. One mechanism being used by the DOE national laboratories is the
  1049. Cooperative Research and Development Agreement (CRADA). The first
  1050. CRADA in the genome project, established by DOE in the spring of
  1051. 1991, was between Life Technologies, Inc. (LTI) and the LANL
  1052. Center for Human Genome Studies for technologies developed in the
  1053. single-molecule sequencing project. In this project an
  1054. LTI-modified DNA polymerase will be used to label a single DNA
  1055. strand with four different fluorescent, base-specific tags. After
  1056. an exonuclease cuts the labeled nucleic acid base pairs from the
  1057. DNA, the labeled bases will be induced to fluoresce as they pass
  1058. sequentially through a focused laser beam. The bases can be
  1059. identified and counted by a sensitive photodetector (see figure
  1060. on p. 25 for more information). If successful, the technology
  1061. will allow sequencing of 50,000-bp DNA fragments at 1000 bp/s.
  1062. LTI will have the first opportunity to license products resulting
  1063. from the joint effort and would pay royal ties to LANL under such
  1064. a license.
  1065.  
  1066. Potential commercial advancements in the Human Genome Program
  1067. have also been recognized outside the genome community. Research
  1068. and Development magazine selected an achievement by Edward Yeung
  1069. and other Ames Laboratory scientists as one of the 100 most
  1070. significant developments of 1991. This R&D 100 Award was given
  1071. for the development of a user-friendly instrument that detects
  1072. with extremely high sensitivity the fluorescent molecule
  1073. concentration (based on laser-excited fluorescence), an
  1074. improvement that may lead to routine high-speed DNA sequencing by
  1075. capillary gel electrophoresis. A U.S. patent for portions of this
  1076. technology has been issued, and several commercial manufacturers
  1077. are considering the possibilities of marketing the instrument.
  1078.  
  1079. A technology pioneered by LLNL to identify chromosomal
  1080. abnormalities (e.g., aneuploidy, translocations, and deletions)
  1081. has been licensed to Imagenetics, Inc., a medical diagnostics
  1082. firm that will manufacture the technology and provide funding for
  1083. future research and development. This technology involves the use
  1084. of specially developed fluorescent dyes called Whole Chromosome
  1085. PaintsÖ to detect diseases such as cancers and leukemia. Whole
  1086. Chromosome Paints are being marketed by LTI.
  1087.  
  1088. Some other technology transfers from DOE-sponsored genome
  1089. research, both at the national laboratories and extramurally, are
  1090. highlighted below. In progress or awaiting finalization are many
  1091. more developments and agreements, some of which cannot be
  1092. disclosed at this time because of their proprietary nature.
  1093.  
  1094. Resources. Collaborative agreements have aided in the further
  1095. development of several new technologies used in genome research,
  1096. as well as in their commercial applications. New methods are
  1097. being evaluated for use in isolating mRNA, chromosomes, and
  1098. restriction fragments; in amplifying hybridization signals; and
  1099. in extending DNA molecules. In addition, bacterial host strains
  1100. have been developed that give greater stability to cosmid
  1101. constructs containing human DNAs. Improvements are being made in
  1102. DNA detection methods by the development of new probes, stains,
  1103. and fluorescent dyes.
  1104.  
  1105. As a result of the recent cloning of the fragile X gene, several
  1106. companies are negotiating for licenses to develop assays for
  1107. diagnosing fragile X syndrome, probably the most frequently
  1108. inherited form of mental retardation.
  1109.  
  1110. Hardware. Automation and enhancement of data collection and
  1111. analysis has been the goal of many collaborations with the
  1112. commercial sector. Equipment is being designed to automate (1)
  1113. the production of high-density arrays on agarose or filters and
  1114. (2) clone fingerprinting by gel electrophoresis (as well as the
  1115. data collection and analysis software). Advanced applications for
  1116. robotic systems are also being developed.
  1117.  
  1118. The resolution of DNA fragments is being enhanced by improvements
  1119. in pulsed-field gel electrophoresis. Resonance ionization
  1120. spectroscopy is being modified to enable rapid detection of
  1121. stable isotope labels on DNA following gel electrophoresis. A
  1122. commercial gel scanner is being developed for reading DNA gels.
  1123.  
  1124. Software. To aid physical map construction, programs are being
  1125. designed for efficient clone analysis. Several other
  1126. image-analysis programs are being developed, including
  1127. data-capture software for images from video screens in
  1128. combination with a DNA molecule imaging system.
  1129.  
  1130. Sequencing. Multiplex sequencing technologies are being used to
  1131. sequence pathogenic microbes.
  1132.  
  1133.  
  1134.  
  1135.  
  1136.  
  1137. Human Genome Center Research Narratives
  1138.  
  1139. Lawrence Berkeley Laboratory
  1140.  
  1141. Since its inception in 1987, the Lawrence Berkeley Laboratory
  1142. (LBL) Human Genome Center has focused on developing the necessary
  1143. research and analytical technology to speed genome mapping and
  1144. decrease the cost of sequencing. Over the last year, LBL has
  1145. strengthened its ties with the University of California,
  1146. Berkeley, particularly in the biological sciences. This
  1147. collaboration fosters interdisciplinary activities in biology,
  1148. instrumentation, and informatics.
  1149.  
  1150.  
  1151. Biology
  1152.  
  1153. The biology component at LBL is concentrating on developing and
  1154. improving mapping and sequencing strategies for human chromosome
  1155. 21. To achieve these goals, investigators in each biology project
  1156. draw on the expertise of the center's instrumentation and
  1157. computing groups.
  1158.  
  1159. Two major biology projects are under way, and a third is in
  1160. development. Physical mapping at LBL is focused on a 10-Mb region
  1161. of human chromosome 21, and over 90 unique chromosome 21-specific
  1162. yeast artificial chromosomes (YACs) have been located by
  1163. fluorescence in situ hybridization (FISH). A new method has been
  1164. developed that permits rapid isolation of chromosome-specific
  1165. YACs, using probes isolated from flow-sorted chromosome libraries
  1166. from Lawrence Livermore National Laboratory. In addition, cDNAs
  1167. specific to a given YAC are being isolated by an automatable
  1168. procedure based on magnetic beads.
  1169.  
  1170. The second major biology effort involves testing new approaches
  1171. to physical mapping and genomic sequencing. These projects
  1172. exploit current methods, such as FISH and appropriate pooling
  1173. strategies, for efficient isolation of overlapping clones. In
  1174. addition, new work has begun on subcloning and ordering libraries
  1175. of clones for mapping and on the use of gamma delta transposons
  1176. as the primer site for sequencing studies. Increased efficiency
  1177. in constructing physical maps results from a clone-limited
  1178. strategy for generating maps based on sequence tagged sites
  1179. (STSs). This nonrandom selection strategy reduces the number of
  1180. STS assays required and produces contigs that cover a larger
  1181. fraction of the genome.
  1182.  
  1183. The third biology project is aimed at developing automated
  1184. methods for generating genetic maps. A simple filter assay will
  1185. be used to detect heterozygosity at mapped loci in yeast, mice,
  1186. and human DNA samples.
  1187.  
  1188.  
  1189. Instrumentation
  1190. The instrumentation program within the LBL Human Genome Center
  1191. has two major areas of effort: (1) biology and instrumentation
  1192. development and support and (2) new instrumentation development
  1193. based on emerging technologies. Supporting activities include the
  1194. design and fabrication of gel boxes, automation of protocols on
  1195. existing robotic frameworks, and the installation and networking
  1196. of a variety of image-acquisition systems. In addition, advanced
  1197. robotic [high-speed colony picking, robotic-based polymerase
  1198. chain reaction, and DNA synthesis] and laboratory systems
  1199. integration is under development.
  1200.  
  1201. Efforts to produce new, adaptable technologies for the genome
  1202. program include optimizing large-molecule detection systems;
  1203. designing versatile optical fluorescence systems for multiplex
  1204. labeling; and developing microfabricated arrays for application
  1205. to large-scale clone libraries, sequencing by hybridization, and
  1206. other procedures. The use of computer-controlled robotic systems
  1207. provides a mechanism for automatically capturing the vast amount
  1208. of data generated by laboratory operations. This requires a close
  1209. coordination between hardware and software development in
  1210. laboratory system design that goes far beyond automation of a few
  1211. discrete protocols.
  1212.  
  1213.  
  1214.  
  1215.  
  1216. Informatics
  1217.  
  1218. A major part of the computing and instrumentation effort is
  1219. driven by biology projects. The center's computing group focuses
  1220. on specific applications in four major areas: raw data
  1221. acquisition and analysis, information tracking and management,
  1222. data interpretation and comparison analysis, and development of
  1223. software tools. Visual data for mapping (including in situ
  1224. pictures, autoradiograms, ethidium gels, and chemiluminescent
  1225. staining) are handled by BioPix, a set of programs that assemble
  1226. and integrate data from image capture to analysis. A similar
  1227. system is being developed for sequence data. The Chromosome
  1228. Information System (CIS) allows biologists to search, edit, and
  1229. compare various maps, markers, and related reference information
  1230. and to interact with other programs to exchange data. The
  1231. laboratory data analysis system uses existing software packages
  1232. and provides system management and support throughout the center.
  1233. New, in-house analysis packages are being devised for sequence
  1234. alignment and assembly. Software development tools permit rapid
  1235. design and modification of database management systems, thus
  1236. facilitating increased productivity, vendor independence, and
  1237. conceptual clarity.
  1238.  
  1239.  
  1240. Achievements
  1241.  
  1242. *    Over 90 independent YACs averaging 100 kb were regionally
  1243.      assigned to human chromosome 21 by FISH. These YACs include
  1244.      genetic markers to help integrate maps.
  1245.  
  1246. *    Two hundred unique probes were isolated for chromosome 21
  1247.      and are being used to identify YACs from genomic libraries.
  1248.  
  1249. *    A rapid cDNA clone-screening method uses immobilized YAC
  1250.      clones to screen cDNA libraries, which are then localized on
  1251.      specific chromosomes. An alternative screening method uses
  1252.      individual YACs or cosmids attached to magnetic beads to
  1253.      isolate specific cDNAs, a method that can be readily
  1254.      automated to speed identification of coding sequences for
  1255.      physical mapping.
  1256.  
  1257. *    Marker-selected libraries, highly enriched for clones
  1258.      containing (CA)n repeats, were constructed from primary
  1259.      genomic libraries. These enriched libraries increase the
  1260.      efficiency of screening almost 50-fold.
  1261.  
  1262. *    A probe-mapping procedure determines the distance between
  1263.      the probe and the chromosome or YAC end. This method, which
  1264.      uses X rays to break large DNA pieces randomly, can be used
  1265.      to map cDNAs and to estimate the length of entire genes.
  1266.  
  1267. *    A double-ended, clone-limited strategy for physical mapping
  1268.      of chromosomes was devised. This strategy maps chromosomes
  1269.      on the order of 100 Mb and should result in larger contigs
  1270.      with a minimum of assays.
  1271.  
  1272. *    CIS, developed by the genome center computing group, was
  1273.      used to produce consensus maps at workshops on human
  1274.      chromosomes 3 and 21 and is being expanded for use with a
  1275.      number of plant species in the Plant Genome Program of the
  1276.      U.S. Department of Agriculture.
  1277.  
  1278. *    High-level database design tools have been developed to
  1279.      permit molecular biologists to define data objects in a way
  1280.      that captures biological concepts. The software
  1281.      automatically generates low-level commands for a commercial
  1282.      database management system, facilitating the evolutionary
  1283.      development of modular system components. These tools are
  1284.      also being used by researchers to design the Superconducting
  1285.      Super Collider database and the Integrated Genome Database.
  1286.  
  1287. *    A variety of mechanical, electrical, and chemical means have
  1288.      been used to manipulate DNA molecules; these methods include
  1289.      stretching molecules physically by externally applied
  1290.      electrical fields and guiding the molecules through grooves
  1291.      in a glass surface; digesting and separating single
  1292.      molecules; and picking up, transporting, and releasing DNA
  1293.      with scanning tunneling microscope (STM) tips.
  1294.  
  1295. *    Investigation of the feasibility of using STM for
  1296.      visualizing the individual bases of single-stranded DNA has
  1297.      shown that while purines and pyrimidines can be
  1298.      distinguished from each other, two bases in the same class
  1299.      cannot be differentiated by this method.
  1300.  
  1301. *    A fast, filter-based assay was developed to identify single
  1302.      base-pair polymorphisms, eliminating the need for gel
  1303.      assays.
  1304.  
  1305. *    Higher throughput was achieved through the construction of a
  1306.      dedicated high-speed colony-picking workstation. The pick
  1307.      rate is 10 to 20 times faster than the initial picking
  1308.      system and both faster and more accurate than a highly
  1309.      qualified human. The new picker arrayed an entire library of
  1310.      over 10,000 clones in 1 day.
  1311.  
  1312. *    Robots have been modified for use with a number of chemistry
  1313.      protocols, including cosmid and YAC library replication,
  1314.      various pooling schemes, and high-density filter array
  1315.      production. Using the robot to replicate libraries has made
  1316.      copies available to researchers in the private sector and in
  1317.      other national laboratories.
  1318.  
  1319. Future Plans
  1320.  
  1321. *    Construction of a 10-Mb contig of human chromosome 21 based
  1322.      on overlapping YACs. The sequence will be determined by the
  1323.      most efficient strategy available.
  1324.  
  1325. *    Sequencing of a P1 clone. Subclone assembly will use a
  1326.      nonrandom strategy, and primer sequences will originate in
  1327.      the transposon gamma delta.
  1328.  
  1329. *    Construction of chromosome genetic maps of human chromosomes
  1330.      16 and 19 in collaboration with other DOE genome centers. A
  1331.      simple gel-based heterozygosity assay is being developed to
  1332.      support this research.
  1333.  
  1334. *    Development of a computational biology program within the
  1335.      computing group to design and implement new algorithms for
  1336.      sequence assembly. Preliminary data will come from
  1337.      collaborations with other genome centers.
  1338.  
  1339. *    Design and implementation of a software tool suite for
  1340.      managing information and for optimizing the unique strategy
  1341.      of particular research groups. As large-scale sequencing
  1342.      projects develop, new acquisition and analysis software will
  1343.      be integrated into CIS.
  1344.  
  1345. *    Implementation of QUEST, a database tool that will provide a
  1346.      single entry point to the conceptual data model. QUEST will
  1347.      then implement automatically any changes in the user
  1348.      interface, the database query procedures, and the database
  1349.      schema definition.
  1350.  
  1351. *    Optimization of improved detectors and the associated mass
  1352.      spectrometry system for large biological molecules.
  1353.      
  1354. *    Automation of handling and analysis of dot-blot
  1355.      hybridization experiments and the implementation of a
  1356.      high-speed colony-picking apparatus.
  1357.  
  1358. For more information on the LBL Human Genome Center, contact
  1359. Jasper Rine, Director, or Sylvia Spengler, Deputy Director, at
  1360. 510/486-4943.
  1361.  
  1362.  
  1363. Lawrence Livermore National Laboratory
  1364.  
  1365. The Human Genome Center at Lawrence Livermore National Laboratory
  1366. (LLNL) is a multidisciplinary team effort that brings together
  1367. chemists, biologists, molecular biologists, physicists,
  1368. mathematicians, computer scientists, and engineers in an
  1369. interactive research environment. Many of these individuals have
  1370. previously collaborated on research projects in molecular
  1371. biology, cytogenetics, mutagenesis, and instrumentation, as well
  1372. as in the National Laboratory Gene Library Project (NLGLP). These
  1373. projects have contributed substantially to the identification and
  1374. characterization of human DNA repair genes, specifically the
  1375. three on chromosome 19 that are a focus of interest at LLNL.
  1376.  
  1377. The short- and long-term goals of the LLNL effort are to (1)
  1378. develop biological and physical resources useful for genome
  1379. research, (2) model and evaluate DNA mapping and sequencing
  1380. strategies, (3) couple these resources and strategies in an
  1381. optimal way to construct ordered clone maps and DNA sequences of
  1382. human chromosomes, and (4) use the map and sequence information
  1383. to study genome organization and variation. To achieve these
  1384. goals, the Human Genome Center is organized into three broad
  1385. research and support areas, each consisting of multiple projects
  1386. led by a principal investigator. Extensive interaction occurs
  1387. within and among all projects that have as their common goal the
  1388. construction of ordered clone maps of the human genome. The
  1389. program structure of the center includes a core facility and
  1390. projects that focus on physical mapping and enabling
  1391. technologies.
  1392.  
  1393.  
  1394. Research and Support Areas
  1395.  
  1396. Coordination and collaboration take place with other research
  1397. groups throughout the world that are involved in the genome
  1398. initiative or other mutual scientific interests. The role of LLNL
  1399. in the Human Genome Project is seen as encompassing several
  1400. areas, including technology development, map construction, map
  1401. interpretation, and integration with ongoing and new programs in
  1402. structural biology and mutagenesis. The following three
  1403. components are highly interactive; individual staff members often
  1404. have responsibilities in more than one component.
  1405.  
  1406. Core facilities. The administrative group is concerned with
  1407. budget oversight, external and internal meeting coordination,
  1408. preparation of center reports, training coordination, property
  1409. and space management, safety oversight, and secretarial support.
  1410. The scientific core provides general support to the physical
  1411. mapping effort, including cell culture and DNA extraction;
  1412. library, probe, and clone management; oligonucleotide synthesis;
  1413. fluorescence-based restriction mapping; and DNA sequencing. The
  1414. core also facilitates material distribution to collaborators in
  1415. the external community.
  1416.  
  1417. Mapping activities. Five projects represent the coordinated
  1418. effort to obtain an overlapping set of clones for human
  1419. chromosome 19 and to further characterize genomic organization:
  1420.  
  1421. *    Assembly, closure, and characterization of a chromosome 19
  1422.      contig map. The goal of this project is to construct an
  1423.      overlapping set of cosmid clones using a variety of
  1424.      techniques. An automated fluorescence-based
  1425.      restriction-fragment fingerprinting strategy is used to
  1426.      establish a foundation map of cosmid contigs. The contig
  1427.      closure effort will focus on using yeast artificial
  1428.      chromosomes (YACs) and cosmids with two hybridization-based
  1429.      techniques; one is based on fragments generated from Alu
  1430.      sequence primers or sequence tagged sites (STSs) by the
  1431.      polymerase chain reaction (PCR) and the second on RNA
  1432.      transcripts generated from the ends of cloned inserts.
  1433.  
  1434. *    Interdigitation of the physical and genetic maps of human
  1435.      chromosome 19. The goals of this effort are to locate known
  1436.      genetic markers on the expanding contig map, to coordinate
  1437.      the isolation of chromosome 19-specific STSs, and to
  1438.      localize them on the cosmid map.
  1439.  
  1440. *    DNA sequence mapping by fluorescence in situ hybridization
  1441.      (FISH). This project exploits the power of FISH on metaphase
  1442.      chromosomes, interphase cells, and pronuclear DNA. FISH will
  1443.      be used to determine the location of genes of interest and
  1444.      the relative order and orientation of the cosmid contigs.
  1445.  
  1446. *    cDNA mapping. The goal of this project is to isolate,
  1447.      sequence, and map cDNAs-expressed in a variety of human
  1448.      tissues_that will become the STSs on which future studies of
  1449.      genetic organization and gene function will be based.
  1450.  
  1451. *    New mapping strategies. New methods useful for library
  1452.      construction, contig closure, and overlap detection will be
  1453.      developed and validated. Focus is on improving Alu-PCR-based
  1454.      technology and pooling schemes to achieve closure of the
  1455.      chromosome 19 map with cosmids and YACs.
  1456.  
  1457.  
  1458. Enabling technologies. The following groups provide
  1459. computational, resource, and instrumentation support for research
  1460. activities:
  1461.  
  1462.      ∙Computational support for the Human Genome Center. This
  1463.      group is responsible for mathematical modeling of mapping
  1464.      and sequencing strategies and the development and
  1465.      application of data analysis algorithms and software. They
  1466.      are also responsible for the construction and maintenance of
  1467.      interactive relational databases that enable internal and
  1468.      external data access, including development of graphical
  1469.      visualization tools.
  1470.      
  1471. *    NLGLP. This project, a joint effort with Los Alamos National
  1472.      Laboratory, draws upon LLNL experience in flow
  1473.      instrumentation and chromosome sorting to construct human
  1474.      chromosome-specific libraries in lambda and cosmid vectors
  1475.      for use in physical mapping and other studies.
  1476.  
  1477. *    Instrumentation for cytogenetics and gene mapping. This
  1478.      group is responsible for developing instrumentation to
  1479.      facilitate flow systems analysis and chromosome sorting and
  1480.      to support FISH.
  1481.  
  1482.  
  1483. Accomplishments
  1484.  
  1485. The LLNL Human Genome Center has made excellent progress in the
  1486. construction of an ordered set of cosmids for chromosome 19, the
  1487. development and application of new biochemical and mathematical
  1488. approaches for constructing ordered clone maps, the automation of
  1489. fingerprinting chemistries, and high-resolution imaging of DNA.
  1490. Major accomplishments are highlighted below.
  1491.  
  1492. *    Considerable progress has been made toward the closure of
  1493.      the chromosome 19 physical map. More than 10,000 cosmids
  1494.      have been analyzed by an automated fluorescence-based
  1495.      fingerprinting approach and assembled into over 870 contigs
  1496.      that span about 80% of the chromosome. FISH has been used to
  1497.      locate over 400 cosmids and 117 contigs on the cytological
  1498.      map, and more than 70 known genetic markers have been
  1499.      located on cosmid contigs. Closure of the gaps between
  1500.      contigs is under way using YACs and cosmids.
  1501.  
  1502. *    Cosmid contigs analyzed in the carcinoembryonic antigen
  1503.      (CEA) gene family region of chromosome 19 were found to be
  1504.      tightly linked over relatively short stretches of DNA. This
  1505.      gene family of about 22 members appears to span a contiguous
  1506.      region of about 1 Mb. With probes made from the ends of
  1507.      these contigs, hybridization techniques were applied to join
  1508.      contigs established by fingerprinting into larger contigs.
  1509.      In addition, almost 2 Mb surrounding the myotonic dystrophy
  1510.      locus were linked with cosmids and YACs.
  1511. *    More than 20 clones containing DNA sequences corresponding
  1512.      to a number of important genes and regions that map to chromosome
  1513.      19 were isolated from two separate YAC libraries. Among these
  1514.      clones were the region encoding the LDL receptor and ApoE gene,
  1515.      two important components of the regulation of cholesterol and
  1516.      triglyceride metabolism in humans. Similarly, a region was
  1517.      isolated that encodes a family of serine proteases called
  1518.      Kallikreins, whose role is the specific proteolytic activation of
  1519.      peptide hormones and growth factors. Clones of these regions are
  1520.      being used for the structural analysis and mapping of these
  1521.      genes.
  1522.  
  1523. *    A structural defect found in the cloned gene linked to the
  1524.      autosomal dominant disease myotonic dystrophy has been
  1525.      identified through an international collaboration. This
  1526.      chromosome 19 defect, which is characterized by a tandemly
  1527.      repeated segment of DNA within or close to the coding region
  1528.      on q13.3, is similar to that seen in the fragile X syndrome.
  1529.      The extent of the amplified region appears to be associated
  1530.      with the severity of the disease.
  1531.  
  1532. *    The gene for DNA ligase 1 was mapped to the long arm of
  1533.      chromosome 19. A defect in this gene may be associated with
  1534.      increased cancer risk. This is the fourth gene involved in
  1535.      DNA metabolism that has been mapped to this region of
  1536.      chromosome 19.
  1537.  
  1538. *    Significant progress was accomplished in defining the
  1539.      organization of the cytochrome P450 genes mapping to
  1540.      chromosome 19. Multiple members of each of the three
  1541.      subfamilies were identified. The cosmids containing these
  1542.      genes will be useful resources for studies of the function
  1543.      and physiological importance of the genes.
  1544.  
  1545. *    Three levels of resolution of FISH have been developed and
  1546.      applied to localize and orient cosmids. Localizing cosmids
  1547.      to metaphase chromosomes provides a resolution of about 1 to
  1548.      3 Mb. Localization to somatic interphase cells gives a
  1549.      resolution of from 50 kb to 1 Mb and hybridization to sperm
  1550.      pronuclei a 20-kb to 1-Mb resolution. With FISH, a linear
  1551.      relationship was demonstrated between physical distance and
  1552.      genomic distance of 20 kb up to at least 800 kb in pronuclei
  1553.      derived from human spermatozoa. With a single probe, the
  1554.      presence of multiple copies of the closely related genes of
  1555.      the CEA family has been detected in human sperm pronuclei.
  1556.      Single and multicolor hybridizations are routinely
  1557.      performed.
  1558.  
  1559. *    A reproducible method of mapping YACs by FISH has been
  1560.      developed. This procedure involves isolating YACs with
  1561.      pulsed-field gels, digesting with the restriction enzyme Mbo
  1562.      I, ligating to oligonucleotide linker adapters, and
  1563.      amplifying with PCR. The products are then mapped onto human
  1564.      metaphase chromosomes by standard FISH methods.
  1565.  
  1566. *    The technique of Alu-PCR has been further exploited. To
  1567.      isolate region-specific DNA probes from human-rodent hybrid
  1568.      cell lines, previously developed PCR procedures were
  1569.      expanded. Human sequences are preferentially amplified using
  1570.      PCR primers specific for repeats of the human Alu repeat
  1571.      family. Several new primers have been developed that amplify
  1572.      human DNA sequences very efficiently, further facilitating
  1573.      probe isolation from human genome regions present in the
  1574.      available hybrids. Many different human sequences amplify
  1575.      from the hybrids; individual probe sequences are obtained by
  1576.      subsequent cloning in plasmid vectors in Escherichia coli.
  1577.      To expedite this, ligation-independent cloning has been
  1578.      developed to increase efficiency of cloning and eliminate
  1579.      the common background of clones that do not contain
  1580.      recombinant DNA molecules. In addition, an efficient
  1581.      procedure has been developed to clone the PCR products
  1582.      common to two cell lines. This method _coincidence
  1583.      cloning_permits a further enrichment for sequences derived
  1584.      from defined regions of the genome.
  1585.  
  1586. *    Clone-pooling schemes have been developed to facilitate
  1587.      screening of both cosmid and YAC libraries. Each clone is
  1588.      present in a number of different pools, reducing the number
  1589.      of DNA samples that must be deposited on a high-density
  1590.      filter for hybridization-based screening and the number of
  1591.      tubes needed for PCR-based screening. Since each clone is
  1592.      defined by a unique combination of pools, the screening of
  1593.      pools by probe hybridization permits identification of the
  1594.      recombinants shared by a number of pools. This approach was
  1595.      used very successfully to screen a 10,000-clone cosmid
  1596.      library. The idea also was used to consolidate a
  1597.      60,000-clone YAC library into about 1800 sample pools.
  1598.      Results demonstrated that hybridization-positive YAC pools
  1599.      can, indeed, be distinguished from hybridization-negative
  1600.      YAC pools, thus allowing the efficient identification of YAC
  1601.      clones.
  1602.  
  1603. *    Human YACs were isolated from a library constructed using a
  1604.      monochromosomal 19 hybrid cell line. The YACs vary in size
  1605.      between 120 and 350 kb. One of the analyzed YACs carries
  1606.      sequences from the telomere region of chromosome 19, and
  1607.      another maps to the centromere region of chromosome 19 by
  1608.      FISH.
  1609.  
  1610. *    A second-generation suite of robust, reliable computer
  1611.      programs was completed for signal preparation and analysis
  1612.      of chromosome 19 restriction fragment fingerprints. These
  1613.      programs implement methods for random noise suppression,
  1614.      background subtraction, and color decorrelation. A new
  1615.      program (TIMEWARP) was also completed to map peak locations
  1616.      in a gel to a common coordinate system by dynamic
  1617.      programming and shape-preserving spline interpolation.
  1618.  
  1619. *    The Sybase database has been enhanced to contain all the
  1620.      laboratory notebook and experimental data important to
  1621.      physical map construction. This includes clone repository
  1622.      information, restriction fragment fingerprinting, and data
  1623.      on probe hybridization and FISH. The database is coupled to
  1624.      the graphical browser so the end user can retrieve many of
  1625.      the experimental results in graphical form.
  1626.  
  1627. *    The graphical database browser was enhanced to run Human
  1628.      Genome Project data remotely over Internet. The browser's
  1629.      ability to link to multiple databases at external
  1630.      collaborator sites has been demonstrated.
  1631.  
  1632. *    In a collaborative effort, automatic transnetwork methods
  1633.      for transferring physical mapping results to the central
  1634.      Genome Data Base (GDB) at Johns Hopkins were built, tested,
  1635.      and implemented by GDB and LLNL. This work was in support of
  1636.      DOE concerns that all laboratories should effect mechanisms
  1637.      to ensure that data are made available to the appropriate
  1638.      public databases after a suitable time period. Prototype
  1639.      methods were implemented, tested, and publicly demonstrated
  1640.      for logically linking our database with the major sequence
  1641.      and mapping databases (GenBankr and GDB). Direct
  1642.      transnetwork queries that logically integrate these data
  1643.      sets are now feasible.
  1644.  
  1645. *    As part of NLGLP, high-speed flow sorting was used to purify
  1646.      individual human chromosomes for cloning. Large-insert phage
  1647.      and cosmid libraries have been made for chromosomes 9, 12,
  1648.      18, 19, 21, 22, and Y. Several libraries have been
  1649.      distributed to users and evaluation sites. In addition, the
  1650.      high-speed sorter has been rebuilt with new fluidics to
  1651.      optimize sterility and with new electronics to increase the
  1652.      purity of the sorted material.
  1653.  
  1654. *    Construction of a new high-speed chromosome sorter was
  1655.      completed. This instrument has new digital acquisition
  1656.      electronics, a new fluidic system, and a more stable sample
  1657.      stream. The instrument analyzes chromosomes at the rate of
  1658.      up to 20,000/s and can reliably produce 250 to 1000 ng of
  1659.      sorted chromosome DNA equivalents per day.
  1660.  
  1661. *    Using scanning tunneling microscopy (STM), individual images
  1662.      of the bases adenine and thymine were obtained at atomic
  1663.      resolution, indicating that a scanning-probe microscopy
  1664.      technique can discriminate between purines and pyrimidines.
  1665.  
  1666. *    Several technologies have been transferred to industry. They
  1667.      include software for analysis and graphical display of
  1668.      physical map data, sequence information for the
  1669.      commercialization of Alu-PCR primers, and vectors for the
  1670.      construction of cosmid libraries. In addition, collaborative
  1671.      research programs with industry have continued in the areas
  1672.      of fluorescence-based restriction fragment analysis,
  1673.      development of pulsed-field gel systems, development and
  1674.      testing of automated and high-throughput plasmid/cosmid DNA
  1675.      extraction, and development and testing of a robot for
  1676.      high-density colony replication on filters.
  1677.  
  1678.  
  1679. Future Plans
  1680.  
  1681. The LLNL genome center's first priority is to complete, to the
  1682. extent possible, an ordered clone map of chromosome 19; this
  1683. physical map will likely be a composite linear array of cosmid,
  1684. lambda, and YAC clones. It will be correlated with the genetic
  1685. map to assist the scientific community in localizing and
  1686. isolating all genes from chromosome 19. State-of-the-art
  1687. technology will be used to sequence selected high-interest
  1688. regions of the chromosome. Once the technology has been validated
  1689. for map construction of a large portion of chromosome 19, efforts
  1690. will be directed to chromosome 2.
  1691.  
  1692. When Human Genome Project emphasis shifts from mapping to
  1693. sequencing, exploration will turn to rapid automated DNA
  1694. sequencing methods that can use large fragments such as cosmids
  1695. or YACs as templates. STM and X-ray imaging technologies under
  1696. development at LLNL are expected to contribute to advancements in
  1697. sequencing.
  1698.  
  1699. Automation is an essential element of physical mapping. New
  1700. processes and instruments will be explored to reduce the need for
  1701. human intervention in highly repetitive tasks. A number of
  1702. instruments for clone manipulation and biochemical processes will
  1703. be considered for automation.
  1704.  
  1705. An effort to map and sequence the cDNAs expressed in a variety of
  1706. human tissues has recently been initiated. These cDNAs will be
  1707. used to generate STSs and will serve as the foundation for future
  1708. studies of gene organization and gene function.
  1709.  
  1710. Assisting the scientific community in completing ordered clone
  1711. maps is critical and will remain a high priority. LLNL intends to
  1712. serve as a resource laboratory for clones and for map information
  1713. on chromosomes of interest. Ultimately, map and sequence
  1714. information will be used to study the global architecture of the
  1715. chromosome and also to evaluate human somatic and genetic
  1716. variation, both spontaneous and induced.
  1717.  
  1718. For more information on the LLNL Human Genome Center, contact
  1719. Anthony Carrano, Director, at 510/422-5698 or Leilani Corell,
  1720. Administrator, at 510/423-3841.
  1721.  
  1722.  
  1723. Los Alamos National Laboratory
  1724.  
  1725. The Center for Human Genome Studies at Los Alamos National
  1726. Laboratory (LANL) provides direction, coordination, and technical
  1727. oversight for the LANL portion of the DOE Human Genome Program.
  1728. The center draws scientific talent from six technical divisions
  1729. at LANL. Molecular biologists, chemists, physicists,
  1730. mathematicians, computer scientists, and engineers are
  1731. contributing to progress in physical mapping, technology
  1732. development, and informatics. Although a specific goal is the
  1733. assembly of a complete physical map for human chromosome 16, much
  1734. of the work is broadly supportive of the worldwide Human Genome
  1735. Project. Collaborative research and development programs have
  1736. also been initiated with private-sector and other institutions
  1737. involved in human genome research. The major technical
  1738. subdivisions of the center are physical mapping, technology
  1739. development, and informatics. Activities are also under way at
  1740. the center to explore ethical, legal, and social issues arising
  1741. from genome research data and to transfer technology developed
  1742. within the center's projects.
  1743.  
  1744.  
  1745. Physical Mapping
  1746.  
  1747. Physical mapping includes the development of conceptual advances
  1748. in mapping strategy and the construction of a physical map of
  1749. chromosome 16. The physical map will be composed of phage,
  1750. cosmid, and YAC contigs ordered by repetitive sequence
  1751. fingerprinting. These ordered contigs will be integrated with the
  1752. genetic linkage map, the cytogenetic map, and known gene
  1753. sequences on chromosome 16. The final map, along with its
  1754. eventual translation into a sequence tagged site (STS) map, will
  1755. provide the means for rapid access to any region of the
  1756. chromosome for further analysis. In addition, the ordered clone
  1757. sets will be available for eventual sequencing.
  1758.  
  1759.  
  1760. Technology Development
  1761.  
  1762. Technology development efforts include the application of
  1763. robotics to the handling and storage of DNA fragments, the
  1764. development and application o f methods for the construction of
  1765. DNA libraries from flow-sorted chromosomes, and the development
  1766. of new methods for rapid, inexpensive, large-scale sequencing.
  1767. All these projects are or will be supportive of the physical
  1768. mapping of chromosome 16, and they also contribute to the larger
  1769. genome program. For example, the construction and distribution of
  1770. various kinds of libraries from sorted chromosomes is playing a
  1771. significant role at many of the genome research centers.
  1772.  
  1773.  
  1774. Informatics
  1775.  
  1776. Informatics efforts involving the collection and analysis of
  1777. genome-related data will play an increasingly important role in
  1778. the genome project. LANL has a long history of expertise in this
  1779. research area and will continue to lead in providing these
  1780. essential resources.
  1781.  
  1782.  
  1783. Ethical, Legal, and Social Issues (ELSI) Activities
  1784.  
  1785. The center also sponsors active participation in ELSI studies
  1786. related to data produced by human genome research and is
  1787. compiling a comprehensive literature bibliography in
  1788. collaboration with Georgetown University. LANL scientists
  1789. participated in a series of discussions on ELSI issues sponsored
  1790. by the University of California Humanities Research Institute.
  1791.  
  1792.  
  1793. Technology Transfer
  1794.  
  1795. LANL will continue to put a high priority on collaborations with
  1796. private industry to use the skills and resources of the private
  1797. sector and to ensure effective technology transfer to the U.S.
  1798. commercial sector. The first Cooperative Research and Development
  1799. Agreement (CRADA) involving human genome research activity was
  1800. signed in 1991 by LANL and Life Technologies, Inc. (LTI).
  1801.  
  1802.  
  1803. Recent Progress and Future Directions
  1804.  
  1805. Construction of a physical map of chromosome 16. The
  1806. chromosome-mapping strategy at LANL involves the rapid generation
  1807. of cosmid contigs representing around 60% of the target
  1808. chromosome, followed by directed gap closure with yeast
  1809. artificial chromosomes (YACs). The first phase of this goal, the
  1810. rapid generation of nucleation contigs on chromosome 16, has been
  1811. completed [Stallings et al., Proc. Natl. Acad. Sci. USA 87:
  1812. 6218-22 (1990)]. An approach for identifying overlapping cosmid
  1813. clones by exploiting the high density of repetitive sequences in
  1814. human DNA was used to generate 553 contigs following the
  1815. fingerprinting of over 4500 individual cosmid clones. These
  1816. contigs represent more than 80% of the euchromatic arms of
  1817. chromosome 16 and were constructed with about one-fourth as many
  1818. cosmid fingerprints as random strategies requiring 50% minimum
  1819. overlap detection.
  1820.  
  1821. Nucleating at specific regions allows (a) the rapid generation of
  1822. large (>100 kb ) contigs in the early stages of contig mapping
  1823. and (b) the production of a contig map with useful landmarks
  1824. [i.e., (GT)n repeats] for rapid integration of the genetic and
  1825. physical maps. All 4500 fingerprinted cosmids in contigs and
  1826. singlets have been rearrayed on high-density filters. Such
  1827. filters already provide investigators with access to more than
  1828. 90% of chromosome 16, with a 60% probability that any region is
  1829. already present in a contig. These high-density
  1830. chromosome-specific cosmid filter arrays have also proved useful
  1831. for YAC fingerprinting with repetitive sequence polymerase chain
  1832. reaction (PCR) techniques. In collaboration with the laboratories
  1833. of David Ward (Yale University) and David Callen (Adelaide
  1834. Children's Hospital, Australia), 130 of these arrayed cosmids
  1835. have been regionally localized via in situ hybridization or
  1836. somatic cell hybrid panels. The average gap (containing only
  1837. singlets), approximately 65 kb in length, can be easily closed
  1838. with YACs. A single walk from each end of current contigs should,
  1839. statistically, reduce the number of contigs to approximately 50,
  1840. one of the 5-year goals of the Human Genome Project (i.e., 1- to
  1841. 2-Mb contigs; >95% coverage). To facilitate closure, LANL
  1842. investigators are constructing from monochromosomal hybrids and
  1843. flow-sorted material both a total genomic YAC library (from cell
  1844. line GM130, using the vectors pJS97 and pJS98; currently onefold
  1845. representation) and chromosome 16 YAC clones. One hundred STS
  1846. markers are being generated to key contigs. Extensive analyses of
  1847. the DNA sequences obtained from contig ends are in progress using
  1848. multiple approaches to identify potential coding regions. These
  1849. approaches include nucleotide and translated amino acid sequence
  1850. homology searches against GenBank, using BLAST and FASTA, and the
  1851. new adaptive network program, GRAIL, developed and made available
  1852. by the Oak Ridge National Laboratory. Current progress with YAC
  1853. closure indicates that the complete physical map of chromosome 16
  1854. will be achieved in the next few years.
  1855.  
  1856.  
  1857. Low-abundance repetitive DNA sequences identified on chromosome
  1858. 16. Chromosome 16-specific, low-abundance repetitive DNA
  1859. sequences (designated CH16LARs) have been identified during
  1860. construction of the cosmid contig map of this chromosome.
  1861. CH16LARs were initially identified by in situ hybridization of
  1862. cosmid and YAC clones to normal human chromosomes (in
  1863. collaboration with David Ward). The cosmid clones all came from
  1864. contig 55. The hybridization signals were unusually intense and
  1865. occurred on four regions of human chromosome 16: bands p13, p12,
  1866. p11, and q22. Contig 55 contains more clones than any other
  1867. contig (78 clones or 2% of all clones fingerprinted thus far).
  1868. Ordering clones within contig 55 is not possible because the
  1869. presence of these low-abundance repetitive DNA sequences has
  1870. generated false overlaps. The regions containing CH16LARs may
  1871. cover as much as 5% of the euchromatic arms of chromosome 16 (~5
  1872. Mb of DNA). One CH16LAR sequence (CH16LAR1) was cloned and
  1873. sequenced, and a minisatellite type of repetitive sequence was
  1874. identified. The region containing CH16LARs is of biological
  1875. interest since the pericentric inversion breakpoints commonly
  1876. found in myelomonocytic leukemia fall within these regions
  1877. [Mitelman, Hereditas 104: 113 (1986)]. Alternative strategies for
  1878. mapping and ordering clones from this region are being
  1879. implemented.
  1880.  
  1881.  
  1882. Construction and distribution of DNA libraries from flow-sorted
  1883. chromosomes: National Laboratory Gene Library Project (NLGLP).
  1884. NLGLP is a cooperative project between LANL and Lawrence
  1885. Livermore National Laboratory. Investigators at LANL have cloned
  1886. a set of complete digest libraries into the EcoR I insertion site
  1887. of Charon 21A; they are available from the American Type Culture
  1888. Collection, Rockville, Maryland. Sets of partial digest libraries
  1889. in the cosmid vector sCos1 and in the phage vector Charon 40 are
  1890. being constructed for human chromosomes 4, 5, 6, 8, 10, 11, 13,
  1891. 14, 15, 16, 17, 20, and X. Individual human chromosomes are first
  1892. sorted from rodent-human hybrid cell lines until about 1 µg of
  1893. DNA has been accumulated. The sorted chromosomes are then
  1894. examined for purity by in situ hybridization, and the DNA is
  1895. extracted and partially digested with the restriction enzyme Sau
  1896. 3AI, dephosphorylated, and cloned into vectors. Partial digest
  1897. libraries have been constructed for chromosomes 4, 5, 6, 8, 11,
  1898. 13, 16, 17, and X. Purity estimates from sorted chromosomes,
  1899. flow-karyotype analysis, and plaque or colony hybridization
  1900. indicate that most of these libraries are 90 to 95% pure.
  1901. Additional cosmid library constructions and arrays of libraries
  1902. having five- to tenfold genomic coverage into microtiter plates
  1903. are in progress. Libraries have been constructed in M13 or
  1904. bluescript vectors to generate STS markers for selecting
  1905. chromosome-specific inserts from a genomic YAC library. LANL has
  1906. also cloned sorted DNA into YAC vectors and expects to construct
  1907. a series of YAC libraries representing individual chromosomes
  1908. (see below).
  1909.  
  1910. A YAC library for human chromosome 21. YACs have been constructed
  1911. using DNA isolated from aliquots of flow-sorted human chromosome
  1912. 21. Chromosomes were prepared from the somatic cell hybrid
  1913. WAV-17, which contains chromosome 21 as the only human
  1914. chromosome. DNA isolated from sorted chromosomes was restricted
  1915. with either Cla I or Eag I or both Not I and Nhe I, ligated to
  1916. YAC vectors pJS97 and pHS98, and transformed into Saccharomyces
  1917. cerevisiae strain YPH 250. The transformation efficiency of YACs
  1918. ranged from 600 to 2500 cfu/µg of sorted DNA. About 1200 human
  1919. YACs with an average size of 200 kb have been identified. The
  1920. locations of 20 random YACs on chromosome 21 were confirmed by
  1921. hybridization to somatic cell hybrid mapping panels. Three YACs
  1922. that hybridize to D21S55 have been identified and are being used
  1923. to initiate construction of a physical map of the Down's syndrome
  1924. region of chromosome 21. Sixty YAC clones from the chromosome 21
  1925. library were localized on chromosome 21 by in situ hybridization.
  1926. The results indicate that the library contains inserts that are
  1927. well distributed along the length of the chromosome and that the
  1928. frequency of chimeric inserts is low (below 3%). A collaboration
  1929. between the genome centers at LANL and Lawrence Berkeley
  1930. Laboratory (LBL) will use the library for comprehensive physical
  1931. mapping of chromosome 21 . The ability to construct
  1932. chromosome-specific YAC libraries from sorted chromosomes will
  1933. facilitate isolation of disease genes and construction of
  1934. long-range physical maps of complex genomes. LBL is working on
  1935. chromosome 21 in cooperation with LANL.
  1936.  
  1937.  
  1938. Chromosome-specific STS libraries. Specific STSs have been
  1939. systematically generated using flow-sorted chromosomes. DNA from
  1940. about 200,000 chromosomes was digested with either one or two
  1941. restriction enzymes (usually BamH I and Hind III) and cloned
  1942. directly into bacteriophage M13mp18. One-pass sequencing was
  1943. conducted, either manually or with a Dupont Genesis 2000
  1944. automated sequencer. DNA sequences were analyzed for the presence
  1945. of sequence similarity to common human repetitive sequences, and
  1946. appropriate PCR oligomers were synthesized. An acceptable STS-PCR
  1947. assay yielded the appropriately sized product from both the
  1948. hybrid cell line DNA containing only the human chromosome of
  1949. interest and the pools of 384 anonymous YAC clones, spiked with 5
  1950. ng/ml total human DNA. To date, over 340 kb of anonymous DNA
  1951. sequence from human chromosomes 5 and 7 have been analyzed. Two
  1952. hundred STS markers for chromosome 7 have been generated in
  1953. collaboration with Maynard Olson's laboratory at Washington
  1954. University [Green et al., Genomics (in press)], and the first 100
  1955. STS markers for chromosome 5 are currently being generated in
  1956. collaboration with John Wasmuth's laboratory at the University of
  1957. California, Irvine; 50 STSs for chromosome 5 have been regionally
  1958. localized. The overall efficiency of PCR reactions yielding
  1959. appropriate products, with the anonymous genomic sequences from
  1960. flow-sorted chromosomes, has been approximately 75%. GRAIL
  1961. analyses indicate that approximately 15% of both the chromosome
  1962. 16 STSs and the randomly selected STSs for chromosomes 5 and 7
  1963. contain putative coding regions.
  1964.  
  1965.  
  1966. Informatics. The Laboratory Notebook database, designed to manage
  1967. all information necessary for map assembly, has been expanded to
  1968. include sequences, STS mapping information, and grid
  1969. hybridization data, as well as clone fingerprints and completed
  1970. maps. The forms-based interface is being expanded to provide easy
  1971. access to the new tables. Graphical interfaces and innovative
  1972. algorithms to aid map assembly have been prototyped and are being
  1973. refined. Integrated, multilevel maps are increasing in
  1974. importance. A strong emphasis for the coming year will be to
  1975. implement the Software for Integrated Genome Map Assembly (SIGMA)
  1976. system, which was designed to aid in display, assembly,
  1977. evaluation, and editing of integrated maps.
  1978.  
  1979. DNA sequencing based upon single-molecule detection in flow
  1980. cytometry. This project addresses the problem of rapidly
  1981. sequencing bases in large fragments of DNA. A DNA fragment of
  1982. about 40 kb will be labeled with base-identifying tags and
  1983. suspended in the flow stream of a flow cytometer capable of
  1984. single-molecule detection. The tagged bases will be sequentially
  1985. cleaved from the single fragment and identified as the liberated
  1986. tag passes through the laser beam. A sequencing rate of 100 to
  1987. 1000 bases/s on DNA strands of around 40 kb is projected [Genet.
  1988. Anal. 8: 1 (1991)]. Accomplishments of this project are as
  1989. follows:
  1990.  
  1991. *    Signed CRADA with LTI for joint research on DNA sequencing.
  1992.      LTI will offer expertise in nucleic acid chemistry and
  1993.      enzymology, and LANL will specialize in detection technology
  1994.      and DNA handling. LTI will commercialize the technique [for
  1995.      more information, refer to the figure on p. 25 and to Human
  1996.      Genome News, 3(1): 5 (May 1991)].
  1997.  
  1998. *    Detected several different kinds of single fluorescing
  1999.      molecules with ~85% efficiency and low error rates [Chem.
  2000.      Phys. Lett. 174: 553 (1990)].
  2001.  
  2002. *    Observed photon bursts simultaneously from rhodamine-6G and
  2003.      Texas Red, using both a doubled Nd/YAG and a synchronously
  2004.      pumped dye laser for excitation and dual-wavelength
  2005.      detection.
  2006.  
  2007. *    Synthesized DNA fragments up to 500 nucleotides long that
  2008.      contain one fluorescent nucleotide and three normal
  2009.      nucleotides. DNA synthesis was observed with rhodamine-dCTP,
  2010.      rhodamine-dATP, rhodamine-dUTP, fluorescein-dATP, and
  2011.      fluorescein-dUTP. This work was a collaboration with LTI.
  2012.  
  2013. *    Digested the fluoresceinated DNAs described above by six
  2014.      different exonucleases: native T4 polymerase, native T7
  2015.      polymerase, Klenow fragment of Escherichia coli pol I, exo
  2016.      III, E. coli pol III holoenzyme, and snake venom
  2017.      phosphodiesterase. LTI also participated in these
  2018.      investigations.
  2019.  
  2020.  
  2021. Robotic workcell for DNA filter array construction. A gantry
  2022. robot-based workcell has been assembled to array small spots of
  2023. DNA in an interleaved format. Grid densities on these membrane
  2024. filters can be varied from 576 to 9216 spots per 22 cm2. The
  2025. robot picks a microtiter plate from a dispenser, scans a barcode
  2026. label, removes the plate cover, and inserts a 96-pin gridding
  2027. tool into the plate wells. The tool is then positioned at the
  2028. appropriate place on the membrane, and the solutions on the pins
  2029. are transferred as spots. The gridding tool is washed and
  2030. sterilized, the lid replaced on the microtiter plate, and the
  2031. plate placed into a receiving stacker. The entire sequence is
  2032. repeated with new plates until the desired array has been
  2033. constructed.
  2034.  
  2035. For more information on the LANL Center for Human Genome Studies,
  2036. contact Robert K. Moyzis, Director, or Larry Deaven, Deputy
  2037. Director, at 505/667-3912.
  2038.  
  2039.  
  2040.  
  2041.  
  2042.  
  2043. Program Management Infrastructure
  2044.  
  2045. DOE OHER Mission
  2046.  
  2047. Genetics and radiation biology have been a long-term concern of
  2048. the DOE Office of Health and Environmental Research (OHER) and
  2049. DOE forerunners_the Atomic Energy Commission (AEC) and the Energy
  2050. Research and Development Administration (ERDA). In the United
  2051. States, the first federal support for genetics research was
  2052. through AEC. In the early days of nuclear energy development, the
  2053. focus was on radiation effects and later broadened under ERDA and
  2054. DOE to include the health implications of all energy technologies
  2055. and their by-products (see "Enabling Legislation" in box below).
  2056. Today, an extensive program of OHER-sponsored research on genomic
  2057. structure, maintenance, damage, and repair continues at the
  2058. national laboratories and universities. Some major components of
  2059. OHER genetics research are (1) molecular cloning and
  2060. characterization of DNA repair genes, (2) improvement of
  2061. methodologies and resources for quantitating and characterizing
  2062. mutations, and (3) the focused resource and technology
  2063. development needed to map and sequence the human genome_the Human
  2064. Genome Program.
  2065.  
  2066.  
  2067.      Enabling Legislation
  2068.      The Atomic Energy Act of 1946 (P.L. 79-585) provided the
  2069.      initial charter for a comprehensive program of research and
  2070.      development related to the utilization of fissionable and
  2071.      radioactive materials for medical, biological, and health
  2072.      purposes.
  2073.      
  2074.      The Atomic Energy Act of 1954 (P.L. 83-703) further
  2075.      authorized AEC "to conduct research on the biologic effects
  2076.      of ionizing radiation."
  2077.      
  2078.      The Energy Reorganization Act of 1974 (P.L. 93-438) provided
  2079.      that responsibilities of ERDA shall include "engaging in and
  2080.      supporting environmental, biomedical, physical and safety
  2081.      research related to the development of energy resources and
  2082.      utilization technologies."
  2083.      
  2084.      The Federal Nonnuclear Energy Research and Development Act
  2085.      of 1974 (P.L. 93-577) authorized ERDA to conduct a
  2086.      comprehensive nonnuclear energy research, development, and
  2087.      demonstration program to include the environmental and
  2088.      social consequences of the various technologies.
  2089.      
  2090.      The DOE Organization Act of 1977 (P.L. 95-91) instructed the
  2091.      department "to assure incorporation of national
  2092.      environmental protection goals in the formulation and
  2093.      implementation of energy programs; and to advance the goal
  2094.      of restoring, protecting, and enhancing environmental
  2095.      quality, and assuring public health and safety," and to
  2096.      conduct "a comprehensive program of research and development
  2097.      on the environmental effects of energy technology and
  2098.      programs."
  2099.      
  2100.      
  2101. Human exposure to environmental factors and the body's response
  2102. to such factors are a major concern. Unavoidable genome-damaging
  2103. agents in the environment include natural radiation sources, such
  2104. as the components of sunlight, cosmic rays from space, and radon
  2105. from the earth. Both inorganic and organic chemicals, some
  2106. natural to the environment and others generated by human commerce
  2107. and energy-related processes, put people at risk. Normal
  2108. biological functions also contribute to the risk of genetic
  2109. damage when the body's own cells produce potentially damaging
  2110. molecules in the course of metabolic processes such as defensive
  2111. actions against microbes, detoxification of harmful environmental
  2112. substances, and cell proliferation. Even DNA is not completely
  2113. stable chemically; its normal methylcytosine constituent has a
  2114. low but measurable rate of spontaneous mutagenic change.
  2115. Systems that reverse many types of DNA damage have evolved to
  2116. include a wide range of repair mechanisms within cells of all
  2117. species. Humans show great diversity in this capacity, with
  2118. repair-gene deficiencies showing up as sensitivity to DNA damage
  2119. from low-level radiation and in diseases such as cancer. Some
  2120. human genes that contribute to DNA repair processes have been
  2121. characterized, and others await detection and molecular cloning.
  2122. A goal of the OHER program is to improve the capabilities for
  2123. diagnosing individual susceptibility to genome damage.
  2124.  
  2125. The genome program is providing fundamental information about the
  2126. linear structure of chromosomes and genes, but understanding gene
  2127. function requires other types of knowledge. Elucidating the
  2128. three-dimensional (3-D) structure of proteins is crucial in
  2129. explicating their functions. To advance these studies, several
  2130. unique facilities for 3-D microstructure research, developed and
  2131. maintained at DOE laboratories (see box on DOE facilities), are
  2132. increasingly in demand by molecular biologists.
  2133.  
  2134. To carry out its national research and development obligations,
  2135. OHER conducts the following activities:
  2136.  
  2137. *    Sponsors research and development projects at universities,
  2138.      in the private sector, and at DOE national laboratories;
  2139.      
  2140. *    Uses the unique capabilities of multidisciplinary DOE
  2141.      national laboratories for the nation's benefit;
  2142.  
  2143. *    With advice from the scientific community and other sectors
  2144.      of government, considers novel, beneficial initiatives; and
  2145.  
  2146. *    Provides expertise on various governmental working groups.
  2147.  
  2148. David J. Galas has directed OHER, an office of the DOE Office of
  2149. Energy Research, since April 1990. He also serves under the White
  2150. House Office of Science and Technology Policy as Cochair of the
  2151. Committee on Life Sciences and Health and as Chairman of its
  2152. Subcommittee on Biotechnology Research. John C. Wooley became
  2153. OHER Deputy Associate Director in June 1992.
  2154.  
  2155. The Human Genome Program, conceived as an Initiative within OHER,
  2156. is administered primarily through the Health Effects and Life
  2157. Science Research Division, directed by David A. Smith. The
  2158. Medical Applications and Biophysical Research Division, directed
  2159. by Robert W. Wood, monitors the instrumentation sector of the
  2160. Human Genome Program and, more broadly, sponsors research and
  2161. development of resources and instrumentation having biomedical
  2162. and biotechnological applications.
  2163.  
  2164. Major DOE Facilities and Resources Relevant to Molecular Biology
  2165. Research
  2166.  
  2167. Center for X-Ray Optics                             LBL
  2168. GenBankr Data Sequence Repository                   LANL
  2169. High Flux Beam Reactor                              BNL
  2170. Los Alamos Neutron Scattering Center                LANL
  2171. National Flow Cytometry Resource                    LANL
  2172. National Laboratory Gene Library Project            LANL, LLNL
  2173. Protein Structure Data Bank                         BNL
  2174. National Synchrotron Light Source                   BNL
  2175. Scanning Transmission Electron Microscope Resource  BNL
  2176. Stanford Synchrotron Radiation Laboratory           Stanford
  2177. GRAIL, Online Sequence Interpretation Service       ORNL
  2178.  
  2179.  
  2180. Program Management Task Group
  2181.  
  2182. The Human Genome Program Management Task Group (see box for list
  2183. of members) reports to the OHER Director and works to coordinate
  2184. the following within OHER:
  2185.  
  2186. *    peer review of research proposals, using both prospective
  2187.      and retrospective evaluations and
  2188.  
  2189. *    administration of awards, collaboration with all concerned
  2190.      agencies and organizations, organization of periodic
  2191.      workshops, and responses to the needs of the developing
  2192.      program.
  2193.  
  2194. DOE Human Genome Program Management Task Group in 1992
  2195.  
  2196. David A. Smith, Chair    Molecular biologist
  2197. Ann M. Barber            Computational biologist
  2198. Benjamin J. Barnhart     Geneticist
  2199. Daniel W. Drell          Biologist
  2200. Gerald Goldstein         Physical scientist
  2201. Murray Schulman          Radiation biologist
  2202. Jay Snoddy*              Molecular biologist
  2203. Marvin Stodolsky         Molecular biologist
  2204. John C. Wooley           Biophysicist
  2205.  
  2206. *On detail from Argonne National Laboratory.
  2207.  
  2208.  
  2209. Field Coordination
  2210.  
  2211. Human Genome Coordinating Committee (HGCC)
  2212.  
  2213. Another component of the OHER management structure, HGCC was
  2214. formed in October 1988 to represent DOE genome program
  2215. researchers along with observers from other government and
  2216. private agencies (see box for list of HGCC members). Members of
  2217. the Human Genome Program Management Task Group are ex-officio
  2218. members of HGCC, and they participate in the regularly scheduled
  2219. HGCC meetings. HGCC responsibilities include the following:
  2220.  
  2221. *    assisting OHER with overall coordination of DOE-funded
  2222.      genome research;
  2223.  
  2224. *    facilitating the development and dissemination of novel
  2225.      genome technologies;
  2226.  
  2227. *    ensuring proper management and sharing of data and samples;
  2228.  
  2229. *    participating with other national and international efforts;
  2230.      and
  2231.  
  2232. *    recommending establishment of ad hoc task groups to analyze
  2233.      specific areas, such as ethical, legal, and social issues;
  2234.      informatics requirements; mapping and sequencing
  2235.      technologies; use of the mouse as a model organism; cost of
  2236.      resource distribution; and use of chromosome flow-sorting
  2237.      facilities.
  2238.  
  2239. Human Genome Coordinating Committee Members in 1992
  2240.  
  2241. Elbert W. Branscomb, Computational Biologist, Human Genome
  2242. Center, Lawrence Livermore National Laboratory
  2243.  
  2244. Charles R. Cantor, Principal Scientist, DOE Human Genome Program,
  2245. Lawrence Berkeley Laboratory
  2246.  
  2247. Anthony V. Carrano, Director, Human Genome Center and Leader,
  2248. Biomedical Sciences Division, Lawrence Livermore National
  2249. Laboratory
  2250.  
  2251. C. Thomas Caskey, Director, Institute for Molecular Genetics,
  2252. Baylor College of Medicine
  2253.  
  2254. David J. Galas, Office of Health and Environmental Research, DOE
  2255.  
  2256. Raymond F. Gesteland, Professor and Cochair, Department of Human
  2257. Genetics, University of Utah; Investigator, Howard Hughes Medical
  2258. Institute Laboratory for Genetic Studies at the Eccles Institute,
  2259. University of Utah
  2260.  
  2261. Leroy E. Hood, Director, Center for Integrated Protein and
  2262. Nucleic Acid Chemistry and Biological Computation; Director,
  2263. Cancer Center, California Institute of Technology
  2264.  
  2265. Robert K. Moyzis, Director, Center for Human Genome Studies, Los
  2266. Alamos National Laboratory
  2267.  
  2268. Jasper Rine, Director, Human Genome Center, Lawrence Berkeley
  2269. Laboratory
  2270.  
  2271. Robert J. Robbins, Director, Welch Medical Library for Applied
  2272. Research in Academic Information, Johns Hopkins University
  2273.  
  2274. David A. Smith, Office of Health and Environmental Research, DOE
  2275.  
  2276. Lloyd M. Smith, Assistant Professor, Analytical Division,
  2277. Department of Chemistry, University of Wisconsin, Madison
  2278.  
  2279. John C. Wooley, Office of Health and Environmental Research, DOE
  2280. ______________
  2281.  
  2282. HGCC Executive Officer: Sylvia J. Spengler, Deputy Director Human
  2283. Genome Center, Lawrence Berkeley Laboratory
  2284.  
  2285.  
  2286. A Principal Scientist is a member of HGCC, reports to the Human
  2287. Genome Program Task Group regarding the responsibility of keeping
  2288. the program at the leading edge of genome research, and conveys
  2289. recommendations on broad scientific policies to HGCC. Currently
  2290. serving as a Principal Scientist is Charles R. Cantor, Lawrence
  2291. Berkeley Laboratory.
  2292.  
  2293.  
  2294. Human Genome Management Information System (HGMIS)
  2295.  
  2296. As an aid to the DOE Human Genome Program Task Group,
  2297. communication and information services are provided by HGMIS at
  2298. Oak Ridge National Laboratory. In this role HGMIS facilitates
  2299. international communication among management and research
  2300. personnel and informs other interested persons about genome
  2301. research. HGMIS publications, such as the bimonthly newsletter
  2302. Human Genome News and technical and program reports, are
  2303. available to anyone interested in the genome project. Human
  2304. Genome News is jointly supported by OHER and the NIH National
  2305. Center for Human Genome Research (NCHGR).
  2306.  
  2307. Subscribers to the newsletter number over 13,000 and include
  2308. genome and basic researchers at national laboratories,
  2309. universities, and other research institutions; professors and
  2310. teachers; industry representatives; legal personnel; ethicists;
  2311. students; genetic counselors; physicians; the press; and other
  2312. interested individuals. In the first quarter of 1992, over 5000
  2313. Genome Data Base users were added to the mailing list.
  2314. Subscribers outside the United States include more than 3000
  2315. individuals and institutions in 48 countries.
  2316.  
  2317.  
  2318. Human Genome Distinguished Postdoctoral Fellowships
  2319.  
  2320. In 1990 OHER established the Human Genome Distinguished
  2321. Postdoctoral Research Program to support research on projects
  2322. related to the DOE Human Genome Program. The postdoctoral program
  2323. developed from a 1988 recommendation of the DOE Energy Research
  2324. Advisory Board to "increase support through expansion of the
  2325. targeted (science and engineering) graduate and postgraduate
  2326. research fellowship programs with emphasis given to
  2327. energy-related areas of greatest projected human resource
  2328. shortages." Recipients of the first fellowships, awarded in FY
  2329. 1991, are listed below.
  2330.  
  2331. 1991 DOE Human Genome Distinguished Postdoctoral Fellows*
  2332.  
  2333. Xiaohua Huang (Stanford University, Biophysical Chemistry)
  2334. Host: University of California, Berkeley
  2335.  
  2336. Ben Koop (Wayne State University, Molecular Biology and Genetics)
  2337. Host: California Institute of Technology
  2338.  
  2339. Carol Soderlund (New Mexico State University, Computer Science)
  2340. Host: Los Alamos National Laboratory
  2341.  
  2342. Harold Swerdlow (University of Utah, Bioengineering)
  2343. Host: University of Utah
  2344.  
  2345. *Contact: Linda Holmes: 615/576-3192, Fax: 615/576-0202.
  2346.  
  2347. Fellowship appointments are tenable at DOE and university
  2348. laboratories having substantial DOE-sponsored research projects
  2349. supportive of the Human Genome Program. Fellows will participate
  2350. in advanced genetics-related research, interact with outstanding
  2351. professionals, and become familiar with major issues while making
  2352. personal contributions to the program's goal of mapping and
  2353. sequencing the human genome. This interaction, involving the
  2354. exchange of ideas, skills, and technologies, will benefit the
  2355. fellow, the host laboratory, and the DOE program.
  2356.  
  2357. These fellowships complement the Alexander Hollaender
  2358. Distinguished Postdoctoral Fellowships initiated by OHER. The
  2359. Hollaender Fellowships, established in memory of the 1983
  2360. recipient of the prestigious DOE Enrico Fermi Award, provide
  2361. support in all areas of OHER-sponsored research. Both
  2362. postdoctoral programs are administered by Oak Ridge Associated
  2363. Universities, which is a university consortium and DOE
  2364. contractor.
  2365.  
  2366.  
  2367. Resource Allocation
  2368.  
  2369. Reports by the Health and Environmental Research Advisory
  2370. Committee (HERAC) and the National Research Council (NRC)
  2371. recommended that national funding for the Human Genome Project
  2372. increase to a sustaining yearly level of $200 million. DOE
  2373. program expenditures were $5.5 million in FY 1987, $10.7 million
  2374. in FY 1988, $17.5 million in FY 1989, $25.9 million in FY 1990,
  2375. $46 million in FY 1991, and $59 million in FY 1992. The proposed
  2376. presidential budget for the DOE Human Genome Program in FY 1993
  2377. is $64.7 million (graph). DOE-sponsored research is conducted in
  2378. a variety of institutions (upper table). The lower table
  2379. categorizes research expenditures for FY 1992.
  2380.  
  2381. Types of Institutions Conducting DOE-Sponsored Genome Research
  2382.  
  2383.  8   National laboratories
  2384.  3   Other federal organizations
  2385. 41   Academic institutions
  2386. 10   Private-sector institutions
  2387. 12   Nonacademic, commercial organizations
  2388.  
  2389. Human Genome Program Funds Distribution in FY 1992 (in $K)
  2390. (Commitments as of May 1, 1992)
  2391.  
  2392. ----------------------------------------------------------------------------
  2393. | Organization  Mapping     Instrumenta  Informa  ELSI     Totals Percent  |
  2394. | Type          &           tion         tics                     of       |
  2395. |               Sequencing  Development                           568001   |
  2396. |--------------------------------------------------------------------------|
  2397. | DOE Labs      23671       7559         5122     236      36588  64.4     |
  2398. |                                                                          |
  2399. | Academic      5462        3341         4528     736      14067  24.8     |
  2400. |                                                                          |
  2401. | Institutions  2173        0            602      847      3622   6.4      |
  2402. | (nonprofit)                                                              |
  2403. |                                                                          |
  2404. | NIH Labs      680         0            0        0        680    1.2      |
  2405. |                                                                          |
  2406. | Companies     1550        0            314      392      2256   3.9      |
  2407. | and SBIR2                                                                |
  2408. |                                                                          |
  2409. | All           33536       10900        10566    2211     57213           |
  2410. | Organizations                                                            |
  2411. |                                                                          |
  2412. | [Percent      [59.0]      [19.2]       [18.6]   [3.9]    [100.7]^3       |
  2413. | of 56800]                                                                |
  2414. ----------------------------------------------------------------------------
  2415.  
  2416.  
  2417.  
  2418. 1  Total allocation of $59 million less capital equipment funds of $2.2
  2419.    million.
  2420. 2  Small Business Innovation Research grants.
  2421. 3  Excess occurs because funding for genome SBIR projects is received from
  2422.    the DOE-wide SBIR program, to which OHER contributes.
  2423.  
  2424.  
  2425.  
  2426.  
  2427. Interagency Coordination
  2428.  
  2429. Joint DOE-NIH Activities
  2430.  
  2431. The NIH Human Genome Program, led by NIH NCHGR, has emphasized
  2432. the study of disease genes in the construction of complete
  2433. genetic and physical maps of the genomes of humans and selected
  2434. model organisms. NIH is also developing new technologies and
  2435. information systems to manage mapping and sequencing data.
  2436.  
  2437. In the fall of 1988 DOE and NIH began coordinating their human
  2438. genome research programs under the Memorandum of Understanding,
  2439. an outgrowth of the HERAC and NRC reports, "to foster interagency
  2440. cooperation that will enhance the human genome research
  2441. capabilities of both agencies." More information on
  2442. NCHGR-sponsored projects and infrastructure may be obtained by
  2443. contacting the NCHGR Office of Communications at 301/402-0911.
  2444.  
  2445. Joint DOE-NIH Subcommittee on the Human Genome in 1992
  2446.  
  2447. Cochairs:
  2448.  
  2449. Paul Berg (PACHG)        Stanford University School of Medicine
  2450. Sheldon Wolff (HERAC)    University of California, San Francisco
  2451. Charles R. Cantor        Lawrence Berkeley Laboratory (HGCC)
  2452. Anthony V. Carrano       Lawrence Livermore National Laboratory (HGCC)
  2453. Joseph L. Goldstein      University of Texas Southwestern Medical Center
  2454. Leroy E. Hood            California Institute of Technology
  2455. Leonard S. Lerman        Massachusetts Institute of Technology (HERAC)
  2456. Victor A. McKusick       Johns Hopkins Hospital
  2457. Robert K. Moyzis         Los Alamos National Laboratory (HGCC)
  2458. Maynard V. Olson         Washington University School of Medicine (PACHG)
  2459. MaryLou Pardue           Massachusetts Institute of Technology (HERAC)
  2460. Mark L. Pearson          E. I. du Pont de Nemours & Company (PACHG)
  2461. Diane C. Smith           Xerox Corporation (PACHG)
  2462. Robert T. Tjian          University of California, Berkeley
  2463. Nancy S. Wexler          Columbia University (PACHG)
  2464. John C. Wooley           Office of Health and Environmental Research, DOE
  2465.  
  2466.  
  2467. Ex Officio Members:
  2468.  
  2469. David J. Galas           Office of Health and Environmental Research, DOE
  2470. Mark S. Guyer            National Center for Human Genome Research, NIH
  2471. Elke Jordan              National Center for Human Genome Research, NIH
  2472. David A. Smith           Office of Health and Environmental Research, DOE
  2473. Michael Gottesman        National Center for Human Genome Research, NIH
  2474.  
  2475.  
  2476. A national plan, primarily authored by NIH and DOE, for a
  2477. coordinated multiyear research project was presented to Congress
  2478. in early 1990. Understanding Our Genetic Inheritance, The U.S.
  2479. Human Genome Project: The First Five Years (1991-1995) detailed a
  2480. comprehensive spending plan and optimal strategies for mapping
  2481. and sequencing the human genome. Referred to as the Five Year
  2482. Plan, it calls for open biannual meetings of the DOE-NIH Joint
  2483. Subcommittee on the Human Genome. The joint subcommittee invites
  2484. reports from experts, including those on national and
  2485. international genome efforts; medical genetics; and related
  2486. ethical, legal, and social issues as they pertain to data
  2487. produced in the project. The subcommittee is made up of members
  2488. from the NIH Program Advisory Committee on the Human Genome
  2489. (PACHG) and from the DOE HERAC or the HGCC members appointed by
  2490. HERAC. The subcommittee reports to its parent committees_PACHG
  2491. and HERAC.
  2492.  
  2493. Many workshops and meetings have since been cosponsored by the
  2494. two agencies (see Appendix B). In addition, the Joint
  2495. Subcommittee on the Human Genome has established five joint
  2496. working groups that meet regularly to address specific areas of
  2497. genome research and make recommendations to the joint
  2498. subcommittee. The objectives of these five joint working groups,
  2499. listed below, include establishing research priorities;
  2500. identifying research, training, and technical needs; and
  2501. coordinating U.S. research activities with those of other
  2502. countries. Members of the working groups represent various
  2503. disciplines. (Membership lists of the working groups are included
  2504. in Appendix D.)
  2505.  
  2506. Joint Mapping Working Group. The mapping working group encourages
  2507. development and use of methodologies to integrate genetic linkage
  2508. and physical maps, meet project mapping goals, and identify
  2509. informatics needs associated with map generation and completion.
  2510.  
  2511. Joint Informatics Task Force (JITF). An ad hoc committee, JITF
  2512. prepared a comprehensive report on genome information needs and
  2513. data analysis tools. The report was presented to the DOE-NIH
  2514. Joint Subcommittee on the Human Genome in January 1992.
  2515.  
  2516. Joint Sequencing Working Group. The sequencing working group
  2517. investigates and makes recommendations on research and technology
  2518. development priorities to enable the sequencing of 3 billion
  2519. nucleotides of human DNA within 15 years.
  2520.  
  2521. Joint Working Group on Ethical, Legal, and Social Issues (ELSI).
  2522. ELSI identifies and addresses the social concerns that may arise
  2523. as genome technology is developed and genetic data becomes
  2524. available; stimulates bioethics research; promotes education of
  2525. professional and lay groups; and collaborates with international
  2526. groups such as the Human Genome Organization (HUGO), United
  2527. Nations Educational, Scientific, and Cultural Organization
  2528. (UNESCO), and the European Community (see next section).
  2529.  
  2530. Joint Working Group on the Mouse. The mouse working group was
  2531. established to develop a strategy for efficiently using the mouse
  2532. to accomplish mapping project goals as outlined in the Five Year
  2533. Plan. This strategy will take advantage of the extensive genetic
  2534. map data amassed on the mouse. Because of numerous similarities
  2535. between mouse and human genomes, these studies are considered
  2536. essential to understanding human biology and to interpreting more
  2537. complex data obtained in studies of humans.
  2538.  
  2539.  
  2540. Other U.S. Genome Research
  2541.  
  2542. U.S. Department of Agriculture (USDA). USDA has implemented a
  2543. Plant Genome Research Program to foster and coordinate research
  2544. on single and multigenic traits related to agricultural,
  2545. forestry, and environmental concerns. The goal of this 5-year
  2546. program is to improve plant varieties by locating important genes
  2547. and markers on chromosomes, determining gene structure, and
  2548. transferring genes to improve the performance of economically
  2549. important crops such as corn, wheat, soybeans, and pine. Use of
  2550. these "molecular breeding" techniques will increase U.S.
  2551. competitiveness in the world marketplace.
  2552.  
  2553. National Science Foundation (NSF). NSF coordinates an interagency
  2554. research effort to map and sequence the small genome of
  2555. Arabidopsis thaliana, a simple weed that provides an ideal model
  2556. for studying plant biochemistry, genetics, and physiology.
  2557. Knowledge of the function of every Arabidopsis gene will be
  2558. applicable to the understanding and manipulation of higher plants
  2559. and to genome research in general. These studies are also
  2560. supported by DOE, NIH, and USDA as part of their own genome
  2561. initiatives, and the four agencies coordinate their Arabidopsis
  2562. activities. NSF also has instrumentation, computational, and
  2563. informatics programs that support genomics research, in addition
  2564. to individual awards in genetics and molecular biology.
  2565.  
  2566. Howard Hughes Medical Institute (HHMI). HHMI, a private medical
  2567. research organization, contributes to the genome effort through
  2568. its support of biomedical research primarily at university
  2569. molecular biology and genetics laboratories. In addition, HHMI
  2570. has cosponsored several genomics conferences and, between 1985
  2571. and September 1991, supported the collection and dissemination of
  2572. genome mapping data through a network of databases.
  2573.  
  2574.  
  2575.  
  2576.  
  2577. International Coordination
  2578.  
  2579. Genomic research is being carried out in countries throughout the
  2580. world. The two international organizations described on the next
  2581. two pages are working to coordinate and facilitate national
  2582. efforts. HUGO includes a number of DOE and NIH genome
  2583. investigators and administrators. HUGO and UNESCO have been
  2584. informed of dedicated genome programs in the following nations
  2585. and international agencies: Commonwealth of Independent States
  2586. (formerly U.S.S.R.), Denmark, European Community, France,
  2587. Germany, Hungary, Italy, Japan, Netherlands, United Kingdom, and
  2588. United States.
  2589.  
  2590.  
  2591. HUGO: Worldwide Genome Research Coordination
  2592.  
  2593. HUGO, formed by scientists to coordinate worldwide genome mapping
  2594. and sequencing, now has regional offices in the United States
  2595. (Bethesda, Maryland) and Europe (London) and a satellite office
  2596. in Moscow. A Pacific office is under development in Osaka, Japan.
  2597.  
  2598. HUGO offices were funded initially by several charitable
  2599. organizations. In 1990 HHMI awarded HUGO a 4-year, $1 million
  2600. grant to support the HUGO Americas office; in that same year The
  2601. Wellcome Trust provided a 3-year grant, with the first year's
  2602. funds amounting to over $400,000, to assist with activities in
  2603. the European office. The Imperial Cancer Research Fund (U.K.)
  2604. provides support for the HUGO president's office, and the Osaka
  2605. office has received private support as well. To support future
  2606. activities, HUGO directors intend to raise funds from various
  2607. countries that have active genome research programs.
  2608.  
  2609. HUGO members are elected; there are over 400 members from 32
  2610. countries. The international officers in 1992: Sir Walter Bodmer
  2611. (United Kingdom), President; Charles R. Cantor (United States),
  2612. Vice-President; Andrei Mirzabekov (Russia), Vice-President;
  2613. Kenichi Matsubara (Japan), Vice-President; Bronwen Loder (United
  2614. Kingdom), Secretary; and Robert Sparkes (United States),
  2615. Treasurer. Each office operates with its own trustees.
  2616.  
  2617. The objectives of HUGO include
  2618.  
  2619. *    fostering collaboration to avoid unnecessary competition or
  2620.      duplication of effort and to coordinate human genome
  2621.      research with model organism studies;
  2622.  
  2623. *    coordinating exchanges of relevant data and materials;
  2624.  
  2625. *    educating researchers and the public on the scientific,
  2626.      ethical, social, legal, and commercial implications of the
  2627.      research; and
  2628.  
  2629. *    acting as a clearinghouse for genome-related information,
  2630.      such as relevant conferences, worldwide genome programs and
  2631.      researchers, and database and material availability. A
  2632.      training program may be initiated to encourage the spread of
  2633.      new and promising technologies.
  2634.  
  2635. HUGO has established expert international ad hoc advisory
  2636. committees on mapping workshops and databases, informatics,
  2637. ethics, mouse mapping, and intellectual property and ownership.
  2638.  
  2639. Single-chromosome workshops are crucial to the success of the
  2640. Human Genome Project. Working with the funding agencies, HUGO is
  2641. playing a central role in the coordinated development of such
  2642. meetings and has assisted in planning workshops for chromosomes
  2643. 2, 3, 13, 16, 19, and X in 1992. HUGO expects to work with the
  2644. scientific community to select workshop chairs and to assist in
  2645. fundraising and organizing and running these and future meetings.
  2646. Chromosome workshops and other meetings are listed in Appendix B.
  2647.  
  2648.  
  2649. UNESCO: Promoting the Interests of Developing Countries
  2650.  
  2651. A UNESCO Human Genome Program was approved for 1990-91 at the
  2652. 25th session of the UNESCO General Conference. Attendees
  2653. concluded that full knowledge of the human genome is vitally
  2654. important and that UNESCO could be influential in stimulating
  2655. governments and agencies to support coordinated programs. UNESCO
  2656. expects to play a key role in promoting the interests of
  2657. developing countries. The Scientific Coordinating Committee
  2658. (SCC), composed of 13 scientists, plans and implements the
  2659. program, which was budgeted at $350,000 for the first year; SCC
  2660. members include representatives selected from geographic regions
  2661. and from international genome organizations such as HUGO. Members
  2662. of SCC and of the UNESCO Secretariat agreed that UNESCO will
  2663. concentrate its activities on access to and use of data obtained
  2664. from human genome mapping and sequencing research, as well as on
  2665. related ethical and social issues.
  2666.  
  2667. UNESCO emphasizes the use of training programs as one of the best
  2668. means of obtaining cooperation and diminishing the gap between
  2669. developed and developing countries. The Third World Academy of
  2670. Sciences (TWAS) joined UNESCO in sponsoring a training program
  2671. that provided 19 fellowships in 1991 to awardees from Algeria,
  2672. Argentina, Cameroon, Chile, China, Costa Rica, Cyprus,
  2673. Czechoslovakia, Egypt, Guinea, India, Indonesia, Myanmar, the
  2674. Republic of Korea, Peru, Spain, Ukraine, Russia, and Yugoslavia.
  2675. The 1- to 3-month fellowships enable scientists from developing
  2676. countries to carry out research in well-established scientific
  2677. centers and to learn new research techniques. UNESCO and TWAS are
  2678. also jointly compiling a directory to identify third-world genome
  2679. researchers and their needs.
  2680.  
  2681. To avoid overlap with other genome projects, UNESCO focuses on
  2682. communication among countries about major trends and regional
  2683. efforts, one of which, the Latin American Human Genome Program,
  2684. was established during a UNESCO-supported symposium in Chile in
  2685. 1990. The first annual UNESCO South-North Human Genome Conference
  2686. was held in 1992 in Caxambu, Brazil, to increase interaction
  2687. between scientists from developed countries and those of the
  2688. third world. The second conference is planned for Thailand in
  2689. 1993, and the third will probably take place in China in 1994.
  2690.  
  2691.  
  2692.  
  2693.