home *** CD-ROM | disk | FTP | other *** search
/ The California Collection / TheCaliforniaCollection.cdr / his065 / genetcii.arj / GENETCII.TXT
Text File  |  1991-02-18  |  18KB  |  411 lines

  1.  
  2.      GENETIC ENGINEERING: FUNDAMENTALS AND APPLICATIONS
  3.  
  4.       II.  cDNA Cloning and Protein/Variant Production
  5.  
  6.               David C. Tiemeier, Senior Fellow
  7.                Biological Sciences Department
  8.                       Monsanto Company
  9.                     St. Louis, Missouri
  10.  
  11. (NOTE:   Edited for CompuServe by C. E. Styron.  Comments on 
  12. this article can be forwarded through CompuServe E-Mail to 
  13. 76054,1666 or through SourceMail BBH329.)
  14.   
  15. INTRODUCTION
  16.  
  17. In  an earlier article in this series,  I discussed some  of 
  18. the   basic   concepts   and  techniques   associated   with 
  19. recombinant DNA technology.  These techniques can be used to 
  20. isolate and amplify,  that is to clone,  a piece of DNA from 
  21. the  total  set of DNA of an  organism.   Depending  on  the 
  22. amount  of DNA required to encode the particular gene(s) one 
  23. wishes  to  study,  the cloned DNA fragment might  encode  a 
  24. portion of one gene or up to several complete  genes.   This 
  25. procedure also yields DNA sequences which flank the gene and 
  26. are critical for the normal physiological control of protein 
  27. production.
  28.  
  29. The  recombinant DNA technology permits one to make not only 
  30. large amounts of the DNA corresponding to a particular  gene 
  31. but  also large amounts of the protein encoded by that gene.  
  32. This can,  in turn, permit detailed studies of the protein's 
  33. structure and its interaction with substrate and inhibitors.  
  34. Moreover,  this can be the basis for a production process if 
  35. the protein, itself, is judged to be a product candidate for 
  36. animal or human health care applications.
  37.  
  38. PROTEIN PRODUCTION
  39.  
  40. The vector used to produce the protein encoded by the cloned 
  41. gene   differs   from   that  described   for   the   simple 
  42. amplification   of  the  hybrid  DNA.    DNA  elements   are 
  43. incorporated on either side of the foreign gene which direct 
  44. the host cell to produce an mRNA transcript and subsequently 
  45. translate  the  mRNA  into  protein.   By  using  regulatory 
  46. elements known to be very efficient in the host  cell,  high 
  47. level production of the protein can be achieved. (Figure 1)
  48.  
  49.  
  50. FIGURE 1: EXPRESSION VECTOR
  51.  
  52.                  _______
  53.                 |       | <--- REPLICATION ELEMENT
  54.                ______________________________
  55.                | __________________________ | __
  56.                ||                          ||   |    SELECTABLE
  57.                ||                          ||   |  <--- MARKER
  58.             __ ||                          || __|
  59. PROMOTER   |   ||                          ||
  60.       ---> |   ||      FOREIGN DNA         ||  
  61.            |__ ||    INSERTION SITE        || 
  62.                ||____________  ____________||
  63.                |_____________||_____________|
  64. TRANSLATION                        
  65. SIGNALS    --->  |______|    /\    |______|  <--- TERMINATOR
  66.                             /  \
  67.                              ||
  68.                              ||
  69.                      _________________     
  70.                      _________________
  71.  
  72.                           FOREIGN
  73.                             DNA
  74.  
  75.  
  76. In some cases, proteins have been produced at high levels in 
  77. E.  coli.   Human  and bovine somatotropin are  examples  of 
  78. this.    The  yeast,  Saccharomyces,  better  known  to  the 
  79. fermentation industry, has also been used for the production 
  80. of  some  proteins.   Proteins  are  more  readily  secreted 
  81. secreted  from yeast and that feature may facilitate protein 
  82. isolation in some instances.   In other cases,  animal cells 
  83. have been used as the expression host.   Tissue  plasminogen 
  84. activator(tPA)  is  an example of this.   Animal  cells  may 
  85. prove  particularly  useful  for  producing  proteins  whose 
  86. function  is  affected by post-translational  modifications.  
  87. Many  of these modifications are not performed by  E.  coli.  
  88. Some  are  performed by yeast but in a  way  different  from 
  89. animal cells.  
  90.  
  91. cDNA CLONING
  92.  
  93. Gene-containing  DNA fragments,  isolated directly from  the 
  94. cell's  DNA as described in the first article,  may be  used 
  95. for  the protein production I have just described;  but  two 
  96. reasons  have  prompted  scientists to  use  an  alternative 
  97. cloning  approach.   First,  most genes only occur as single 
  98. copies in the DNA.   Since DNA in higher eukaryotes such  as 
  99. soybeans,  cows,  and humans have enough information for one 
  100. to  ten million genes,  one must mount a non-trivial cloning 
  101. project  to  pull  out  the  full  gene  copy.   Second,  as 
  102. mentioned in the first article,  many genes have been  found 
  103. to   be  interrupted  by  DNA  segments  called  intervening 
  104. sequences,  or  introns.   These  are  good  for  the  gene, 
  105. apparently  facilitating  the  stable  accumulation  of  the 
  106. gene's mRNA,  but rough on the molecular biologist who would 
  107. like to over-produce the encoded protein.   Introns can make 
  108. the stretch of DNA encoding the gene so big that it  doesn't 
  109. fit   into  most  vectors.    Moreover,   some  of  the  key 
  110. host:vector  systems  for  protein  production,  principally 
  111. those involving E.  coli, do not remove the introns from the 
  112. mRNA.   As a result,  even though mRNA might be made  within 
  113. the host it cannot be properly translated into protein.
  114.  
  115. To understand the alternative cloning approach, it is useful 
  116. to  recall  the "central dogma" of  molecular  biology.   An 
  117. organism's traits are encoded in DNA.  The information for a 
  118. specific  protein,  associated  with a particular  trait  or 
  119. characteristic,  is  converted into a second  polynucleotide 
  120. termed   messenger   RNA   (mRNA)  by   a   process   called 
  121. transcription.   This  specific  bit of information is  then 
  122. translated into the particular protein. (Figure 2)
  123.  
  124.  
  125. FIGURE 2:  "CENTRAL DOGMA" OF MOLECULAR BIOLOGY
  126.  
  127.     DNA  =============================
  128.  
  129.                     ||
  130.                     ||  TRANSCRIPTION
  131.                    \||/ 
  132.                     \/ 
  133.     RNA  -----------------------------
  134.  
  135.                     ||
  136.                     ||  TRANSLATION 
  137.                    \||/
  138.                     \/
  139.  
  140.                   PROTEIN
  141.  
  142.  
  143. Different  cells in an organism are specialized  to  produce 
  144. only  a  portion  of the proteins encoded in the  total  DNA 
  145. complement.   Some cells produce as much as 1 - 2 percent of 
  146. their total protein as a single  species.   Generally,  mRNA 
  147. levels reflect this same bias.  Hence, if one can start with 
  148. a  population of cells that are preferentially producing the 
  149. protein  of interest and one can produce  a  double-stranded 
  150. DNA  copy  from  the mRNA,  the gene cloning will  have  the 
  151. advantage of starting with a DNA population highly  enriched 
  152. in the desired gene.  Moreover, the mRNA that accumulates in 
  153. the cell and that is subsequently translated into protein is 
  154. a  mature  form  lacking the  introns.   Hence,  the  double 
  155. stranded  DNA  that results also lacks the  introns  and  so 
  156. contains  the  amino  acid information in  an  uninterrupted 
  157. form.
  158.  
  159. Fortunately   for  the  molecular   biologist,   an   enzyme 
  160. associated  with certain animal viruses is capable of  using 
  161. mRNA as a template to generate a complementary piece of DNA.  
  162. Eukaryotic  mRNA typically has a run of adenylic acid at its 
  163. 3'   terminus  (FIGURE  3a)  so  that  a  short   piece   of 
  164. deoxythymidylate  can be used as a primer or starter for the 
  165. enzymatic  synthesis (FIGURE 3b).   Because  this  enzymatic 
  166. process  is  the opposite of transcription,  the enzyme  has 
  167. been   named   reverse   transcriptase.     The    resulting 
  168. complementary  DNA  is referred to as cDNA and  the  cloning 
  169. approach based on this initial conversion of mRNA to cDNA is 
  170. termed cDNA cloning. (Figure 3)
  171.  
  172.  
  173. FIGURE 3:  cDNA CLONING
  174.  
  175. a.   ----------------------------AAAA
  176.                     ||
  177.      Reverse        ||
  178.      Transcriptase  ||    oligo dT primer
  179.                    \||/
  180.                     \/
  181.  
  182. b.    -----------------------------AAAA
  183.                     ||      -------TTT
  184.                     ||
  185.                    \||/
  186.                     \/
  187.  
  188. c.    -----------------------------AAAA
  189.       -----------------------------TTT
  190.                     ||
  191.      RNAase H       ||
  192.      DNA polymerase ||
  193.                    \||/
  194.                     \/
  195.  
  196. d.   ----------
  197.      ------------------------------TTT
  198.                     ||
  199.                     ||
  200.                    \||/
  201.                     \/
  202.  
  203. e.   ------------------------------
  204.      ------------------------------
  205.                     ||
  206.      DNA ligase     ||   linkers
  207.                     || 
  208.                    \||/
  209.      ___            \/           ___
  210.     |   |                       |   |
  211. f.  |---|-----------------------|---|
  212.     |---|-----------------------|---|
  213.     |___|           ||          |___|
  214.                     ||
  215.     Restriction     ||
  216.     Enzyme         \||/
  217.                     \/
  218.      ___                           _ 
  219.         |                         | 
  220. g.   ---|-------------------------|-   
  221.        -|-------------------------|---
  222.        _|                         |___
  223.  
  224.  
  225. The  single-stranded  cDNA  can be converted into  a  double 
  226. stranded DNA using ribonuclease H and DNA  polymerase.   The 
  227. former  chews away the mRNA in the hybrid leaving short  RNA 
  228. pieces  which  can act as primers to start synthesis of  the 
  229. second  DNA strand (FIGURE 3d).   This process results in  a 
  230. double-stranded  cDNA  (FIGURE  3e).    Short,   chemically-
  231. synthesized oligonucleotides containing desired  restriction 
  232. enzyme  sites  can then be attached with DNA ligase  (FIGURE 
  233. 3f).   Subsequent  cutting with the appropriate  restriction 
  234. enzyme  then generates the single-stranded termini  or  ends 
  235. (FIGURE   3g)   described  last  time  which   can   mediate 
  236. recombination with the vector.  
  237.  
  238. There  are  many  variations  on  the  cDNA  cloning  scheme 
  239. outlined here.   All start,  however, with mRNA enriched for 
  240. the  particular  sequence of interest and take advantage  of 
  241. enzymatic  tools  for  converting the mRNA  into  a  double-
  242. stranded cDNA.
  243.  
  244. As with the cloning of a specific piece of genomic DNA,  the 
  245. identification  of the desired cDNA clone typically  depends 
  246. on hybridization with labeled oligonucleotides specific  for 
  247. the  desired  gene or screening of the cells transformed  by 
  248. the  hybrids  with  antibodies  specific  for  the   desired 
  249. protein.   Basically, if one can purify small amounts of the 
  250. desired   protein,   its  gene  can  be   cloned.    Protein 
  251. microsequencing  on  as  little as 10  - 100  micrograms  of 
  252. protein  can provide a partial amino acid sequence on which, 
  253. since  the  DNA  genetic  code  is   known,   gene-specific, 
  254. synthetic oligonucleotide probes can be based.  Alternately, 
  255. specific  antibodies  raised against similar  quantities  of 
  256. protein  can  be used to screen cDNA libraries if  they  are 
  257. constructed  so  as to produce the  encoded  protein.   
  258.  
  259.  
  260. VARIANT PROTEIN PRODUCTION
  261.  
  262. In  addition  to  permitting the  production  of  naturally-
  263. occurring proteins, the expression technology can be adapted 
  264. to   the  production  of  variants  of   naturally-occurring 
  265. proteins.  This can be useful for defining the relationships 
  266. between  protein  structure and function and  for  providing 
  267. novel  proprietary  compositions for  product  applications.  
  268. There  are  two  basic  approaches to  the  construction  of 
  269. variants:  site-specific mutagenesis and random mutagenesis.
  270.  
  271. Site-specific or site-directed mutagenesis is a very precise 
  272. means  of generating proteins with specific  alterations  in 
  273. their  structure.   One  needs  to have already  cloned  the 
  274. desired gene and to know its DNA sequence.   The cloned gene 
  275. is  then introduced into a bacterial virus system  known  as 
  276. M13.   This has the unique characteristic of yielding either 
  277. double-stranded  or single-stranded forms of the hybrid  DNA 
  278. molecule.   One  then  synthesizes  an  oligodeoxynucleotide 
  279. whose  internal  sequence  matches the new amino  acids  one 
  280. wishes  to  introduce into the protein.   The  ends  of  the 
  281. oligonucleotide  are  made such that they match the  already 
  282. known sequence of the gene. (Figure 4)
  283.  
  284.  
  285. FIGURE 4: ENZYMATIC CONSTRUCTION OF HETERODUPLEX 
  286.           
  287.           ENCODING BASE CHANGES
  288.  
  289.                  __________________________            
  290.                 |                          |                    
  291.                 |                          |                  
  292.                 |                          |     
  293.                 |                          | 
  294.                 |                          |   
  295.                 |            ___           |  
  296.                 |___________/   \__________| 
  297.                    _________     ________    
  298.                             \_x_/  
  299.                                
  300.                              ||
  301.                             \||/
  302.                              \/                               
  303.  
  304.                  __________________________            
  305.                 |                          |                    
  306.                 |                          |                  
  307.                 |                          |     
  308.                 |                          ||
  309.                 |                          ||  
  310.                 |            ___           || 
  311.                 |___________/   \__________||
  312.                    _________     ___________| 
  313.                             \_x_/  
  314.  
  315.                              ||
  316.                             \||/
  317.                              \/
  318.                
  319.                 ____________________________
  320.                | __________________________ |           
  321.                ||                          ||                    
  322.                ||                          ||                  
  323.                ||                          ||     
  324.                ||                          ||
  325.                ||                          ||  
  326.                ||            ___           || 
  327.                ||___________/   \__________||
  328.                |____________     ___________| 
  329.                             \_x_/  
  330.  
  331.  
  332.  
  333.  
  334. When  the  oligonucleotide is added to  the  single-stranded 
  335. hybrid,  it hybridizes by virtue of its complementary  ends.  
  336. DNA  polymerase,  using nucleotide triphosphates as building 
  337. blocks,  the  oligonucleotide   as  primer,  and  the  gene-
  338. containing  hybrid  as  template proceeds  to  complete  the 
  339. second  strand.   A heteroduplex circle results (FIGURE  4).  
  340.  
  341. The two circles are mismatched in the region where the first 
  342. strand  contains  the  old sequence and  the  second  strand 
  343. contains  the  new  sequence  representing  the  amino  acid 
  344. alterations one desires to make.   When the heteroduplex  is 
  345. introduced  into E.  coli one of the two strands is selected 
  346. for viral replication and production.   Approximately,  half 
  347. the  time the viral DNA obtained has the old sequence  fixed 
  348. in both strands;  the other half has the new sequences fixed 
  349. in both strands.  One can then re-introduce this altered DNA 
  350. into  the expression vector and obtain the  desired  protein 
  351. variant.   In  addition to amino acid replacements,  one can 
  352. similarly produce amino acid additions and deletions.   This 
  353. has  been  an  important program in our  studies  of  bovine 
  354. somatotropin.
  355.  
  356. It  is  obvious that one must have some idea of  what  amino 
  357. acids ought to be varied and what specific variations should 
  358. be made. 
  359.  
  360. If the gene is in hand and already sequenced,  if 
  361. synthetic  oligonucleotides  are  available,   and  if   the 
  362. expression  system  and protein purification scheme  are  in 
  363. place,  then  one  person can hope to generate a half  dozen 
  364. variant proteins in a three to six month  period.   However, 
  365. when  you consider that any one of twenty amino acids  could 
  366. be put into any one of a typical protein's one hundred amino 
  367. acid positions and that you could delete,  add, or rearrange 
  368. protein  segments  as  well,  it is clear  that  one  cannot 
  369. realistically  expect  to construct all possible  structural 
  370. variants.   Information  from  the  first  set  of  variants 
  371. constructed  in this way and knowledge of peptide  chemistry 
  372. are   critical   elements  in  advancing   a   site-specific 
  373. mutagenesis program in a productive fashion.
  374.  
  375. The   second  approach  to  variant   construction,   random 
  376. mutagenesis,  can  be a powerful adjunct.   This depends  on 
  377. generating  mutations  randomly  throughout the  gene  or  a 
  378. region  of  the  gene  enzymatically  or  chemically.    Its 
  379. advantage is that it can be applied to proteins for which we 
  380. have   little  structure:function  information.    What   is 
  381. critical in this approach is that a rapid,  functional assay 
  382. be available.
  383.  
  384.  When the randomly mutated gene is re-inserted 
  385. into  the expression vector and returned to the  host  cell, 
  386. each cell now produces a different variant protein.  With E. 
  387. coli  or  yeast cell systems,  one can reasonably plate  and 
  388. screen  thousands  of variant proteins on  a  nutrient  agar 
  389. plate.   With  mammalian  cells hundreds can potentially  be 
  390. screened.   The plates are subjected to the particular assay 
  391. and the rare variants identified on the plates.
  392.  
  393. CONCLUSION
  394.  
  395. The  technologies  to  produce  large  amounts  of  specific 
  396. proteins  and variants of those proteins represent  powerful 
  397. tools  for  the  synthesis  of  protein  products  and   the 
  398. identification of non-protein products.  A very fertile area 
  399. of  research  will be the combination of these  technologies 
  400. with   techniques   for   protein   crystallization,   X-ray 
  401. crystallography,  and  computer-assisted  protein  structure 
  402. analysis.  
  403.  
  404. ACKNOWLEDGEMENT
  405.  
  406. I  thank Gwen Krivi and Roger Wiegand for their advice,  and 
  407. Vicki Grant for her tireless assistance, and Clarence Styron 
  408. for  his  encouragement  and  editorial  assistance  in  the 
  409. completion of this article.
  410.  
  411.