home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / bit / listserv / statl / 2308 < prev    next >
Encoding:
Text File  |  1993-01-06  |  4.0 KB  |  111 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!GSF.DE!BENZ
  3. X-Mailer: ELM [version 2.3 PL11]
  4. Message-ID: <9301060926.AA24213@cony.gsf.de>
  5. Newsgroups: bit.listserv.stat-l
  6. Date:         Wed, 6 Jan 1993 10:25:04 MET
  7. Sender:       STATISTICAL CONSULTING <STAT-L@MCGILL1.BITNET>
  8. From:         Joachim Benz <benz@GSF.DE>
  9. Subject:      elimination of correlation (fwd)
  10. Lines: 99
  11.  
  12. For a colleague of me (Anja Oetmann, email: oetmann@gsf.de) I forward
  13. this request:
  14. >---------------------------------------------------------------------
  15. >   Our project aims to measure and to describe the present phenotypical
  16. >   variability of german indigenous populations of a wide-spread grass
  17. >   species (population in biological sense). We are interested in variation
  18. >   within and between populations as well as in the total variability of each
  19. >   character.
  20. >!   The object is to minimize the number of sites that covers the
  21. >!   over-all variance and further to preserve this variance through IN SITU
  22. >!   conservation.
  23. >   The problem is how to consider/eliminate the existing correlations
  24. >   between several characters before starting mathematical analyses.
  25. >
  26. >Data:
  27. >=====
  28. >
  29. >        * 100 sites, each divided in 3 subpopulations covering
  30. >          spaced heterogeneity of the sites
  31. >        * total plant number: 18 000
  32. >        * 13 variables for each plant were observed:
  33. >             5 measures:                            30 values/subpopulation
  34. >             1 measure:                             60 values/subpopulation
  35. >             7 estimations (in german: Bonituren):  60 scores/subpopulation
  36. >        * Data of 1 year and 1 experimental site (spaced plants)
  37. >
  38. >
  39. >STRATEGY TO SOLVE THE PROBLEM:
  40. >=============================
  41. >   1. Estimation of the univariate variability of one subpopulation
  42. >      We define the term variability of a specific variable as follows:
  43. >
  44. >         VB     = [ VBL      .... VBH     ]
  45. >           i,j,l       i,j,l         i,j,l
  46. >
  47. >         with:  VBL     = MEAN     -STDEV
  48. >                   i,j,l      i,j,l      i,j,l
  49. >                VBH     = MEAN     +STDEV
  50. >                   i,j,l      i,j,l      i,j,l
  51. >        (assumption: the distributions are symetric)
  52. >         i = index of variables [1, ..., 13]
  53. >         j = index of subpopulations [1,2,3]
  54. >         l = index of sites [1, ..., 100]
  55. >
  56. >   2. Estimation of the univariate variability at one site
  57. >
  58. >         VBS   = [ VBMIN   .... VBMAX   ]
  59. >            i,l         i,l          i,l
  60. >
  61. >         with:  VBMIN     = MIN(VBL     ,VBL     ,VBL     )
  62. >                     i,l           i,1,l    i,2,l    i,3,l
  63. >                VBMAX     = MAX(VBH     ,VBH     ,VBH     )
  64. >                     i,l           i,1,l    i,2,l    i,3,l
  65. >
  66. >   3. Estimation of the univariate variability over all sites
  67. >
  68. >         VBG  = [ VBGMIN .... VBGMAX ]
  69. >            i           i           i
  70. >
  71. >         with:  VBGMIN  = MIN(VBMIN     ,l=1,...,100)
  72. >                      i             i,l
  73. >                VBGMAX  = MAX(VBMAX     ,l=1,...,100)
  74. >                      i             i,l
  75. >
  76. >    4. Selection of sites
  77. >       Select a minimal number of sites, that the cover of the total
  78. >       variabilties in all variables by the selected sites becomes a
  79. >       maximum.
  80. >
  81. >But there is a serious problem we have no solution at the moment.
  82. >Between the variables the covariances are not 0. PCA we can't use as an
  83. >intermediate step to come to uncorrelated variables because the assumption
  84. >of one density function doesn't hold. On the other hand we assume if we
  85. >   ---
  86. >carry out the optimization with the original variables we will get a too
  87. >strong influence of highly correlated variables in the results.
  88. >
  89. >Any suggestions and discussion are appreciated.
  90. >
  91. >
  92. >Thanks in advance ....
  93. >
  94.  
  95. --
  96.  
  97. Sincerely,
  98.  
  99. Joachim Benz
  100.  
  101.    University of Kassel
  102.    Faculty of Agriculture (FB 20)
  103.    Nordbahnhofstr. 1a
  104.    D-3430 Witzenhausen
  105.    (FRG)
  106.  
  107.    Phone: (+49)-5542-503-560
  108.    Fax:   (+49)-5542-503-588
  109.    email: benz@gsf.de
  110.           C=de; A= ; P=gsf; S=benz (X.400)
  111.