home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #23 / NN_1992_23.iso / spool / sci / math / stat / 2103 < prev    next >
Encoding:
Internet Message Format  |  1992-10-10  |  4.2 KB

  1. Path: sparky!uunet!zaphod.mps.ohio-state.edu!wupost!waikato.ac.nz!maj
  2. From: maj@waikato.ac.nz
  3. Newsgroups: sci.math.stat
  4. Subject: Re: robust location estimators
  5. Message-ID: <1992Oct11.121834.11351@waikato.ac.nz>
  6. Date: 11 Oct 92 12:18:34 +1300
  7. References: <19s96oINNdd9@agate.berkeley.edu> <44800@ucbvax.BERKELEY.EDU> <BvGFAu.GEv@mentor.cc.purdue.edu> <1992Oct2.084819.11178@waikato.ac.nz>
  8. Organization: University of Waikato, Hamilton, New Zealand
  9. Lines: 99
  10.  
  11. In article <1992Oct2.084819.11178@waikato.ac.nz>, maj@waikato.ac.nz writes:
  12. > In article <BvGFAu.GEv@mentor.cc.purdue.edu>, hrubin@pop.stat.purdue.edu (Herman Rubin) writes:
  13. >> 
  14. > [stuff and quotes deleted]
  15. >> Robustness cannot be defined in a formal manner to be a precise concept.
  16. >> The definition I like is
  17. >> 
  18. >>     The robustness of a procedure is the extent to which its 
  19. >>     properties do not depend on those assumptions which one
  20. >>     does not wish to make.
  21. >> -- 
  22. >> Herman Rubin, Dept. of Statistics, Purdue Univ., West Lafayette IN47907-1399
  23. >> Phone: (317)494-6054
  24. >> hrubin@pop.stat.purdue.edu (Internet, bitnet)  
  25. >> {purdue,pur-ee}!pop.stat!hrubin(UUCP)
  26. > This is a good definition of what one wants, but I dispute that
  27. > robustness cannot be given a formal definition. I'll try:
  28. >    A statistical functional is robust iff it is continuous.
  29. > Continuous in what topology?   you may ask. *That* I wont answer,
  30. > that's were the vagueness of the concept comes in.
  31.  
  32.  
  33. An email correspondence with Peter Hamer leads me to think that I was perhaps a
  34. little on the terse side in my earlier posting, he writes:
  35.       
  36.       >       Take the distance between two cdfs F and G to
  37.       >       be given by, say, the sup norm.
  38.       >
  39.       >       It is easy to see that within any epsilon of
  40.       >       F there are distributions with arbitrarily
  41.       >       different mean.
  42.  
  43.       I don't know how you intended this to be interpreted. I seems
  44.       very much like saying that applied statistics is impossible;
  45.       as no real data is *known* to come from a precisely specified
  46.       distribution.
  47.  
  48.       All applied statistical procedures must be applicable to distributions
  49.       `close to' the one nominally assumed, and you seem to be saying that
  50.       this is impossible.
  51.  
  52.  
  53.       Regards, Peter (pgh@bnr.co.uk)
  54.  
  55.  
  56.  
  57. [My reply may be of interest to other readers of this group.]
  58.  
  59. Rather than try to persuade you about the correctness of my
  60. remarks I have looked up a few references. Have a look at
  61.  
  62. Staudte & Sheather 'Robust Estimation and Testing' Wiley 1990
  63. Section 3.2.4 pp65-67
  64.  
  65. Hampel, F.R. 'A General Qualitative definition of Robustness'
  66. Ann Math Stat v42, 1887-1896, (1971)
  67. [esp. Theorem 1, p1891]
  68.  
  69. Huber, P.J. 'Robust Statistical Procedures'(1977)  #27 in
  70. CBMS-NSF series.
  71. [esp. Chapter 2 and first part of Ch 3. I prefer this to
  72. the more elaborate treatment in his 1981 book.]
  73.  
  74. Huber and Hampel work in the full generality with statistics
  75. understood as sequences of functionals. However the main
  76. points are unchanged and more easily understood by considering
  77. only functionals.
  78.  
  79. Example: the divisor n-1 standard deviation can be represented
  80.          as a sequence of functionals, one for each sample
  81.                   size.
  82.                   The divisor n standard deviation can be represented
  83.                   as a single functional with no need to involve
  84.                   sample size.
  85.                   
  86. The discontinuity of the sample mean as a function from a
  87. space of cdfs to the reals poses no real problem to
  88. *applied* statistics because in practice we do not really use
  89. the mean by itself: we actually employ data inspection 
  90. followed by transformations and/or outlier deletion. In reality
  91. the robust perspective is more of a threat to traditional
  92. *mathematical* statistics with its highly developed theory
  93. about the behaviour of relatively simple statistics at
  94. precisely specified models, something that does not really
  95. model modern applied statistical practice in the least.            
  96.  
  97.        
  98.  
  99. -- 
  100. Murray A. Jorgensen [ maj@waikato.ac.nz ]    University of Waikato
  101. Department of Mathematics and Statistics     Hamilton, New Zealand      
  102. __________________________________________________________________
  103. 'Tis the song of the Jubjub! the proof is complete,
  104. if only I've stated it thrice.'
  105.