home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / bit / listserv / statl / 1947 < prev    next >
Encoding:
Internet Message Format  |  1992-11-11  |  1.5 KB

  1. Path: sparky!uunet!stanford.edu!bcm!convex!darwin.sura.net!jvnc.net!gmd.de!Germany.EU.net!mcsun!news.funet.fi!hydra!klaava!tarkkone
  2. From: tarkkone@klaava.Helsinki.FI (Lauri Tarkkonen)
  3. Newsgroups: bit.listserv.stat-l
  4. Subject: Re: Outliers
  5. Keywords: Parameter estimation, outliers
  6. Message-ID: <1992Nov11.222750.5428@klaava.Helsinki.FI>
  7. Date: 11 Nov 92 22:27:50 GMT
  8. References: <Nov.11.16.46.06.1992.15885@gandalf.rutgers.edu>
  9. Organization: University of Helsinki
  10. Lines: 25
  11.  
  12. In <Nov.11.16.46.06.1992.15885@gandalf.rutgers.edu> kluger@gandalf.rutgers.edu (Dr. Avi Kluger) writes:
  13.  
  14. >I was wondering if any of the readers know of material regarding
  15. >the actual (as opposed to hypothetical) impact of outliers on
  16. >estimation of correlations.  There is one article by Orr et al
  17. >in Personnel Psychology 1991 vol 44 no 3 which reports that various
  18. >outlier deletion methods had only a small impact on average rho
  19. >estimation and various effects on the variance of the estimates.
  20. >Do you know of any other recent emprical treatment of the question?
  21.  
  22. >Avi Kluger
  23. >Institute of Management and Labor Relations
  24. >Rutgers University
  25. >(908) 932 5823
  26.  
  27. Have you heard about influence curves. This means you study the change
  28. in correlation if a boservatin is removed from the data:
  29.  
  30. Say  z(x,y) = r(x,y) - r
  31. r = correlation for the whole data, r(x,y) is the correlation of the
  32. data minus that observation. The function r(x,y) can be written by
  33. means of n, x, y, r, mx, yx, sx, sy. (m for mean and s for standard 
  34. deviation.).
  35.  
  36. - Lauri Tarkkonen
  37.