home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #23 / NN_1992_23.iso / spool / sci / math / stat / 2094 < prev    next >
Encoding:
Internet Message Format  |  1992-10-09  |  2.4 KB

  1. Path: sparky!uunet!portal!lll-winken!uwm.edu!wupost!darwin.sura.net!rsg1.er.usgs.gov!news.cs.indiana.edu!bsu-cs!news.nd.edu!mentor.cc.purdue.edu!pop.stat.purdue.edu!hrubin
  2. From: hrubin@pop.stat.purdue.edu (Herman Rubin)
  3. Newsgroups: sci.math.stat
  4. Subject: Re: approx. of binomial dist., help needed
  5. Message-ID: <Bvt8Kp.70r@mentor.cc.purdue.edu>
  6. Date: 8 Oct 92 16:02:49 GMT
  7. References: <1992Oct7.025857.28031@news2.cis.umn.edu>
  8. Sender: news@mentor.cc.purdue.edu (USENET News)
  9. Distribution: all
  10. Organization: Purdue University Statistics Department
  11. Lines: 41
  12.  
  13. In article <1992Oct7.025857.28031@news2.cis.umn.edu> lee@hecto.cs.umn.edu (YoungJun Lee) writes:
  14.  
  15. > The stat. book I have just says that
  16. >  "Binomial distribution with n trials and success probability p can be
  17. >   approximated by possion distribution(when n is large, p is very small, and
  18. >   np is of moderate magnitude" and normal distribution(when n is large and
  19. >   p is not too near 0 or 1)"
  20.  
  21. > What's large n ? 
  22. > What's "the very small p" or "not too near 0 or 1"?
  23. > What's np of moderate magnitude ?
  24.  
  25. > For instance, n = 1000 and p = 0.001, then is 1000 is large?,
  26. > is 0.001  is very small  or not too near 0 ?
  27. > is np (1000 * 0.001 = 1) of moderate magnitude?
  28. > Should I approximate this by possion dist or normal ?
  29.  
  30. > Would you please give me an idea when I should use possion/normal dist.
  31. > to approximate binomial distribution.
  32.  
  33. There are some simple theorems about the accuracy, but these are conservative
  34. for some purposes.  However, they are good guidelines.
  35.  
  36. The error in the Poisson approximation to the binomial is bounded by np^2,
  37. where this is the sum of the absolute errors to the probabilities.  This can
  38. be moderately improved for large variance.  In your example above, this would
  39. make the error bound .001, and the actual error is about .000552.
  40.  
  41. The error in the central limit theorem has two main terms; a multiple of
  42. the standardized third moment divided by the standard deviation, and a
  43. bounded expression divided by the variance.  These expansions and error
  44. bounds can be found in the standard works.  Since the variance is .999,
  45. this approximation will be quite poor.
  46.  
  47. There are formulas to compute the binomial cdf by continued fractions 
  48. from the probability of the endpoint.
  49. -- 
  50. Herman Rubin, Dept. of Statistics, Purdue Univ., West Lafayette IN47907-1399
  51. Phone: (317)494-6054
  52. hrubin@pop.stat.purdue.edu (Internet, bitnet)  
  53. {purdue,pur-ee}!pop.stat!hrubin(UUCP)
  54.