home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / news / spam-faq < prev   
Internet Message Format  |  2004-05-16  |  9KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!newsfeed.stanford.edu!news.killfile.org!not-for-mail
  2. From: tskirvin@killfile.org (Tim Skirvin)
  3. Newsgroups: news.admin.net-abuse.bulletins,news.admin.net-abuse.usenet,news.admin.net-abuse.sightings,news.admin.net-abuse.misc,news.answers
  4. Subject: FAQ: Current Usenet spam thresholds and guidelines
  5. Supersedes: <spam-faq.20040509050002$29fd@news.killfile.org>
  6. Followup-To: news.admin.net-abuse.usenet
  7. Date: Sun, 16 May 2004 00:00:01 -0500
  8. Organization: Killfiles, Unlimited
  9. Lines: 162
  10. Approved: news-answers-request@MIT.EDU, nanas-req@ravenna.com
  11. Expires: Sun, 27 Jun 2004 05:00:01 GMT
  12. Message-ID: <spam-faq.20040516050001$1d4d@news.killfile.org>
  13. Reply-To: tskirvin@killfile.org
  14. X-Trace: victor.killfile.org 1084683602 31176 216.43.25.138 (16 May 2004 05:00:02 GMT)
  15. X-Complaints-To: usenet@killfile.org
  16. Summary: This posting contains the current Spam definitions, thresholds, 
  17.      and guidelines, as used by most major spam cancellers and news
  18.      administrators.
  19. X-Auth: PGPMoose V1.1 PGP news.admin.net-abuse.sightings
  20.     iD8DBQFApvVSv1i8LqUfqQURAqblAJ4jsjTTEsgwoavXUJJfVnPW4UKEKwCfaXTH
  21.     97SZIboKgwmWZJFE/l41HX4=
  22.     =hSA0
  23. Xref: senator-bedfellow.mit.edu news.admin.net-abuse.bulletins:34814 news.admin.net-abuse.usenet:610158 news.admin.net-abuse.sightings:1410058 news.admin.net-abuse.misc:222761 news.answers:271300
  24.  
  25. Archive-name: usenet/spam-faq
  26. Posting-Frequency: weekly
  27. Last-modified: 1998/11/10
  28. URL: http://www.killfile.org/faqs/spam.html
  29. Maintainer: tskirvin@killfile.org (Tim Skirvin)
  30. Original-Author: clewis@ferret.ocunix.on.ca (Chris Lewis)
  31.  
  32.         Current Spam thresholds and guidelines.
  33.  
  34. This article is intended to describe the current consensus spam thresholds 
  35. and ensure that the definitions of these terms are available and consistent.  
  36. It is believed that most, if not all, spam cancellers use these terms and 
  37. definitions in their work; however, many other people use the terms 
  38. inappropriately, which leads to confusion in discussions.  This is an
  39. informal FAQ aimed at clarity and understanding, not anal-retentive
  40. correctness.
  41.  
  42. Excessive Multi-Posting (EMP) has the same meaning as the term "spam" 
  43. usually carries, but it is more accurate and self-explanatory.  EMP means, 
  44. essentially, "too many separate copies of a substantively identical 
  45. article."
  46.  
  47. "Substantively identical" means that the material in each article is 
  48. sufficiently similar to construe the same message.  The signature is 
  49. included in the determination.  These are examples of substantively
  50. identical articles:
  51.  
  52.      - byte-for-byte identical messages
  53.      - otherwise identical postings minimally customized for 
  54.       each group it appears in.
  55.      - advertising the same service.
  56.      - articles that consist solely of the same signature
  57.      - articles which consist of inclusions of other user's 
  58.       postings, but are otherwise identical.
  59.  
  60. Cross-posting means that a single message appears in more than one group.  
  61. Most newsreaders allow you to specify more than one group in a posting.
  62.  
  63. Excessive Crossposting (ECP) refers to where a "lot" of postings to more 
  64. than one group each have been made.
  65.  
  66. Some people think cross-posting is "bad".  In and of itself, it's good 
  67. behaviour - it allows you to reach more groups with less impact on the net.  
  68. Especially if you set the Followup-to: header to one group.  It is "bad" 
  69. when it's done to attack newsgroups or provoke flamewars (like cross-posting 
  70. how to cook a cat between alt.tasteless and rec.pet.cats), but this is beyond 
  71. the scope of this FAQ.
  72.  
  73. This author considers the term "spam" to mean excessive postings of
  74. EMP and/or ECP variety.  That is, "spam", is a generic term for several
  75. different things.  The term was originally supposed to mean EMPs only, but 
  76. most people use "spam" to mean "any excessive posting".
  77.  
  78. A spam, EMP, or ECP therefore refers to a posting that has been posted to
  79. many places.  There is a consensus that there is a point at which it is 
  80. abuse, and is subject to advisory cancellation.
  81.  
  82. A formula has been invented by Seth Breidbart which attempts to
  83. quantify the degree of "badness" of a spam (whether EMP or ECP) as a
  84. single number.  The Breidbart Index (BI) is defined as the sum of the
  85. square roots of n (n is the number of newsgroups each copy was posted
  86. to).
  87.  
  88. Example: If two copies of a posting are made, one to 9 groups, and one
  89. to 16, the BI index is sqrt(9)+sqrt(16) = 3+4 = 7.
  90.  
  91. The BI2 (Breidbart Index, version 2) is an experimental metric, which
  92. may eventually replace the BI.  It is calculated by computing the sum
  93. of the square roots of n, plus the sum of n, and dividing by two.  Eg:
  94. one posting to 9, and one to 16 is
  95.  
  96.     (sqrt(9) + sqrt(16) + 9 + 16) / 2
  97.     ( 3 + 4 + 9 + 16 ) / 2 = 32 / 2 = 16
  98.  
  99. The BI2 is more "aggressive" than the BI, intended to cut off the "higher
  100. end".  BI allows about 125 newsgroups maximum.  BI2 allows a maximum of 35.
  101.  
  102. A slightly less aggressive index is the SBI (Skirvin-Breidbart Index); it 
  103. is calculated much the same as the BI2, but sums the number of groups in 
  104. the Followup-to: header (if available), rather than the newsgroups.  Eg: 
  105. one posting to 9 groups, and one to 16 with followups set to 4 is
  106.  
  107.     (sqrt(9) + sqrt(16) + 9 + 4) / 2
  108.     ( 3 + 4 + 9 + 4 ) / 2 = 20 / 2 = 10
  109.  
  110. Except in nl.*, where the SBI is followed, the BI2 and SBI are not used to 
  111. determine whether a spam is cancellable.
  112.  
  113. The thresholds for spam cancels are based _only_ on one or more of the 
  114. following measures:
  115.  
  116.         1) The BI is 20 or greater over a 45 day period.
  117.     2) is a continuation of a previous EMP/ECP, within a 45 day
  118.        sliding window.  That is: if the articles posted within the
  119.        past 45 days exceeds a BI threshold of 20, it gets removed,
  120.        unless the originator has made a clear and obvious effort to
  121.        cease spamming (which includes an undertaking to do so
  122.        posted in news.admin.net-abuse.usenet).  This includes "make
  123.        money fast" schemes which passed the EMP/ECP thresholds
  124.        several years ago.  This author recommends one posting
  125.        cross-posted to no more than 10 groups, no more often than
  126.        once every two weeks (a BI of 3).
  127.  
  128. A single posting cannot be cancellable - to reach a BI of 20, it would
  129. have to be cross-posted to 400 groups.  This isn't possible due to
  130. limitations in Usenet software.
  131.  
  132. These thresholds nominally apply to all hierarchies - not just the Big-8
  133. and alt.*.  Many hierarchies have more restrictive rules, which are decided 
  134. upon and enforced by their users and administrators; they may also opt out
  135. of the cancellations, at the discretion of the same users and admins.
  136.  
  137. These cancels have nothing whatsoever to do with the contents of the
  138. message.  It doesn't matter if it's an advertisement, it doesn't matter if 
  139. it's abusive, it doesn't matter whether it's on-topic in the groups it was 
  140. posted in, it doesn't matter whether the posting is for a "good cause" or 
  141. not - spam is cancelled regardless, based on _how many times_ it was said
  142. and not _what_ was said.
  143.  
  144. Administrators wishing to ignore spam cancels can "alias out" the site 
  145. "cyberspam", and the cancels will not affect your system.  This is normally 
  146. done at your feed site, but patches are available for INN to allow you to 
  147. reject spam cancels on your own system.   Ask in news.admin.net-abuse.usenet 
  148. if you need this patch.
  149.  
  150. Further literature on posting etiquette and related information:
  151.  
  152. The newsgroup news.announce.newusers
  153. <URL:news:news.announce.newusers>
  154.     
  155. "What is Usenet", by Salzenberg, Spafford and Moraes
  156. <URL:ftp://ftp.faqs.org/faqs/usenet/what-is/part1>
  157.  
  158. "What is Usenet?  A second opinion.", by Vielmetti
  159. <URL:ftp://ftp.faqs.org/faqs/usenet/what-is/part2>
  160.  
  161. "FAQ: Advertising on Usenet: How To Do It, How Not To Do It", by Furr
  162. <URL:ftp://ftp.faqs.org/faqs/usenet/advertising/how-to/part1>
  163.  
  164. "A Primer on How to Work With the Usenet Community", by Von Rospach, et al
  165. <URL:ftp://ftp.faqs.org/faqs/usenet/primer/part1>
  166.  
  167. "Rules for posting to Usenet", by Horton, Spafford & Moraes.
  168. <URL:ftp://ftp.faqs.org/faqs/usenet/posting-rules/part1>
  169.  
  170. "Emily Postnews Answers Your Questions on Netiquette", by Templeton et al
  171. <URL:ftp://ftp.faqs.org/faqs/usenet/emily-postnews/part1>
  172.  
  173. Numerous books and publications on Usenet, such as O'Reilly's "Stopping
  174. Spam" (Schwartz and Garfinkel), the "Whole Internet Guide and Catalog" 
  175. (Krol), "Usenet Handbook" (Harrison), etc.
  176.  
  177. "Cancel Messages: Frequently Asked Questions", by Skirvin
  178. <URL:http://www.killfile.org/faqs/cancel.html>
  179.  
  180. The above FAQs are also mirrored at various sites, including as ftp.sunet.se,
  181. mirror.aol.com, ftp.uu.net, ftp.uni-paderborn.de, nctuccca.edu.tw,
  182. hwarang.postech.ac.kr, ftp.hk.super.net etc.
  183.  
  184. A mailing list has been set up to assist those wishing to post commercial
  185. advertisements on Usenet in a responsible fashion.  Email your questions to
  186. commerce@acpub.duke.edu.
  187.