home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / usenet / creating-newsgroups / justification < prev    next >
Encoding:
Internet Message Format  |  2004-04-20  |  6.4 KB

  1. Path: senator-bedfellow.mit.edu!dreaderd!not-for-mail
  2. Message-ID: <usenet/creating-newsgroups/justification_1082376800@rtfm.mit.edu>
  3. Supersedes: <usenet/creating-newsgroups/justification_1079688903@rtfm.mit.edu>
  4. Expires: 3 Jun 2004 12:13:20 GMT
  5. X-Last-Updated: 2001/10/31
  6. Organization: none
  7. From: rob@alt-config.org (Rob Maxwell)
  8. Newsgroups: alt.config,news.groups,alt.answers,news.answers
  9. Subject: [FAQ] Gathering Traffic Data for Proposed Newsgroups
  10. Followup-To: alt.config,news.groups
  11. Approved: news-answers-request@MIT.Edu
  12. Originator: faqserv@penguin-lust.MIT.EDU
  13. Date: 19 Apr 2004 12:15:19 GMT
  14. Lines: 116
  15. NNTP-Posting-Host: penguin-lust.mit.edu
  16. X-Trace: 1082376919 senator-bedfellow.mit.edu 565 18.181.0.29
  17. Xref: senator-bedfellow.mit.edu alt.config:425632 news.groups:479719 alt.answers:72577 news.answers:270269
  18.  
  19. Archive-name: usenet/creating-newsgroups/justification
  20. Last-modified: 10 June 2001
  21. Posting-Frequency: Monthly (on the 1st)
  22. URL: http://www.alt-config.org/justification.htm
  23. Maintainer: Rob Maxwell <rob@alt-config.org>
  24. Disclaimer: Approval for *.answers is based on form, not content.
  25.  
  26. Gathering Traffic Data for Proposed Newsgroups
  27. Or
  28. How to use Google Groups
  29.  
  30. The traditional expectation that a newsgroup justify its existence by virtue
  31. of existing Usenet traffic goes back to the earliest days. It precedes the
  32. birth of alt.*, the Great Renaming that bought forth the Big 7 (later the
  33. more familiar Big 8 with the creation of the humanities.* hierarchy in 1995),
  34. and even the rise and eventual fall of the backbone Cabal.
  35.  
  36. In the early 1980s, if discussion of a topic became significant enough, a new
  37. newsgroup was created to centralize the discussion. With only a relatively
  38. few corporate and university mainframes providing the Unix Users' Network
  39. (Usenet) to a similarly few readers it was fairly easy to see when a topic
  40. was worthy of receiving its own newsgroup. Today with over three Gigabytes of
  41. text-only discussion occurring on a daily basis coupled with the abuse of the
  42. alt.* newsgroup creation process leading to a significant number of alt.*
  43. newsgroups not being carried on any given news server it has become
  44. effectively impossible to see when a topic becomes popular enough to warrant
  45. a newsgroup of its own.
  46.  
  47. This is where Google Groups comes into the picture. It would start in 1995
  48. when Deja decided to begin archiving Usenet text postings until 2000 when the
  49. task became too overwhelming and expensive leading them to try different
  50. things but ultimately their efforts would be futile leading to their sale of
  51. their archive and name to the Internet search engine company Google. After a
  52. rough start, Google was finally able to bring together Deja's massive archive
  53. with their recent efforts at archiving Usenet under the name of Google Groups
  54. <http://groups.google.com/>.
  55.  
  56. Getting started
  57.  
  58. The journey to Justification begins at Google Groups' Advanced Group Search
  59. <http://groups.google.com/advanced_group_search>. What you will be looking
  60. for is how often the topic is discussed in English on Usenet. The customary
  61. method uses a search for the keyword or phrase being used over the last
  62. ninety-days. The recommended quantity of on-topic posts is ten (10) per day
  63. on average. For the sake of this demonstration we will be trying to justify
  64. the ABC television show "20/20".
  65.  
  66. Start by typing 20/20 into "Find Messages with all of the words", change the
  67. dropdown box from "10 messages" to "100 messages", Language Return messages
  68. written in "any language" to "English", and Message Dates () Return messages
  69. posted between 29 Mar 1995 to the date three months before today's date. A
  70. visual example is available at: <http://www.alt-config.org/20-20a.gif>
  71.  
  72. The results for this search for "20/20" on 27 May 2001 produced these
  73. results:
  74.  
  75. Relevant English Messages for 20/20 from 28 Feb 2001 to 27 May 2001 Results
  76. 1- 100 of about 12,400. <http://www.alt-config.org/20-20b.gif>
  77.  
  78. That averages out to 137.78 posts per day which clearly meets the 10 per day
  79. recommendation, or does it?
  80.  
  81. Refining the search results
  82.  
  83. Taking a closer look at the 20/20 example shows that the first on-topic
  84. mention of the show is the 14th search result. <http://www.alt-config.org/20-
  85. 20c.gif>
  86.  
  87. Although this is an extreme example which is badly contaminated by "%20"
  88. which is a way of representing a space in a URL when of course spaces are not
  89. allowed and is often in a search result URL which is seen in the third search
  90. result for 20/20.
  91.  
  92. Repeating the search for 20/20 and adding "abc" it is on produces radically
  93. different results:
  94. Relevant English Messages for 20/20 abc from 28 Feb 2001 to 27 May 2001
  95. Results 1-100 of about 374
  96.  
  97. Three hundred seventy-four averages out to a mere 04.16 posts per day coming
  98. to less than half of the desirable results. <http://www.alt-config.org/20-
  99. 20d.gif>
  100.  
  101. This is why your initial search results must be checked carefully before
  102. attempting to use them. First off, there is a known glitch in the software
  103. Google acquired from Deja which usually does a poor (sometimes comically
  104. poor) estimate of "about" how many results were found. A blatant example of
  105. this was a search for "infertility insurance":
  106.  
  107. Relevant English Messages for "infertility insurance" from 18 Feb 2001 to 18
  108. May 2001 Results 1 - 4 of about 6. <http://www.alt-config.org/20-20e.gif>
  109.  
  110. The quick way to see the actual totals or least enough to see if there is
  111. justification which of course would be 900 on-topic messages over 90 days is
  112. to scroll down to the bottom of the page (or press the [End] key) and double-
  113. click the 9 under Goooooooooogle which will take you to the 901st message if
  114. there is one. [Note: This is why "100 messages" is selected instead of the
  115. default "10 messages".] The glitch is meaningless if the top line is:
  116.  
  117. Relevant English Messages for "_______" from 28 Feb 2001 to 27 May 2001
  118. Results 901-1000 of about #,###.
  119.  
  120. Things to avoid
  121.  
  122. Most of the things that can falsely inflate results show up on the last
  123. pages. A weekly Frequently Asked Questions (FAQ) on the topic or containing a
  124. reference to same will produce 12-14 identical results with only one being
  125. valid. Far worse then this is when the subject ends up in someone's signature
  126. if they post a few messages per day they can create a few hundred false hits
  127. in the 90 day period. A sig hit requires a search in the same time frame for
  128. the author to determine the total number of hits the sig has caused and then
  129. finding out the number of actual posts made on the subject being searched.
  130.  
  131. ... END ...
  132.  
  133.  
  134.  
  135.