home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / internet / info-research-faq / part2 < prev    next >
Encoding:
Internet Message Format  |  2004-04-18  |  67.2 KB

  1. Path: senator-bedfellow.mit.edu!dreaderd!not-for-mail
  2. Message-ID: <internet/info-research-faq/part2_1082200966@rtfm.mit.edu>
  3. Supersedes: <internet/info-research-faq/part2_1079601013@rtfm.mit.edu>
  4. Expires: 31 May 2004 11:22:46 GMT
  5. References: <internet/info-research-faq/part1_1082200966@rtfm.mit.edu>
  6. X-Last-Updated: 2002/04/17
  7. Organization: none
  8. From: david@spireproject.com (David Novak)
  9. Newsgroups: alt.internet.research,sci.research,alt.answers,sci.answers,news.answers
  10. Subject: Information Research FAQ v.4.7 (Part 2/6)
  11. Followup-To: poster
  12. Approved: news-answers-request@mit.edu
  13. Summary: Information Research FAQ: Resources, Tools & Training
  14. Originator: faqserv@penguin-lust.MIT.EDU
  15. Date: 17 Apr 2004 11:28:22 GMT
  16. Lines: 1293
  17. NNTP-Posting-Host: penguin-lust.mit.edu
  18. X-Trace: 1082201302 senator-bedfellow.mit.edu 576 18.181.0.29
  19. Xref: senator-bedfellow.mit.edu sci.research:24079 alt.answers:72508 sci.answers:15953
  20.  
  21. Archive-name: internet/info-research-faq/part2
  22. Posting-Frequency: monthly
  23. Last-modified: April 2002
  24. URL: http://spireproject.com
  25. Copyright: (c) 2001 David Novak
  26. Maintainer: David Novak <david@spireproject.com>
  27.  
  28.                   Information Research FAQ     (Part 2/6)
  29.  
  30.             100 pages of search techniques, tactics and theory
  31.           by David Novak of the Spire Project (SpireProject.com)
  32.  
  33.  
  34.     Welcome. This FAQ addresses information literacy; the skills, tools and
  35.     theory of information research. Particular attention is paid to the
  36.     role of the internet as both a reservoir and gateway to information
  37.     resources.
  38.  
  39.     The FAQ is written like a book, with a narrative and pictures. You have
  40.     found your way to part two, so do backtrack to the beginning. If you
  41.     are lost, this FAQ always resides as text at
  42.     http://spireproject.com/faq.txt and with pictures at
  43.     http://spireproject.com/faq.htm
  44.  
  45.     This FAQ is an element of the Spire Project http://spireproject.com,
  46.     the primary free reference for information research and an important
  47.     resource for search assistance.
  48.  
  49.     ***    The Spire Project also includes a 3 hour public seminar titled
  50.     ***    Exceptional Internet Research. This is a fast paced seminar
  51.     ***    supported with a great deal of webbing, reaching to skills and
  52.     ***    research concepts beyond the ground covered on our website and
  53.     ***    this FAQ. http://spireproject.com/seminar.htm has a synopsis.
  54.     ***    I am in Europe, seminaring in Ireland and Europe though I
  55.     ***    will be returning to the US shortly, and South Australia for
  56.     ***    a seminar this October.
  57.  
  58.     Enjoy,
  59.     David Novak - david@spireproject.com
  60.     The Spire Project : SpireProject.com and SpireProject.co.uk
  61.  
  62.     NOTE FOR RETURN READERS: previously, we prepared this section by
  63.     converting work originally prepared in html. This became unproductive
  64.     so we have limited the internet links in this FAQ and direct you to the
  65.     more lengthy articles prepared in html. All the required links and
  66.     search tool forms reside in other parts of the Spire Project, like the
  67.     websites and free shareware
  68.     (http://spireproject.com/spire_latest_version.zip).
  69.  
  70.  
  71.  
  72.                         Searching Specific Formats.
  73.                                  Section 4
  74.     On the second year of his training, Shakh began to piece together the
  75.     many rules and guidelines to understanding hieroglyphs. He had thought
  76.     the lessons would end once he learned the glyphs but no, there were
  77.     long and convoluted rules governing the translation of sounds into
  78.     glyphs. Simple rules govern the placement of glyphs on the wall -
  79.     certain glyphs lose their meaning when placed apart.
  80.  
  81.     Then, there was the art of writing. The glyphs had to be the right size
  82.     and shape. If you were about to finish the line, you could squish
  83.     certain glyphs just a little to make room for the next glyph. If you
  84.     did not plan well, you would leave the line hanging, a word unfinished,
  85.     a sentence incomplete.
  86.  
  87.     Then Shakh started to learn hieratic - shorthand glyphs for less formal
  88.     situations.
  89.  
  90.     It was all very complicated and cumbersome. Shakh did not like the
  91.     technical nature of writing. So much to learn and still so far from
  92.     writing clear, interesting results. His seasons in training went very
  93.     slowly. The Nile rose then fell then rose again.
  94.  
  95.                         - - - - - - - - - - - - - -
  96.  
  97.     A great deal of dull information must be comprehended, absorbed,
  98.     internalized. Nothing spectacular. Nothing of particular interest. Just
  99.     a mass of rules and guidelines to help you move within the world of
  100.     information.
  101.  
  102.     On the third year of medical school the aspiring doctor begins to
  103.     memorize a vast linked-array of drugs, symptoms and afflictions. The
  104.     next three years are spent developing this mental array; refining,
  105.     building, adding experience, so that one day a doctor may look at a
  106.     symptom, think of possible afflictions or drug reactions, then
  107.     proscribe drugs or call for further tests. The whole process of
  108.     learning this array is intensely dull.
  109.  
  110.     In the first part of this FAQ we explained in detail how an information
  111.     search involves first selecting a suitable format (book, webpage, news,
  112.     interview ...) then searching a few important tools that help us find
  113.     information in that format. The first format we will look at is the
  114.     humble book.
  115.  
  116.  
  117.                                    Books
  118.            Links and forms at http://spireproject.com/books.htm
  119.     Shakh arrived in Edfu on a small boat in the company of his father. It
  120.     was a short walk from the dock to the Edfu temple complex. A fantastic
  121.     sight. A noble sight. The temple included a vast library of books and
  122.     manuscripts - a warehouse of knowledge about Egypt.
  123.  
  124.     Not that there were many manuscripts in total. The time and expense it
  125.     took to create even a single copy made the library a prohibitive
  126.     expense open to only those in certain need. This was not a public
  127.     library, but an elitist library, open only to those who could justify
  128.     the gifts required to enter. There it was, open before them, long
  129.     shelves of scrolls arranged by rough topic. Amazing indeed. Shakh
  130.     shivered slightly in the cool air. This would be his life for the next
  131.     few years.
  132.  
  133.                         - - - - - - - - - - - - - -
  134.  
  135.     Books have such meaning to us as a society. We have a vibrant emotional
  136.     connection. Books exude a solid proof of value to a larger community.
  137.     They are important resources but the additional awe is amazing to
  138.     behold. Try ripping a chapter from a book you own in public. The stares
  139.     and discomfort is almost tangible. Some book-lovers get upset about
  140.     slight creases in books, treating books as if they were important
  141.     museum quality manuscripts - something to hold with awe and treat
  142.     gently.
  143.  
  144.     Being a book writer is similarly impressive. It is a mark of an expert.
  145.     A knowledgeable expert. A knowledgeable expert we should listen too,
  146.     should pay money for the chance to listen to, should pay, listen and
  147.     carefully not crease their work.
  148.  
  149.     This attitude is silly.
  150.  
  151.     A book is a package of information, prepared along certain guidelines,
  152.     with a purpose. In research we look for books on a topic that may help
  153.     us answer a question. These books tend to be large, lengthy, detailed,
  154.     verbose, heavy. Books are not good at describing cutting edge
  155.     developments. They generally summarize popular consensus. They avoid
  156.     criticism. When searching, they can make horrible resources.
  157.  
  158.     Books are also large and physical creations. They must be stored. They
  159.     stick around. They have a limited shelf life but libraries are forever
  160.     over-stocked with dated publications of limited use and value. They are
  161.     also long - troublesome things to read.
  162.  
  163.     Books come in different flavors. There are the books by industry
  164.     insiders who tell the truth, rip the facade about a particular
  165.     industry. Such books make brilliant resources. There are also books by
  166.     journalists, prepared without insider knowledge, more of a novel of a
  167.     newsworthy situation. Such books tend to the verbose, circumstantial,
  168.     light on facts.
  169.  
  170.     Certain questions simply beg to be answered by reading a book. Such
  171.     questions are usually general, introductory, timeless. For such
  172.     questions a stack of news articles would lack cohesion. A collection of
  173.     articles would be too precise, not give you the larger picture. Such
  174.     questions need the 100 pages of description, pictures and the
  175.     considered framework that books embody.
  176.  
  177.     Finding a Book
  178.     As an information format, there are certain tools and resources you
  179.     need to be aware of to effectively search for books. Thankfully, many
  180.     of these tools have emerged on the internet. These include:
  181.  
  182.     - A database of the free books on the internet from projects like the
  183.     Online Book Initiative and Project Gutenberg. Includes many
  184.     copyright-free classics (but not ebooks - a different concept).
  185.     - Three government publication databases for the US, UK and Australia.
  186.     The US and Australian databases are comprehensive. The UK database is
  187.     incomplete. The complete database is commercially available
  188.     - The book databases of large online bookstores is incomplete but
  189.     useful as a fast search of current books. Some include background
  190.     information. I use Barnes & Noble, Amazon, Borders and the UK Internet
  191.     Bookshop (of the WHSmith bookstore chain).
  192.     - The largest libraries of the world, like the US Library of Congress
  193.     and British Library hold more than 20 million publications stretching
  194.     back many years. The online book catalogues are not good for the latest
  195.     books, but are brilliant at earlier works.
  196.     - Local libraries and state libraries are noteworthy as finding a book
  197.     in their database also means you have found access to these books.
  198.     - The definitive resource is the collection of national Books-in-Print
  199.     databases like [US] Books in Print, Australian Books in Print, French
  200.     Books in Print... These databases are commercially available online, as
  201.     print directories (yuck) in libraries and often from publicly available
  202.     to search from good bookstores
  203.  
  204.     Book Databases
  205.     Information about new books is organized in a collection of national
  206.     "Books in Print" databases. This information is publisher-verified,
  207.     includes forthcoming titles, and is naturally updated far faster than
  208.     the library and bookstore catalogues.
  209.  
  210.     Books in Print, produced by Bowker, delivers publisher-verified
  211.     information on US books. British Books in Print is produced by Whitaker
  212.     & Sons, delivers publisher-verified information on UK books. Further
  213.     national book indexes include Australian Books in Print (Thorpe),
  214.     Canadian Books in Print (University of Toronto Press), Les Livres
  215.     Disponibles/French Books in Print (Electre), Italian Books in Print,
  216.     German Books in Print and others.
  217.  
  218.     All these directories are available as print directories (not
  219.     particularly convenient), as a commercial database (through database
  220.     retailers), for subscription (bookstores frequently subscribe) or
  221.     through Global Books in Print (through not really global, is a group of
  222.     book databases).
  223.  
  224.     With regards to the print versions, there may be recent editions in
  225.     your state library but don't bother. The directory is not user-friendly
  226.     as you must page through each month's subject categories. A more
  227.     convenient alternative access point is your favorite large bookstore.
  228.     For about Au$4500/year, many bookstores subscribe to Global Books in
  229.     Print on CD-ROMs, or a national 'books in print' database. There should
  230.     be no cost for searching, but ask for the date and the database name so
  231.     you have a clearer idea of what is being searched.
  232.  
  233.     Further Book Resources
  234.     Book Reviews are a viable tool in a book search. The tools mentioned
  235.     above will give you very little information indeed - mainly title,
  236.     author, format and price. You will usually want more than this before
  237.     you buy a book.
  238.  
  239.     Book reviews are published in a range of book-related journals and
  240.     newspapers. These are compiled into a commercial database of Book
  241.     Reviews, like the Book Review Digest by H.W.Wilson or Book Review Index
  242.     by Gale Research, or individual book reviews from the like of the New
  243.     York Review of Books (http://www.nybooks.com/nyrev/). A state library
  244.     may provide access to the Book Review Digest Database.
  245.  
  246.     Online book reviews are further discussed in Locating Book Reviews
  247.     (http://www.lib.monash.edu.au/hss/guides/fsreview.htm) by Monash
  248.     University Library.
  249.  
  250.     Barnes & Noble, and to a lesser degree Amazon, have additional
  251.     information in their book database. Since it is free, it makes for a
  252.     fine immediate alternative to searching book reviews.
  253.  
  254.     Future developments in book-related discussion groups holds out more
  255.     promise in harnessing the opinions of a book-reading public. Quality
  256.     issues remain (and the anonymous musings listed in Amazon.com and
  257.     Barnes & Noble
  258.  
  259.     There are also book finding services with specialty book databases -
  260.     like a database of second-hand books. Books on Demand is a directory of
  261.     out-of print books available for reprinting (and includes price and
  262.     order information.)
  263.  
  264.     Strategy
  265.     Obviously title searches are not effective tools to discover new books.
  266.     Not all books on Vincent Van Gogh include Vincent in the title. Subject
  267.     searches, work well only if you can grasp the indexing.
  268.  
  269.     Apply these effective search techniques:
  270.     1) Browse the subject listing and select the subjects which interest
  271.     you.
  272.     2) Read the subject listings off a book you know interests you - then
  273.     search for other books in those subjects.
  274.     3) Search for other publications from suggestive authors (especially
  275.     when the author is an association).
  276.  
  277.     Library catalogues, like LOCIS can illustrate these techniques. Let's
  278.     say a title or subject search lands you with one of the books listed in
  279.     LOCIS. This catalogue lists the applicable subject titles. Looking at
  280.     books placed in the same subject category works well.
  281.  
  282.     A word about Book Types. Just as internet information comes in
  283.     different qualities and formats, books also come in different styles
  284.     and flavours. Books written by industry insiders are characterized by
  285.     personal stories and expert wisdom from an author telling all the
  286.     secrets. These books are worth looking for, and the short bio may give
  287.     a clue. Books written by Journalists have a different flavour, slightly
  288.     more newsy with less factual than, let say, Government books (far more
  289.     factual than most), and frequently updated books (far more current than
  290.     most). Try to find the style of book suited to your needs.
  291.  
  292.     Information Theory
  293.     The book industry has reached a kind of plateau where fairly definitive
  294.     databases exist for listing books. There are databases for government
  295.     books, out-of-print books, second-hand books, current books. The
  296.     internet has changed some elements of this mix, as business models try
  297.     to support moving existing databases to free access, and others use
  298.     this change to try to present more definitive databases. Book reviews
  299.     have never properly been used by the book industry, so the big change
  300.     appears to be a move from book titles (as in most book databases and
  301.     library catalogues) to rich information (like Barnes & Noble) which
  302.     includes reviews and readers comments.
  303.     ___________________________________________________
  304.  
  305.  
  306.                                 The Article
  307.            links and more at http://spireproject.com/article.htm
  308.  
  309.     Articles hold a definitive value, a statement of quality and currency.
  310.     Sometimes articles are long, unique and informative works. Sometimes
  311.     articles are short, simple, trite; a rehash of common knowledge. There
  312.     is a range of ways to access articles - though none are particularly
  313.     inexpensive. We also have difficulties paying copyright - so most paid
  314.     research assistance is restricted to certain, more expensive tools. In
  315.     all, articles are cumbersome, cumbersome and time-consuming to work
  316.     with. They can also be brilliantly rewarding.
  317.  
  318.     There are three difficulties with article searches:
  319.     1_ Finding the articles which interest us.
  320.     2_ Getting our hands on a copy. (Many articles you locate may be
  321.     impractical to access in person while electronic access can be
  322.     expensive.)
  323.     3_ Copyright permission, (which can be potentially simple or
  324.     exceedingly expensive).
  325.  
  326.     Of course, the main stay of article research is photocopying an article
  327.     directly from a journal. Find a library nearby which holds the journal
  328.     then read or photocopy it then and there. This process can be improved
  329.     by using the online library catalogues (to see if they hold the
  330.     journal) and by searching a database of library holdings (often
  331.     available for free by asking or calling a librarian at your state
  332.     library). As you could expect, some commercial businesses will
  333.     undertake this work on your behalf, for a fee.
  334.  
  335.     The difficulty with this process, of course, is this does not help you
  336.     discover what articles will interest you - this only works if you have
  337.     a useful bibliography to work from.
  338.  
  339.     In recent years, a concerted effort has been made to bring you full
  340.     text articles electronically. Commercial databases in general have
  341.     moved from being strictly bibliographic to many full text articles. A
  342.     system of full text articles on CD-ROM has a brilliant future. Up to
  343.     500 journals are updated frequently in this inexpensive format. (Most
  344.     Research Libraries have this station.)
  345.  
  346.     Some of the commercial full text databases have emerged online too.
  347.     Northern Light presents this. Unfortunately, the better quality
  348.     articles are not included in these databases. It is not an absolute
  349.     rule but to date, many of these commercial databases are filled with
  350.     regional business papers, newspapers or similar middle to low quality
  351.     publications.
  352.  
  353.     There is another system for accessing articles, which comes to us from
  354.     a very long time ago. Inter-library loans are a system worked out
  355.     between libraries so articles can be exchanged between libraries.
  356.     Naturally you need the assistance of a library - and a great deal of
  357.     patience. Such requests can take over a month to arrive.
  358.  
  359.     Lastly, there is always the option of direct purchase of periodicals
  360.     from the publisher.
  361.  
  362.     Commercial Services
  363.     Carl Uncover service (fatback articles).
  364.     CARL (http://www.carl.org) is one of the great library groups in North
  365.     America established a service to provide articles by post or fax. Carl
  366.     promises to fax articles provided you use their system to check one of
  367.     their many libraries has the required document.
  368.  
  369.     Northern Light - online database of articles
  370.     Northern Light (http://www.nlsearch.com) is a search engine of both the
  371.     web and their own database of articles available for purchase. The
  372.     rates are cheaper than Carl (up to $4.00 per downloaded document) and
  373.     the articles are delivered over the internet (not faxed) but the range
  374.     is smaller.
  375.  
  376.     Information Theory
  377.     Many of the databases will begin to offer their services either as a
  378.     pay-per-view, or through reasonable direct subscription methods on the
  379.     internet. This has been predicted for years but depends on the
  380.     emergence of a fine way to purchase cheap items on the internet:
  381.     digital money. No effective digital money has emerged yet, and most
  382.     databases will either wait, or try one of the existing incomplete
  383.     methods. Essentially, critical mass has not yet arrived, and it now
  384.     appears that the true fall in price of information is waiting on an
  385.     effective digital money. In preparation, magazines and newspapers are
  386.     purchasing all the rights possible - especially the electronic rights.
  387.     More appears on this topic later.
  388.     ___________________________________________________
  389.  
  390.  
  391.                                  Webpages
  392.           Links and forms at http://spireproject.com/webpage.htm
  393.  
  394.     Webpages are often of unknown age, of only guessed at quality and
  395.     potentially the easiest information to retrieve. There are many points
  396.     of entry to web resources, but search tools differ. Try to match your
  397.     search tool to your question. To start, you will need to learn
  398.     something of the different tools - described below - and four basic
  399.     search techniques: Boolean, Proximity, Field Searches & Truncation.
  400.  
  401.     Global Search Engines
  402.     Altavista (http://altavista.com) includes a very large, fast search
  403.     engine. It allows for Basic Boolean AND + NOT - OR | Proximity " " ~
  404.     (near - within 10 words of each other.) Several Fields: title:"Spire
  405.     Project" domain:gov url:edu link:cn.net.au and Truncation/Wildcard (*)
  406.     Of import, Capitals matter with Altavista.
  407.  
  408.     All-the-Web (http://www.alltheweb.com) is important because it is large
  409.     - really large - with a flexible search facility. Allows Partial
  410.     Boolean + - Simple Proximity " " and Several Fields a title field
  411.     search normal.title:spire url field url.all:.au link text and link url
  412.     fields normal.atext:spire link.all:cn.net.au All-the-Web is not case
  413.     sensitive. The same database supporting All-the-Web supports Lycos.
  414.  
  415.     Inktomi (via http://hotbot.lycos.com) provides its substantial web
  416.     directory through other companies, in this case, HotBot. also allows
  417.     searches by region, by date, and more.
  418.  
  419.     Debriefing (http://www.debriefing.com) is our meta-search engine of
  420.     choice. Use this to find names & named websites. Accepts Partial
  421.     Boolean + - Simple Proximity " ". Capitals matter.
  422.  
  423.     Google(http://www.google.com/) is a new style of search engine which
  424.     ranks sites with more care and concern. This works well for sites you
  425.     know a little about in advance. Unfortunately, has no useful field
  426.     searches. Allows Partial Boolean + - Simple Proximity " ".
  427.     Unfortunately, No Truncation not even for plurals!
  428.  
  429.     When searching for a topic with precise descriptive terms, use a broad
  430.     search engines. Always place the Boolean +symbol before each search
  431.     word (like this: +word1 +word2) to insist all words appear in the
  432.     results. Quotes keep words together ("word1 word2"). These two simple
  433.     steps dramatically improve results. Keep adding words and search limits
  434.     until the number of hits is reasonable.
  435.  
  436.     For more global search engines, there are numerous lists to consider
  437.     like the W3 Search Engines page at the University of Geneva
  438.     (http://cui.unige.ch/meta-index.html#INF) and the Industry Research
  439.     Desk (http://www.rbbi.com/links/sengine.htm).
  440.  
  441.     Meta-Search Engines & Google
  442.     If you know something of the destination already, like a title or
  443.     company name or full name, try using a search tool that excels in
  444.     finding named websites. There should be little difficulty in finding
  445.     such sites with either Google or a Meta-Search engine, but don't get
  446.     excited and use these on other occasions.
  447.  
  448.  
  449.     Categorized Lists
  450.     When searching for information that lends itself to a particular
  451.     category or topic, start with resources which group information in
  452.     categories. With few exceptions, these resources index websites, not
  453.     webpages. Also, keep your search words simple as these are small
  454.     databases.
  455.  
  456.     Yahoo (http://yahoo.com) is the largest of this type of directory tree;
  457.     the definitive site. Accepts Partial Boolean + - Simple Proximity " "
  458.     Truncation * and Several Field t: (for titles)  u: (for urls) and a
  459.     date field through a form.
  460.  
  461.     The Open Directory Project (http://dmoz.org) is a Netscape effort to,
  462.     presumably, mute the strength of Yahoo. It is very good, and very
  463.     similar to Yahoo.
  464.  
  465.     Looksmart (http://www.looksmart.com) is another significant directory.
  466.  
  467.     For an alternative, try the World Wide Web Virtual Library: Subject
  468.     Catalogue (http://vlib.org/Overview.html), a distributed network of
  469.     subject lists, not nearly as dominant as Yahoo, but far more
  470.     "scholarly" shall we say. This virtual directory has been around many
  471.     years, previously famous from www.w3.org.
  472.  
  473.  
  474.     Reviewed Sites
  475.     When seeking specific fields of study, when topics are clouded with
  476.     many similar, low quality sites, start with resources with a greater
  477.     degree of personal attention. Peer review and vetting produce resources
  478.     with more quality but limited coverage, better suited to this
  479.     situation. Also, keep your search words simple.
  480.  
  481.     The Scout Report (http://wwwscout.cs.wisc.edu) is one of the oldest and
  482.     most highly regarded e-newsletters introducing new internet resources.
  483.     Residing at the University of Wisconsin, the Scout Report describes
  484.     research, education & topical sites. The Scout Report Signpost provides
  485.     a quick search of previously featured sites.
  486.  
  487.     BUBL (http://www.bubl.ac.uk) is a British site which reviews internet
  488.     resources then indexes by Dewey decimal number. I prefer their Dewey
  489.     presentation but the collection is not large (though the largest of the
  490.     library projects I have seen).
  491.  
  492.     The Argus Clearinghouse (http://www.clearinghouse.net) is a vast
  493.     collection of internet guidebooks. We can search the titles &
  494.     descriptions, but then click on the highlighted keywords to find
  495.     related guides. I suspect Argus is not successfully keeping pace with
  496.     internet development.
  497.  
  498.     AlphaSearch (http://www.calvin.edu/library/searreso/internet/as/) is
  499.     similar to Argus. This one indexes important nexus sites and should be
  500.     browsed.
  501.  
  502.     The Britannica.com (as in Encyclopedia Britannica
  503.     http://www.britannica.com) has been remolded as a free guide to books,
  504.     periodicals, web and their encyclopedia. This encyclopedia is perhaps
  505.     the best.
  506.  
  507.     FAQs can be searched from an FAQ database like the one at
  508.     http://www.faqs.org
  509.  
  510.     WebRings list sites by topic. Each webring is maintained by a volunteer
  511.     at an uninvolved site using standard software. The primary sites are
  512.     currently Webring.com and bomis.com
  513.  
  514.     Specialty Tools
  515.     For issues with a particular government, url or language origin,
  516.     consider using tools designed with this in mind.
  517.  
  518.     * Altavista can be limited to specific domains (gov edu au) with their
  519.     "domain:domainname" field search. "url:url-segment" is also useful.
  520.     Read the Altavista Fancy Features for Typical Searches.
  521.  
  522.     * GovBot (http://ciir2.cs.umass.edu/Govbot/) as developed by The Center
  523.     for Intelligent Information Retrieval (CIIR) is a search engine which
  524.     indexes exclusively a great number of government webpages, a unique
  525.     resource.
  526.  
  527.     * Altavista also allows for a field search by language. Searching for a
  528.     Japanese site? Consider searching only webpages in Japanese.
  529.  
  530.     * Purely regional search engines may also be the answer. Aussie.com.au,
  531.     for example, is a search engine indexing only Australian websites.
  532.     There are fine lists of regional search engines and directories like
  533.     SearchEngineCollossus, Search Engines WorldWide, SearchEngineWatch and
  534.     Yahoo.
  535.  
  536.     * Topic-specific search engines, a new arrival, has a very promising
  537.     future. Ideally you will find a search engine like ChemGuide
  538.     (http://www.fiz-chemie.de/en/datenbanken/chemguide/)covering over a
  539.     million chemistry related pages. Search Engine Guide
  540.     (http://searchengineguide.com) and Gary Price's Direct Search.
  541.     (gwis2.circ.gwu.edu/~gprice/direct.htm) list topical search engines.
  542.  
  543.     * Lastly, there are some commercial databases aimed at the software and
  544.     internet industries. Consider OCLC's NetFirst (articles from magazines
  545.     describing the internet).
  546.  
  547.     Conclusion
  548.     For many of us, searching the web is simply typing words into a search
  549.     engine. I hope I have shown there is more to it than this. What may not
  550.     be clearly evident from a brief overview of resources is that each
  551.     resource has a particular difference, a particular focus, a particular
  552.     angle that helps us answer certain questions faster than other tools
  553.     and searches.
  554.  
  555.     Yes, in the simple world of Yahoo and Altavista you pay no attention to
  556.     the specific differences between alternatives - you are left with the
  557.     worst of these two tools. Your results are general, timeless and
  558.     imprecise.
  559.  
  560.     Contrary to myth, global search engines are not the best place to start
  561.     most of the time - just some of the time. On other occasions, start
  562.     with a directory, a meta-search engine, a guide, an FAQ... We should be
  563.     able to identify which tools excel at locating what kinds of webpages.
  564.     (There is no simple search of everything.)
  565.  
  566.     There are more insights into effective internet research. Information
  567.     clumps; Information is not established in isolation but instead
  568.     develops in context, is reinforced, and becomes a trend. The publishing
  569.     motivation & promotion purpose can help us rapidly judge the content of
  570.     a website. The webpage address can tell us a great deal about both the
  571.     website structure and the type of publisher.
  572.  
  573.     Once skilled, you can segment and search the most promising areas of
  574.     the web quickly and efficiently. If you do not quickly find your
  575.     answers there may be other, more appropriate resources. Consider asking
  576.     for help in an appropriate discussion group, or reviewing printed
  577.     literature instead. The Web is only one resource among many.
  578.  
  579.     If your primary interest is Search Engines, consider reading A Higher
  580.     Signal - To - Noise Ratio
  581.     (http://www.dpi.state.wi.us/dpi/dlcl/lbstat/search1.html) by Bob Bocher
  582.     & Kay Ihlenfeldt, Sink or Swim: Internet Search Tools & Techniques
  583.     (http://www.lboro.ac.uk/info/training/finding/sink.htm) by Ross Tyner
  584.     and The Search is Over
  585.     (http://www.zdnet.com/pccomp/features/fea1096/sub2.html) by Adam Page.
  586.     For even more, read Searching the Internet
  587.     (http://wwwscout.cs.wisc.edu/toolkit/searching/) a publication in the
  588.     Scout Toolkit and browse Search Engine Watch.
  589.  
  590.     Strategy
  591.     Searching the web is more skill than most of us acknowledge. The web is
  592.     a manifestation of the demon professional researcher's work with all
  593.     the time in the commercial information market. There is constantly the
  594.     fear you have missed that single important site with everything.
  595.     Consider the researcher's motto:
  596.  
  597.     Someone, somewhere, probably knows the answer.
  598.  
  599.     But how long do we search for gems, and where do we look? To decide, we
  600.     must learn about internet structure and organization. Why is
  601.     information published on the web? Why is it promoted? Let's review the
  602.     reasoning behind effective internet research. There is so much more
  603.     than putting words into search engines.
  604.  
  605.     #1 Motivation
  606.     We can make some very astute generalizations about a webpage very
  607.     quickly if we can judge the reason it was published. Not only is this
  608.     an important step in analyzing any information, but this tells us a
  609.     great deal about the contents of the webpage.
  610.  
  611.     Yes, merely determining a site belongs to an association actually
  612.     specifies the quality, motivation and type of information we will find.
  613.  
  614.     Associations either publish what is termed 'brochureware' (promotional
  615.     material), or if well advanced, present research work previously
  616.     restricted to the association library: important research studies & the
  617.     like. Commercial interests have much more difficulty delivering useful
  618.     resources. The importance of projecting a corporate image comes first
  619.     (lots of 'brochureware'), and service descriptions come second. On
  620.     occasion, commercial interests will support a worthwhile service tied
  621.     closely to their own service - thus banks present interest rates -
  622.     bookstores present their book database.
  623.  
  624.     The certainty with which we can make these judgments will astound you.
  625.     Corporate websites never publish "changes to patent law". They simply
  626.     don't have the motivation. Only an individual would publish this, most
  627.     likely not on the web but though a mailing list.
  628.  
  629.     Information is not distributed randomly. Consider Format, Preparation,
  630.     Motivation and Promotion. Consider this, then Visualize the information
  631.     you seek.
  632.  
  633.     #2 Promotion
  634.     We can make further snap judgments about web information from the way
  635.     you get there. Promotion is very difficult on the web, and it is hard
  636.     to find poorly promoted information. The tools you use to reach
  637.     information pre-determines the type and quality of information you will
  638.     find.
  639.  
  640.     Search engines index webpages indiscriminately. Advertised websites
  641.     must have a pay-off. Directories focus on established websites (not
  642.     webpages). Link pages also link to established websites but put more
  643.     thought into the selection of resources. Both usually focus on general
  644.     sites. For specific or current resources, we need to move to mailing
  645.     lists or active nexus point.
  646.  
  647.     Yes, when we find a webpage through the Scout Report (a prominent
  648.     resource discovery newsletter), we can assume the webpage has a high
  649.     quality of information, is reasonably current and has a general appeal
  650.     (within the interest of the newsletter readers).
  651.  
  652.     Let's put this in reverse. If we are looking for a recent document by a
  653.     prominent library committee, we will not find it through Altavista,
  654.     Yahoo, or normal link pages (except accidentally). We may find it
  655.     through specialist newsletters, active nexus points, or through mailing
  656.     lists.
  657.  
  658.     #3 Visualize
  659.     When an artist begins to paint, they visualize the image. They already
  660.     have a concept of the finished result. Internet research is no
  661.     different. We start by building a vision of the information we seek.
  662.     Who would publish it. What is their motivation? Who would promote it?
  663.     Where would I find it?
  664.  
  665.     Information Clumps. Information is created, nurtured, develops, gets
  666.     transplanted, gets arranged and becomes visible through a process which
  667.     brings similar information together. Your understanding of this
  668.     process, including motivation and promotion, must guide your search of
  669.     the web. Only then will we know where to look, and quickly know if the
  670.     answers are on the web.
  671.     ___________________________________________________
  672.  
  673.  
  674.                                    News
  675.           links and more at http://spireproject.com/newswire.htm
  676.     Shakh was invited to travel with the army on the conquest of Nubia. The
  677.     Egyptian army was not in need of further soldiers but there was a need
  678.     for a witness. Shakh would write the official chronicles of the army's
  679.     exploits. He would be expected to send a simple diary on papyrus back
  680.     to the palace and then to compose numerous descriptions for memorial
  681.     walls. He may also be consulted for paintings on the pharaohs tomb. It
  682.     was a fine offer, and he relished in the prospect of increasing his
  683.     value exposure.
  684.  
  685.     The war was not swift, nor was it entirely one-sided. In the end,
  686.     superior numbers had its effect and Nubia was once again reunited with
  687.     Greater Egypt. Reporting was initially a challenge, since very little
  688.     happened from day to day. Slowly, Shakh got a handle on the process and
  689.     focussed on the grandness of the venture. Two years after floating up
  690.     stream, Shakh was able to do his finest work, the parade of captured
  691.     soldiers past the Pharaoh's representative.
  692.  
  693.                         - - - - - - - - - - - - - -
  694.  
  695.     News articles are typically light and biased. Do not believe a news
  696.     item is a great critical analysis of current events. Most news is
  697.     produced under time restrictions, for prompt consumption. In research,
  698.     news often proves particularly useful for locating information about
  699.     individuals or businesses. News is also critical in creating a timeline
  700.     of events, in recording events of regional/national/international
  701.     importance.
  702.  
  703.     News prepared by individual reporters is collected together by large
  704.     news organizations, then delivered to other news organizations around
  705.     the world. Your local news organization does not have a reporter in
  706.     Iran, but rather buys the story off a newswire, then packages it in
  707.     your evening news hour or morning newspaper.
  708.  
  709.     You have probably heard of: United Press International (UPI), Reuters
  710.     Global News, Agence France Presse, Associated Press and Xinhua Chinese
  711.     Newswire. These very large organizations make their information
  712.     available to you in a variety of ways. News collects in commercial
  713.     databases of past news, some single source, others, large multi-source
  714.     databases. Current news is also packaged into large multi-source
  715.     systems delivered by email or newsgroups. Many newswires are available
  716.     online free of charge.
  717.  
  718.     Free News
  719.     Critical to the changes on the internet is the emergence of free access
  720.     to text news. Individual newspapers present news free. Newswires
  721.     present news free. News sections to larger sites like Yahoo present
  722.     news from many sources, free. News-only search engines will help you
  723.     find information from a great many sites with news.
  724.  
  725.     The process of finding current news is about as slick as imaginable.
  726.     Here are a few players in the market:
  727.  
  728.     * Yahoo News (www.yahoo.com/headlines/) is leading this field with web
  729.     delivery of current news from Reuters, Associated Press, and others.
  730.     Yahoo also includes a free search for one week's news.
  731.  
  732.     * Voice of America Newswire (VoA and now voanews.com) delivers news in
  733.     English & many other languages.
  734.  
  735.     * The Washington Post (www.washingtonpost.com) offers their own current
  736.     news for searching, as well as the Associated Press wire, each searched
  737.     separately for the past week.
  738.  
  739.     * Fox News (www.foxnews.com) presents current news online (both current
  740.     events and sport news). CNN news (www.cnn.com) is another searchable
  741.     site. Both repackage some newswires and present them online. C|news
  742.     (www.news.com) does this too.
  743.  
  744.     * Newsbytes (www.newsbytes.com) is a newswire solely on computer
  745.     topics, computer, telecom and online world. InternetWire and other
  746.     specialty newswires also present news from their website.
  747.  
  748.     * United Nations Radio: The World in Review is one of many news shows
  749.     with the transcripts online. Unusually, the Vatican's newswire is not
  750.     free online.
  751.  
  752.     * Obviously many more exist - and thankfully we don't need to create a
  753.     list or manage the sources. The Spire Project has a clickable map of
  754.     English language newspapers. There are definitive lists of global
  755.     newspapers like Gary Price's
  756.     http://gwis2.circ.gwu.edu/~gprice/newscenter.htm#International
  757.     http://dailyearth.com and http://ipl.org/reading/news/
  758.  
  759.     Commercial Resources
  760.     The commercial segment of the news market is obviously being squeezed
  761.     by the copious quantities of free news online. There are, however,
  762.     still some viable markets, principally enterprise solutions (companies
  763.     are willing to pay for slight improvements), past database access, and
  764.     surprisingly the Wall Street Journal (US$49/yr).
  765.  
  766.     To these markets we have Clarinet and Newspage. World News Connection
  767.     is US Government service presenting translated news (quite a gem) as a
  768.     searchable database. Unusually, prices start at US$25/7days - yes one
  769.     price for the news!
  770.  
  771.     Of course news alerts can be arranged from the commercial news
  772.     databases through the database retailers, and each newswire like Agence
  773.     France Newswire, Canada Newswire, Xinhua News and Associated Press all
  774.     are unique databases, and all stretch back many years. Further
  775.     databases like Newswire ASAP and what used to Global Textline are
  776.     massive databases of multiple newswires and newspapers. I recall at one
  777.     stage Textline had over 4 billion pages.
  778.  
  779.     Conclusion
  780.     News articles are typically light and biased. The sheer quantity of
  781.     news in the large news databases make this a useful resource to fall
  782.     back for any tightly focused research topic. I once discovered an
  783.     obscure scientist working in a unique field from a small 3 paragraph
  784.     article in a local farmer's newspaper in England (Global Textline
  785.     Database).
  786.  
  787.     Newswires and News Databases are just two elements of a large industry
  788.     which extends to the your local newspaper and to further specialty
  789.     databases. Most newspapers maintain their own local news database, and
  790.     some make this available electronically. A manual clipping services may
  791.     also be the option - certain firms manually page through local papers
  792.     looking for advertisements or articles.
  793.  
  794.     While on the topic, certain newswires like Business Wire and PR
  795.     Newswire essentially distribute certain types of news for money. Yes,
  796.     anything in these newswires is there because the company paid for it to
  797.     be there - $500 and up most likely. Other newswires earn money in the
  798.     reverse process: from the media who read or publish their work.
  799.     Associated Press or Reuters are created from news organizations. Others
  800.     like Voice of America (VOA) are alternatively funded, but with
  801.     reasonable reliability.
  802.  
  803.     There are also a range of focused newswires such as Newsbyte (computer
  804.     issues), PR Newswire (product releases), and Middle Eastern newswires.
  805.     Further newswires can be found at Yahoo.
  806.  
  807.     Strategy
  808.     I can think of four ways to use this information for research:
  809.  
  810.     1) As an alternative to your evening news or morning newspaper. Online
  811.     news is available 24 hours a day, in more detail, from respected news
  812.     organizations.
  813.  
  814.     2) Search past news to locate information unlikely to emerge in
  815.     journals or magazines. News includes a great deal of local detail and
  816.     personal information unlikely to be found elsewhere.
  817.  
  818.     3) As a historical record of events, perhaps the basis of a timeline.
  819.  
  820.     4) Current Awareness and Alerts so articles come to you as they are
  821.     reported. News stories by email will become a large industry over the
  822.     next two years.
  823.  
  824.     Information Theory
  825.     Just how inexpensive can news become? US$25 gets you access to past
  826.     translated news! VoaNews.com keeps a searchable directory back a month
  827.     for free. Many newspapers still have extensive archives of news, though
  828.     they hope to one-day charge for them. In a way, no-one is making money
  829.     from news. It is only worth the advertising revenue for distracting you
  830.     from reading the news - and that is falling too. With the freedom of
  831.     moving information through the internet, several free services will
  832.     send you email when an news article matches your interests (an Alert).
  833.  
  834.     The future will see much more "compile your own" newspaper - especially
  835.     since it could conceivably be compiled at minimal to no expense
  836.     depending on the technology (frames anyone?) An intriguing lawsuit
  837.     recently stopped TotalNews (a news only search engine) from displaying
  838.     news articles in a frame.
  839.  
  840.     If allowed to speculate for a moment, News-for-Pay may also become a
  841.     viable businesses. Perhaps this is just being cynical of journalistic
  842.     standards and the accepted standards of promotion. Perhaps it is also
  843.     recognition that Businesswire and PRWire are just two of several
  844.     newswires where you pay to have your news included. Obviously news
  845.     today is biased towards advertisers (through advertorials) and
  846.     promoters. Perhaps this will become automated some day - like Yahoo's
  847.     "we will look at your site right away for $200".
  848.  
  849.     Naturally, the links and many of the forms to news resources discussed
  850.     here can be found at http://spireproject.com/newswire.htm and also our
  851.     All-in-one page: http://spireproject.com/spir.htm
  852.     ___________________________________________________
  853.  
  854.  
  855.                          Theses and Dissertations
  856.            links and more at http://spireproject.com/discuss.htm
  857.  
  858.     Theses and dissertations are professional papers completed for higher
  859.     degrees. That is to say, they are long, dense and often very esoteric
  860.     and convoluted. Trouble is, most theses and dissertations have no more
  861.     than 12 copies ever - one always to the University Library, one with
  862.     the author, but others scatter to the wind.
  863.  
  864.     All University Libraries hold a copy of past theses undertaken at their
  865.     university. This gives rise to the unfortunate but necessary pastime of
  866.     searching each local university library for relevant theses. The
  867.     advantage here is masters and occasionally honours theses are indexed.
  868.     Most often, just undertake a keyword search then add "thes*"
  869.     (truncation of theses or thesis).
  870.  
  871.     Electronic Theses Databases:
  872.     Dissertation Abstracts Online, produced by UMI, delivers abstracts to
  873.     most every doctoral dissertation/thesis in North America, some master's
  874.     theses and some international theses. This is the definitive site to
  875.     search, though you will need the help of your library to see more than
  876.     the abstract. Some libraries will have subscribed to Dissertations
  877.     Abstracts OnDisc - the CD-version of this database.
  878.  
  879.     The [British] Index to Theses with Abstracts is a print directory by
  880.     ASLIB. This publication is also available as a database, available for
  881.     site licenses through Theses.com (www.theses.com). This source is quite
  882.     comprehensive as can be seen with the University List.
  883.  
  884.     Several other national databases do exist. Here in Australia, a list of
  885.     theses was maintained from 1966 to 1991. The Gale Directory of
  886.     Databases also lists THESA, a database of French theses, and
  887.     Dissertations and Theses of the ROC (Taiwan).
  888.  
  889.     The Australian Education Index (1978+), produced by ACER (Australian
  890.     Council for Educational Research), is a directory listing citations and
  891.     some abstracts to Australian work in education. Also available as a
  892.     commercial database, AEI is bundled into Austrom, a common collection
  893.     of Australian databases.
  894.  
  895.     Digital Archives of Theses
  896.     In theory, some theses should be available on the internet,
  897.     particularly theses lodged electronically. There is a push for
  898.     universities to accept electronic thesis submission, and to build
  899.     digital archives of theses. The embryonic National Digital Library of
  900.     Theses and Dissertations (NDTLD - www.theses.org) is just one such a
  901.     project. There is a distributed and sequential keyword search to
  902.     participating universities through its not particularly functional. In
  903.     theory, this is an incremental improvement to searching library
  904.     catalogues.
  905.  
  906.     Conclusion
  907.     Getting a thesis can be very difficult. You will need the help of a
  908.     document delivery through a library and many theses will not be
  909.     available to borrow. You can also buy theses. Read Obtaining Copies of
  910.     Dissertations (http://www.library.yale.edu/ref/err/disscops.htm) by
  911.     Yale University Library for more. For an alternative look at theses,
  912.     consider Locating Theses
  913.     (http://www.lib.monash.edu.au/hss/guides/fstheses.htm) by the Monash
  914.     University Library.
  915.  
  916.     A note on developments in this field: some Theses abstracts are
  917.     emerging online already. Projects like the LA Theses Database
  918.     (Landscape Architecture Theses Archive) have much promise but poor
  919.     coverage. Full text theses presentation also have promise with the US
  920.     Department of Education funding a National Digital Library of Theses
  921.     and Dissertations and Virginia Tech starting to request electronic
  922.     submission of all theses.
  923.  
  924.     UMI (the producers of Dissertation Abstracts Online) has backed this
  925.     move with a direct delivery service of electronic theses to US
  926.     libraries for $26, but only theses held in their digital archives are
  927.     available. Eventually, large digital Theses archives will be the norm,
  928.     but until then, very little will happen in this field.
  929.  
  930.     A thesis is a tightly constrained information package, produced in the
  931.     university environment with limited appeal. For economic reasons, we
  932.     should not be surprised theses databases are incomplete. The emergence
  933.     of theses archives sounds interesting - a good use of the internet -
  934.     but does not represent a financial opportunity that could be explored
  935.     without government assistance. Consequently, this small area of the
  936.     information sphere is government grant-driven.
  937.     ___________________________________________________
  938.  
  939.  
  940.                                   Patents
  941.            links and more at http://spireproject.com/discuss.htm
  942.  
  943.     A patent discloses certain facts about a commercially important
  944.     invention in exchange for certain rights to exploit the invention. This
  945.     is a little simplistic, but explains why patents are factual, unique
  946.     from other research resources, and a little vague in certain specifics.
  947.     If you have never seen a patent before, see a sample US patent ,
  948.     Australian patent, and this brief description
  949.     (http://www.ipaustralia.gov.au/patents/P_home.htm).
  950.  
  951.     There are three primary resources involved in patent research. Firstly,
  952.     we have the free internet resources. Secondly, we have the national
  953.     patent agency resources. Thirdly, we have the commercial patent
  954.     databases.
  955.  
  956.     Free Patent Databases
  957.     The concept of free patent databases has surely come, and while many
  958.     countries are only slowly moving this direction, the movement is
  959.     inevitable.
  960.  
  961.     * The US Patent and Trademark Office (USPTO) provides a US Patent
  962.     Bibliographic database at patents.uspto.gov with full use of fields,
  963.     date and abstract text searching. Choose between their Boolean search,
  964.     advanced (field) search or by US patent number. They also maintain a
  965.     fulltext [US] Aids Patent Database and other resources.
  966.  
  967.     * The IBM's Patent Server is a public service providing a different
  968.     patent database of US Patent abstracts. The IBM service is similar but
  969.     different from the USPTO service - certainly not less powerful.
  970.  
  971.     * The Canadian Intellectual Property Office (CIPO) maintains the
  972.     Canadian Patent Fulltext Database from '89. This database is on par
  973.     with the US Patent Database, with perhaps even better searching
  974.     technology.
  975.  
  976.     * The Japanese Patent Office (www.jpo-miti.go.jp) has a searchable
  977.     database of Japanese patent abstracts, including patent number, title,
  978.     inventor, company, and abstract of the patent.
  979.  
  980.     Patent Authority Services
  981.     Patent libraries are an important and cost-effective patent resource.
  982.  
  983.     * IP Australia (www.ipaustralia.gov.au) (formerly the Australian
  984.     Industrial Property Organisation (AIPO)) has a patent library in each
  985.     Australian state capital. Each library provides free access to the APAS
  986.     database (Australian Patent Abstract Search) and includes a complete
  987.     microfiche copy of all Australian patents and the Australian Official
  988.     Journal of Patents, Trademarks & Designs (the official Australian
  989.     patent gazette).
  990.  
  991.     Most offices also hold US Patents on microfiche! Staff will help you
  992.     use the APAS database, arranged for free text searching by
  993.     International Patent Classification. A particularly useful service by
  994.     IP Australia is the delivery of copies of many foreign patents for
  995.     AU$15. You will need the patent number, country and title for this.
  996.  
  997.     * The US Patent and Trade Mark Organization (USPTO) has the Patent and
  998.     Trademark Depository Library Program (PTDL's) placing the CASSIS
  999.     database (The USPTO patent abstract database on CD-ROM) and US patents
  1000.     around the US.
  1001.  
  1002.     The US patent libraries also hold the Official Gazette of the U.S.
  1003.     Patent and Trademark Office, The official US patent gazette.
  1004.     Importantly, the gazette is fully online and searchable from 1995.
  1005.  
  1006.     * The [UK] Patent Office (www.patent.gov.uk) provides for the Patents
  1007.     Information Network (PIN) which hosts patent information in the UK. The
  1008.     British Library is just one listed source of UK patents (further
  1009.     information online) and delivers some patent services.
  1010.  
  1011.     * The Canadian Intellectual Property Office (CIPO) (cipo.gc.ca)
  1012.     produces the Canadian Patent Index (CPI). They also publish The Patent
  1013.     Office Record, Canada's official patent gazette.
  1014.  
  1015.     * There are many more national & international patent organizations
  1016.     like Intitut National de la Propriete Industrielle [France], World
  1017.     Intellectual Property Organization (WIPO) and European Patent Office.
  1018.     Thankfully there are fine lists of patent libraries and patent
  1019.     websites.
  1020.  
  1021.     Commercial Patent Services
  1022.     One of the most invaluable resources in serious patent research is
  1023.     access to several of the very large commercial patent databases.
  1024.  
  1025.     * Lexis-Nexis (www.lexis-nexis.com) retails several patent databases.
  1026.     Thanks to Patscan (University of British Columbia), we also a guide to
  1027.     searching patents on Lexis-Nexis.
  1028.  
  1029.     * The Dialog Corporation (www.dialog.com) retails a collection of
  1030.     patent databases including: Derwent World Patents Index, Inpadoc,
  1031.     Claims/U.S. Patents and  European Patents FullText.
  1032.  
  1033.     * CASSIS is the USPTO database. For a little more information on this,
  1034.     consider the Patent Guide to Using CASSIS, at the University of
  1035.     Michigan.
  1036.  
  1037.     * Derwent Scientific and Patent Information (www.derwent.co.uk) is a
  1038.     prominent publisher of Patent and scientific information including
  1039.     commercial databases.
  1040.  
  1041.     * Questel-Orbit (www.questel.orbit.com) also retails patent databases.
  1042.  
  1043.     * CAS/STN (www.cas.org) retails a collection of patent databases
  1044.     including Chemical Patents Plus for U.S. Chemical patents.
  1045.  
  1046.     In addition to the database retailers and producers, there is a lively
  1047.     industry of patent services.
  1048.     * The Patent Libraries will assist you with some services. IP
  1049.     Australia, for example, will retrieve most full patents from other
  1050.     countries for AU$15.
  1051.  
  1052.     Conclusion
  1053.     Until recently, the legal profession has had a complete monopoly on
  1054.     patent work. As you can see, this need no longer be the case. Casual
  1055.     researchers will find the free patent databases easy to use, and more
  1056.     experienced researchers should not be dissuaded from searching the
  1057.     commercial databases or patent libraries themselves. The very large
  1058.     commercial databases, like Inpadoc, are particularly easy to use.
  1059.  
  1060.     Of course, there are occasions when patent searches are critical, and
  1061.     experts should be sought. Certainly legal assistance is required if you
  1062.     are preparing to lodge your own patent, but patent data as a source of
  1063.     information is another matter.
  1064.  
  1065.     As an industry, patent research is still deeply entrenched in the
  1066.     high-price commercial database and database-centered services. I am
  1067.     mildly surprised the emergence of free databases like the USPTO's
  1068.     patent database has not led to a fall in the costs of the high-end
  1069.     databases (which remain some of the most expensive databases in
  1070.     publicly accessible). It appears this industry, as indeed several
  1071.     others, has no intent to drop the price of retail database access to a
  1072.     more supportable level. I can only predict this rests on economic
  1073.     grounds. Patent information purchases are price insensitive.
  1074.     ___________________________________________________
  1075.  
  1076.  
  1077.                                 Statistics
  1078.             links and more at http://spireproject.com/stats.htm
  1079.  
  1080.     Statistics allow us to lie with confidence. Dense and factual,
  1081.     carefully interpreted statistics are also far more reliable than
  1082.     personal experience. The expense of collecting meaningful statistics
  1083.     limits the types of organizations involved in this work. This divide is
  1084.     also a very elegant way to divide this field.
  1085.  
  1086.     #1 National Statistical Agencies,
  1087.     #2 Government Agency Statistics,
  1088.     #3 Commercial Statistics,
  1089.     #4 Association Statistics.
  1090.  
  1091.     Statistical Directories
  1092.     Statistical Abstracts (statistical bibliographies and statistical
  1093.     directories) describe sources of statistics.
  1094.  
  1095.     Instat publishes "International Statistics Sources: subject guide to
  1096.     Sources of International Comparative Statistics" but I found this less
  1097.     than brilliant. A better link is Statistical Sources (by Gale
  1098.     Research), a basic and very large statistical abstracts directory.
  1099.  
  1100.     On the internet, US government statistics are well recorded in
  1101.     Statistical Abstract of the United States 1999
  1102.     (http://www.census.gov/stat_abstract) a 1000+ page document made
  1103.     available online in pdf format by the US Census Bureau.
  1104.  
  1105.     Statistical Venues
  1106.     Many statistics appear regularly in journals, annual reports and
  1107.     newspapers. Specialty libraries, particularly specialty librarians, may
  1108.     be aware of additional statistics.
  1109.  
  1110.     If an expert goes through the effort to collect statistics, you are far
  1111.     more likely to locate them by undertaking an article search, (looking
  1112.     particularly for journal articles) and a book search. In both cases,
  1113.     limit your search to only the last couple of years or you will locate
  1114.     very old, dated statistics. A particularly sophisticated approach could
  1115.     be to ask BusLib-l (Business Librarians' Electronic Discussion List)
  1116.     since this is a mailing list of librarians. Use this resource
  1117.     sparingly, and only after having exhausted other avenues.
  1118.  
  1119.     National Statistical Agencies
  1120.     Most every country in the world has a single government agency
  1121.     dedicated to collecting, collating and publishing national statistics.
  1122.     Statistics Canada, Australian Bureau of Statistics, The US Census
  1123.     Bureau, The (UK) Office for National Statistics; we have a fine page on
  1124.     national statistical agencies (http://spireproject.com/bureau.htm).
  1125.  
  1126.     These organizations manage the census, watch the movement of money and
  1127.     goods in and out of the country, and undertake a wide range of other
  1128.     surveys. Finding these statistics is relatively straight forward, with
  1129.     several directories on the internet.
  1130.  
  1131.     Government Agency Statistics
  1132.     Most government agencies collect reams of data on the industries they
  1133.     monitor. Sometimes these statistics are published, sometimes you have
  1134.     to ask for them, only rarely are they considered private or
  1135.     unavailable.
  1136.  
  1137.     Here in Western Australia, the government departments for Tourism,
  1138.     Labour, Small Business and Big Business all publish top-rate statistics
  1139.     free to interested parties. Our Dept of Tourism keeps a directory of
  1140.     future tourism related projects.
  1141.  
  1142.     When government statistics are bound and published, try the government
  1143.     book databases. Remember MOCAT, AGIP and part of UKOP are free online.
  1144.     Again, some US government statistics are well recorded in Statistical
  1145.     Abstract of the United States 1999 by the US Census Bureau, online in
  1146.     pdf format.
  1147.  
  1148.     Association Statistics
  1149.     Valuable statistics only come from motivated sources, and associations
  1150.     are certainly motivated. Start with a list of likely associations, then
  1151.     call up and either explain you needs or ask for their price list for
  1152.     publications and statistics. For AU$25, the Australian Booksellers
  1153.     Association publishes a brilliant analysis of the book industry.
  1154.     Association statistics are financially informative, as the intended
  1155.     audience is association members.
  1156.  
  1157.     Commercial Statistics
  1158.     Statistics created for sale are frequent in the financial sector but
  1159.     exist in a number of further situations. Banks use more professionally
  1160.     prepared market reports such as reports by the Australian economic
  1161.     consultancy firm Syntec Economic Services, Guide to Growth, which
  1162.     examines Australian industries financially with forecasts. IBIS
  1163.     (www.ibis.com), another economic consultancy, also publishes to this
  1164.     market.
  1165.  
  1166.     Professionally prepared market reports are also emerging, with the full
  1167.     text immediately from the commercial information market. Each database
  1168.     retailer has several such databases, but often these databases are
  1169.     focused globally or in a different country. Sheila Webber
  1170.     (http://www.dis.strath.ac.uk/people/sheila) has a very good list of
  1171.     firms which market research reports.
  1172.  
  1173.     Conclusion
  1174.     Central to the Internet Revolution is the liberation of just this kind
  1175.     of information. Increasingly, we will see the publishing of such
  1176.     documents on the internet, but for the few statistics currently online,
  1177.     there is no effective search. You can only browse government websites.
  1178.     Away from the internet, you must either contact the agencies directly
  1179.     (in the hope they do collect statistics), look at the statistical
  1180.     directories or seek agency statistics in other documents: books,
  1181.     pamphlets, newsletters.
  1182.  
  1183.     Once you have proceeded this far, it is wise to stop looking for
  1184.     statistics, and begin again at sophisticated commentary - which is
  1185.     likely to include supporting statistics or references to statistics
  1186.     anyway. Seek expert guidance from others who would know of hard-to-find
  1187.     statistics.
  1188.  
  1189.     One approach to finding statistics is to reverse the process. Who would
  1190.     prepare the statistic? Statistics are created in a logical manner, in a
  1191.     very expected manner. Tourism statistics? - most likely undertaken by
  1192.     either the government tourism authority, a tourism association or the
  1193.     national statistical agency. There are few others who could even
  1194.     consider preparing tourism statistics. If you can think through the
  1195.     preparation process, you can usually identify who would have created
  1196.     the statistic. (Internet statistics are the exception - too many
  1197.     organizations are creating statistics of worth.)
  1198.  
  1199.     Let's move on to specific fields of statistics.
  1200.  
  1201.     National Statistical Bureau
  1202.     The Spire Project has a fine html article on the National Statistical
  1203.     Agencies (http://spireproject.com/bureau.htm). Australia
  1204.     (www.abs.gov.au), United Kingdom (www.ons.gov.uk), Canada
  1205.     (www.statcan.ca) and United States (www.census.gov) all have national
  1206.     statistical agencies. Each organization collects and publishes
  1207.     statistics on many facets of their respective countries. This article
  1208.     should simplify your work in searching, selecting and appraising these
  1209.     sources.
  1210.  
  1211.     Each statistical agency organizes their statistics in a distinct way.
  1212.     The Australian Bureau of Statistics (ABS) has an annual Catalogue of
  1213.     Publications but also a search function, specialized statistical
  1214.     category guides and several periodicals on new resources. The UK Office
  1215.     for National Statistics (ONS) has a statistical overview, product
  1216.     catalog and a search. The US Census Bureau has a collection of very
  1217.     large publication catalogues, directories and periodicals. Statistics
  1218.     Canada has several searches, publications and a catalogue
  1219.  
  1220.     The two further elements to the statistical agencies are the
  1221.     statistical libraries and the unreported commercial statistics. The ABS
  1222.     has a dedicated statistical library within each Australian state, and
  1223.     collections of ABS documents within most public and school libraries.
  1224.     While the ABS documents within libraries are limited, the ABS libraries
  1225.     are very detailed with most every publication they create available for
  1226.     review. This is standard throughout the world.
  1227.  
  1228.     While publications are sold by each statistical agency, and the
  1229.     publication catalogues are available online, each agency has data they
  1230.     sell in other formats. CD-ROMs of popular geographical and statistical
  1231.     distribution have become very popular, as have small area population
  1232.     statistics. Some of these services are packaged and sold for specific
  1233.     purposes, like 4-site by the ABS used in describing business locations.
  1234.     Even further, statistics can be generated specific to your needs. This
  1235.     might include ABS import and export statistics for specific
  1236.     commodities, or specific results from any of their surveys.
  1237.  
  1238.     Lastly, Usinfostore.com presents a collection of economic indicators as
  1239.     time-series data. The statistics originate from several government
  1240.     agencies and is best considered as a value-added service: an intriguing
  1241.     beneficial trend?
  1242.  
  1243.     National Statistical Agencies are certainly not the only source of
  1244.     statistics. They are, however, some of the easiest to access. These
  1245.     agencies also have several traits that distinguish them from other
  1246.     information sources.
  1247.  
  1248.     Firstly, these agencies are legally required to disguise their
  1249.     statistics to protect the identity of specific businesses and
  1250.     individuals (with the exception of the Business Register). If there is
  1251.     only one or two timber exporters in Western Australia, the ABS will not
  1252.     give you timber exports from Western Australia. Specifics are found in
  1253.     directories like Kompass, commercial databases, or insider information
  1254.     (experts and articles by experts).
  1255.  
  1256.     Secondly, national statistical agencies have a tendency to be old. Most
  1257.     surveys are not completed annually, but rather every two, three or more
  1258.     years. Census data is older still. The analysis process also adds a
  1259.     delay. The ABS tends to take a year or more to collate and analyze
  1260.     statistics. For Legal and Accounting Services Australia we have '92-'93
  1261.     statistics, and the '95-96 statistics are due to be released early Nov
  1262.     1997. Certain statistics like National Indicators are rapidly produced,
  1263.     but most are not.
  1264.  
  1265.     Thirdly, national statistical agency publications are detailed - far
  1266.     more than most statistical publications. Commercial statistical sources
  1267.     often neglect supporting information like sample size and demographic
  1268.     breakdown, but expect these publications to include this and more.
  1269.     Publications may still require further analysis, and may occasionally
  1270.     come from inferior sources of information, but they are professionally
  1271.     delivered.
  1272.  
  1273.     There are several ways to search each agency: (1)
  1274.     Each agency has thoughtfully provided their catalogue of publications
  1275.     online. The links are above.
  1276.  
  1277.     (2) Each agency collects certain information for analysis. It is
  1278.     helpful to become familiar with the various surveys and information
  1279.     sources used by each agency.
  1280.  
  1281.     Besides the Census, the ABS conducts surveys of weekly household
  1282.     expenditure, agricultural land-use surveys, R&D surveys, and periodic
  1283.     surveys of various segments of the economy (like Legal and Accounting
  1284.     Services, Australia 1992-93). They also collect landing cards (tourism
  1285.     information), export and import documentation, regional hotel occupancy
  1286.     rates and more. Each statistical agency is similar.
  1287.  
  1288.     If the Australian Bureau of Statistics (ABS) has not yet conducted a
  1289.     survey of hospital occupancy, they will not have this information.
  1290.  
  1291.     (3) Agencies publish guides to information on a particular topic. They
  1292.     also publish various newsletters of recent releases and annual
  1293.     yearbooks too.
  1294.  
  1295.     National Statistical Agencies are not the only statistics, nor
  1296.     particularly the best. They are, however, often the best source for
  1297.     demographic data, widely used by government and frequently re-published
  1298.     in other government documents.  These agencies also provide a range of
  1299.     sample and national summary data directly from their website. Online
  1300.     statistics have not yet been organized, so I rather expect browsing the
  1301.     website for free information will be unwise, unless you are looking for
  1302.     simple national data.
  1303.     ___________________________________________________
  1304.                     This document continues as Part 3/6
  1305.     ___________________________________________________
  1306.     Copyright (c) 1998-2001 by David Novak, all rights reserved. This FAQ
  1307.     may be posted to any USENET newsgroup, on-line service, website, or BBS
  1308.     as long as it is posted unaltered in its entirety including this
  1309.     copyright statement. This FAQ may not be included in commercial
  1310.     collections or compilations without express permission from the author.
  1311.     Please send permission requests to david@spireproject.com
  1312.  
  1313.