home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / internet / info-research-faq / part1 next >
Encoding:
Internet Message Format  |  2004-04-18  |  66.1 KB

  1. Path: senator-bedfellow.mit.edu!dreaderd!not-for-mail
  2. Message-ID: <internet/info-research-faq/part1_1082200966@rtfm.mit.edu>
  3. Supersedes: <internet/info-research-faq/part1_1079601013@rtfm.mit.edu>
  4. Expires: 31 May 2004 11:22:46 GMT
  5. X-Last-Updated: 2002/04/17
  6. Organization: none
  7. From: david@spireproject.com (David Novak)
  8. Newsgroups: alt.internet.research,sci.research,alt.answers,sci.answers,news.answers
  9. Subject: Information Research FAQ v.4.7 (Part 1/6)
  10. Followup-To: poster
  11. Approved: news-answers-request@mit.edu
  12. Summary: Information Research FAQ: Resources, Tools & Training
  13. Originator: faqserv@penguin-lust.MIT.EDU
  14. Date: 17 Apr 2004 11:28:22 GMT
  15. Lines: 1251
  16. NNTP-Posting-Host: penguin-lust.mit.edu
  17. X-Trace: 1082201302 senator-bedfellow.mit.edu 569 18.181.0.29
  18. Xref: senator-bedfellow.mit.edu sci.research:24078 alt.answers:72507 sci.answers:15952
  19.  
  20. Archive-name: internet/info-research-faq/part1
  21. Posting-Frequency: monthly
  22. Last-modified: April 2002
  23. URL: http://spireproject.com
  24. Copyright: (c) 2001 David Novak
  25. Maintainer: David Novak <david@spireproject.com>
  26.  
  27.                        The Information Research FAQ
  28.  
  29.             100 pages of search techniques, tactics and theory
  30.           by David Novak of the Spire Project (SpireProject.com)
  31.  
  32.  
  33.     Welcome. This FAQ addresses information literacy; the skills, tools and
  34.     theory of information research. Particular attention is paid to the
  35.     internet as both a reservoir and gateway to information resources.
  36.  
  37.     This FAQ is an element of the Spire Project, the primary free reference
  38.     for information research and an important source for search assistance.
  39.     Do visit http://spireproject.com . It is free and compliments this FAQ
  40.     with links, forms and tools.
  41.  
  42.     This FAQ resides with pictures at http://spireproject.com/faq.htm and
  43.     as text at http://spireproject.com/faq.txt
  44.  
  45.     ***    The Spire Project also includes a 3 hour public seminar titled
  46.     ***    Exceptional Internet Research. This is a fast paced seminar
  47.     ***    supported with a great deal of webbing, reaching to skills and
  48.     ***    research concepts beyond the ground covered on our website and
  49.     ***    this FAQ. http://spireproject.com/seminar.htm has a synopsis.
  50.     ***    I am in Europe, seminaring in Ireland, and Europe though I
  51.     ***    will be returning to the US shortly, and South Australia for
  52.     ***    a seminar this October.
  53.  
  54.  
  55.     Enjoy,
  56.     David Novak - david@spireproject.com
  57.     The Spire Project : SpireProject.com and SpireProject.co.uk
  58.  
  59.     . . Prelude.
  60.     1 .
  61.     . . . . . . Everyday searching has a simple approach.
  62.     2 .
  63.     . . . . . . Searching for specific, quality information demands a more
  64.     complex approach.
  65.     3 .
  66.     . . . . . . Let's understand how information is arranged on the
  67.     internet.
  68.     4 .
  69.     . . . . . . Each format (book, article, web, etc...) has unique search
  70.     tools and resources.
  71.     5 .
  72.     . . . . . . Specific guidance on libraries, discussion groups and other
  73.     venues.
  74.     6 .
  75.     . . . . . . Review and discuss types of information in specific fields.
  76.     7 .
  77.     . . . . . . Boolean, proximity, field searching, Dewey and patent
  78.     classification.
  79.     8 .
  80.     . . . . . . Quality depends on source, currency, search process,
  81.     reliability...
  82.     9 .
  83.     . . . . . . Commercial information industry, libraries and the
  84.     info-broker.
  85.     10 .
  86.     . . . . . . Information moves and evolves in fascinating ways.
  87.     11 .
  88.     . . . . . . Steps to improve an online search.
  89.     12 .
  90.     . .
  91.  
  92.  
  93.  
  94.                                  Prelude.
  95.  
  96.     Many of us unwittingly digest great amounts of information in the
  97.     course of a day. Our information needs are more modest and usually
  98.     repetitive. When we have questions, we reach for a small collection of
  99.     preferred information sources close at hand with a collection of
  100.     assessments as to what is credible and trusted.
  101.  
  102.     As a child, these sources include the school library, an encyclopedia
  103.     and parents. All the sources are trusted.
  104.  
  105.     As an adult, these sources include the state library, the newspaper,
  106.     bookstores and current magazines. Adults understand truth has become a
  107.     little more relative, but when the evening news declares presidential
  108.     hopeful George W Bush is ahead by 3% (on a sample of 707) we slip into
  109.     thinking he is leading.
  110.  
  111.     There is more to information literacy. It is, after all, a profession.
  112.     There are tools you know nothing about and techniques you have never
  113.     heard of. There is a specialized vocabulary just made to confuse you.
  114.     Research, or rather information research (to distinguish it from
  115.     lab-coat style research) is so very much more involved.
  116.  
  117.     Yet there is great simplicity to research too. Just under the murky
  118.     mist of confusing resources rests a solid platform to stand on. In any
  119.     one field there are just a handful of databases, directories and
  120.     periodicals to consider. After decades of library and information
  121.     industry evolution, clearly valuable sources have already floated to
  122.     the top, monopolizing their respective fields. Most cities have just
  123.     one or two primary newspapers. Large industries like book publishing
  124.     have few book databases and a handful of primary book distributors.
  125.  
  126.     Enters the internet: not so much a change of information as a
  127.     revolution in access to information. Previously you could justify
  128.     having just a handful of preferred information sources because these
  129.     were the sources easily available. Today, and the future, is filled
  130.     with information close at hand. We are dropped into a morass of
  131.     competing information just waiting to capture our attention, and strain
  132.     both our capacity to absorb information and our capacity to understand
  133.     the differences between sources.
  134.  
  135.     A great segment of our community will fall back to tried and true
  136.     information sources they grew up with: state library, bookstore, local
  137.     newspaper. The better alternative sources will be ignored for no
  138.     particular reason. The rush of the information revolution will push
  139.     past them. They will only hear of changes when their information needs
  140.     suddenly change - and they are confronted with a vast collection of
  141.     unfamiliar options, and struggle with understanding what sources they
  142.     need.
  143.  
  144.     A smaller segment of our community, by virtue of frequently tackling
  145.     questions best answered with unfamiliar sources, will be driven to
  146.     understand the information world: to become truly information literate.
  147.  
  148.     There is another story here too. The way our society handles
  149.     information is undergoing some very fascinating changes. Any
  150.     predictions for the future should acknowledge the tension and flow of
  151.     information in our society. Take, for example, the vast surplus of
  152.     information emerging on the internet, and the convulsions of the
  153.     commercial information industry in response. Rather than focusing on
  154.     how information is organized, we can also focus on how information
  155.     becomes organized. The who, where and why of information, the
  156.     sociological perspective, adds meaning to the phrase "information
  157.     revolution".
  158.  
  159.                         - - - - - - - - - - - - - -
  160.     It was another warm day. The young Egyptian boy strode purposely out
  161.     the gate towards the river. The Nile was low this time of year. Very
  162.     abundant with fish and bird life. With luck, Shakh would return at
  163.     sunset with food for the pantry. Mother would be pleased with that.
  164.  
  165.     Shakh knew fishing had changed little over the last hundred years. The
  166.     walls of his family's ancestral home had just such a scene of his
  167.     grandfather fishing on the Nile from a small reed boat. The thinly
  168.     carved relief was complete with spear, fish, ducks and Shakh's
  169.     grandmother nearby holding lotus flowers.
  170.  
  171.     Shakh stopped by old-man Jacob on his short walk to the bank of the
  172.     Nile. He liked the old trader. Years ago Jacob had traveled to the
  173.     Levant and brought back many strange artifacts. Some even came as far a
  174.     field as the Harrapan people who were said to live beyond Sheba, across
  175.     the waves, some three years journey away. He especially liked the small
  176.     black head carved in a style so unlike anything else Shakh had seen.
  177.  
  178.                         - - - - - - - - - - - - - -
  179.  
  180.     The Harrapan people lived on the banks of the great Indus river in
  181.     modern-day Pakistan. A great civilization almost on par with the
  182.     Sumerians and the more distant Egyptians, very little remains today.
  183.     They built vast cities of clay brick with rectangular city blocks. They
  184.     built drains, public toilets and state granaries. They were the first
  185.     to populate the Indus river valley. (see
  186.     http://www.harappa.com/indus2/index.html)
  187.  
  188.     Little remains. The Harrapan civilization fell with the arrival of the
  189.     Aryan race and the intervening millennia treated their past poorly. The
  190.     arrival of Islam erased much of their history as did the shifting Indus
  191.     river itself. The British used the bricks from one ancient city in the
  192.     construction of a great railway. Only today are the archaeological digs
  193.     once again unearthing the past.
  194.  
  195.     I search for Harrapa on the internet. Nothing special, just type
  196.     'Harrapa' into any of the popular search engines and I uncover
  197.     harrapa.com, a website devoted to some recent information from these
  198.     digs. Looks good. Pictures of ancient pots. Children's toys. A map to
  199.     an ancient city.
  200.  
  201.     Of course, Shakh would have known of the Harrapan civilization. While
  202.     it is uncertain ancient Egyptian ever visited in person, goods and
  203.     rumors traveled far from trader to trader. Ancient Egyptians, while not
  204.     accomplished conquerors abroad, did travel and mix with distant
  205.     peoples.
  206.  
  207.     Shakh lived in a civilization centuries distant from us, yet both you
  208.     and Shakh know a similar amount about the Harrapan civilization. The
  209.     intervening years have not made everything clear. Even the information
  210.     revolution has not changed the facts. Both you and Shakh have just a
  211.     single source of information about the Harrapan civilization. You have
  212.     the pictures on harrapa.com and our short excerpt here. Shakh has the
  213.     old-man's art object to look at, the old-man's myth of a civilization
  214.     beyond the waves.
  215.  
  216.     This story carves the act of searching in deep relief. Searching is a
  217.     skill, a trade and to some a profession. It is also just a simple task
  218.     of finding information - something we do every day, in so many ways,
  219.     without any of the difficulties we will get into later in this FAQ.
  220.  
  221.     The difficulties only emerge when you want to do something spectacular.
  222.     Should you wish to know something specific about the Harrapan
  223.     civilization, or understand something contentious - then we require a
  224.     greater degree of expertise and experience. The search becomes a
  225.     challenging adventure in its own right.
  226.  
  227.                         - - - - - - - - - - - - - -
  228.     The Nile was always a slow river but three months out of the year it
  229.     burst its banks and flooded the fields, bringing life on the banks of
  230.     the Nile to a complete halt. For these three months Shakh's family
  231.     would move into the ancestral home in the streets surrounding the great
  232.     pyramids. It was an old home, centuries old. Well suited to their needs
  233.     with a storeroom for food, separate rooms for the parents, and an
  234.     active social life in close proximity to others. In many ways, this was
  235.     the most exciting time for young Shakh. For the rest of the year he
  236.     lived in relative isolation in the village by the Nile. For these three
  237.     months, he lived in a city, bustling with activity, construction and
  238.     recreation.
  239.  
  240.     Shakh had expected this year to be like the last but his father secured
  241.     Shakh an important position - he would be in training to become a
  242.     scribe. Father had grand plans for young Shakh, plans that extended far
  243.     beyond life as a scribe. What's more, with luck and further prosperity,
  244.     Shakh's father had the means to secure his further advance.
  245.  
  246.                         - - - - - - - - - - - - - -
  247.  
  248.     Much of ancient Egypt is available for us to read off the walls of the
  249.     many remaining buildings. They were not a literate nation, yet were
  250.     able to adorn almost everything with writing and pictures. They lived
  251.     in the most enlightened society of the day. Years later, Egypt would
  252.     gift the fledgling Hellenic state a full third of their Greek
  253.     vocabulary.
  254.  
  255.     This is part of the reason for such an interest in travelling to Egypt.
  256.     It is the visual symbols that inform us and draw us in so deeply.
  257.     Standing before the great religious statues, we begin to feel how it
  258.     was to live and work in that day. To run amok as a young student,
  259.     waiting for the Nile to subside once again.
  260.  
  261.     Yet, there is much more to knowing ancient Egypt than just the
  262.     monuments and wall reliefs. Years of study has recovered their lost
  263.     language of hieroglyphs. Years of archaeology has unearthed their daily
  264.     lives.
  265.  
  266.     History and Archaeology are fine examples of searching in practice.
  267.     Both fields struggle openly with the bias and uncertainty each new fact
  268.     brings forth. Malta is a small island off the coast of Sicily, close to
  269.     Tunisia. Should evidence emerge of ancient Egyptians living on Malta,
  270.     what does it mean? Was Malta an Egyptian conquest or an occasional
  271.     station for their fishing fleet?
  272.  
  273.     This uncertainty applies to all information, in all situations. One of
  274.     the first events for the new regime in Pakistan was to acknowledge that
  275.     important national statistics, like the national GDP figures, had been
  276.     fudged to a serious and significant degree. Important national
  277.     statistics are not intrinsically true because of their source. This is
  278.     not a problem solely of underdeveloped nations. Rumor suggests that
  279.     during the height of Singapore's land value bubble their national
  280.     figures were unreliable too.
  281.  
  282.     Searching is a skill and an attitude. In this FAQ we progressively
  283.     unfold the way information is found. Initially, let's cover a simple
  284.     way to find information; a structured approach to an everyday problem.
  285.     Afterwards, we shall look more closely, and with more complexity, at
  286.     the world of information.
  287.  
  288.  
  289.  
  290.                            Searching is Simple.
  291.                                  Section 1
  292.  
  293.     Searching is simple. It starts with a question. It ends with an answer.
  294.     Everything between is searching. Much of it has to do with the tools
  295.     you use. Select the right tool and you can get to the answer almost by
  296.     default. Luckily, for any given topic there tends to be just a handful
  297.     of must-use tools. For more complicated questions, there are usually
  298.     plenty of people to ask for assistance.
  299.  
  300.     The answers you are seeking will be found in a selection of different
  301.     formats. In this I mean books, articles, interviews, and more. This is
  302.     a very convenient concept and forms the foundation to all our work both
  303.     here and in the Spire Project. Few research tools cover more than a
  304.     single format; those that do, tend to cover each format poorly. Start a
  305.     search by selecting the specific format you are seeking. Then, select
  306.     your preferred search tool from a small collection specific to that
  307.     format. To get the information, simply follow through and read, search
  308.     or interview. Everything follows naturally.
  309.  
  310.                              Have a Question.
  311.                              Select a Format.
  312.                            Select a Search Tool.
  313.  
  314.     There are just a few formats to consider.
  315.  
  316.     Books
  317.     . . . . . Dense, factual, comprehensive and a minimum of 6 months to a
  318.     year old.
  319.     Articles
  320.     . . . . . Shorter than books but focused on one topic.
  321.     News
  322.     . . . . . Short and shallow. Immediate.
  323.     Statistics
  324.     . . . . . Factual. More reliable.
  325.     Theses
  326.     . . . . . Very thick. Deeply researched. Esoteric.
  327.     Webpages
  328.     . . . . . Immediate, mixed quality, with limited factual support.
  329.     Interviews
  330.     . . . . . Immediate, varied quality, partly digested.
  331.  
  332.     Each format has a selection of simple tools to find information. Many
  333.     of these tools will be on the internet - which may mean easily
  334.     accessible. A word of caution: try not to confuse search tools that
  335.     happen to be on the internet with searching internet information. The
  336.     Amazon.com book catalogue is a search tool useful in locating books.
  337.     Though on the web, searching Amazon is part of a book search, not a web
  338.     search. A search of the Reuters newswire is a news search, not a web
  339.     search, even though Reuters releases current news on the web. Each
  340.     format should remain distinct in your mind.
  341.  
  342.     Tools to Find Books
  343.     1) Some books, particularly classics, are free on the internet through
  344.     efforts like Project Gutenberg.
  345.     2) Libraries allow you to read books. Library catalogues are frequently
  346.     online.
  347.     3) The largest libraries, like the Library of Congress and the British
  348.     Library, list millions of books in their online catalogues.
  349.     4) Most currently available 'in print' books are listed in national
  350.     Books-in-Print databases.
  351.     5) Each country maintains a special government publication database.
  352.     6) Lastly, online bookstore catalogues like that of Barnes & Noble,
  353.     list a sizeable portion of current in-print books.
  354.  
  355.     Tools to Find Webpages
  356.     1) Global search engines index hundreds of millions of webpages for
  357.     free text searching. Consider Altavista and All-the-Web.
  358.     2) Global directories list resources by category. Consider Yahoo or the
  359.     Open Directory Project.
  360.     3) Regional search engines and directories focus more tightly on
  361.     regionally important topics.
  362.     4) Lastly, more specialized search tools, from search engines which
  363.     focus on specific topics (like maths or government webpages), services
  364.     which link you to important topic-specific websites, and services which
  365.     manually review websites, all can take you further.
  366.  
  367.     Tools to Find News
  368.     1) Current news is found in newspapers and the evening news. News clips
  369.     can be delivered electronically, or purchased through specialist news
  370.     clipping services.
  371.     2) Newswires redistribute regional news to a larger audience. Many
  372.     newswires release their text news free online.
  373.     3) Specialized search engines like NewsBlip and TotalNews aggregate
  374.     current online news.
  375.     4) State libraries archive past copies of regional papers.
  376.     4) Individual newspapers maintain libraries of previous articles. Many
  377.     are available as commercial databases.
  378.     5) Larger commercial databases unite the news from many prominent
  379.     newspapers. These databases of news articles stretch back many years.
  380.  
  381.     This story is repeated with all the formats information comes in.
  382.  
  383.     To drum this in with repetition, searching starts with a question.
  384.     Select the format (book, news or webpage). Next, select one or more
  385.     tools from our short list of search tools for that format. Want to
  386.     understand the lifecycle of the spider? A book should prove useful.
  387.     Let's look at either our local library book catalogue or a big
  388.     commercial bookstore catalogue like Barnes & Noble (http://bn.com).
  389.  
  390.     Search. Read. Voila, the lifecycle of the spider.
  391.  
  392.     If searching appears a little boring at this point, you have not
  393.     visited a library recently. The excitement comes in finding the
  394.     information. The rest is dull indeed.
  395.  
  396.                         - - - - - - - - - - - - - -
  397.  
  398.     The information revolution washes over us, picks us up and pushes us
  399.     forward like so much driftwood. From now on our lives will forever be
  400.     awash with information. We will eat it. Breathe it. Live in it. Drown
  401.     in it. Some of us will even learn to live for it. Those most capable
  402.     will have the skills to search, sift and sort information.
  403.  
  404.     The information revolution is not about primary research, lab coats and
  405.     discovery. It is about a surplus of information. The searching we have
  406.     just discussed is not a particularly creative process. Simple searching
  407.     is not sufficient to deal with the great tide of information moving
  408.     against us. But then, simple searching lacks finesse. Simple searching
  409.     is, well, simple.
  410.  
  411.     Searching is one of those most delightful tasks where skill is
  412.     everything. A search without talent will give you just a taste. Like
  413.     pottery perhaps. Anyone can get something but only an expert can
  414.     accomplish wonders. Quality information, reliable answers, effective
  415.     coverage of resources; it takes skill to get to this level.
  416.  
  417.     Advances in technology and the delivery of search assistance has made
  418.     searching easier than ever before. Many search tasks can be
  419.     accomplished without any experience. With more challenging questions a
  420.     novice will get results - results they will be proud of. But not
  421.     results they should be proud of. With experience, you will recognize
  422.     how much more is possible.
  423.  
  424.     Let's proceed by adding a little more complexity.
  425.  
  426.  
  427.                            Searching is Complex
  428.                                  Section 2
  429.  
  430.     Your value as a searcher is directly related to the number of resources
  431.     you can reach for quickly, and your skill at phrasing a research
  432.     question. Consequently, as a searcher, you will work hard at building
  433.     ready access to a range of resources. You also work hard at
  434.     understanding the special characteristics of collections of
  435.     information.
  436.  
  437.     The technical name for complex searching is 'Information Research'. I
  438.     prefer to think of information research as an effort to locate answers,
  439.     efficiently. Information Research is not vague browsing of available
  440.     information for something that interests you. It is not browsing the
  441.     library bookshelf or reading the newspaper, nor is it internet surfing.
  442.     Information research is searching with a purpose ... and it is hard
  443.     work.
  444.  
  445.     Research is also an art form. The skills, tools, and resources we work
  446.     with are only the canvass and paints of an artist. Research extends
  447.     from commercial, legal, reporting, through the skills of interviewing,
  448.     database searching, and research analysis using books, articles,
  449.     experts and patents. Research is so large a field, involving so many
  450.     skills, tools and resources, you will quickly find you do not wish to
  451.     learn it all.
  452.  
  453.     At the heart of information research lies a simple motto: "Someone,
  454.     somewhere, probably knows the answer."
  455.  
  456.     To quote The Information Broker's Handbook (Sue Rugge and Alfred
  457.     Glossbrenner): "As information brokers, we shouldn't consider ourselves
  458.     capable of providing solutions... What we 'can' provide, and what sets
  459.     a really good information broker apart from the rest, are resources. We
  460.     can provide the client with the kinds of information he or she needs
  461.     ... that make it possible for individuals to solve their problems."
  462.  
  463.     Let this sink in. We are not experts in the field we are researching.
  464.     Collecting information on the moons of Jupiter? Do not pretend to be an
  465.     astronomer. We are only experts at the tools for gathering information.
  466.  
  467.     A Quick Introduction to Effective Searching.
  468.  
  469.     1) Searchers work hard to properly frame the question.
  470.     2) Searchers know the technology, know where to look.
  471.     3) Searchers know you can ask.
  472.  
  473.     Step One: Properly Frame the Question
  474.     The preparation of your question is critical. There is a galaxy of
  475.     difference between a young student asking, "I am interested in trees",
  476.     and a specific, attainable question like "Where would I find a tree
  477.     surgeon I can talk to?"
  478.  
  479.     The information sphere is very large and rather confusing. Each item of
  480.     information has aspects of authenticity, accuracy, reliability, and
  481.     bias. Information comes in many formats: interviews, books, articles,
  482.     statistics. We learn about information from many sources: literature,
  483.     discussion, resource lists, experience. There are also personal issues:
  484.     budget, time, depth and purpose.
  485.  
  486.     With all this to think about, we must be very careful about each
  487.     question we ask. This issue is vital once we start an article search,
  488.     and can easily mean the difference between 5 concise articles, and
  489.     hundreds of general articles. The essence of our question is the manner
  490.     with which we approach the information sphere. The question directs our
  491.     efforts.
  492.  
  493.     One key is to treat searching as an art, much like painting or
  494.     photography. The true mark of an artist, and the primary step wanna-be
  495.     artists miss, is visualizing what you want before you begin.
  496.  
  497.     When searching, sit down and visualize what a successful search would
  498.     look like in this situation. How many pages? How many documents? What
  499.     kind of authors and what kind of quality of document? Go through the
  500.     whole gamut of different types of research tools and describe it. Would
  501.     a simple three-line newspaper article be a success? Would a 20-year-old
  502.     dissertation be acceptable? Would a short conversation with an expert
  503.     suffice? Would all three together suffice? (This approach works
  504.     exceptionally well with internet research too.)
  505.  
  506.     If you can phrase a question in a way that lends itself to your
  507.     resources, you are far more likely to get the answers desired. Oddly,
  508.     this often means you are asking for places where the information
  509.     resides rather than asking directly for the information.
  510.  
  511.     A novice starts with a question like, "What can I do for my exceptional
  512.     child?" You should rephrase this question immediately. "What resources
  513.     will help me help my exceptional child." These are both valid questions
  514.     but the second question has a distinct answer - the first is far too
  515.     vague. Other questions could be "What are other parents doing for their
  516.     exceptional child?" or "Who can help advise me on how to teach my
  517.     exceptional child."
  518.  
  519.     Now we shape the question to get precise answers. "Where do I find a
  520.     definitive list of associations?" (or a search for "+association
  521.     +directory") works much better than, "What association works with
  522.     exceptional children?" What about, "Who would know of associations for
  523.     exception children?" and, "Are there pamphlets of advice for parents of
  524.     exceptional children?" and, "What umbrella organizations/specialist
  525.     libraries exist for exceptional children?"
  526.  
  527.     Questions are not right or wrong, just better or worse at illuminating
  528.     certain aspects of the answer. Make sure your questions illuminate
  529.     something useful.
  530.  
  531.     There are ways to frame questions for commercial databases, for
  532.     research assistance, for interviews, for getting the truth from to your
  533.     children. Your skill in phrasing the question has a lot to do with the
  534.     results. Poor questions tend to come back and haunt us later when you
  535.     miss relevant information. Set aside ample time to refresh and reframe
  536.     your questions.
  537.  
  538.     Step Two: Know the Technology, Know Where to Look.
  539.     Research rests on understanding the technology and an awareness of the
  540.     resources. In the example above, a directory of associations does
  541.     exist. Here in Australia it is the "Directory of Australian
  542.     Associations", found in most important Australian libraries. The
  543.     Australian "Department of Education" has a major interest in promoting
  544.     exceptional children. In Western Australia, Infolink, a community
  545.     information service, should have a record of major community groups for
  546.     exceptional students. I have no direct knowledge of umbrella
  547.     organizations or specialist libraries, though I expect both the
  548.     education department and Infolink would. A quick search of some large
  549.     libraries may help us find some of the pamphlets.
  550.  
  551.     Knowing of specific resources is helpful. It is great if you live next
  552.     door to the president of Mensa. You have easy access to someone
  553.     knowledgeable, able to give his or her take on the situation.
  554.  
  555.     Knowing the tools to help you find resources, the meta-resources, is
  556.     vital. So what if we do not know exceptional students come under the
  557.     Department of Education. Do we know who to ask to find the government
  558.     department involved? If you do not know of the directory of
  559.     associations, who or where would you look for one? Being unfamiliar
  560.     with meta-resources is a serious handicap - you will find yourself
  561.     searching hours for something a professional would do on the phone
  562.     while drinking coffee.
  563.  
  564.     Keep in mind the Spire Project is dedicated to providing you some of
  565.     this experience. Our web articles should suggest directions to look.
  566.     But there are limits to how we can help. At some point you simply must
  567.     sit down with the Kompass Directory, or the Gale Directory of
  568.     Databases, or the Australian Bureau of Statistics library, and become
  569.     familiar with getting to all the relevant information.
  570.  
  571.     Another must, for all searching, is experience searching electronic
  572.     databases with complex research queries - a difficult task only made
  573.     better with practice. As a general rule, if you don't use Fields,
  574.     Proximity and Boolean search terms, you are doing it wrong. Most people
  575.     do it wrong.
  576.  
  577.     Step Three: Know You Can Ask.
  578.     There is very little mystery about professional research. Lots of
  579.     people are experienced in different aspects of this field. My personal
  580.     weak point is in direct interviewing where as I am a pioneer in
  581.     secondary resource research. This is OK. In fact I use this liberally
  582.     to determine the skill of professional researchers - do they know their
  583.     own limits? The field is much too large to be an expert in all its
  584.     aspects.
  585.  
  586.     The positive site to this is many people welcome requests for help. I
  587.     enjoy asking librarians questions. I also ask my customers, my
  588.     suppliers and other professional researchers. Never get caught in the
  589.     trap of feeling you know what to do. The joy in this profession is that
  590.     most people do not expect you to be an expert in their field, just an
  591.     expert in your field: particularly the meta-resources. Even if it
  592.     requires a polite reminder, customers will appreciate you asking them
  593.     for likely keywords in difficult searches. I always make a habit of
  594.     asking librarians if I am missing something. A librarian is always
  595.     fluent in their collections and I frequently locate real gems this way.
  596.     (As an example, my state library arranges computer books in two sets,
  597.     one Dewey and another in an alternative structure. Who would have
  598.     guessed?)
  599.  
  600.     Especially if you are just a student, always keep your ears open. You
  601.     will frequently find yourself in the presence of some expert in some
  602.     facet of research telling you something you already know. Consider
  603.     carefully before you interject... Your expert may be about to explain
  604.     something new to you.
  605.  
  606.     Information research is a dedication to learning. At its heart is a
  607.     collection of specific research skills, an awareness of research tools,
  608.     and a gifted mind. - Oh, and a large amount of coffee. Without
  609.     knowledge of and access to relevant research-worthy resources, your
  610.     research will be severely limited and doubtful. This is why much of
  611.     your work becoming an effective researcher involves learning about the
  612.     resources and meta-resources for your field. Much of our work in the
  613.     Spire Project is drawing your attention to relevant resources.
  614.  
  615.     Before we progress to specific resources for specific formats (books,
  616.     webpages, news), let us attack head on the role of the internet in
  617.     information research. This should surprise you.
  618.  
  619.  
  620.  
  621.                            The Internet Format.
  622.                                  Section 3
  623.  
  624.     As Shakh became more proficient with writing, father wrote more
  625.     frequently of the family deity. Horus, the falcon god, had long watched
  626.     over his family. Horus sees all, his father would write, and even
  627.     across the many miles separating you from us, Horus will watch over you
  628.     and keep you close. It was a great comfort to Shakh to have the family
  629.     deity looking after him.
  630.  
  631.     Shakh too devoted himself to a life of watching and knowing.
  632.  
  633.                         - - - - - - - - - - - - - -
  634.  
  635.     We have discussed how information comes packaged in certain
  636.     standardized formats like books, articles or news clips. Each format
  637.     has particular qualities and standards that reflect the way the
  638.     information is prepared. For example books are dense, factual,
  639.     comprehensive and a minimum of 6 months to a year old.
  640.  
  641.     So how can we apply this newfound wisdom to the internet?
  642.  
  643.     Let's start at the beginning. The internet is an inexpensive and
  644.     pervasive system for the delivery of data. It is also the medium of a
  645.     dramatic shift in the way we access information.
  646.  
  647.     A (1) dramatic drop in the cost of publishing is fuelling (2) the
  648.     liberation of information from previously closed systems, leading to
  649.     (3) an emergence of alternative funding for certain public resources
  650.     and (4) an eagerly awaited 'direct to consumer' commercial information
  651.     industry.
  652.  
  653.     The first mental knot to untie is the separation of internet resources
  654.     into distinct formats. Electronic books share most of the qualities of
  655.     books published on paper. News stories found on the web share all of
  656.     the qualities of news in your local newspaper. The fact they are
  657.     electronic or appear as webpages has nothing to do with it. News is
  658.     news. Electronic books are almost books.
  659.  
  660.     But if online news is news, and online books are almost books, and both
  661.     are not internet formats, what is an internet format?
  662.  
  663.     The search-by-format method is a concept to simplify and understand the
  664.     many information resources which exist in the world. The concept is
  665.     only as valuable as it is successful at enlightening us. As to the
  666.     internet, we have more to learn, but could safely divide the internet
  667.     into several formats at this time, perhaps webpages, online discussion
  668.     and ftp resources. Yet this is largely superficial. The real value
  669.     comes from understanding the qualities of different types of webpages.
  670.     We shall divide the webpage format further.
  671.  
  672.     Must we really learn this?
  673.     You would be pardoned for equating searching and the internet. Much of
  674.     the hype surrounding internet search tools builds the illusion that the
  675.     skill of searching can somehow be distilled computationally then
  676.     delivered to you electronically. Through the wonders of modern science,
  677.     you can have the best information at your finger tips without having
  678.     learn anything of search technology.
  679.  
  680.     This is a pervasive lie (or marketing fiction). The electronic research
  681.     industry has been around for decades and has worked on this problem for
  682.     some time. No upstart internet guru has invented a technique to
  683.     suddenly transform the search process. Such thinking would work in
  684.     section two (Searching is Easy) but is the first illusion we must
  685.     shatter for you to progress.
  686.  
  687.     Case in point, Lycos and All-the-Web search engines use the same
  688.     database of webpages. This database is growing rapidly, it stood at
  689.     350,000,000 webpages in June 2000 and hopes to reach one billion
  690.     webpages by the end of 2001. It stands as a grand achievement in
  691.     organization, right?
  692.  
  693.     Wrong. Years ago I was using a unified database of news called Global
  694.     Textline (no longer available but replaced by others). It had an
  695.     astounding four billion news articles available for advanced text
  696.     searching! Four billion news items, representing many years of news
  697.     from all over the world. This was superficially 10 times the size of
  698.     the current All-the-Web search engine.
  699.  
  700.     No, the internet does not even hold the record for being the largest
  701.     information field. Oh, it will surely surpass the quantity of
  702.     commercial information, and superficially we could say it may already
  703.     have achieved this. But the internet is not a new medium for
  704.     information research. It is emerging as a new resource, not a new
  705.     phenomenon.
  706.  
  707.     The internet is a new medium for business - most businesses have never
  708.     incorporated the immediacy or global nature of internet involvement, so
  709.     considerable rethinking is required. The internet is a new medium for
  710.     publishing for almost all of us; very few of us published
  711.     electronically before the internet emerged. The internet is NOT a new
  712.     medium for research. Information researchers have been working
  713.     electronically for years. The internet is just a new resource we can
  714.     reach for with strengths, weaknesses and peculiar traits we must
  715.     appreciate.
  716.  
  717.     By way of an example, let us compare Link Analysis as used in Google
  718.     and Raging (of Altavista) with the process of editorial vetting as used
  719.     in scientific journals.
  720.  
  721.     Through the magic of link analysis, we can make certain assumptions
  722.     about the value of a webpage by adding up the number of other pages
  723.     linking to that page. In its simplest form, webpages with at least 100
  724.     inbound links from other websites are judged to be quality, valuable
  725.     resources. A webpage without any inbound links has the suspicion of
  726.     being of poorer quality. After all, no one has thought it valuable
  727.     enough to add a link to their further resources page.
  728.  
  729.     This logic has some serious shortcomings. Firstly, the process rewards
  730.     long-term projects that have been online long enough to earn links. A
  731.     brilliant new webpage would have few links - yet. It would be ranked
  732.     poorly, undeservedly. Secondly, link analysis rewards websites over
  733.     webpages. The pages with the most links are often homepages. Rating
  734.     homepages over second level webpages works at odds to keyword
  735.     searching. Our keywords will be found in specific, perhaps second-tier
  736.     webpages. Links go to the top level. Thirdly, link analysis is a mass
  737.     market, popular technique. You are banking on the intellectual finesse
  738.     of a mass of mindless computer users much like yourself. It is the same
  739.     kind of popular democratic selection that votes B-grade actors into the
  740.     presidency.
  741.  
  742.     Let's contrast this with the process of editorial vetting used in
  743.     scientific journals. Each article is reviewed by a selection of
  744.     knowledgeable peers who understand the topic is great depth. Each
  745.     article is further improved by the editing of the journal editors, and
  746.     by self-editing, for there is great competition and prestige at stake.
  747.     Only a handful of the many submissions are judged worthy and appear in
  748.     the printed journal. Success places the successful in the standard of
  749.     record; stamped with an external statement of truth and importance.
  750.  
  751.     Of course, the logic of editorial vetting also has shortcomings.
  752.     Firstly, the process is time and effort intensive. Many of the most
  753.     important journals will delay six months or more between submission and
  754.     publication. In our digital era this is increasingly unacceptable.
  755.     Secondly, the number of submissions accepted are at odds with the pace
  756.     of development. So much more happens in the world than can be digested
  757.     in this manner. Thirdly, editorial vetting supports the clannish
  758.     behavior leveled against the upper echelons of science. New and novel
  759.     developments have difficulty floating to the top if the peer review
  760.     process should not be open to new ideas.
  761.  
  762.     If link analysis is popular and democratic, editorial vetting is
  763.     elitist and autocratic. Both approaches have pros and cons.
  764.  
  765.     Once you have absorbed the drama between link analysis and editorial
  766.     vetting, please do not retain the belief that your search needs will be
  767.     completely solved for you. Searching is a complex, overgrown garden and
  768.     its time to get your hands dirty.
  769.  
  770.     So what does the internet have to do with searching?
  771.     The internet changes searching in two ways. Firstly, the webpage is a
  772.     new format to contend with.
  773.  
  774.     "Webpages are often of unknown age, of only guessed at quality and
  775.     potentially the easiest information to retrieve. There are many points
  776.     of entry to web resources but search tools differ. Try to match your
  777.     search tool to your question."
  778.                                  (See http://spireproject.com/webpage.htm)
  779.  
  780.     The internet is also a conduit to many of the pre-existing tools for
  781.     searching other formats (books, news, interviews).
  782.  
  783.     With an internet connection, we can reach database retailers and many
  784.     commercial quality databases like LOCOC, ERIC, MOCAT and AGIP directly
  785.     from the source. We can also remotely search the catalogue of most
  786.     libraries in the world. These are not new resources, just new ways to
  787.     reach them.
  788.  
  789.     In this day of interconnectivity and change, it is too tempting to
  790.     declare the information industry is in rapid flux. Everything I have
  791.     learned suggests this is not so. There are some changes associated with
  792.     new channels but by and large the process of searching for information
  793.     remains the same.
  794.  
  795.     Let's look briefly at news as an example. News articles are written by
  796.     the reporter, sold to international newswires which then distribute
  797.     these stories to interested newspapers and news channels, that
  798.     incorporate the news into your newspaper or evening TV news.
  799.  
  800.             Journalist - Newswire - Newspaper/News show - You.
  801.  
  802.     News would also be added to commercial databases of past news. These
  803.     databases are then provided to database retailers like Dialog or
  804.     Lexis-Nexis who sell occasional access to you.
  805.  
  806.   Journalist - Newswire - Commercial Database - Database Retailer - You.
  807.  
  808.     With the internet, newswires have also provided their text news to
  809.     online sites. Text news is thus available for you to browse or search.
  810.  
  811.             Journalist - Newswire - Internet News Sites - You.
  812.  
  813.     I draw your attention to several facts. The fundamental nature of the
  814.     industry has not changed. Journalists and newswires still impart upon
  815.     the news the same nature as before. It is short, shallow, immediate. It
  816.     is created to journalistic standards.
  817.  
  818.     If you wish to search past news, you must still reach for the
  819.     commercial database, most likely through a database retailer. Searching
  820.     for news online only goes back two weeks at most.
  821.  
  822.     Lastly, to date only the text format for news is widely disseminated.
  823.     Sometimes a couple of pictures are included but the visual news, as
  824.     used in the evening news on TV, is sure to remain priced beyond public
  825.     consumption.
  826.  
  827.     So what has changed? There is another venue for you to pick up the
  828.     news. There are opportunities for new databases to be created, some of
  829.     limited time (like totalnews.com - a database of current news on other
  830.     websites). Little else has changed. The creation and dissemination of
  831.     news remains pretty much as before the internet arrived.
  832.  
  833.     Let us look even more briefly at book publishing. Books are produced by
  834.     authors, improved by editors, published by publishers, marketed by
  835.     bookstores, then purchased by you.
  836.  
  837.              Author - Editors - Publishers - Bookstores - You.
  838.  
  839.     Today we have a couple of new online bookstores - and a large number of
  840.     new old online bookstores (existing bookstores now selling online). We
  841.     have a collection of free books online (largely classics like
  842.     Shakespeare, which strangely, were immediately published as really
  843.     inexpensive paperback classics available in airports everywhere).
  844.  
  845.     There are also a range of very useful commercial quality book databases
  846.     which have become free to search online. I am thinking the government
  847.     publication catalogues (MOCAT [US], AGIP [Australia] and Stationery
  848.     Office Online Catalogue [UK]) and the online catalogues for the Library
  849.     of Congress (LOCOC) and the British Library.
  850.  
  851.     Lastly, the online catalogue to the large bookstores like Barnes and
  852.     Noble, Amazon and The Internet Bookshop (UK's WHSmith) can provide a
  853.     free and fast database of books in print, though not as good as the
  854.     commercial Books-in-Print databases. Of course, any local bookstore
  855.     will offer to search books-in-print for you, so this is not as
  856.     revolutionary as it might at first appear.
  857.  
  858.     In summary, we have a collection of recently discounted book databases
  859.     we can more easily search, we have additional sites to buy books, and
  860.     little else. The creation and dissemination of books remains pretty
  861.     much as before the internet arrived. Has the book industry changed? Not
  862.     really.
  863.  
  864.     The most remarkable change has been the emergence of group discussion
  865.     online, the emergence of a new format for information (like the
  866.     webpage) and the opportunities to connect faster to a whole range of
  867.     pre-existing searchable resources.
  868.  
  869.     This is the reason why we discuss searching-by-format. Later, at the
  870.     end of this FAQ, we return to this topic and show that the real
  871.     revolution is not in resources or industry or search tools but a
  872.     revolution in immediate access. Access, it turns out, enriches the art
  873.     of searching.
  874.  
  875.     Pessimistically.
  876.     On counterpoint, as an information resource, the internet can still be
  877.     much too limited for many situations. If we are not careful, searching
  878.     the internet becomes no better than browsing the shelf of your state
  879.     library.
  880.  
  881.     What most impresses me about the internet is the promise of changes in
  882.     the future. The internet as a system suggests radical improvements to
  883.     the current decade-old systems that have attained their search-worthy
  884.     status. What impresses me most are the improvements mostly still in the
  885.     future, not yet proven, set to remain promising ventures for a time.
  886.  
  887.     This is not to say internet research can not be rewarding. In some
  888.     fields like computer studies, the internet has already surpassed parity
  889.     with books, articles and associations. Just when you will consult the
  890.     internet as a research-worthy resource depends on cost, effort, and the
  891.     quality of the information returned. This judgement call requires more
  892.     than a little experience.
  893.  
  894.     Value is important. I sincerely hope we can suppress our enthusiasm for
  895.     free information in favour of a truer appraisal of the value of
  896.     information. Make no mistake, commercial information is brilliant. It
  897.     is almost heresy to even compare commercial information with the
  898.     results of a few hours on the internet.
  899.  
  900.     Internet Information Theory
  901.     Let us agree the internet is great fun to surf but more challenging
  902.     when you have a specific question in mind.
  903.  
  904.     To improve our search skills, we begin by understanding how information
  905.     is arranged on the internet. Contrary to myth, information is not
  906.     disorganized but rather organized very carefully along clear patterns.
  907.     Many patterns are specific to the information format (text document,
  908.     webpage, email message, printed article). Further patterns match the
  909.     way we become aware of information, or are specific to the information
  910.     systems (mailing list, FAQ, peer-reviewed journal). Your understanding
  911.     of the strengths and weaknesses of each pattern, each format, each
  912.     system, guides your search for information. We shall start by
  913.     shattering the internet, and commenting on the many pieces.
  914.  
  915.     Three Definitions of the Internet
  916.     Do be careful when using the word 'internet'.
  917.  
  918.     1_ The internet is a physical network; more than a million computers
  919.     continuously exchanging information. The internet allows us to transfer
  920.     information around the world.
  921.  
  922.     2_ The internet is a landscape of information available on almost every
  923.     topic imaginable. This information appears almost chaotically
  924.     distributed to the world but holds clear patterns. For instance,
  925.     linking information together are various structures like government web
  926.     links, search engines and FAQ documents.
  927.  
  928.     3_ The internet is a community of 500+ million individuals. These are
  929.     real people who choose to interact, discuss and share information
  930.     online.
  931.  
  932.     In this example, let me just draw your attention to the way most of our
  933.     research effort focuses on the second definition: a landscape of
  934.     information. Much of the best information originates in the third
  935.     definition: the internet is a community. Sometimes it is far more
  936.     effective to ask real people than search the information cyberspace.
  937.  
  938.     What I just mentioned is not so important as the technique I just used.
  939.     I broke the large seemingly chaotic system into smaller pieces: pieces
  940.     that hopefully make more sense. Eventually, when we've made sense of
  941.     the little bits, perhaps we can comment astutely on the big-picture.
  942.  
  943.     Information, transaction, entertainment
  944.     There is a triad of functions to all online activity:
  945.  
  946.     Function      -  Activity  -      Unit
  947.     ----------------------------------------
  948.     Information   -  Research  -  The Fact or Conclusion
  949.     Exchange      -  Business  -  The Transaction
  950.     Entertainment -  Play      -  The Experience
  951.  
  952.     Each internet function grows at a different rate and moves in a
  953.     different direction. The development of forums is firmly in the
  954.     smallest segment dealing with information. This segment is quite poorly
  955.     organized and confusing. The entertainment function in contrast is well
  956.     financed and graphically innovative with clear, profitable
  957.     opportunities.
  958.  
  959.     Much of the web is prepared with Exchange or Entertainment in mind.
  960.     "Brochureware" (purely promotional webpages) is rarely required for
  961.     research but is critical to securing a transaction. Entertainment
  962.     related or just entertaining websites abound. Let us recognize just how
  963.     few webpages are information & research related.
  964.  
  965.     My own experience suggests we are just beginning to see the movements
  966.     towards profiting from providing information. Direct selling of
  967.     information is still chaotic and unrewarding.
  968.  
  969.     Information Formats
  970.     The way information is packaged has a great bearing on the content,
  971.     quality and use of the information. This theme is evident throughout
  972.     the work of the Spire Project, and is particularly applicable to
  973.     internet information. Webpages, text files, software, email and
  974.     database entries each have particular qualities. Each shapes,
  975.     constrains and restricts the informative content. These particular
  976.     qualities apply irrespective of the information involved.
  977.  
  978.     Books are dense, factual, a little old. Articles are short, sharp, more
  979.     recent. News is puff, introductory, immediate. Each way the information
  980.     is packaged, each format, presents the information to set standards.
  981.  
  982.     Information formats on the internet are the same. Webpages are
  983.     graphical, technical to produce, and not easily updated. FAQs are
  984.     easier to maintain, text only, and attract more peer review. Mailing
  985.     lists are simpler still, text, short, immediate, very peer-reviewed,
  986.     characterized by discussion and resource discovery. Newsgroups are
  987.     characterized by extremely low costs, vulnerable to trashing, poorly
  988.     managed. Email is simple use, one-to-one discussion.
  989.  
  990.     Let's look at books more closely. Books are created by authors who have
  991.     something to write. Books are printed and marketed by Publishers to the
  992.     bookstores that then provide it to the readers. Each facet of this
  993.     process defines the resource. Books have quality, editorial vetting but
  994.     minimal peer-review, marketable value and a potentially lengthy
  995.     preparation time.
  996.  
  997.     When it comes to research, why look for a book when investigating
  998.     digital money? Books would just have the wrong qualities - would
  999.     present the information poorly. We need a more current format (digital
  1000.     money is a fast moving topic), and a more peer-reviewed format (books
  1001.     have editorial vetting but not intrinsic peer-review). Why not search
  1002.     for a mailing list, an FAQ, or an association website. These formats
  1003.     have qualities more appropriate to our question.
  1004.  
  1005.     Information Preparation
  1006.     Information flows also impress patterns on internet information. Most
  1007.     information is transplanted to the web - first created elsewhere. The
  1008.     source of information imparts as much pattern as the eventual format
  1009.     the information takes.
  1010.  
  1011.     Information may appear as a webpage, and conform to our expectations
  1012.     for all webpages but the information may have been prepared from the
  1013.     discussion on a mailing list - and thus enjoy a more topical, specific,
  1014.     timely and peer-reviewed quality.
  1015.  
  1016.     Let's look at FAQs. The best resource in the world on copyright law is
  1017.     the musings of a group of copyright lawyers who form the copyright
  1018.     mailing list. The copyright FAQ supported by this group is a logical
  1019.     document summarizing much of the discussion of this mailing list. FAQs
  1020.     are vetted by the news.answers team, then automatically mirrored around
  1021.     the world. From its origins in the mailing list, the FAQ is a
  1022.     peer-reviewed document, often full of links to further resources,
  1023.     topical, knowledgeable and factual. As an FAQ, the document is not
  1024.     immediate, graphical or financially rewarding (some FAQs stagnate).
  1025.  
  1026.     Only some internet information is created within the internet
  1027.     environment. The concept of 'brochureware' describes the common traits
  1028.     to promotional webpages directly prepared from paper promotional
  1029.     brochures.
  1030.  
  1031.     One of the more exciting trends is the movement of information from the
  1032.     dusty shelves of government offices and association libraries to their
  1033.     more accessible websites. The quality of information retained in your
  1034.     average government agency, from quality research reports, to detailed
  1035.     studies, to current industry monitoring is very high. These qualities
  1036.     are then brought over to the web format. Such web-documents tend to be
  1037.     isolated (not linked to other related resources) and perhaps a little
  1038.     behind the time line but of a generally high quality.
  1039.  
  1040.     An exciting holistic view of the internet information landscape is
  1041.     based on these descriptions. Imagine, for a moment, information flowing
  1042.     through a collection of systems. At certain points, information groups
  1043.     together, and generates new, perhaps higher quality information, which
  1044.     then flows in a different system, a different direction, to different
  1045.     people.
  1046.  
  1047.     The flow of information from one person to another, from one format to
  1048.     another, imprints qualities to the information along the way. Each
  1049.     organization, or subsequent re-organization, imparts specific styles
  1050.     and conventions and quality to the result.
  1051.  
  1052.     Publishing Motivation
  1053.     Let us proceed to a third set of patterns. Information appears on the
  1054.     internet for one very specific reason. Someone Publishes (DUH). The
  1055.     motivation behind publishing colours the information. This is a pattern
  1056.     we can use to quickly judge the contents of a webpage.
  1057.  
  1058.     Ask yourself who is publishing, and why.
  1059.  
  1060.     One of the biggest publishing segment a year ago were individuals
  1061.     publishing documents derived from their personal expertise. A typical
  1062.     document would be one with minimal peer review, a list of aging links
  1063.     to further resources, simple graphics, variable to short length, prone
  1064.     to bias but moderately reliable because the publisher knows their topic
  1065.     well. These pages are often located on web pages with private
  1066.     sub-directories (usually starting /~name/).
  1067.  
  1068.     Commercial sites publish mainly for the promotional value. Their
  1069.     secondary purpose is to provide sales information to prospective
  1070.     clients. Rarely do commercial sites go beyond this. Commercial webpages
  1071.     often reside on their own domain name, as a .com, or in sub-directories
  1072.     - without the tilde symbol. Commercial sites also tend to age badly.
  1073.     They are very noticeable from their front page.
  1074.  
  1075.     Government agencies are emerging as valued publishers. Slowly their
  1076.     dormant information becomes available through this new medium.
  1077.     Currently almost all government documents on the internet also appear
  1078.     in print, meaning they are factual, exhaustively reviewed, tend to be a
  1079.     little old (but age well), and come from highly paid knowledgeable
  1080.     people who believe it is their duty to inform others. Such documents
  1081.     are lengthy and appear on .gov domains.
  1082.  
  1083.     These patterns are simple to see.
  1084.  
  1085.     Grant-funded projects create brilliant research resources and hold much
  1086.     promise in pushing the limits of this technology. I am eager to see the
  1087.     results of the US Patents project, and appreciate the value of having
  1088.     Supreme Court rulings on the internet. Often such projects focus deeply
  1089.     on content. Most projects reside on educational servers and are widely
  1090.     discussed within knowledgeable groups.
  1091.  
  1092.     Associations publish association-kind-of-things. Most are initially
  1093.     just like the commercial webpages. With time such sites become much
  1094.     more factual and research-worthy. Most associations are dedicated to
  1095.     developing awareness of their chosen topic, albeit coloured by their
  1096.     chosen bias. Few associations are significant publishers but in time,
  1097.     this segment will begin to liberate dormant information within
  1098.     associations.
  1099.  
  1100.     Let's summarize. The key is to always watch who is the publisher. We
  1101.     can assume a great deal, quickly. We are unlikely to find the latest
  1102.     changes to patent law from government or commercial publishers. Such
  1103.     organizations are simply not motivated to present such information.
  1104.  
  1105.     Promoting Information
  1106.     Publishing is one achievement but you and I will never read any
  1107.     information until we learn it exists. This simple fact creates even
  1108.     more patterns to internet information. Knowledge of information moves
  1109.     through set routes on its way from writer to reader.
  1110.  
  1111.     Promotion is not simple. It is a process that takes time, effort and
  1112.     perhaps money. Information without serious promotion tends not to be
  1113.     promoted far from the source. Another way to phrase this; you must
  1114.     search close to the source to find poorly promoted information.
  1115.  
  1116.     A search engine indexes pages relatively indiscriminately. This also
  1117.     means a site of quality is not likely to reach your attention. The odds
  1118.     are not good, and from a promotion point of view, search engines
  1119.     generate minimal traffic to your webpage. Search engines also drop you
  1120.     rather randomly into a website. It is often necessary to move up a
  1121.     directory to understand the purpose and motivation of a site you find
  1122.     interesting.
  1123.  
  1124.     Information published through advertising tends to have a financial
  1125.     payoff for the promoter. This kind of information tends to be
  1126.     promotional information. Brochureware.
  1127.  
  1128.     The alternatives are to promote a webpage or website through one of the
  1129.     referral tools. Each such tool accepts links on some criterion. Each
  1130.     tool you use to locate information also selects particular types of
  1131.     information for your attention.
  1132.  
  1133.     If you arrive at a document by recommendation through a mailing list,
  1134.     the document is likely to be recent, on-topic and specific to the
  1135.     purpose of the mailing list. Alternatively, (for poor mailing lists) it
  1136.     will be wildly off topic and trash. You are unlikely to see referrals
  1137.     to old documents or documents of historical importance. These are the
  1138.     qualities most acceptable to the mailing list environment.
  1139.  
  1140.     Directory trees, FAQs, guidebooks and related promotion tools all work
  1141.     as historically important documents. In the past, such resources list,
  1142.     describe and alert people to relevant information for the field.
  1143.     Slowly, over time, this function becomes acknowledged, reinforced and
  1144.     promoted. Time is the essence of this fame.
  1145.  
  1146.     Webpages or websites found through historically important documents, by
  1147.     their nature, tend to be long lasting websites with lasting importance
  1148.     in the field. Such documents point to other similar documents or
  1149.     websites that have achieved a long-lasting importance. You are unlikely
  1150.     to find specific documents but rather sites that focus or bring
  1151.     together information. In short, there is little motivation to link to
  1152.     specific webpages, when a link to an important website is just as good.
  1153.  
  1154.     Similar generalizations can be made of each type of promotional tool,
  1155.     and become important in rapidly seeking our information which matches
  1156.     our intention, as well as summarizing the likely motivation, and bias,
  1157.     of webpages we are interested in.
  1158.  
  1159.     Information Clumps
  1160.     Information Clumps. Information is created, nurtured, develops, gets
  1161.     transplanted, gets arranged and then becomes visible through a process
  1162.     which brings similar information together.
  1163.  
  1164.     As we have discussed, there are factors deeply affecting all
  1165.     information on the internet. Motivation, Preparation, Format and
  1166.     Promotion all define the quality and content of any given item of
  1167.     information. With so many influences, we should not be surprised to
  1168.     learn information naturally groups together. In reality, there is
  1169.     nothing natural involved - it is a social phenomenon reinforced each
  1170.     time you and I visit or read one resource but not another.
  1171.  
  1172.     History can explain some aspects of internet development. As a small
  1173.     collection of sites become dominant in particular fields, by collecting
  1174.     and delivering better content to more people, new sites find it
  1175.     progressively more difficult to capture attention. This dynamic works
  1176.     for websites reaching out for visitors, and discussion groups reaching
  1177.     out for subscribers. In each case, seniority counts.
  1178.  
  1179.     Seniority counts in several ways too. Promotion is directly related to
  1180.     quality, interest, traffic and time. The longer a site is active, the
  1181.     better the footpath develops, the more people visit. Secondly, quality
  1182.     content is directly related to access to quality content, peer review,
  1183.     and time/money. Important existing sites gain in every way.
  1184.  
  1185.     This results in a grand system where the first-in, best-dressed, can
  1186.     capture the high ground and secure a grand lead in awareness and
  1187.     footpath over competitors who follow. Yahoo is a prime example of a
  1188.     directory tree, not even the best in most areas, which has achieved
  1189.     unparalleled traffic & awareness.
  1190.  
  1191.     This competition is equally evident where no money is involved. Perhaps
  1192.     your association wishes to create a new referral website, or an open
  1193.     mailing list, or an informative guide. All sound concepts, effective
  1194.     projects. However, if older, established resources exist, the work will
  1195.     be long and arduous.
  1196.  
  1197.     Despite the marketing message, the internet is not a world where the
  1198.     best information floats to the top. The internet will not let you to
  1199.     reach millions. You must compete for the attention, participation,
  1200.     devotion and assistance in a manner very similar to building a
  1201.     business.
  1202.  
  1203.     In concrete terms, information clumps on the internet. The best
  1204.     resource could appear on any internet system (webpages, email mailing
  1205.     lists, ftp-archives, FAQs, online databases, newsgroups...) but we can
  1206.     be fairly certain the best information will congregate in just one or
  1207.     two. Consider this as an application of the 80:20 rule. 80% of the good
  1208.     information will be found on 20% of the formats, arranged concisely by
  1209.     20% of the search tools.
  1210.  
  1211.     Consider our article "Searching the Web"
  1212.     (http://spireproject.com/webpage.htm). We progressively search
  1213.     different web tools, looking for the most worthy. Searching the
  1214.     internet is the same. You must touch each system to see which system is
  1215.     dominant, where the information is congregating for your topic.
  1216.  
  1217.     Bringing this together
  1218.     In summary, we have broken down and discussed various qualities of
  1219.     published information and promoted information. We have made sweeping
  1220.     generalizations and educated guesses about information on the internet.
  1221.     Now what?
  1222.  
  1223.     When a painter begins to paint, they have already visualized some of
  1224.     the image. They already have a concept of the finished result. Internet
  1225.     research is no different. We start by building a vision of the
  1226.     information we seek. Who would publish it? Where would I find it? What
  1227.     is its motivation? How would we find it? We now have a practical
  1228.     vision.
  1229.  
  1230.     The address is one of the keys. The web address (or URL - Uniform
  1231.     Resource Locator) for any item of information gives us a surprising
  1232.     amount of information - particularly as we are making generalizations
  1233.     about information patterns. We can guess if information resides on a
  1234.     personal webpage, a funded university project, or a commercial project.
  1235.     The information resides on a .gov website? - the quality is likely to
  1236.     be higher and conform to our expectations of government resources.
  1237.  
  1238.     We use this new-found experience in three ways. Firstly, we restrict
  1239.     our searches to the most likely sources. Secondly, we quickly jump
  1240.     through lists of resources (such as those generated by search engines)
  1241.     to the sources that match our expectations. Thirdly, our assessment of
  1242.     information quality can be guided by our snap-judgements of its origin
  1243.     and purpose.
  1244.  
  1245.     Internet newcomers often expect to have instant access to the latest
  1246.     information at the touch of the button in beautiful colour and peer
  1247.     reviewed quality prose. Who is publishing this? Where is this
  1248.     information coming from? Who would help us find this? Such a vision is
  1249.     fantasy. If we were instead to look for an association website,
  1250.     dedicated to a certain type of research, or an informed newsgroup,
  1251.     maintained by people passionate about sharing this technology, then we
  1252.     have made four steps forward. We are clear about where to look for the
  1253.     answers we seek, and we will know quickly if the answers are online.
  1254.  
  1255.     Let us now leave this discussion on internet organization and internet
  1256.     theory. This is tough newly discovered territory, more than a little
  1257.     rough. I fear it will make most sense to people with considerable
  1258.     experience with the internet. Let us now explore the fertile grounds of
  1259.     understanding more familiar formats like books and news.
  1260.     ___________________________________________________
  1261.                     This document continues as Part 2/6
  1262.     ___________________________________________________
  1263.     Copyright (c) 1998-2001 by David Novak, all rights reserved. This FAQ
  1264.     may be posted to any USENET newsgroup, on-line service, website, or BBS
  1265.     as long as it is posted unaltered in its entirety including this
  1266.     copyright statement. This FAQ may not be included in commercial
  1267.     collections or compilations without express permission from the author.
  1268.     Please send permission requests to david@spireproject.com
  1269.  
  1270.