home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / internet / info-research-faq / part6 < prev   
Encoding:
Text File  |  2004-04-18  |  70.1 KB  |  1,344 lines

  1. Path: senator-bedfellow.mit.edu!dreaderd!not-for-mail
  2. Message-ID: <internet/info-research-faq/part6_1082200966@rtfm.mit.edu>
  3. Supersedes: <internet/info-research-faq/part6_1079601013@rtfm.mit.edu>
  4. Expires: 31 May 2004 11:22:46 GMT
  5. References: <internet/info-research-faq/part1_1082200966@rtfm.mit.edu>
  6. X-Last-Updated: 2002/04/17
  7. Organization: none
  8. From: david@spireproject.com (David Novak)
  9. Newsgroups: alt.internet.research,sci.research,alt.answers,sci.answers,news.answers
  10. Subject: Information Research FAQ v.4.7 (Part 6/6)
  11. Followup-To: poster
  12. Approved: news-answers-request@mit.edu
  13. Summary: Information Research FAQ: Resources, Tools & Training
  14. Originator: faqserv@penguin-lust.MIT.EDU
  15. Date: 17 Apr 2004 11:28:24 GMT
  16. Lines: 1324
  17. NNTP-Posting-Host: penguin-lust.mit.edu
  18. X-Trace: 1082201304 senator-bedfellow.mit.edu 576 18.181.0.29
  19. Xref: senator-bedfellow.mit.edu sci.research:24083 alt.answers:72512 sci.answers:15957
  20.  
  21. Archive-name: internet/info-research-faq/part6
  22. Posting-Frequency: monthly
  23. Last-modified: April 2002
  24. URL: http://spireproject.com
  25. Copyright: (c) 2001 David Novak
  26. Maintainer: David Novak <david@spireproject.com>
  27.  
  28.                   Information Research FAQ     (Part 6/6)
  29.  
  30.             100 pages of search techniques, tactics and theory
  31.           by David Novak of the Spire Project (SpireProject.com)
  32.  
  33.  
  34.     Welcome. This FAQ addresses information literacy; the skills, tools and
  35.     theory of information research. Particular attention is paid to the
  36.     role of the internet as both a reservoir and gateway to information
  37.     resources.
  38.  
  39.     The FAQ is written like a book, with a narrative and pictures. You have
  40.     found your way to part five, so do backtrack to the beginning. If you
  41.     are lost, this FAQ always resides as text at
  42.     http://spireproject.com/faq.txt and http://spireproject.co.uk/faq.txt
  43.     and with pictures at http://spireproject.com/faq.htm
  44.  
  45.     ***    The Spire Project also includes a 3 hour public seminar titled
  46.     ***    Exceptional Internet Research. This is a fast paced seminar
  47.     ***    supported with a great deal of webbing, reaching to skills and
  48.     ***    research concepts beyond the ground covered on our website and
  49.     ***    this FAQ. http://spireproject.com/seminar.htm has a synopsis.
  50.     ***    I am in Europe, seminaring in Ireland and Europe though I
  51.     ***    will be returning to the US shortly, and South Australia for
  52.     ***    a seminar this October.
  53.  
  54.     Enjoy,
  55.     David Novak - david@spireproject.com
  56.     The Spire Project : SpireProject.com and SpireProject.co.uk
  57.  
  58.  
  59.  
  60.                           Searching as Industry.
  61.                                  Section 9
  62.  
  63.     Of interest to you now, the internet offers you a very good look at the
  64.     information industry. Most organizations involved in the information
  65.     industry publish exhaustive product descriptions on the net. Most
  66.     commercial products are delivered electronically.
  67.  
  68.     Professional Search Resources
  69.  
  70.     As a profession, researchers have diverse skills and needs. Constantly
  71.     working with information, in a competitive market, professional
  72.     information seekers are often starved for high quality information
  73.     about new research techniques, skills and sources. This can be found
  74.     through discussion groups like BusLib-l, websites on library science
  75.     like LisNews.com, associations like the Association of Independent
  76.     Information Professional (AIIP) and the Society of Competitive
  77.     Intelligence
  78.     Professionals (SCIP), events and conferences as listed in the journal
  79.     Online & CDROM Review.
  80.  
  81.     As a more introductory resources, start with the a selection of books
  82.     and webpages like:
  83.     - The Intelligence Cycle[1], courtesy of the CIA library - a
  84.     single-page summary of the research process.
  85.  
  86.     - The Information Broker's Handbook by Sue Rugge and Alfred
  87.     Glossbrenner, McGraw-Hill. Third Edition (1997) - a must-read for those
  88.     interested in the business side of information research.
  89.  
  90.     - Secrets of the Super Searchers by Reva Basch. Unfortunately a 1993
  91.     book, but unique as a look into the field of information brokers.
  92.     Published by Eight Bit Books. (Dewey 025.524 BAS)
  93.  
  94.     - Online is a good bimonthly magazine for information brokers. (Dewey
  95.     025.04).
  96.  
  97.     There are a number of interesting periodicals, most owned and marketed
  98.     by Information Today Inc. BUBL lists a number more [2]. Others are
  99.     electronic publications, like LIBRES [3]: Library and Information
  100.     Science Research Electronic Journal, a biannual scholarly journal and
  101.     Information Research [4].
  102.  
  103.     The commercial databases of interest are LISA (Library and Information
  104.     Science Abstracts), ALISA (Australian LISA), Information Science and
  105.     Library Literature.
  106.  
  107.     The links for these resources and more are on the Spire Project at
  108.     http://spireproject.com/links.htm#3
  109.  
  110.     [1] http://www.odci.gov/cia/publications/facttell/intcycle.htm
  111.     [2] http://bubl.ac.uk/journals/lis
  112.     [3] http://aztec.lib.utk.edu/libres/
  113.     [4] http://www.shef.ac.uk/~is/publications/infres/ircont.html
  114.  
  115.                         - - - - - - - - - - - - - -
  116.  
  117.     The Professional Search
  118.  
  119.     Professional research demands a more effective, timely use of resources
  120.     at hand. It is challenging, and it is an occupation.
  121.  
  122.     Unlike research undertaken for your own needs, professional researchers
  123.     often know little about the topic they are asked to investigate. We may
  124.     not know the phrases which accurately describe a specific concept, we
  125.     sometimes don't recognize gold if its labeled copper, but we have to do
  126.     everything fast - lest the cost escalate above the expectation of the
  127.     client.
  128.  
  129.     Client? Yes, professional research starts with the client.
  130.  
  131.     Professional research involves far less book and library work, and far
  132.     more interviewing, database access and online article purchasing. When
  133.     money is involved, time becomes very precious. The first luxury lost:
  134.     the luxury to get to know the topic in leisurely detail.
  135.  
  136.     Instead, professional research starts with a careful description of
  137.     exactly what information is desired (and why). You must quickly build a
  138.     good plan about who you will ask and where you will look. This is,
  139.     after all, your primary skill others have great difficulty in
  140.     duplicating - traversing the information sphere swiftly and skillfully.
  141.  
  142.     Many researchers today can search databases. Most researchers are
  143.     familiar with library work. Personal research has the added benefit of
  144.     being part of the learning process. So why reach for a professional?
  145.  
  146.     The first unique skill we must refine is our knowledge of the research
  147.     tools. Computer databases may be easily accessible, but are not easy to
  148.     search. Interviewing is conceptually simple, but is not simple in
  149.     practice. Each aspect of research can and must be refined.
  150.  
  151.     The second unique skill: interpretation. Working with information
  152.     frequently allows us to better judge the reliability and bias of the
  153.     information we retrieve.
  154.  
  155.     Most information you find will be tainted. Secondary expertise almost
  156.     always present information in a biased way. You will counter this bias
  157.     both by being aware of the bias and by interviewing someone with a
  158.     different view. An inventor proclaims a devise in near completion - do
  159.     we believe? Obviously it requires further study. This is often lost on
  160.     amateur researchers - by collecting information from a variety of
  161.     different resources, with a range of bias, we can create a superior
  162.     assessment of the value of each item of information. Research based
  163.     solely on government research, no matter how well done, is
  164.     unprofessional.
  165.  
  166.     The third unique skill is speed. We must be able to provide research as
  167.     a service, as a business, quickly. This goes beyond research to the
  168.     banal work of copyright and legal protection, selecting effective
  169.     research tools, finding fast expertise to supplement your own.
  170.  
  171.     The skills of professional research are like the artist. They take a
  172.     lifetime to learn. The work is just business.
  173.  
  174.                         - - - - - - - - - - - - - -
  175.  
  176.     The Database Industry
  177.  
  178.     The commercial information sphere existed in the 1970's and earlier. It
  179.     is far more developed, far better organized, far better funded, almost
  180.     always far more valuable and expensive than every other research
  181.     resource.
  182.  
  183.     For the most part, commercial information is arranged reasonably
  184.     uniformly in large databases of full-text or bibliographic information.
  185.     Some databases are small, single source documents, while others are
  186.     vast unfocused collections of, for example, all the news from the last
  187.     15 years.
  188.  
  189.     Most directories and journals can be made into a database, but
  190.     single-source databases do not enjoy much financial success. The market
  191.     is too limited and the cost of promotion too high (except in a local
  192.     market with newspapers). To overcome this difficulty, single sources
  193.     are grouped together into larger collections of databases on a
  194.     particular topic. These large database groups have become primary tools
  195.     in commercial research.
  196.  
  197.     Developing these databases requires considerable expertise and expense.
  198.     Sometimes data requires abstracting, interpreting, and as with some
  199.     Lexis-Nexis and WestLaw databases, even expert legal interpretation.
  200.     Sometimes firms develop a portfolio of databases. Sometimes firms build
  201.     just one.
  202.  
  203.     The marketing and consumer billing of such databases is then provided
  204.     by a relatively small collection of large database retailers. A list
  205.     can be found in our "Commercial Databases" article. As an indication of
  206.     the size of this market, Knight-Ridder sold Dialog & Datastar for a
  207.     figure approaching half a billion dollars.
  208.  
  209.     This industry consisting of a wide collection of players, each
  210.     improving and developing the information from individual periodicals,
  211.     journals, news items - all very confusing for the end user. This is
  212.     elegantly illustrated by the database descriptions for Lexis-Nexis
  213.     databases (their preferred term is libraries). See
  214.     http://www.lexis-nexis.com/lncc/sources/ as an example of specific
  215.     databases. In particular, see their library on patents.
  216.  
  217.     Many single-sources appear in different commercial databases. Further,
  218.     different databases sometimes include different information from the
  219.     same single-source. One database may include just abstracts, another
  220.     may include fulltext, chemical indexing and more.
  221.  
  222.     As a result, most researchers are unfamiliar with what exactly is being
  223.     searched.
  224.  
  225.     This state of affairs is not unproductive. Searching a 'Database about
  226.     Patents', is uncomplicated. You receive information on patents. It is
  227.     simple, informative and incomplete. Of course, researchers are busy
  228.     people. Time is critical. Results matter. We are familiar with this
  229.     system from searching the web too. Just what are the differences
  230.     between All-the-Web, Lycos and Altavista? If we fully understood the
  231.     complexities of each available database, yet still have a few databases
  232.     to consider - would our search be better? Often not. This system of
  233.     incomplete information also leads to great customer loyalty to database
  234.     retailers. Comparative information is dropped in favour of simplicity.
  235.     Ultimately, I am hard pressed to compare prices let alone describe the
  236.     differences between information products.
  237.  
  238.     Prices actually model many a developed industry, remarkably similar to
  239.     the telephone or banking industry. As one friend commented, "bullshit
  240.     baffles the brains". The prices are complex on purpose. It becomes very
  241.     unrewarding to compare prices, and any conclusions are only valid in
  242.     specific circumstances - and will not hold in others. This trend,
  243.     familiar to us as a multitude of banking changes and telephone pricing
  244.     schedules, reinforces our need to stop price hunting and trust our
  245.     favoured information retailers.
  246.  
  247.     This is not to say we should not compare prices, just that you will
  248.     find comparing prices a most unrewarding experience. It really requires
  249.     you to search and retrieve the same information on different systems -
  250.     and this does not even begin to touch different databases, or database
  251.     groupings, or variables that change over time like download speeds.
  252.  
  253.     Optimistically, there are actually very few important databases in each
  254.     field. It may be simple to browse each of the databases in your field
  255.     and compare directly. You may never need to know more than a few
  256.     databases intimately.
  257.  
  258.     Realistically, you will yearn for a simpler solution.
  259.  
  260.     The commercial information industry has distributed information this
  261.     way for several decades. It is both sophisticated and quite difficult.
  262.     You will need to become experienced with inverted indexes, search
  263.     techniques (Boolean, truncation, proximity, field limits ...) and
  264.     properly phrasing the question in a way that will be answered by a
  265.     database search. I have always found the value of a database search
  266.     directly proportional to the length of the search query.
  267.  
  268.     If you are incompletely skilled at database research, you will take
  269.     longer, pay more and locate far more information (or unwisely discard
  270.     more) than desired.
  271.  
  272.     This is very different from searching Altavista and Webcrawler.
  273.  
  274.     Doing your own research offers an opportunity to more closely influence
  275.     the research process. Sometimes only you understand the topic and
  276.     sometimes you can more quickly discard unimportant details. Certainly
  277.     it is becoming simpler to undertake some work yourself.
  278.  
  279.     Many of the commercial databases are also available in a CD format.
  280.     Substantial subscription costs limit their availability to large
  281.     research institutions and libraries, but exceptions exist. I believe
  282.     world books in print costs AU$5000+. Provided you can find casual
  283.     access, it will cost you far less. Keep an eye on the age, though.
  284.     Sometimes (and only sometimes) online information is more recent.
  285.  
  286.     The decision between undertaking research on your own or seeking
  287.     external help is really a decision based on your research expertise,
  288.     your budget, your access to information, your time, and the importance
  289.     of finding all the information available. It also depends on your
  290.     access to some decent research assistance. I will soon be able to help
  291.     with this.
  292.  
  293.     What I do know is a newcomer to the commercial information sphere will
  294.     seriously underestimate the difficulty involved in searching, and
  295.     underestimate both the cost of research and the cost of research
  296.     assistance. Keep in mind this same system serves the needs of large
  297.     commercial conglomerates, professional legal research, and well
  298.     financed government studies. The commercial information sphere contains
  299.     far more valuable information than you need. Sometimes the internet is
  300.     just an interesting sneeze in comparison.
  301.  
  302.     ñ Article: The State of Databases Today:2000 by Martha E Williams,
  303.     tracts the development of this industry with survey results. Found as
  304.     the foreword of the Gale Directory of Databases.
  305.  
  306.                         - - - - - - - - - - - - - -
  307.  
  308.     Squeezing the Info-Broker
  309.  
  310.     I was reading an interesting article by Anthea Statigos in ONLINE [1]
  311.     that stirred me to thinking about the future of Information Brokerage.
  312.     The article in question outlined the shift of information brokers into
  313.     the marketing department, towards new roles in negotiating information
  314.     access licenses, helping people understand and select appropriate
  315.     resources - and oddly, in overseeing the intranet development process
  316.     so as to deliver the information people need.
  317.  
  318.     The article premise is rather accurate - as far as it goes. But I
  319.     wonder if the true message behind this shift is the decline and death
  320.     of information brokering as a profession? If information brokers (also
  321.     known as information professionals) are moving to new roles, are they
  322.     vacating the old roles, the traditional roles in the research process?
  323.  
  324.     In my library, I reach for the Information Broker's Handbook [2] for a
  325.     relevant quote:
  326.  
  327.     "The heart and soul of the information broker's job is information
  328.     retrieval. But many individuals offer information organization services
  329.     as well."
  330.  
  331.     So, Information Retrieval, and Information Organization. Anyone who has
  332.     seen the simple information retrieval options incorporated in recent
  333.     information packages can be in no mind that the information retailing
  334.     industry is certainly minimizing the need to reach for an intermediary.
  335.     Technology is certainly closing the gap - but this development has
  336.     always been in the cards.
  337.  
  338.     A central difficulty for information brokers is a simple maxim: provide
  339.     better results than clients doing the search themselves. Often working
  340.     in unfamiliar territory, a researcher may find it very difficult to
  341.     excel. There are two dilemmas here. Firstly, while we may pride
  342.     ourselves in accomplishing unique requests, we have expensive costs
  343.     associated with one-off searches. There is little likelihood someone
  344.     else will ask a similar question. There are simply no possible
  345.     economies of scale.
  346.  
  347.     Secondly, our search difficulty is not shared by the client. The client
  348.     has difficulty with the technology - certainly. The client does not
  349.     have difficulty with recognizing the wheat from the chaff, the gold
  350.     embedded in the articles and at a basic level, the search words you
  351.     will need to get to the right stuff.
  352.  
  353.     There is a very good reason why university students are pushed to learn
  354.     basic and sophisticated search technologies.
  355.  
  356.     There is another take on this story.
  357.  
  358.     Creating Value in the Network Economy [3] includes a chapter by Philip
  359.     Evans and Thomas Wurster.
  360.  
  361.     "emerging open standards and the explosion in the number of people and
  362.     organizations connected by networks are freeing information from the
  363.     channels that have been required to exchange it, making those channels
  364.     unnecessary or uneconomical."
  365.  
  366.     "Newspapers and banking are not special cases. The value chains of
  367.     scores of other industries will become ripe for unbundling. The logic
  368.     is most compelling - and therefore likely to strike soonest - in
  369.     information businesses ... All it will take to deconstruct a business
  370.     is a competitor that focuses on the vulnerable sliver of information in
  371.     its value chain."
  372.  
  373.     And in the back of my mind comes the thoughts that maybe the
  374.     information retrieval function we have been providing is just one such
  375.     information business. This business, attempting to be the pinnacle of
  376.     the research process, is ripe for unbundling. Not only can our function
  377.     be incorporated directly into the advertising and technology of the
  378.     information resources we use, but our skill can also be coded into
  379.     simpler and simpler guides and resources like my work on the Spire
  380.     Project.
  381.  
  382.     Perhaps as an industry we never managed to secure our captive market.
  383.  
  384.     Initially, this will affect that mainstay of information brokerage:
  385.     commercial database retrieval. And like the newspapers that will begin
  386.     lose the profit center of classified advertising (ripe for unbundling
  387.     and delivered electronically,) additional pressure will be applied to
  388.     the business of providing information research services.
  389.  
  390.     Eventually, we retreat to other areas as information professionals:
  391.     Information Organization, Research Education and Training.
  392.  
  393.     Somewhere in amidst this story lies a new role for researchers. The
  394.     need for research certainly exists and is forecast to grow dramatically
  395.     as the information age develops. What is lost, sadly, is an
  396.     understanding of the ease at which this work will be done. This is
  397.     certainly destined to move away from being an industry for
  398.     professionals working at $50/hr to $150/hr + costs! Others can provide
  399.     this work, easier than now. People we will most likely call researchers
  400.     - and not information brokers.
  401.  
  402.     This is more than a push towards specialization. There is another way
  403.     to see this transformation. The information broker was a retail point
  404.     for wholesalers who are now firmly selling directly to the consumer.
  405.     There is much less of a need for an intermediary between database
  406.     retailers and information consumers - and there is a firm trend in this
  407.     direction.
  408.  
  409.     Information brokers defined their role in the information industry as
  410.     masters of the difficult technology of research, capable of finding
  411.     most anything. Come to us when you are lost and we will find the
  412.     answers - for a price. We know the technology, the meta-resources, the
  413.     tricks used to find information. We routinely retrieve a higher quality
  414.     of information, far faster, than you can yourself. The standard model:
  415.     a library run service offering primarily database search & retrieval
  416.     for their patrons.
  417.  
  418.     This business model is coming to an end.
  419.  
  420.     Yes, perhaps the information broker is dead. Soon to be replaced with
  421.     low-wage researchers and research assistants, and high-end information
  422.     executives and research trainers. Like it or not, most of us will
  423.     incorporate a little more research into our current work, and reach for
  424.     a little more intelligible research resources. Everything else will be
  425.     accomplished by true specialists.
  426.  
  427.     [1] Online (a periodical with some coverage of library & information
  428.     research. July/August 1999 p71-73, by Anthea Statigos of Outsell Inc.
  429.     [2] The Information Brokers Handbook p.21, by Sue Rugge and Alfred
  430.     Glossbrenner. Windcrest/McGraw-Hill. 1992.
  431.     [3]Creating Value in the Network Economy, Edited by Don Tapscott.
  432.     Chapter 2: Strategy and the New Economics of Information by Philip
  433.     Evans & Thomas Wurster. p.18 & 25. A Harvard Business Review Book.
  434.  
  435.  
  436.                             Information Theory.
  437.                                 Section 10
  438.  
  439.  
  440.     The Information Service Industry
  441.     Private Detectives, Professional Database Researchers, Library
  442.     Researchers, Legal Researchers, Commercial Database Producers,
  443.     Commercial Database Retailers, Magazines, News Organizations,
  444.     Libraries, this is a big industry. Information Research is just a
  445.     process linking together people seeking information with people who
  446.     provide it.
  447.  
  448.     It seems in vogue to reconsider all businesses as being in the
  449.     information business. My accountant and your stockbroker both provide
  450.     information services. While I agree these two professions are intensive
  451.     users of information, I purchase their interpretation of information.
  452.     It is not a trivial difference but nonetheless serves to cloud the true
  453.     size of the industry just involved in selling you access to
  454.     information.
  455.  
  456.     From university days, I was aware of the large commercial database
  457.     retail giants (Dialog, Dun&Bradstreet) and the database producers. I
  458.     also met with some of the firms distributing largely to the library
  459.     market (like SilverPlatter). Little further information about these
  460.     businesses leaks beyond the research industry.
  461.  
  462.     Some of the businesses are aimed primarily towards the library
  463.     community. Database subscriptions are unlikely to interest an
  464.     individual. Few are appropriate to businesses. Let us briefly scan just
  465.     the products and services intended for a consumer.
  466.  
  467.     Commercial Database Retailers - These organizations devote their effort
  468.     at bringing commercial database information to individuals. Dialog,
  469.     Datastar, Infomart, Lexis-Nexis and others will assist you to access
  470.     information only available through commercial databases. (See our
  471.     article, "Commercial Databases".)
  472.  
  473.     Current News and Current Awareness - If you want to know of new
  474.     articles and news important to you as it is reported, then there are a
  475.     selection of services available: news by email, news by newsgroup, news
  476.     by periodic automated database search, and other novel approaches.
  477.     Costs for this service have fallen dramatically: effective solutions
  478.     start at about US$10/month and are not strictly dependent on range &
  479.     quality of information. (See our article, "Newswires & News
  480.     Databases".)
  481.  
  482.     Information Brokers - There is a whole industry of specialized
  483.     researchers who will try to locate and compile research to your
  484.     specifications. The backbone of this industry is payment for access to
  485.     commercial databases, but different information brokers will gladly
  486.     enter into any effort required to locate information. Information
  487.     brokers, business librarians, legal researchers and others all use the
  488.     tools described in this website, as a service for their clientele. (See
  489.     our article, "Research as a Discipline".)
  490.  
  491.     Patent Assistance - Patent searching is one of the more difficult
  492.     branches of serious research. Some of the resources are free on the
  493.     internet, and commercial patent databases are readily available through
  494.     the database retailers. If there is serious money at stake, you must
  495.     consider legal assistance. Certainly use lawyers for patent
  496.     applications (beyond the scope of the Spire Project). But a patent can
  497.     also be a research tool. Patent research can provide you with what is
  498.     often the first appearance of costly commercial research. This is both
  499.     a source of cutting edge solutions and competitive intelligence.
  500.  
  501.     Media Monitoring - Certain firms solely focus on monitoring TV, radio &
  502.     newspapers. These firms typically run teams who page through newspapers
  503.     looking for matching articles, then post or fax to the client. New
  504.     technologies are also advancing into this field.
  505.  
  506.     Document Delivery - Most local bookstores will gladly help you locate a
  507.     book from their directories but if you want a book from abroad, or an
  508.     article from a journal or magazine, you will need the assistance of
  509.     another set of information workers. A distinct but similar approach
  510.     assists with the distribution of journal articles. Many of the document
  511.     delivery firms are closely tied to information organizations. Little
  512.     information is available about these organizations.
  513.  
  514.                         - - - - - - - - - - - - - -
  515.  
  516.     Trends in the Information Sphere
  517.     For the past few years, individual database owners/maintainers have
  518.     been flirting with the idea of making paid access available through the
  519.     internet, rather than the existing system of allowing database
  520.     retailing firms to promote and market their databases. I have heard
  521.     rumours most database producers earn up to 30% of retail price when
  522.     delivered through database retailers - 70% being retained by the
  523.     database retailer.
  524.  
  525.     The internet is not a commercially viable alternative...yet, but some
  526.     databases have emerged with alternative funding despite this (Library
  527.     of Congress, ERIC, Medline). Others are creeping in around the edges by
  528.     offering subscribers access at a much reduced flat annual fee (Computer
  529.     Select at one time). I expect most database producers are waiting for a
  530.     meaningful way to charge. Digital money holds the key but despite the
  531.     hype, practical use appears to be a medium to long-term reality.
  532.  
  533.     A second trend is internet publishing itself. Gradually, the
  534.     information is getting easier to locate. (Don't laugh please - its
  535.     undignified.) We are also getting better at using the internet as a
  536.     tool to disseminate information. We have the very visible, if perhaps
  537.     short-lived, search engines but also other efforts like archives of
  538.     FAQs, archives of guidebooks, applying the Dewey decimal system to the
  539.     internet, specialist directories, subject guides, specialist search
  540.     engines. This will be a lively field for several years to come. As it
  541.     gets easier to locate the good information, perhaps the lines between
  542.     commercial quality and internet quality will begin to merge in places.
  543.  
  544.     The third trend is the very promising prospect of paying for
  545.     information by the page through the internet - viewing the results in a
  546.     web page immediately. There are some technical hurdles yet, but certain
  547.     elements are already appearing in ventures like DialogWeb. This step
  548.     may prove profitable for ATM vendors and owners of internet cafes, pubs
  549.     and kiosks. It will also herald a dramatic drop in the cost of
  550.     information.
  551.  
  552.                         - - - - - - - - - - - - - -
  553.  
  554.     Are We Developing an Informative Internet?
  555.     Several serious glitches have delayed the further improvement of the
  556.     internet as an effective information resource. Oh, sure it is the
  557.     world's largest library and thousands of new webpages are published
  558.     every hour. But this trite statement disguises how slow the informative
  559.     value of the internet is developing.
  560.  
  561.     Vision:
  562.     The internet holds so very much promise. Marketing mantras tell us so,
  563.     but few of us grasp this technology will completely rewrite the rules
  564.     of community, government and the exchange of intellectually valuable
  565.     information.
  566.  
  567.     One of the hurdles is vision. We are not yet delivering the information
  568.     pertaining to community, government and the exchange of intellectually
  569.     valuable (improved) information. We are only proceeding quickly with
  570.     market information and computer-related information. We are still
  571.     toying with further ways the internet can transform other areas of our
  572.     life.
  573.  
  574.     We should have achieved more by now.
  575.  
  576.     Organization:
  577.     The net is still very disorganized. A number of developments promise to
  578.     eventually make the internet less confusing and better organized. To
  579.     date, we have several cumbersome techniques, a large collection of
  580.     search tools and a great deal of potentially interesting links.
  581.  
  582.     Publishing:
  583.     As mentioned, thinking about who is publishing assists us with our
  584.     search. Applying this to where information is emerging - and we learn
  585.     much of the best information is not reaching the internet. Certainly,
  586.     the commercially generated information is not reaching the internet
  587.     (covered below). The large research studies paid for by public funds
  588.     and slowly aging on the shelves of government and non-government
  589.     organizations are also not coming online. Government, institutional and
  590.     commercial organizations primarily publish brochure-ware - as befitting
  591.     the presentation of market information. (Even offering to publish such
  592.     documents freely does not appreciably affect this trend as the
  593.     restrictions are not financial, but mindset. See our past work.)
  594.  
  595.     We should recognize few of the more valuable documents emerge online.
  596.  
  597.     Further Reading: Socially Responsible Publishing on the Internet ('97)
  598.     (Available on request)
  599.     A Census of Regionally Important Documents on the Web ('96)
  600.     (Available on request)
  601.  
  602.     Discussion:
  603.     The internet excites me with the promise of a real community rebirth
  604.     arising from this technology. For the first time in history we should
  605.     be able to discuss in an informed manner any number of issues from
  606.     crime to taxation. Tied into this are issues of government
  607.     transparency, international assistance, anti-corporate market reform
  608.     and community involvement. Unfortunately, my experience with mailing
  609.     lists and more recently with a newsgroup confirm the difficulties in
  610.     developing discussion. Discussion groups function as notice board.
  611.     Unfortunately, the difficulty in developing participation, and in
  612.     moderation, are just a little too cumbersome to be successful. For many
  613.     discussion groups, the chaff overwhelms the wheat, and the information
  614.     content is far from considerable.
  615.  
  616.     The financial rewards are also minimal for establishing and maintaining
  617.     discussion groups. Dramatic improvement to the informative value of the
  618.     internet is unlikely to emerge here.
  619.  
  620.     Further Reading: How to build a discussion on the Internet (by David
  621.     Novak - available on request.
  622.  
  623.     Rewards:
  624.     We have alluded to the importance of editorial and organization on the
  625.     internet. There are several severe limitations to this - first and
  626.     foremost the difficulty in gathering financial rewards for meaningful
  627.     work improving and organizing information.
  628.  
  629.     I am being circumspect here. There is money available - just not where
  630.     it is needed. The most important resources in professional research are
  631.     the contents of the commercial information sphere. This sphere existed
  632.     decades before the internet, is far better funded, and is far larger.
  633.     To compare commercial and internet information is almost heresy. A
  634.     bridge between these two, internet and commercial, emerges slowly.
  635.  
  636.     Digital money should grease the exchange of information by dropping the
  637.     cost of exchange considerably. Today, credit cards provide this
  638.     service. This works, at times, but digital money would allow for small
  639.     amounts of money to change hands. This appears to be a critical
  640.     threshold for bringing much of the commercial information to the net.
  641.  
  642.     About 5 years ago I was introduced to the Thesius Model - an economic
  643.     model to pay the intellectual investment in publishing and organizing
  644.     interactive multimedia. Years earlier there was Xanadu. While I have
  645.     serious reservations about both, they do illustrate the intellectual
  646.     foundations for effective use of a tool for exchanging small amounts of
  647.     money. It opens the doors to direct delivery of copyright work - which
  648.     in turn opens an effective economic model for publishing improved
  649.     information on the internet.
  650.  
  651.     Without digital money, proprietary information can only be exchanged
  652.     digitally by gift (that is free - the initial driving force of the
  653.     internet information sphere, or by credit-card purchase of access to
  654.     passwords to external networks - the current method of accessing
  655.     database retailers.
  656.  
  657.     This has the unfortunate effect of limiting the interest both of
  658.     internet users in the commercial information sphere and the commercial
  659.     information retailers in the internet. Oh, there is movement in both
  660.     directions, but not at the scale experienced in other industries.
  661.  
  662.     Further Reading: The UWA Theseus Project
  663.     (http://www.arts.uwa.edu.au/TheseusWWW/)
  664.     The Xanadu project (http://www.xanadu.com or concise summary -
  665.     http://www.sfc.keio.ac.jp/~ted/XU/XuPageKeio.html)
  666.  
  667.                         - - - - - - - - - - - - - -
  668.  
  669.     A Look at Information Congestion
  670.     Finding information on the internet is a skill. Finding information on
  671.     the commercial information sphere is also a skill. There is a great
  672.     degree of overlap. The awareness of the general public as measured by
  673.     use of commercial resources is very limited. This is further seen from
  674.     the simple use of search engines & the abundance of simple web search.
  675.  
  676.     To hammer this point in, let's take a momentary look at search engines.
  677.     Most searches end in 1000's of results: here are the first 10. Do you
  678.     really think the first 10 or 20 or 100 sites listed are particularly
  679.     better than the next? No - you have a random selection of resources. A
  680.     selection generated by computer based on the most simple of criterion.
  681.     (We should also mention how some search engines sell placement in
  682.     search results).
  683.  
  684.     Remarkably, the search engine is the much-vaulted entryway to the world
  685.     of information!?! Clearly search engines will not dramatically improve
  686.     the informative value of the net - not by themselves.
  687.  
  688.     Multiplication of Information
  689.     One complication of poor information organization is an inflation of
  690.     information overlapping nuggets. Information on the internet is so
  691.     difficult to locate we have almost a continual need for more
  692.     publishing. Information must exist in numerous locations to reach an
  693.     intended audience. Promotion of the simplest nature - recognition for
  694.     the best for a given topic - becomes exceedingly difficult. Only when
  695.     20 sites publish or report a given fact does it become accessible.
  696.  
  697.     Curiously, this is the state of affairs in the wider community.
  698.     Promotion is an expensive specialty. Numerous copies, distributors and
  699.     references are required to generate any kind of significant awareness.
  700.     Why should the internet be different?
  701.  
  702.     Actually, why should the internet be the same? Definitive like the US
  703.     Census Bureau have no need to duplicate this information; to have
  704.     alternative presentation sites. Yet such sites appear the exception.
  705.     Consider a search for the best resources for patent research, we are
  706.     greeted with 954 websites (Altavista search for "patent research"
  707.     Jan-19-2001). Presumably, most of these sites discuss patent research -
  708.     Right? There is no technical or theoretical need for such confusion. I
  709.     wonder if such duplication may be more of an affliction than natural
  710.     tendency.
  711.  
  712.     Justification:
  713.     It is relatively difficult to earn money from publishing improved
  714.     information, or organizing information already on the internet. Given
  715.     the intense interest in this technology, a collection of models have
  716.     emerged. A brief tour of these models will highlight the financial
  717.     limitations to improving the internet as an informative resource.
  718.  
  719.     - - - Working for fame (but not payment)
  720.     This model works well in open source software programming, and some of
  721.     this ethic certainly extends to publishing information.
  722.     Simple altruism/complete lack of justification
  723.     School students and internet novices in particular may not need to
  724.     justify anything. Unfortunately, such work is usually neither
  725.     consistent nor persistent.
  726.     - - - Commercial promotion
  727.     Promotional funds can be used to publish information. Most promotion is
  728.     short-sighted, limited to presenting market information (like product
  729.     information), but in time government and associations will fund
  730.     publishing in-house information for purely promotional reasons.
  731.     - - - Invested commercial businesses
  732.     There are certain commercial opportunities to earn money through banner
  733.     advertising and sponsorship.
  734.  
  735.     Direct payment for improved information (perhaps with digital money),
  736.     direct payment to authors (Theseus model, royalty systems), and direct
  737.     state sponsorship need not be necessary to fundamentally improve the
  738.     internet as an information resource. Academic peer-reviewed journals do
  739.     not pay for articles. Commercial periodicals are supported by
  740.     advertising, and the token subscription costs of magazines usually just
  741.     covers distribution costs. Fame motivates many efforts, not just
  742.     online, and we do not feel the need to habitually justify everything we
  743.     do.
  744.  
  745.     In no small way, as more people become adept at publishing quickly,
  746.     important information will move on the net faster. Similarly,
  747.     information will also gradually become better organized. Economic
  748.     models will not improve the informative value of the internet like
  749.     direct payment. Most current limitations have economic solutions.
  750.     Unfortunately, my reasoned opinion is no economic system will arrive in
  751.     time to make a difference.
  752.  
  753.     Conclusion
  754.     We know something of how information gets published, and how many
  755.     important documents do not reach the internet. We have described how
  756.     information is organized on the internet and how limited editorial
  757.     vetting and organization have given rise to certain traits which give
  758.     rise to the traits like superficial indexing, information duplication,
  759.     and a need for research skills.
  760.  
  761.     Financial rewards and financial tools are unlikely to solve these
  762.     difficulties. We can only hope for a gradual growing out of our current
  763.     difficulties. We will have more of the same for several years to come.
  764.     It is simply the nature of the internet (as currently constructed).
  765.  
  766.     For you, a greater understanding of the internet will assist you to
  767.     judge the worth, likely source and likely venues of the information you
  768.     seek. The same is true in the larger world... database, book & article.
  769.     Each has different traits and qualities, reinforced over time. Your
  770.     understanding of these traits and qualities in part defines your skill
  771.     as a researcher.
  772.  
  773.     As to the future of the internet, on the positive side, there are
  774.     certain qualities to internet communication that make it uniquely
  775.     valuable. Internet communication is inexpensive, relatively rapid, and
  776.     increasingly accessible. On the negative side, the internet is badly
  777.     vetted, potentially very time consuming, and up against very well
  778.     entrenched systems that have been running for either decades or
  779.     millenniums (considering databases or books). Elements like a promised
  780.     but functionally absent digital money, and the lack of a meaningful way
  781.     to recoup the costs of vetting online information, make matters worse.
  782.     Despite this, despite ALL the teething and fundamental difficulties,
  783.     the internet is sufficiently superior to ensure considerable continued
  784.     effort to improve the informative value of the net.
  785.  
  786.                         - - - - - - - - - - - - - -
  787.  
  788.     The Multiplication of Information Effect.
  789.     Just as the internet permits a multitude of voices and perspectives, so
  790.     it permits - and promotes - a multitude of the same information. Yes.
  791.     For a several reasons we shall explore first, the internet multiplies
  792.     the amount of information there is on a topic. This insight can be used
  793.     to improve searching for information, as I will show at the end of this
  794.     article.
  795.  
  796.     The internet is a system of communication. Like all other systems
  797.     (books, articles) the internet systems affect the way we communicate in
  798.     different ways. The absolute number of books depends on what is thought
  799.     can be commercially viable. We could say books permit, and promote a
  800.     limited number of books on the same topic.
  801.  
  802.     The internet does the opposite.
  803.  
  804.     The sheer ease of publishing information on the net is one factor in
  805.     information overkill. The net is an easy place to publish information,
  806.     requiring only individual effort. There is no budgetary concerns, nor
  807.     does attracting an audience initially enter into the publishing
  808.     process, as they would with articles or books.
  809.  
  810.     The ageless state of the internet also rapidly builds information. Old
  811.     information is not removed from the web automatically as in mailing
  812.     lists. Old books go out of print and past magazine articles are
  813.     shelved, indexed and categorized so we must intentionally include them
  814.     in our search. The web is not built this way, and information well past
  815.     its natural expiry date remains.
  816.  
  817.     A dramatic change is also occurring as our society becomes digital. In
  818.     the pre-internet economy experts and specialists in every field are
  819.     distributed to meet needs. In the networked world, expertise is not
  820.     only shared more rapidly, but is required in less places - whether we
  821.     speak geographically or intellectually. Said another way, in
  822.     cyberspace, competition for expertise is most fierce. To be an expert,
  823.     you need to be more expert than others within reach - and since
  824.     gradually more and more experts are within reach - digitally - we form
  825.     a glut of experts.
  826.  
  827.     Oh, this is not a doomsday message - merely a middle ground on the way
  828.     to increased specialization and focus. Historically we can easily see
  829.     Newton was a Scientist but Einstein was a nuclear theorist. Today we
  830.     have quantum theorists. The future is full of very long job titles.
  831.  
  832.     A by-product of this movement is a current glut of experts - perhaps a
  833.     permanent glut of experts. With more people connected and satisfied
  834.     with distant communication, a vet who writes about immunizing your dog
  835.     becomes one of many you can reach for, in several countries. Previously
  836.     we may have been limited to those in your state - but no longer! Now we
  837.     can pick up immunization recommendations from any number of experts
  838.     previously separated by distance or with minimal overlapping media
  839.     outlets.
  840.  
  841.     We can see this clearly on the web. I wrote an article on country
  842.     profiles and yes, as expected, the UK, US, Canada & Australia all write
  843.     and publish traveler advice notices on the web. Are they different?
  844.     Occasionally. Is this a case of multiplication of information? Yes. We
  845.     have reached beyond the applauded internet trait of permitting a
  846.     multitude of communication and reached a state where similar
  847.     information is interpreted by different organizations, and distributed
  848.     electronically.
  849.  
  850.     This is not unique to the internet. News stories also contain
  851.     considerable overlap from one newspaper to another. A search for dog
  852.     immunization on one of the large news databases will result in numerous
  853.     articles all presenting essentially similar information. Business
  854.     periodicals also have considerable overlap, and while each may attempt
  855.     to differentiate their articles from others, there are severe limits -
  856.     and besides, most likely articles do not have an overlapping clientele.
  857.  
  858.     But on the internet, there is overlapping readers. An article written
  859.     for the web is an article written for everyone. Anyone can read it.
  860.     Thanks to the popularity of search engines, it can be available to
  861.     anyone. At least in theory.
  862.  
  863.     This leads us to internet promotion. Information on the web is
  864.     sometimes so difficult to locate we have an almost continual need for
  865.     more publishing. Real traffic is difficult to promote normally, so
  866.     websites devoted primarily to delivering information have a real
  867.     difficulty reaching their audience. This translates either to the need
  868.     for expensive commercial promotion, which often can not be justified,
  869.     or into reaching only those who search carefully for your information.
  870.     The latter means multiplication of the same information.
  871.  
  872.     In writing this article, I see the effects mentioned will lead to
  873.     changes in the future. As I write "attracting an audience initially
  874.     enter into the publishing process", I think to myself this will
  875.     obviously change. Attracting an audience will emerge in time as the
  876.     primary step in publishing. There are many places to take this
  877.     discussion, but my job is a researcher, or rather an internet-focused
  878.     search theorist. (Long job titles will be in vogue). Let us focus on
  879.     how these changes effect this internet as an information resource.
  880.  
  881.     1) Any effort to organize the internet is diluted because of these
  882.     efforts.
  883.     2) Any effort by the researcher to find different perspectives will be
  884.     confounded by the number of people with the same perspective publishing
  885.     in the same medium.
  886.     3) Certain fields are more heavily hit than others. Internet advice on
  887.     what search engines to use is ubiquitous. Java Programming hints are
  888.     numerous. More specialized topics (like internet-focused search theory)
  889.     are less affected.
  890.     4) Viral marketing - a catchword for sure, hopes to achieve promotion
  891.     by seeding many sites with information. Perhaps an innovative way
  892.     around accepting the multiplication of sites delivering the same or
  893.     similar information.
  894.  
  895.     In phrasing the question you wish to answer, before the search,
  896.     experienced researchers will focus on what information is likely to be
  897.     available in numerous overlapping versions. These questions can be
  898.     answered with the search tools that cover information in a more random
  899.     manner: Search Engines do this very well. Tightly focused questions,
  900.     less likely to be distributed so completely, should be approached with
  901.     different tools: mailing lists and nexus points, long complex search
  902.     queries and index points.
  903.  
  904.     In conclusion, the internet will become far more cluttered than we had
  905.     expected. I had previously predicted that search engines would grow to
  906.     meet the needs, but this is not to be. Search engines will continue to
  907.     serve up answers available from multiple places in the world. There is
  908.     market enough in this, and minimal need to tackle anything more.
  909.  
  910.  
  911.  
  912.                     Getting the Best from the Internet.
  913.                                 Section 11
  914.  
  915.     A search for information on the internet is not essentially different
  916.     from the standard information search process. You still need to start
  917.     by outlining carefully just what you are hoping to locate. You also
  918.     need to be aware of the peculiarities of the internet as a researchable
  919.     resource (or rather a collection of resources). If you expect instant
  920.     delivery of exactly what you require, free, then you need a reality
  921.     check (and I am sure you will get one real soon). Sadly, the printed
  922.     media tends to overlook this.
  923.  
  924.     As with all resources, the more familiar you are with a given resource,
  925.     the more efficiently you will work. Get to know the internet for a time
  926.     first. Understand how it works. Then re-adjust your expectations and
  927.     file it as just another collection of resources, perhaps preferable in
  928.     certain circumstances.
  929.  
  930.     A Structured Approach to Searching
  931.     Much of this book has been devoted to describing what we could call a
  932.     structural approach to finding information. We build a question, select
  933.     a format and then search in an essentially static manner. There are
  934.     only a few resources of interest for each format.
  935.  
  936.     On the internet, we again do the same. If you want to search online
  937.     periodicals (a specific format for information with specific qualities
  938.     that might be appropriate) there are just a few sites to review. The
  939.     search is simple and straightforward. Search then read then reassess if
  940.     it helped answer your question.
  941.  
  942.     The structured approach has been a simpler way to introduce a far more
  943.     important application. Searchers know where answers are already -
  944.     without ever having read the answer before - without having studied the
  945.     topic. This is, after all, one of the few reasons to even consider
  946.     paying for professional search assistance.
  947.  
  948.     How does a searcher know where answers lie?
  949.  
  950.     By building up a clear understanding of what information is out there,
  951.     where it resides, and how to get to it, a searcher learns to anticipate
  952.     the location of answers. Anticipation is everything.
  953.  
  954.                         - - - - - - - - - - - - - -
  955.  
  956.     Know Where to Look
  957.     Let's look at information itself. Information passes from producer, to
  958.     organizer, to consumer. It travels many paths in this journey.
  959.     Superficially, we can observe internet communication travels via email,
  960.     newsgroups, and webpages (and others). Let's call these tools.
  961.  
  962.     Looking deeper, we observe information emerges from just a few
  963.     generalized sources: knowledgeable individuals, informed government
  964.     employees, grant funded educational projects, commercial organizations
  965.     and a few others. Each source produces a particular type of
  966.     information, distributes (publishes & promotes) in particular channels,
  967.     and hopes to pay for (or justify) their effort in a particular way.
  968.  
  969.     Efficient internet research is infused with an understanding of who
  970.     publishes, where and why.
  971.  
  972.     Before information reaches the consumer, it passes through a vetting
  973.     which organizes and filters both the quality and the presentation style
  974.     of the information. Let us call these systems. The FAQ is a pivotal
  975.     piece of a system that may start with a post to a mailing list or
  976.     newsgroup, involves the vetting of the FAQ maintainer, then proceeds to
  977.     an FAQ archive then to the end consumer. The webpage is published by
  978.     someone who has justified their time and expense, is indexed by a
  979.     search engine or definitive-topic-website or webring or what have you,
  980.     and then is found and read by the end consumer. The internet has many
  981.     such systems.
  982.  
  983.     Each system again defines many of the traits of the resulting
  984.     information. FAQs are semi-authoritative, collaborative pieces, often
  985.     dense and factual. Private mailing lists are sometimes more
  986.     informative, discussive, as well as serving as a notice board.
  987.     Newsgroups involve far less natural vetting and quality control, but
  988.     excel in distributing popular volume resources like graphics. Search
  989.     engines don't vett, but can be searched.
  990.  
  991.     Each system reinforces the uniqueness it brings to the whole internet.
  992.     When I blindly declare "Information Clumps" at the start of this FAQ, I
  993.     am really describing a trend whereby certain information accumulates in
  994.     a particular location, others out of self-interest add to the pile, and
  995.     further information reinforces both the logic and uniqueness of that
  996.     pile of information.
  997.  
  998.     It is just a short jump from this to understanding how FAQ archives
  999.     grow but maintain a good quality, how the grand internet search engines
  1000.     began to lose value about 15 months ago then recently began regaining a
  1001.     position of strength, and how ftp archives still exist for many
  1002.     computer topics.
  1003.  
  1004.     The internal logic to the organization of information is based on
  1005.     simple principles. It defines the environment within which we strive to
  1006.     improve the internet as an effective information resource. We take this
  1007.     understanding and build sophisticated expectations about what kind of
  1008.     information rests at which format.
  1009.  
  1010.     Further Reading: Searching the Web: Strategy
  1011.     (http://spireproject.com/webpage.htm#5)
  1012.  
  1013.                         - - - - - - - - - - - - - -
  1014.  
  1015.     Multiple Windows
  1016.     Make your browser work for you. All browsers allow you to open multiple
  1017.     windows panes. Open a few and send them off in different directions
  1018.     fetching information. You do not have to wait for each page to return
  1019.     to you before you read. With a little practice, you can juggle four
  1020.     window panes, collecting information from different tools, following
  1021.     different trains of thoughts, reading your way through four websites as
  1022.     they are downloaded.
  1023.  
  1024.     The technique is a little like reading four books at once. It certainly
  1025.     keeps your mind nimble. Worked successfully, multiple windows will
  1026.     double the speed of searching and free you from the speed of your
  1027.     internet connection.
  1028.  
  1029.     Three technical tips are involved. Firstly, a second window pane is
  1030.     opened by selecting File : New : New Window. The shortcut key for this
  1031.     Control+N. Secondly, in Microsoft Explorer, depressing your shift key
  1032.     as you click a link will open the distant file in a new window. In
  1033.     Netscape, depress the control button as you click a link. Thirdly, if
  1034.     you are running windows, the Alt + Tab button jumps between window
  1035.     panes.
  1036.  
  1037.     Taken together you can read down a page, find something interesting,
  1038.     shift+click a link, continue reading the original page, then flip over
  1039.     to reading the second page in a new window.
  1040.  
  1041.     Keep in mind, juggling windows is difficult and requires practice. If
  1042.     you do this in public, be prepared to lose novice surfers who are not
  1043.     ready to use more than one window.
  1044.  
  1045.                         - - - - - - - - - - - - - -
  1046.  
  1047.     Launch Pages
  1048.     Bookmarks are a fine tool for beginners to build. It is not, however,
  1049.     the best organization of tools for a searcher. One of the roles of the
  1050.     Spire Project has been the construction of a far more effective tool,
  1051.     based on having the more common search tools and supporting information
  1052.     close together, on your own computer.
  1053.  
  1054.     Beyond being a plug for you to look at our free shareware
  1055.     SpireProject.zip (http://spireproject.com/spire_latest_version.zip) and
  1056.     single-page shortcut Spire Project Light"
  1057.     (http://spireproject.com/spir.htm), there is a serious issue here.
  1058.  
  1059.     If you are familiar with the use of search engines - and you have fast
  1060.     access to the search box for the search engines - you no longer need
  1061.     the Urls for specific resources. With a name, you can always quickly
  1062.     locate a page. Besides, Urls change. Far better to just keep a list of
  1063.     resources by name.
  1064.  
  1065.     At the start of this FAQ, we mentioned a searcher knows where to find
  1066.     information.
  1067.     "Knowing of specific resources is helpful. Knowing the tools to help
  1068.     you find resources, the meta-resources, is vital."
  1069.     Fast access to information resources is valuable. Fast access to the
  1070.     tools to find information is critical. Build your launch pages with
  1071.     these tools in mind.
  1072.  
  1073.  
  1074.                              Searching is Art.
  1075.                                 Section 12
  1076.     Pharaoh: There is mutiny afoot. I must kill these insolent heretics.
  1077.     Shakh: Good Idea. So who is involved?
  1078.     Pharaoh: I don't know. You must find this out.
  1079.     Shakh: Find out what?
  1080.     Pharaoh: Who my enemies are, of course.
  1081.     Shakh: Enemies?
  1082.     Pharaoh: People who want me dead.
  1083.     Shakh: But not those who want a better ruler...
  1084.     Pharaoh: No not them.
  1085.     Shakh: What about the ones that want a better ruler, and would not mind
  1086.     you dead.
  1087.     Pharaoh: That sounds like everyone.
  1088.     Shakh: And those that want you dead but would never do anything about
  1089.     it.
  1090.     Pharaoh: Well, so long as they don't help anyone else.
  1091.     Shakh: Then you just want the ones who will try to kill you.
  1092.     Pharaoh: Yes,
  1093.     Shakh: Good. Now we know exactly what we are searching for. We are
  1094.     seeking those who will try to kill you. I shall straight away
  1095.     investigate.
  1096.  
  1097.                         - - - - - - - - - - - - - -
  1098.  
  1099.     Napoleon was an expert tactician, except at Waterloo. The recreation of
  1100.     past battles is not a favorite pastime of mine but is an exciting topic
  1101.     all the same. The battle terrain was set. The troops have known
  1102.     abilities and limitations. The movement and direction of the army units
  1103.     is your responsibility. Do you have the strategy involved?
  1104.  
  1105.     Early in his career in an important fight against the Prussians,
  1106.     Napoleon employed a dramatic tactic where he initially held an
  1107.     important hill in the center of the battlefield, then surrendered the
  1108.     hill to the Prussians. The Prussians, confident at this stage, marched
  1109.     the majority of their army around the hill to right, between the hill
  1110.     and a lake, to push the fight on to Napoleon. Napoleon, however, retook
  1111.     the hill with a costly attack up the hill by some of his best units.
  1112.     Success left him in control of the high ground, much of the Prussian
  1113.     army below, moving between the hill and the lake. Unable to dislodge
  1114.     Napoleon from the hill a second time, and unable to withdraw the army
  1115.     from their exposed position, Napoleon pushed on to defeat the Prussians
  1116.     most decisively.
  1117.  
  1118.     The armies were almost evenly matched prior to this conflict and
  1119.     success seemed unlikely. An average general would have fought in a
  1120.     bland way, retreating or perhaps fighting to a stalemate. Napoleon
  1121.     inflicted a decisive defeat. Such generalship goes beyond technical
  1122.     skill to encompass a vision, a strategy, an art.
  1123.  
  1124.                         - - - - - - - - - - - - - -
  1125.  
  1126.     If I have not been careful, I will have presented searching as shopping
  1127.     in a supermarket. The goods are in a large store but there is a decent
  1128.     enough structure to find it. Third aisle for baby food. Go there and
  1129.     look around.
  1130.  
  1131.     Of course, we have discussed two further types of search improvements.
  1132.  
  1133.     There is the skills around properly asking questions. You want a
  1134.     question which accurately describes what you are looking for but you
  1135.     also want the question to be framed in a way which the resources can
  1136.     answer.
  1137.  
  1138.     There is also the awareness of where information SHOULD be. If you know
  1139.     what kinds of information exist and you ruminate long enough on the
  1140.     likely motivations of publishing, we can make some fairly detailed
  1141.     judgements on the whereabouts of the answers you are looking for.
  1142.  
  1143.     There is further skill in dealing with the technical difficulty of
  1144.     information overload. You have limited time and limited resources.
  1145.     Finding information is often a hit or miss affair, so there is an art
  1146.     to selecting the right words to search, the right Boolean prefixes to
  1147.     attach to search terms, the right search tactics to employ to get the
  1148.     most out of each situation.
  1149.  
  1150.     For much of this, you need only experience. If you know in advance a
  1151.     skilled searcher can handle the task of sifting reams of data for
  1152.     useful information, then you can focus on how its done, practice, and
  1153.     learn. The search technology itself is simple.
  1154.  
  1155.     The trouble lies in retrieving from databases with far too much
  1156.     information for simple word selection. It also flares when you are
  1157.     dealing with databases charging up from $2 a minute and an additional
  1158.     cost per item retrieved. You decide very quickly to get good at
  1159.     searching once you receive a bill for $200 of irrelevant information.
  1160.  
  1161.     The simplest solution to this difficulty is to practice. You will find
  1162.     all research libraries provide access to slightly older articles
  1163.     through CD-ROM databases. Search these to hone your skills.
  1164.  
  1165.     I saw a small book on search techniques from an early course in my
  1166.     state library - but it is very basic. Most librarians build experience
  1167.     in using search systems either internally, or through a series of
  1168.     courses given by travelling database officers like the periodic
  1169.     training by Dialog-Insearch. These are expensive, but include some free
  1170.     time searching the expensive databases (no, they don't let you take
  1171.     information back with you).
  1172.  
  1173.     Now, there must be something else I can share with you on this topic.
  1174.     First, learn something about how the databases are built in the first
  1175.     place. It helps if you know what an inverted text database looks like.
  1176.  
  1177.     Second, something personal about technique... I always find the uglier
  1178.     the search query, the better the result. Honestly. A search combining
  1179.     numerous elements improves your chances of getting it right.
  1180.  
  1181.     Third, I always try to change my search techniques to match the medium.
  1182.     I am likely to be more careful of broad searches of expensive database,
  1183.     where as free databases often lead me to gather 50 articles, then
  1184.     weeding them out by hand. (most CD-ROMs allow you to select only the
  1185.     ones you want). Always bring a 3.5'' floppy with you when visiting a
  1186.     library on the of-chance you want to download and look at results
  1187.     another time.
  1188.  
  1189.     Fourth, I almost always find the initial challenge is in locating those
  1190.     specific terms that appear in 80% of the documents that interest you.
  1191.     When searching the internet for information about government use of the
  1192.     web, the specific terms required were government and publishing (not
  1193.     even government publish was close) All other search terms gave far to
  1194.     much garbage. Yes, of course, being an expert in a particular field is
  1195.     an edge in already knowing these special terms.
  1196.  
  1197.     There are two escape hatches here. If you can find one or two articles
  1198.     that interest you, often you can browse these articles for those
  1199.     special words. Sometimes even, the descriptors of an interesting
  1200.     article will give you a specific subject heading. I've heard this
  1201.     technique called the "Pearl Development Technique" but I just think of
  1202.     it as a good idea. The second escape hatch is the use of free databases
  1203.     to prepare you for going online. If you have ready access to a CD-ROM
  1204.     database, search this first - get the right search words on the free
  1205.     databases, then go online.
  1206.  
  1207.     Oh, of course, there is also the issue of just asking someone involved
  1208.     for the proper words. I like to ask my clients if they know what words
  1209.     are likely to be used. It's not a mark of an amateur to be asked, by
  1210.     the way.
  1211.  
  1212.     A couple of side issues
  1213.  
  1214.     1) Keep an eye on the type of document you are searching. If you want
  1215.     full text - don't go looking in bibliography databases. More to the
  1216.     point, don't start word searching databases with really big files
  1217.     without using the proximity indicators and descriptive fields. I hated
  1218.     paying for that 20-page document which included all the words I was
  1219.     interested in - but on different pages.
  1220.  
  1221.     2) Also, keep an eye on the quality of the documents you are
  1222.     retrieving. I know a search of newspapers sounds impressive, but they
  1223.     are rarely capable of explaining anything in depth and are notorious at
  1224.     being advertorials. I try to keep newsprint for locating experts - not
  1225.     for information. I have also been trapped by obscure magazines with
  1226.     appealing articles, only to learn the magazine is one of a large number
  1227.     of very basic business magazines which use fillers or just doesn't like
  1228.     to pay for good journalism. A single article of 5 pages from Scientific
  1229.     American blows 20 small fillers out of the water. In fact the length of
  1230.     an article is a hint of depth.
  1231.  
  1232.     Oh, if you are looking for some really good books on this issue, try
  1233.     the manuals Dialog sends you to start, look for text databases in you
  1234.     library, then proceed to one of the search books recommended at the end
  1235.     of our 'research as a discipline' article.
  1236.  
  1237.     Basic Techniques to research change slowly, though the technology is
  1238.     improving and specific information resources are in rapid flux. It
  1239.     makes for interesting times.
  1240.  
  1241.     So many resources. So many techniques. Its strange to have written down
  1242.     so very much that is dull and tiring yet get it right. You simply must
  1243.     muddle through all those links to get a decent result.
  1244.  
  1245.     Yet the end result is to portray searching as an intensely dull
  1246.     experience. We have very few choices. The information exists in certain
  1247.     clearly marked places. We merely need collect it.
  1248.  
  1249.     If we are not careful we will present you the idea that searching is
  1250.     more like shopping in a supermarket. The goods are in a large store but
  1251.     there is a decent enough structure to find it. Third aisle for baby
  1252.     food. Go there and look around.
  1253.  
  1254.     Actually, this is the general approach to searching. There is no art,
  1255.     no talent, just skill and knowledge of the technology. Want a webpage
  1256.     on dogs - go to Yahoo and type in dogs. Want a telephone number - take
  1257.     out the white pages and remember the alphabet. Want a book and you are
  1258.     near the library, walk in and ask a librarian. Alternatively, walk in
  1259.     and type a few words in the library book database.
  1260.  
  1261.     But there is more - so very much more. And all of this makes for
  1262.     exceptional searching.
  1263.  
  1264.     Let's look at an example. We want information on how to improve the
  1265.     schooling of your exceptionally gifted child. A simple request. What do
  1266.     we do?
  1267.  
  1268.     The art is a kind of magic, of choosing just the right words at the
  1269.     right times, and in phrasing your request for information in a way that
  1270.     tightly describes your interest without removing information that
  1271.     should interest you. The art of searching relies heavily on an
  1272.     understanding of what is possible within a given system. Much of this,
  1273.     you guessed it, involves creative visualizing.
  1274.  
  1275.  
  1276.  
  1277.                               The Last Word.
  1278.  
  1279.     Searching is an attitude. It is a way of looking at the world, and at
  1280.     information, quite distinct from the norm. Statistics are mentioned on
  1281.     TV and you subconsciously weigh the value. You listen to experts and
  1282.     wonder who pays them, and so where the potential purpose bias could
  1283.     come from. Searching is an attitude with little tolerance for spin,
  1284.     puffery or questionable interpretation of statistics.
  1285.  
  1286.     Searching can be a very negative attitude - and this is our last
  1287.     lesson. Search with a critical mind, but also know at some point you
  1288.     must say enough. Enough searching, it is time to make a decision. This
  1289.     line is not defeat, but acceptance that decisions are made on
  1290.     incomplete information. Make your decision when you are ready.
  1291.  
  1292.                         - - - - - - - - - - - - - -
  1293.     Shakh stood before the entrance to the tomb. It was not quite complete.
  1294.     The glyphs were etched for only the first thirty feet of the
  1295.     passageway, and workers were still preparing the burial chamber. The
  1296.     thick dusty air made it hard to breath, but at times it was better than
  1297.     staying outside where the temperature continued to climb.
  1298.  
  1299.     Shakh admired the art on the wall. Meaning within meaning. The divine
  1300.     representations stood offering the pharaoh recognition. In exchange the
  1301.     pharaoh offered a just reign. The scene worked well. Such work was one
  1302.     of the few ways the pharaoh could communicate with the gods.
  1303.  
  1304.     Yet there were other layers to the picture. The gods were depicted as
  1305.     pleased with the work of the pharaoh. Their recognition was a reward
  1306.     for the years of ruling Egypt.
  1307.  
  1308.     There, further in the picture, was reference to the accomplishments of
  1309.     the pharaoh. Much of the writing was dictated by tradition, and the
  1310.     individual scribes were all instructed in the tale, so meaning was
  1311.     particularly important in what was different from other tombs. It was
  1312.     the small differences that made this work unique, that elevated the
  1313.     work from that suitable for any important person to that fit for a
  1314.     king. Birth in a village close to the Nile. References to the pharaoh's
  1315.     re-conquest of Nubia. The special position of Horus, the falcon god.
  1316.  
  1317.     Then there was the technology. Sparkling stars on blue covered the
  1318.     ceiling. This was a new development, unseen before in crypt or
  1319.     building. It had a pleasant effect, expanding the space within the
  1320.     tomb, making it look larger than it really was.
  1321.  
  1322.     And then there was the artistry to the carving. These were fine
  1323.     scribes, clean and precise. The work satisfied him well.
  1324.  
  1325.     Walking out of the half-completed tomb, Shakh sighed, wiped the
  1326.     gathering sweat from his brow, then gave a small thought to the poor
  1327.     sap he used to work for. The old pharaoh had never learned information
  1328.     was power, thought Shakh, sighing regally.
  1329.     ___________________________________________________
  1330.  
  1331.     Acknowledgements: I would like to thank my wife Fiona, whom I love and
  1332.     cherish dearly. The Spire Project is a great effort several years in
  1333.     the making. I trust you enjoyed the results.
  1334.     David Novak - david@spireproject.com - SpireProject.com and
  1335.     SpireProject.co.uk
  1336.     ___________________________________________________
  1337.     Copyright (c) 1998-2001 by David Novak, all rights reserved. This FAQ
  1338.     may be posted to any USENET newsgroup, on-line service, website, or BBS
  1339.     as long as it is posted unaltered in its entirety including this
  1340.     copyright statement. This FAQ may not be included in commercial
  1341.     collections or compilations without express permission from the author.
  1342.     Please post permission requests to david@spireproject.com
  1343.  
  1344.