home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / internet / info-research-faq / part5 < prev    next >
Encoding:
Internet Message Format  |  2004-04-18  |  32.1 KB

  1. Path: senator-bedfellow.mit.edu!dreaderd!not-for-mail
  2. Message-ID: <internet/info-research-faq/part5_1082200966@rtfm.mit.edu>
  3. Supersedes: <internet/info-research-faq/part5_1079601013@rtfm.mit.edu>
  4. Expires: 31 May 2004 11:22:46 GMT
  5. References: <internet/info-research-faq/part1_1082200966@rtfm.mit.edu>
  6. X-Last-Updated: 2002/04/17
  7. Organization: none
  8. From: david@spireproject.com (David Novak)
  9. Newsgroups: alt.internet.research,sci.research,alt.answers,sci.answers,news.answers
  10. Subject: Information Research FAQ v.4.7 (Part 5/6)
  11. Followup-To: poster
  12. Approved: news-answers-request@mit.edu
  13. Summary: Information Research FAQ: Resources, Tools & Training
  14. Originator: faqserv@penguin-lust.MIT.EDU
  15. Date: 17 Apr 2004 11:28:24 GMT
  16. Lines: 605
  17. NNTP-Posting-Host: penguin-lust.mit.edu
  18. X-Trace: 1082201304 senator-bedfellow.mit.edu 569 18.181.0.29
  19. Xref: senator-bedfellow.mit.edu sci.research:24082 alt.answers:72511 sci.answers:15956
  20.  
  21. Archive-name: internet/info-research-faq/part5
  22. Posting-Frequency: monthly
  23. Last-modified: April 2002
  24. URL: http://spireproject.com
  25. Copyright: (c) 2001 David Novak
  26. Maintainer: David Novak <david@spireproject.com>
  27.  
  28.                   Information Research FAQ     (Part 5/6)
  29.  
  30.             100 pages of search techniques, tactics and theory
  31.           by David Novak of the Spire Project (SpireProject.com)
  32.  
  33.  
  34.     Welcome. This FAQ addresses information literacy; the skills, tools and
  35.     theory of information research. Particular attention is paid to the
  36.     role of the internet as both a reservoir and gateway to information
  37.     resources.
  38.  
  39.     The FAQ is written like a book, with a narrative and pictures. You have
  40.     found your way to part five, so do backtrack to the beginning. If you
  41.     are lost, this FAQ always resides as text at
  42.     http://spireproject.com/faq.txt and http://spireproject.co.uk/faq.txt
  43.     and with pictures at http://spireproject.com/faq.htm
  44.  
  45.     ***    The Spire Project also includes a 3 hour public seminar titled
  46.     ***    Exceptional Internet Research. This is a fast paced seminar
  47.     ***    supported with a great deal of webbing, reaching to skills and
  48.     ***    research concepts beyond the ground covered on our website and
  49.     ***    this FAQ. http://spireproject.com/seminar.htm has a synopsis.
  50.     ***    I am in Europe, seminaring in Ireland and Europe though I
  51.     ***    will be returning to the US shortly, and South Australia for
  52.     ***    a seminar this October.
  53.  
  54.     Enjoy,
  55.     David Novak - david@spireproject.com
  56.     The Spire Project : SpireProject.com and SpireProject.co.uk
  57.  
  58.  
  59.  
  60.                               Search Tactics.
  61.                                  Section 7
  62.     The Pharaoh called on Shakh to negotiate the annual royal donation with
  63.     the priests of Karnak temple complex. The Pharaoh was not wise in such
  64.     matters and had previously given far too much to the detriment of the
  65.     state. It was not wise to voice such sentiments. Shakh instead set
  66.     about negotiating a figure ample to their needs but insufficient to
  67.     further expand the temple complex.
  68.  
  69.     Shakh wisely chose to negotiate up river at the Kom Ombo temple - away
  70.     from Karnak. Choosing words carefully, he deftly rejected the initial
  71.     estimate of the temple's needs, then spoke calmly, eyes tight, that the
  72.     Pharaoh had decided Karnak should supply the priests to the Egyptian
  73.     army - at current expenses.
  74.  
  75.     It was a clever ruse. The negotiated royal donation was significantly
  76.     reduced and the priests were happy to be excluded from military duty.
  77.  
  78.                         - - - - - - - - - - - - - -
  79.  
  80.     If searching be a combination of science, art and experience, then the
  81.     science of searching is the easiest of the three. There are just a few
  82.     search elements to remember and search techniques to apply.
  83.  
  84.     Firstly, there are the tactics associated with free text searching;
  85.     that of Boolean, proximity, truncation, field searching, target
  86.     searching and further enhancements.
  87.  
  88.     Secondly, there are the basic classification schemes: the Dewey decimal
  89.     system (for books) The WIPO and US Patent Classification Systems (for
  90.     patents), the Standard Industrial Classification (SIC) Codes (for
  91.     industry) and a number of additional classification systems founded on
  92.     the same principles.
  93.  
  94.     Thirdly, there is the way information is organized. A book has a
  95.     table-of-contents and an index, large directories like Kompass and Gale
  96.     Directory of Databases are arranged with so many indexes (geographic,
  97.     subject, product, name) that the contact information is often separated
  98.     and numbered, then referenced as a number. The results are initially
  99.     confusing. Statistics similarly have ways of presenting information
  100.     (pie charts, line charts, charts with ranges which do not reach zero)
  101.     and again, this can be confusing the first time you see them.
  102.  
  103.     Let's start with the technique associated with searching a text
  104.     database.
  105.  
  106.     Straight Word Searching:
  107.     All search situations allow you to ask for the presence of words in a
  108.     block of text. Obviously it helps if you ask for the right word or
  109.     words. If you ask for the right words, they you will quickly locate the
  110.     information you desire. For best results you obviously want to choose a
  111.     word or words which accurately describes what you are looking for.
  112.     Prepare to search the text several times with different terms, and
  113.     consider the possibility of different spellings for the same words.
  114.  
  115.     Straight word searching is fairly ubiquitous on the internet. You can
  116.     always search a webpage with the search function of your web browser.
  117.     Alternatively, you can search by placing a large amount of text into a
  118.     word processor and using the in-built search functions. Your
  119.     word-processor can handle large files like website traffic logbooks and
  120.     archived files of past mailing list discussion. There are also
  121.     specialist tools like the shareware WinGrep
  122.     (http://www.mindspring.com/~bgrigsby/wingrep.html) for searching many
  123.     files on your computer hard drive. (Alternatively, consider
  124.     AgentRansack http://www.agentransack.com).
  125.  
  126.     Text Fragments:
  127.     The simplest refinement to straight searching involves searching for
  128.     parts of a word - if you are interested in surfing, search for surf
  129.     better yet, search for " surf" with the space in front of the word.
  130.  
  131.     Truncation:
  132.     Some search engines don't allow searches for text fragments, and you
  133.     must explain your intention by adding a truncation mark (usually * or
  134.     ?) to the ends of words. For most professional researchable databases,
  135.     alga? will include both algae and algal (as in algal bloom). I was once
  136.     badly lost because of the spelling difference between aging and ageing.
  137.     There are a number of improvements on this concept to. Sometimes there
  138.     are special symbols for a non-space character car?a, sometimes there is
  139.     automatic awareness of multiple spellings (colour & color). Sometimes
  140.     there is even automatic awareness of synonyms. Often you are initially
  141.     unaware important information is indexed under slightly different
  142.     spelling, so truncation is strongly suggested for most searching.
  143.  
  144.     Thesaurus:
  145.     An improvement on truncation is the opportunity to look directly at a
  146.     list of words, either keywords, or descriptors. This allows you to see
  147.     the range of spellings before you search. This is also ideal for
  148.     searches of company names or proper places so you can select only the
  149.     words you are interested in. In a simple way, some library catalogues
  150.     present subject searches in this way: a list of subject categories
  151.     arranged alphabetically.
  152.  
  153.     Boolean operators:
  154.     Changing tack, searching for multiple words calls for "and, or, not"
  155.     concepts. I want this word and that word, but not another word. It is
  156.     simple enough. Many of the search engines allow for this with the
  157.     -sign, and commercial databases often add brackets. Use of the not
  158.     symbol is frowned upon in textbooks (too easy to dismiss information
  159.     you are interested in it is said), but the 'and & or' is absolutely
  160.     necessary for complex questions like I want [(spaghetti or noodle) and
  161.     pasta] or (Italian and cuisine). With most internet search engines, but
  162.     not all commercial searches, you will find 'and' is assumed.
  163.  
  164.     Proximity operators:
  165.     The next dramatic improvement fixes the position of words relative to
  166.     one another. In this category we have adjacent (often written as adj,
  167.     next, or "inserted in quotes"), near (by how many words), or in the
  168.     same sentence. Often it is wise to stretch the distance a little
  169.     (within two), but where available, proximity is best way to remove the
  170.     dross without affecting the value of information. "Patent near
  171.     Research" is much more precise than "Patent and Research".
  172.  
  173.     Fields:
  174.     By separating information into different fields, we can selectively
  175.     search different portions of the information. I want the title to show
  176.     the words "Patent" and the abstract to include the words "Patent
  177.     Research". Field searching is a common way to refine a search, but be
  178.     aware searching titles is very likely to remove some desired
  179.     information, where as searching descriptors and not abstracts may
  180.     dramatically improve the content.
  181.  
  182.     Date Fields:
  183.     Are you really interested in information more than 15 years old?
  184.     Library catalogues frequently have many aging books, and date limiting
  185.     is very wise.
  186.  
  187.     Further Enhancements:
  188.     Ranking and the ability to search multiple databases are some of the
  189.     further enhancements that select databases permit. There are also
  190.     advances that do not have a grand impact - like natural language.
  191.     Natural interpretation allows the searcher to phrase a question with
  192.     common sentence structure. The computer then interprets what you want.
  193.     In theory natural language is liberating but in practice the strengths
  194.     of Boolean, proximity and field searching far exceed the benefits of
  195.     natural language searching. Lastly, there are special techniques like
  196.     target searching available on a few systems that bear discussing.
  197.     Sorting allows you to shape the presentation of the information. When
  198.     applied to financial information, this is particularly valuable. Alerts
  199.     allow you to automatically repeat a previous search and have the
  200.     information sent to you. Multiple database searching allows you to
  201.     search a collection of databases concurrently. Ranking positions
  202.     certain information at the top. These techniques can be valuable in
  203.     certain circumstances.
  204.  
  205.     These technical options improve the blunt system of simply asking for a
  206.     word. You will find most search functions allow for some of these
  207.     options and all commercial quality databases provide for numerous
  208.     functions. The good news is an experienced searcher can accomplish
  209.     wonders - collecting articles of 70%+ interest regularly on expensive
  210.     database. The bad news is most of the best of search technology is not
  211.     implemented on all the databases you will search and only occasionally
  212.     on databases free on the internet.
  213.  
  214.     Classification
  215.     There are several search techniques associated with library catalogues.
  216.     Beyond the simple author/title/subject search, we should also consider
  217.     searching by Dewey number, and searching first for any title - then
  218.     selecting the subject fields.
  219.  
  220.     Dewey Searching
  221.     The Dewey decimal system is similar in many ways to the patent
  222.     classification system. Each step is divided into 10 - getting more and
  223.     more specific. See this CAL State Dewey list
  224.     (http://www.calstatela.edu/library/guides/Dclass.htm) to get an idea of
  225.     its structure. This number here refers to a book called Australian
  226.     government assistance to local government projects:
  227.  
  228.     The Dewey system is arranged by Discipline, not subject groupings. Each
  229.     digit to the right becomes progressively more detailed. The system
  230.     works well in organizing books - and libraries expand it to suit their
  231.     needs - but it is different from a subject catalogue. Because it is
  232.     arranged by discipline, subject fields may be split.
  233.  
  234.     In searching, we want to duplicate the walk to the shelves and browsing
  235.     other publications that share similar numbers. We do this
  236.     electronically by searching/browsing books that share most of a number.
  237.     Drop a digit - expand the field of interest.
  238.  
  239.     The Dewey system is a bit congested in certain areas, giving rise to
  240.     very long numbers. For this and historical reasons, several national
  241.     libraries do not use the Dewey system. The Library of Congress, for
  242.     example, has its own classification scheme (Outlined here
  243.     http://lcweb.loc.gov/catdir/cpso/lcco/lcco.html ).
  244.  
  245.     Subject Searching
  246.     We can do better than searching the subject index of a library
  247.     catalogue. Try instead to search for a book which interests you - which
  248.     you can usually find easily with a simple title search - and then
  249.     selecting the subjects that book are indexed under.
  250.  
  251.     Many of the library catalogues are making this particularly easy by
  252.     incorporating links into the catalogue results. A quick look at the
  253.     Library of Congress, for example, will show how all the subject fields
  254.     are linked to further searching.
  255.  
  256.     We can show this in action by looking at the book Earth Time [1] by
  257.     David Suzuki, at my State Library. As you can see down the bottom, it
  258.     is indexed under Social Ecology [2] and Human Ecology [3].
  259.  
  260.     This kind of 'locate then expand' is an effective search technique used
  261.     in a number of situations. In commercial databases, we may search for a
  262.     company then expand to make sure we catch any different company
  263.     spellings. We may also wish to search for a book, then search for books
  264.     by the same publisher.
  265.  
  266.     [1]
  267.     http://henrietta.liswa.wa.gov.au/search/asuzuki+david/1,2,46,B/frameset&asuzuki+david+t+1936&11,,45
  268.     [2]
  269.     http://henrietta.liswa.wa.gov.au/search/dsocial+ecology/-5,-1,0,B/browse
  270.     [3]
  271.     http://henrietta.liswa.wa.gov.au/search/dhuman+ecology/-5,-1,0,B/browse
  272.  
  273.                         - - - - - - - - - - - - - -
  274.  
  275.     Patent Classification
  276.     All patents are given a special number. Unfortunately, each country has
  277.     a distinct numbering scheme: US patents are assigned a consecutive
  278.     patent number (currently 6 million+). Australian patents have an
  279.     alphanumerical which includes the year. Canadian patents are numbered.
  280.  
  281.     Above these numbering systems, we have the International Patent
  282.     Classification (IPC), by the World Intellectual Property Organization
  283.     (WIPO). Most every country uses the IPC to classify patents, save the
  284.     US. US Patent Classification is similar in many ways.
  285.  
  286.     International Patent Classification
  287.     Thanks to the World Intellectual Property Organization (WIPO), the
  288.     International Patent Classification (IPC) works as a universal
  289.     classification for patents. Started in 1975 and periodically updated,
  290.     we currently use IPC 7th Edition.
  291.  
  292.     Section, Class & Group. The International Patent Classification looks
  293.     like this: A 02 J 1/00
  294.     At the heart of the IPC is the unique coding of every invention by its
  295.     specific form or function. The system is highly specific and logical,
  296.     and includes numerous cross-references to other codes of similar form
  297.     or function. Think of this as the Dewey Decimal System for patents.
  298.  
  299.     The first letter is the section - one of eight broad categories labeled
  300.     A through G. 'A' represents Human Necessities. 'B' covers Transport.
  301.  
  302.     Each section is divided into Classes. Each class includes two numbers.
  303.     In addition, each class is divided into subclasses, the letters which
  304.     follow the first number.
  305.  
  306.     Each subclass is then divided into groups and subgroups. The number
  307.     before the slash is the group, the number after the slash is the
  308.     subgroup. Subgroups only have two digits, with further numbers
  309.     considered as resting behind a decimal point: 3/46 then 3/464, then
  310.     3/47.
  311.  
  312.     Thus A 47 J 27/09 includes the safety device on your rice cooker and B
  313.     63 G 11/00 covers your various aircraft carriers.
  314.  
  315.     The IPC system is fully described in these published directories:
  316.     The Official Catchword Index by World Intellectual Property
  317.     Organization.
  318.     International Patent Classification: Guide, Survey of Classes & Summary
  319.     of Main Groups
  320.     International Patent Classification: Section G - Physics
  321.     International Patent Classification: Guide
  322.  
  323.     Thanks to the World Intellectual Property Organization (WIPO), these
  324.     full documents are online. We now have direct access to the
  325.     International Patent Classification (7th Edition): Official Catchword
  326.     Index, Guide to the IPC, and the complete Class and Section books.
  327.  
  328.     Note: The International Patent Classification includes plenty of
  329.     internal references - indicating this group is similar to another
  330.     group; motorized boats take precedence over boat function. These
  331.     internal references are important to effectively searching databases.
  332.     There is more to the IPC, and we strongly recommend you read the
  333.     Introductory Manual to the International Patent Classification (IPC)
  334.     found on the WIPO website.
  335.  
  336.     US Patent Classification
  337.     US Patents are classified with 400+ main classes and thousands of
  338.     subclasses. Sound similar to the International Patent Classification?
  339.     It is. US patents are numbered sequentially.
  340.  
  341.     This means you can find US patents:
  342.     - by full text searching through the USPTO database CASSIS (found at US
  343.     patent libraries),
  344.     - by bibliographic & abstract text searching online through the USPTO
  345.     or IBM Patent Library,
  346.     - by US Patent number by US Patent Classification class & subclass - to
  347.     list similar patents by an effective combination search
  348.     - by the searching recent notices in the Official Gazette... available
  349.     online.
  350.  
  351.     The USPTO allows you to search or browse the US Manual of
  352.     Classification online. The Internet Patent Search System lets you to
  353.     browse US Patent titles by class/subclass.
  354.  
  355.     A little more information can be found with the Patent Guide to using
  356.     CASSIS, at the University of Michigan.
  357.  
  358.     Patent Search Strategies
  359.     Here are the avenues open to you:
  360.     1_ Full text search and retrieval through a commercial database.
  361.     2_ Free bibliographic & abstract searching online followed by selective
  362.     patent perusal/ordering.
  363.     3_ Paging manually through the relevant official gazette (the US
  364.     gazette is searchable).
  365.     4_ Retrieval of the titles & abstracts within appropriate
  366.     class/subclass then selective review and patent perusal/ordering.
  367.  
  368.     This last avenue is particularly resourceful and swift. Start by
  369.     reaching for The Official Catchword Index, a book by World Intellectual
  370.     Property Organization (WIPO). This will tell you the possible
  371.     class/subclasses that will interest you. You could word-search a patent
  372.     database and note all the class/subclasses found. Lastly, you can
  373.     always reach for the three separate printed guides that lead you from
  374.     section to subclass.
  375.  
  376.     The result should be a collection of class/subclasses that may interest
  377.     you.
  378.  
  379.     With this information, you can now browse all the patents in the
  380.     class/subclass. This process will help you locate all the patents that
  381.     may interest you since patent classification is more reliable than free
  382.     text search. (Note, both British and American spelling appears in
  383.     patent databases.) This also allows you to quickly review the patents
  384.     in other countries.
  385.  
  386.     If you are undertaking a novelty search - is a patent sufficiently
  387.     unique from other existing patents - then you must review more than one
  388.     country. There can be a significant delay before patent applications
  389.     reach other countries without affecting the protection. Case in point:
  390.     Australia only accounts for 7% of the world's patents.
  391.  
  392.     Further Search Strategy
  393.     Patent search strategy is further discussed in the Introductory Manual
  394.     to the International Patent Classification (IPC) found on the WIPO
  395.     website. You may also wish to reach "Searching for Patents"
  396.     (http://www.ummu.umich.edu/library/PTO/newpatsearch.html) from the
  397.     University of Michigan, and "Patents" by Simon Fraser University
  398.     Libraries (http://www.lib.sfu.ca/kiosk/nelles/patents.htm).
  399.  
  400.                         - - - - - - - - - - - - - -
  401.  
  402.     Trademarks
  403.     Trademark law is designed to protect consumers from confusion. The law
  404.     can work to protect business investment in brands & slogans, but only
  405.     if the business behaves in particular ways which protect consumers from
  406.     confusion: actively using the trademark, working to restrict the
  407.     trademark from becoming generic, routinely searching for unauthorized
  408.     use. For a very clear description of trademark use, and the
  409.     responsibilities of trademark owners, read the short webpages A Guide
  410.     to Proper Trademark Use, and How are Marks Protected both by Gregory
  411.     Guillot.
  412.  
  413.     Trademark Law has implications for searching: Just because a
  414.     potentially conflicting trademark has been found does not mean it
  415.     should concern you. It may be simple to show or argue that trademark
  416.     ownership has lapsed and become abandoned unintentionally.
  417.  
  418.     A common law search involves searching records other than the federal
  419.     register and pending application records. It may involve checking phone
  420.     directories, yellow pages, industrial directories, state trademark
  421.     registers, among others, in an effort to determine if a particular mark
  422.     is used by others when they have not filed for a federal trademark
  423.     registration.
  424.  
  425.     The system may appear particularly legalistic, and it is. Recent
  426.     Australian Trade Marks Office Decisions
  427.     (http://www.austlii.edu.au/au/cases/cth/ATMO/recent-cases.html),
  428.     information ultimately supplied by IP Australia, displays this vividly.
  429.     However, much trademark activity is self-evident. In Australia, A$350
  430.     and a minimum of seven and a half months will usually earn you a
  431.     registered trademark. Should you choose a trademark and find another
  432.     has used it, you will most likely receive a 'cease & desist' letter and
  433.     forfeit the value you may have invested in the trademark.
  434.  
  435.     This leads us to the importance of commercial trademark databases,
  436.     watching services and other commercial services. Searching both
  437.     prevents investment in an unusable trademark and inadvertent
  438.     infringement by others - a responsibility of trademark owners.
  439.  
  440.     Trademark Classification
  441.     A concise list of the 42 classes of the International Trademark
  442.     Classification codes courtesy of Master-McNeil Inc. WIPO is in charge
  443.     of the full class description, currently The 7th edition of the Nice
  444.     Classification, but this is rather lengthy. IP Australia has a simple
  445.     search feature of classification terminology.
  446.  
  447.     Trademarks are assigned to a particular class of product or service. A
  448.     slogan or mark, for example, could be registered for use in movies but
  449.     not computer products. The situation has changes recently but let us
  450.     explain the difference down the page a bit.
  451.  
  452.     Originally, all goods and services were broken down into 42 classes.
  453.     These classes are international divisions organized by WIPO (World
  454.     Intellectual Property Organization), so are the same from country to
  455.     country. Registered trademark documents will explain at length the
  456.     types of products & services covered by a particular trademark.
  457.  
  458.     There is some bleeding between categories, and trademark examiners are
  459.     unlikely to grant requests for nearly identical trademarks in similar
  460.     categories, but class plays a role in granting trademarks.
  461.  
  462.     Recently it became necessary to list specifically the products or
  463.     services to be covered, and the 42 classes have been expanded to a
  464.     collection of specific sub-classes, which is reminiscent of patent
  465.     classification, but far less useful.
  466.  
  467.     Class is important as trademarks are class-specific. You can search by
  468.     class in certain registered trademark databases, but this is not
  469.     particularly a good search technique: you are far too likely to miss a
  470.     comparable trademark.
  471.  
  472.     Trademark Picture Descriptors
  473.     Search Image Descriptors, by IP Australia, here abbreviated, needs
  474.     basic words - simple like bird or butterfly.
  475.  
  476.     One difficulty with trademark searches is that all the tools apply best
  477.     to words which appear in trademarks. What of the picture? The solution
  478.     appears to be image descriptors. I am uncertain of the international
  479.     nature of image descriptors, but at least in Australia, there is a
  480.     standard set of image descriptors. IP Australia allows you to search
  481.     for other trademarks with a particular picture element - irrespective
  482.     of the words involved. But to do this, you must first select the
  483.     appropriate image descriptor.
  484.  
  485.     Conclusion
  486.     Trademarks are just one element of intellectual property rights;
  487.     patents, copyright, industrial design rights, circuit layout rights and
  488.     plant breeders rights. As certain registered trademark databases are
  489.     free online, some trademark research can be accomplished quite simply
  490.     by the novice.
  491.  
  492.     Why search?
  493.     1_ To find existing trademarks similar to one you plan to register.
  494.     2_ To find existing trademarks similar to one you plan to use as a
  495.     trademark.
  496.     3_ To see if a trademark is similar to a business name you consider
  497.     using.
  498.     4_ To search for possible infringing trademarks.
  499.  
  500.     This is further explained in this help file by IP Australia.
  501.  
  502.     Further Assistance
  503.     Misc.int-property has a lively usenet discussion on Intellectual
  504.     Property. Access the newsgroup directly: misc.int-property  or search
  505.     the past discussion through Deja.com's usenet archive).
  506.  
  507.     For a lively discussion of how trademark law affects internet domain
  508.     names, consider the trademarks-l mailing list at Washburn University
  509.     (read the Scout Report description
  510.     http://scout7.cs.wisc.edu/pages/00000138.html).
  511.  
  512.                         - - - - - - - - - - - - - -
  513.  
  514.     Industry Classification
  515.     Lastly, we have not yet researched the categorization of industries
  516.     using standard SIC or NAICS codes. In simple terms though, all
  517.     industries are given a specific code. Sub-industry is given a more
  518.     specific code. More and more specific codes refer to the production of
  519.     more and more specific items. Of course, some companies will be
  520.     involved in a collection of industries.
  521.  
  522.     Two competing standards, the SIC and NAICS, have different codes but
  523.     the same coding system. Each code system can be mapped on the other, so
  524.     will cause you no undue concern. Trade statistics, digital business
  525.     directories, and national statistical bureau industry data will all use
  526.     the industry codes.
  527.  
  528.  
  529.                            Information Quality.
  530.                                  Section 8
  531.  
  532.     Information has value. It also has other qualities that will assist you
  533.     to judge information you may consider buying.
  534.  
  535.     Accuracy: the factual nature of the information presented. If the
  536.     statistics purport to show a particular trend - how large is the margin
  537.     of error? How large is the sample size? How likely are there to have
  538.     been factual errors in their development? The measurement of
  539.     statistical error is now a refined science in some fields. A
  540.     statistical result can be inaccurate when the sample size is too small,
  541.     if the margin of error is too large, the sample collection procedure
  542.     incorrect, or a number of other situations.
  543.  
  544.     Reliability: the support for trusting the solutions, both from
  545.     additional resources and from being able to duplicate the conclusions.
  546.     This includes the reputation of the researchers. No matter how
  547.     inaccurate and biased you may believe certain facts to be, successful
  548.     independent support of a suggested fact does improve its value.
  549.  
  550.     Bias: conscious or subconscious influences that affect information.
  551.     Bias can occur in collection, preparation and presentation of
  552.     information. Most information you find will be tainted. Secondary
  553.     information is deeply affected. Statistics are not necessarily less
  554.     biased.
  555.  
  556.     We counter bias in several ways. Firstly, we try to be aware of bias.
  557.     Where is bias likely? Which direction would the bias affect the
  558.     information? Secondly, we try to collect information with different
  559.     bias. This is why research based solely on government research, no
  560.     matter how accurate and reliable, is less valuable. Often information
  561.     from different countries can counter bias. Thirdly, we need to accept
  562.     bias is likely to exist. This is why primary sources are often more
  563.     valuable than secondary sources. This is why tertiary sources, like
  564.     experts, can rarely stand alone.
  565.  
  566.     Age: The date information was created or compiled will feature
  567.     prominently in the value of information. Dates given sometimes mean the
  568.     date information was created, or the date information was compiled. How
  569.     old is a book compiled in 1995, which took the author 10 years to
  570.     finish? I find statistics often forecast information, prominently
  571.     displaying recent compilation dates but still use old census data or
  572.     the like to draw their conclusions. Information on the internet
  573.     typically has no date, and can be severely challenged because of this.
  574.  
  575.     Purpose: purpose merits further discussion. When you are uncertain
  576.     about potential bias, you can look for reasons to distrust the
  577.     information instead. Suspicion is not equivalent to bias, but it can be
  578.     thought provoking. Privately, I have heard repeated rumours important
  579.     national statistics have been fudged in different countries. A
  580.     government research report investigating the price of books in
  581.     Australia would have a political purpose, a purpose that provides the
  582.     climate for some potentially significant bias. A tell-all book by
  583.     industry experts often includes a tremendous quality of insider
  584.     experience difficult to find elsewhere. While there may be a purpose of
  585.     self-aggrandizement, the purpose is less a climate for significant
  586.     bias. Medical research has perhaps the greatest climate for significant
  587.     bias, and this suggests the greatest standard of proof and external,
  588.     reliable support.
  589.  
  590.     Accuracy, reliability, bias, age and purpose are very important in
  591.     research. This is what leads us to an appraisal of value. For years,
  592.     the tobacco industry funded 'independent' research finding smoking
  593.     minimally harmful to health. It is now likely there may have been
  594.     errors brought on by accuracy, and bias. Certainly, purpose was in
  595.     doubt. As new studies show smoking is harmful, we can also say the
  596.     original research lacked reliability. In some topics, like the
  597.     internet, research is perpetually suspect because it also ages so
  598.     quickly.
  599.  
  600.     I have seen further discussions that add 'Coverage' and 'Authority' to
  601.     this checklist. Both have bearing on the value of the information
  602.     contained. By coverage, we mean how much detail is invested in covering
  603.     a specific topic. Sparse or shallow coverage is closely tied to missing
  604.     critical aspects of information. News stories frequently have limited
  605.     coverage.
  606.  
  607.     Once you are acclimatized to these elements, you begin to see potential
  608.     for error in a whole range of information. Real-estate association
  609.     figures, expert opinions, Toothpaste advertisements and National GDP
  610.     figures all occasionally display some degree of warping and
  611.     manipulation, clouding the truth. The solution is awareness, comparison
  612.     and careful analysis. As a personal aside, this is part of the reason
  613.     for my personal dislike for market research: it is often taken far more
  614.     seriously than warranted and mean far less than suggested.
  615.     ___________________________________________________
  616.                     This document continues as Part 6/6
  617.     ___________________________________________________
  618.     Copyright (c) 1998-2001 by David Novak, all rights reserved. This FAQ
  619.     may be posted to any USENET newsgroup, on-line service, website, or BBS
  620.     as long as it is posted unaltered in its entirety including this
  621.     copyright statement. This FAQ may not be included in commercial
  622.     collections or compilations without express permission from the author.
  623.     Please send permission requests to david@spireproject.com
  624.  
  625.