home *** CD-ROM | disk | FTP | other *** search
/ nlmpubs.nlm.nih.gov / 2014.05.nlmpubs.nlm.nih.gov.tar / nlmpubs.nlm.nih.gov / umls / ism.txt < prev    next >
Text File  |  1994-04-25  |  14KB  |  465 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7.           5.  UMLS Information Sources Map
  8.  
  9.           5.1.  Introduction
  10.  
  11.           The Information Sources Map (ISM) is a component of the Unified
  12.           Medical Language System (UMLS) project at the National Library of
  13.           Medicine (NLM).  It is a knowledge source which is intended to
  14.           draw upon the capabilities of the the UMLS Metathesaurus and UMLS
  15.           Semantic Network, with two chief aims:
  16.  
  17.           1)   To describe electronically available information sources in
  18.                machine-readable form in such a way as to allow a user of
  19.                appropriate computer software to determine which sources are
  20.                appropriate to a particular query.  We refer to this as the
  21.                descriptive component of the ISM.  The prototype ISM file
  22.                supplied on this disk contains data on the major publicly
  23.                available databases of the NLM, as well as databases and
  24.                expert systems programs from outside of the NLM dealing in
  25.                human genetics, medical diagnosis, and environmental health
  26.                and toxicology.
  27.  
  28.           2)   To provide requisite information to allow automatic
  29.                connection to the information source, and the completion of
  30.                a successful information retrieval session.  We refer to
  31.                this as the procedural component of the ISM.  Procedural
  32.                tools for the ISM are under active development, employing
  33.                recently developed techniques and standards for network
  34.                information retrieval; it is hoped that some of this
  35.                software will appear on a future UMLS CD-ROM.
  36.  
  37.           5.2.  Format of ISM data
  38.  
  39.           The data exchange format for the Information Sources Map is an
  40.           ASCII representation of a set of relational tables; it is
  41.           expected that the information in these tables will be transformed
  42.           into other representations appropriate for use by specific
  43.           experimenters and developers.  A single table equates to a DOS
  44.           text file in the MSDOS environment.
  45.  
  46.           The ISM tables are:
  47.  
  48.           ISMR            Main Information Sources Map records
  49.  
  50.           ISDEFR          Field definitions for main records
  51.  
  52.           ISVALR          Valid values for ISM subfields which use a
  53.                           controlled vocabulary
  54.  
  55.           5.3.  Descriptions of ISM Tables
  56.  
  57.           5.3.1.  ISMR (Main Information Sources Map Records)
  58.  
  59.           Each field (row) in this table defines a particular item of
  60.           information concerning an information source, and is organized
  61.  
  62.  
  63.  
  64.                                    April 22, 1993
  65.  
  66.  
  67.  
  68.  
  69.  
  70.  
  71.  
  72.  
  73.           into subfields as follows:
  74.  
  75.           Subfield 1:     Unique identifier of the ISM record.
  76.  
  77.           Subfield 2:     Field identifier from the set defined in ISDEFR.
  78.  
  79.           Subfields 3-n:  Subfields following the format defined in ISDEFR,
  80.                           with a vertical bar separator (|, ASCII 174)
  81.                           between subfields.
  82.  
  83.           A logical record in ISMR is defined as all table fields (rows)
  84.           which share a common unique identifier in subfield 1.  An ISM
  85.           main record requires at least the presence of an entity name
  86.           (subfield 2: NA_) combined with a provider (subfield 2: PO_).
  87.           Although there should generally be one and only one entity name,
  88.           all subfields may be repeated, appearing as additional fields
  89.           sharing identical values in subfields 1 and 2.  Where ordering is
  90.           of importance (as in sample screen displays), the order of the
  91.           table fields (rows) controls precedence.  Text which may be
  92.           reformatted for display using a variable line length is
  93.           represented as an unbroken linear string within a field.  Text
  94.           which should not be reformatted (for example, the sample screen
  95.           displays appearing in SAM fields) assumes that the target system
  96.           is capable of displaying at least 80 characters per line.  Other
  97.           than this, the ISM record contains no notion of text formatting.
  98.           Also note that sample screen displays (subfield 2: SAM) have
  99.           sometimes been transcribed from printed examples (some of them
  100.           produced using variable-width fonts); thus it is impossible to
  101.           ascertain if spacing between printing characters arises from
  102.           SPACE or TAB characters.  These sample displays may also contain
  103.           transcription errors.
  104.  
  105.           Leading and trailing spaces have been stripped from all fields in
  106.           the file, except for leading spaces appearing in sample screen
  107.           displays.  Vertical bar characters appearing in sample screen
  108.           displays have been changed to colon (:, ASCII 072) characters.
  109.  
  110.           In the case where a particular database, program or file is
  111.           available from multiple providers, (e.g., MEDLINE provided by
  112.           Dialog, MEDLINE provided by NLM) each entity/provider pair will
  113.           have its own ISMR record.  This convention is adopted because
  114.           providers often use the same name for databases and services
  115.           which are actually quite different in scope, coverage, mode of
  116.           interaction, or output format.
  117.  
  118.           Specified subfields may contain an indirection operator, a @
  119.           character followed by the unique identifier of another logical
  120.           ISM record.  A proposed convention not currently used in the ISMR
  121.           file is to employ a # character followed by the name of an
  122.           information source which is available in machine-readable form,
  123.           but which is external to the ISM files.
  124.  
  125.  
  126.  
  127.  
  128.  
  129.  
  130.                                    April 22, 1993
  131.  
  132.  
  133.  
  134.  
  135.  
  136.  
  137.  
  138.  
  139.           5.3.2.  ISDEFR (Field Definitions for Main ISM Records)
  140.  
  141.           ISDEFR is the data dictionary defining the universe of legal
  142.           subfield names for ISM main records.  A core set of subfield
  143.           names is provided in this prototype; other organizations may
  144.           define additional subfields, where subfield names do not conflict
  145.           with pre-defined ones.  The NLM will maintain a master copy of
  146.           ISM subfield definitions to prevent ambiguous/conflicting use of
  147.           subfield names and field formats.
  148.  
  149.           All field identifiers are 3 characters, with the prototype set
  150.           intended to be congruent with existing NLM/MEDLARS field names.
  151.           Where existing field identifiers are 2 characters, the third
  152.           character is an underscore (_, ASCII 137).
  153.  
  154.           The subfield separator for ISDEFR is the caret (^, ASCII 94), and
  155.           each row (field) contains the following subfields:
  156.  
  157.           Subfield 1: Three-character subfield identifier.
  158.  
  159.           Subfield 2: Subfield Name.
  160.  
  161.           Subfield 3: Subfield Format.
  162.  
  163.           Subfield 4: Scope information.
  164.  
  165.           Subfield 5: Creator of field definition (initials of
  166.                       organization, followed by |, followed by initials of
  167.                       person).
  168.  
  169.           Subfield 6: Valid value field.  If T (True), there is a list of
  170.                       valid values for this field contained in the ISVALR
  171.                       table.  If F (False), the field contents are not a
  172.                       controlled vocabulary.
  173.  
  174.           5.3.3.  ISVALR (Table of Valid Entries for Fields Using Defined
  175.           Text)
  176.  
  177.           ISVALR is a lookup table which defines the valid codes which may
  178.           appear within subfields which employ a restricted vocabulary.
  179.           The subfield separator for ISVALR is the caret (^, ASCII 94), and
  180.           each row (field) contains the following subfields:
  181.  
  182.           Subfield 1: Three-character subfield identifier (from set defined
  183.                       in ISDEFR).
  184.  
  185.           Subfield 2: Valid code.
  186.  
  187.           Subfield 3: Valid text associated with valid code.
  188.  
  189.           Subfield 4: Descriptive commentary, including subfield format
  190.                       information if appropriate.
  191.  
  192.  
  193.  
  194.  
  195.  
  196.                                    April 22, 1993
  197.  
  198.  
  199.  
  200.  
  201.  
  202.  
  203.  
  204.  
  205.           5.4.  List of Current Contents of the ISM
  206.  
  207.           5.4.1.  Information Sources, Listed in Order of Unique Identifier
  208.  
  209.           E00001    MEDLINE
  210.  
  211.           E00002    MeSH VOCABULARY
  212.  
  213.           E00005    MED80
  214.  
  215.           E00008    MED66
  216.  
  217.           E00009    AIDSDRUGS
  218.  
  219.           E00011    AIDSTRIALS
  220.  
  221.           E00012    ChemID
  222.  
  223.           E00013    CHEMLINE
  224.  
  225.           E00014    Developmental and Reproductive Toxicology Database
  226.  
  227.           E00016    Environmental Mutagen Information Center Database
  228.                     Backfile
  229.  
  230.           E00017    Environmental Teratology Information Center Database
  231.                     Backfile
  232.  
  233.           E00018    GENE-TOX
  234.  
  235.           E00019    HISTLINE
  236.  
  237.           E00020    Hazardous Substances Data Bank
  238.  
  239.           E00021    Integrated Risk Information System
  240.  
  241.           E00022    Name Authority File
  242.  
  243.           E00023    Registry of Toxic Effects of Chemical Substances
  244.  
  245.           E00024    SDILINE
  246.  
  247.           E00025    TOXLINE
  248.  
  249.           E00026    TOXLINE65
  250.  
  251.           E00027    TOXLIT
  252.  
  253.           E00028    TOXLIT65
  254.  
  255.           E00030    AIDSLINE
  256.  
  257.           E00031    AVLINE
  258.  
  259.  
  260.  
  261.  
  262.                                    April 22, 1993
  263.  
  264.  
  265.  
  266.  
  267.  
  268.  
  269.  
  270.  
  271.           E00032    BIOETHICS
  272.  
  273.           E00033    CANCERLIT
  274.  
  275.           E00034    CATLINE
  276.  
  277.           E00035    DENTALPROJ
  278.  
  279.           E00036    Directory of Information Resources OnLINE
  280.  
  281.           E00037    HEALTH PLANNING & ADMINISTRATION
  282.  
  283.           E00038    POPLINE
  284.  
  285.           E00039    SERLINE
  286.  
  287.           E00040    Physician Data Query
  288.  
  289.           E00041    BIOTECHSEEK
  290.  
  291.           E00042    DOCUSER
  292.  
  293.           E00043    Chemical Carcinogenesis Research Information System
  294.  
  295.           E00044    Toxic Chemical Release Inventory 1989
  296.  
  297.           E00045    Toxic Chemical Release Inventory 1988
  298.  
  299.           E00046    Toxic Chemical Release Inventory 1987
  300.  
  301.           E00047    Quick Medical Reference (R) Program and Knowledge Base
  302.  
  303.           E00048    Online Mendelian Inheritance in Man
  304.  
  305.           E00049    DXplain
  306.  
  307.           E00050    AI/RHEUM
  308.  
  309.           E00051    Iliad
  310.  
  311.           E00052    GenBank
  312.  
  313.           E00053    Protein Identification Resource
  314.  
  315.           E00054    The EMBL Nucleotide Sequence Database
  316.  
  317.           E00055    DNA Data Bank of Japan
  318.  
  319.           E00056    Toxic Chemical Release Inventory 1990
  320.  
  321.           E00057    TRIFACTS
  322.  
  323.           E00059    Occupational Safety and Health (NIOSH)
  324.  
  325.  
  326.  
  327.  
  328.                                    April 22, 1993
  329.  
  330.  
  331.  
  332.  
  333.  
  334.  
  335.  
  336.  
  337.           E00060    Ground Water On-Line
  338.  
  339.           E00061    Oil and Hazardous Materials Technical Assistance Data
  340.                     System
  341.  
  342.           E00062    National Pesticide Information and Retrieval System
  343.                     (NPIRS)
  344.  
  345.           E00064    National Environmental Data Referral Service (NEDRES)
  346.  
  347.           E00065    Envirofate
  348.  
  349.           E00066    Computer-Aided Environmental Legislative Data System
  350.  
  351.           E00067    MED85
  352.  
  353.           E00069    MED75
  354.  
  355.           E00070    Toxic Chemical Release Inventory 1991
  356.  
  357.           E00071    Coag-Advisor
  358.  
  359.           E00072    Hepatitis-Advisor
  360.  
  361.           E00073    Technology Transfer Network
  362.  
  363.           5.4.2.  Descriptions of Information Suppliers
  364.  
  365.           E00500    National Library of Medicine
  366.  
  367.           E00501    Massachusetts General Hospital Laboratory of Computer
  368.                     Science
  369.  
  370.           E00502    Chemical Information Systems, Inc.
  371.  
  372.           E00503    U.S. Environmental Protection Agency
  373.  
  374.           E00504    Environmental Technical Information System (ETIS),
  375.                     Dept. of Urban and Regional Planning, University of
  376.                     Illinois at Urbana-Champaign
  377.  
  378.           E00505    National Ground Water Information Center (NGWIC),
  379.                     Ground Water Publishing Company, National Ground Water
  380.                     Association
  381.  
  382.           E00506    DIALOG Information Services, Inc.
  383.  
  384.           E00507    National Institute for Occupational Safety and Health
  385.                     (NIOSH)
  386.  
  387.           E00509    BRS Information Technologies, Inc.
  388.  
  389.           E00510    U.S. National Oceanic and Atmospheric Administration
  390.  
  391.  
  392.  
  393.  
  394.                                    April 22, 1993
  395.  
  396.  
  397.  
  398.  
  399.  
  400.  
  401.  
  402.  
  403.           E00511    Center for Environmental and Regulatory Information
  404.                     Systems, Purdue University
  405.  
  406.           E00512    Welch Medical Library, Johns Hopkins University
  407.  
  408.           E00513    Yale Center for Medical Informatics
  409.  
  410.           5.5.  Changes from the Last Release
  411.  
  412.           Records were updated where appropriate.  A number of new pre-
  413.           defined codes were added to the list for the CT_ field, and
  414.           several were removed.  A Source_of variant was created for the
  415.           REN field.
  416.  
  417.           The following ISM entries were removed to create the current
  418.           edition:
  419.  
  420.           E00003    MED86
  421.  
  422.           E00004    MED83
  423.  
  424.           E00006    MED77
  425.  
  426.           E00007    MED72
  427.  
  428.           E00058    De Haen's Drug Data
  429.  
  430.           E00063    National Air Toxics Information Clearinghouse Database
  431.  
  432.           E00508    Paul De Haen International, Inc.
  433.  
  434.           The following ISM entries are new:
  435.  
  436.           E00067    MED85
  437.  
  438.           E00069    MED75
  439.  
  440.           E00070    TRI91
  441.  
  442.           E00071    Coag-Advisor
  443.  
  444.           E00072    Hepatitis-Advisor
  445.  
  446.           E00073    Technology Transfer Network (includes the National Air
  447.                     Toxics Information Clearinghouse Database)
  448.  
  449.           E00513    Yale Center for Medical Informatics
  450.  
  451.  
  452.  
  453.  
  454.  
  455.  
  456.  
  457.  
  458.  
  459.  
  460.                                    April 22, 1993
  461.  
  462.  
  463.  
  464.  
  465.