home *** CD-ROM | disk | FTP | other *** search
/ Hacker Chronicles 2 / HACKER2.BIN / 1168.WWW394.TXT < prev    next >
Text File  |  1994-03-25  |  21KB  |  479 lines

  1. Archive-name: www/faq
  2. Last-modified: 1994/03/15
  3.  
  4.                            COMP.INFOSYSTEMS.WWW FAQ
  5.                                        
  6. Contents
  7.  
  8.      * 1: Recent changes to the FAQ
  9.      * 2: Information about this document
  10.      * 3: Elementary Questions
  11.           + 3.1: What are WWW, hypertext and hypermedia?
  12.           + 3.2: What is a URL?
  13.           + 3.3: How can I access the web?
  14.                o 3.3.1: Browsers accessible by telnet
  15.                o 3.3.2: Obtaining browsers
  16.           + 3.4: How can I provide information to the web?
  17.                o 3.4.1: Obtaining Servers
  18.                o 3.4.2: Producing HTML documents
  19.           + 3.5: How does WWW compare to gopher and WAIS?
  20.           + 3.6: What is on the web?
  21.           + 3.7: I want to know more.
  22.      * 4: Advanced Questions
  23.           + 4.1: How do I set up a clickable image map?
  24.           + 4.2: How do I make a "link" that doesn't load a new page?
  25.           + 4.3: Where can I learn how to create fill-out forms?
  26.           + 4.4: How can I save an inline image to disk?
  27.      * 5: Credits
  28.        
  29.                          1: RECENT CHANGES TO THE FAQ
  30.                                        
  31.      * 3/15/94: Information on saving inline images to disk added
  32.        
  33.                       2: INFORMATION ABOUT THIS DOCUMENT
  34.                                        
  35.    This is an introduction to the World Wide Web project, describing the
  36.    concepts, software and access methods. It is aimed at people who know
  37.    a little about navigating the Internet, but want to know more about
  38.    WWW specifically. If you don't think you are up to this level, try an
  39.    introductory Internet book such as Ed Krol's "The Whole Internet" or
  40.    "Big Dummy's Guide to the Internet". The latter is available
  41.    electronically by anonymous FTP from ftp.eff.org in the directory
  42.    pub/Net_info/Big_Dummy.
  43.    
  44.    This informational document is posted to news.answers,
  45.    comp.infosystems.www, comp.infosystems.gopher, comp.infosystems.wais
  46.    and alt.hypertext on the 1st and 15th of every month (please allow a
  47.    day or two for it to propagate to your site). The latest version is
  48.    always available on the web as
  49.    <http://siva.cshl.org/~boutell/www_faq.html>. (see the section titled
  50.    "What is a URL?" to understand what this means.)
  51.    
  52.    The most recently posted version of this document is kept on the
  53.    news.answers archive on rtfm.mit.edu in
  54.    /pub/usenet/news.answers/www/faq
  55.    file://rtfm.mit.edu/pub/usenet/news.answers/www/faq>. For information
  56.    on FTP, send e-mail to mail-server@rtfm.mit.edu with "_send
  57.    usenet/news.answers/finding-sources_" in the body, instead of asking
  58.    me.
  59.    
  60.    Thomas Boutell maintains this document. Feedback about it is to be
  61.    sent via e-mail to boutell@netcom.com.
  62.    
  63.    In all cases, regard this document as out of date. Definitive
  64.    information should be on the web, and static versions such as this
  65.    should be considered unreliable at best. Please excuse any formatting
  66.    inconsistencies in the posted version of this document, as it is
  67.    automatically generated from the on-line version.
  68.    
  69.                             3: ELEMENTARY QUESTIONS
  70.                                        
  71. 3.1: What are WWW, hypertext and hypermedia?
  72.  
  73.    WWW stands for "World Wide Web". The WWW project, started by CERN (the
  74.    European Laboratory for Particle Physics), seeks to build a
  75.    distributed hypermedia system.
  76.    
  77.    To access the web, you run a browser program. The browser reads
  78.    documents, and can fetch documents from other sources. Information
  79.    providers set up hypermedia servers which browsers can get documents
  80.    from.
  81.    
  82.    The browsers can, in addition, access files by FTP, NNTP (the Internet
  83.    news protocol), gopher and an ever-increasing range of other methods.
  84.    On top of these, if the server has search capabilities, the browsers
  85.    will permit searches of documents and databases.
  86.    
  87.    The documents that the browsers display are hypertext documents.
  88.    Hypertext is text with pointers to other text. The browsers let you
  89.    deal with the pointers in a transparent way -- select the pointer, and
  90.    you are presented with the text that is pointed to.
  91.    
  92.    Hypermedia is a superset of hypertext -- it is any medium with
  93.    pointers to other media. This means that browsers might not display a
  94.    text file, but might display images or sound or animations.
  95.    
  96. 3.2: What is a URL?
  97.  
  98.    URL stands for "Uniform Resource Locator". It is a draft standard for
  99.    specifying an object on the Internet, such as a file or newsgroup.
  100.    
  101.    URLs look like this:
  102.      * file://wuarchive.wustl.edu/mirrors/msdos/graphics/gifkit.zip
  103.      * file://wuarchive.wustl.edu/mirrors
  104.      * http://info.cern.ch:80/default.html
  105.      * news:alt.hypertext
  106.      * telnet://dra.com
  107.        
  108.    
  109.    
  110.    The first part of the URL, before the colon, specifies the access
  111.    method. The part of the URL after the colon is interpreted specific to
  112.    the access method. In general, two slashes after the colon indicate a
  113.    machine name (machine:port is also valid).
  114.    
  115.    In this document, you will often see URLs surrounded by angle
  116.    brackets. This is done because some newsreaders (I am told) can
  117.    recognize them and treat them as "buttons". Do not enter the angle
  118.    brackets when entering a URL by hand to your web browser.
  119.    
  120. 3.3: How can I access the web?
  121.  
  122.    You have two options -- either use a browser that can be telnetted to,
  123.    or use a browser on your machine.
  124.    
  125.   3.3.1: BROWSERS ACCESSIBLE BY TELNET
  126.   
  127.    An up-to-date list of these is available on the Web as
  128.    http://info.cern.ch/hypertext/WWW/FAQ/Bootstrap.html and should be
  129.    regarded as an authoritative list.
  130.    
  131.    info.cern.ch
  132.           No password is required. This is in Switzerland, so continental
  133.           US users might be better off using a closer browser.
  134.           
  135.    ukanaix.cc.ukans.edu
  136.           A full screen browser "Lynx" which requires a vt100 terminal.
  137.           Log in as www.
  138.           
  139.    www.njit.edu
  140.           (or telnet 128.235.163.2) Log in as www. A full-screen browser
  141.           in New Jersey Institute of Technology. USA.
  142.           
  143.    vms.huji.ac.il
  144.           (IP address 128.139.4.3). A dual-language Hebrew/English
  145.           database, with links to the rest of the world. The line mode
  146.           browser, plus extra features. Log in as www. Hebrew University
  147.           of Jerusalem, Israel.
  148.           
  149.    sun.uakom.cs
  150.           Slovakia. Has a slow link, only use from nearby.
  151.           
  152.    info.funet.fi
  153.           (or telnet 128.214.6.102). Log in as info. Not working.
  154.           
  155.    fserv.kfki.hu
  156.           Hungary. Has slow link, use from nearby. Login is as www.
  157.           
  158.   3.3.2: OBTAINING BROWSERS
  159.   
  160.    The preferred method of access of the Web is to run a browser
  161.    yourself. Browsers are available for many platforms, both in source
  162.    and executable forms. Here is a list generated from the authoritative
  163.    list, http://info.cern.ch/hypertext/WWW/Clients.html.
  164.    
  165.     Terminal based browsers
  166.     
  167.    Line Mode Browser
  168.           This program gives W3 readership to anyone with a dumb
  169.           terminal. A general purpose information retrieval tool.
  170.           Available by anonymous ftp from info.cern.ch in the directory
  171.           /pub/www/src.
  172.           
  173.    "Lynx" full screen browser
  174.           This is a hypertext browser for vt100s using full screen, arrow
  175.           keys, highlighting, etc. Available by anonymous FTP from
  176.           ftp2.cc.ukans.edu.
  177.           
  178.    Tom Fine's perlWWW
  179.           A tty-based browser written in perl. Available by anonymous FTP
  180.           from archive.cis.ohio-state.edu in the directory pub/w3browser
  181.           as the file w3browser-0.1.shar.
  182.           
  183.    For VMS
  184.           Dudu Rashty's full screen client based on VMS's SMG screen
  185.           management routines. Available by anonymous FTP from
  186.           vms.huji.ac.il in the directory www/www_client.
  187.           
  188.    NCSA Mosaic for VMS
  189.           Browser using X11/DecWindows/Motif. Multimedia magic. Full http
  190.           1.0 support including PUT-method forms, image maps, etc.
  191.           Recommended if you can run it. Available by anonymous FTP from
  192.           ftp.ncsa.uiuc.edu in the directory Mosaic.
  193.           
  194.    Emacs w3-mode
  195.           W3 browse mode for emacs. Uses multiple fonts when used with
  196.           Lemacs or Epoch. See doc . Available by anonymous FTP from
  197.           Cello
  198.           Browser from Cornell LII. Available by anonymous FTP from
  199.           fatty.law.cornell.edu in the directory /pub/LII/cello.
  200.           
  201.    Mosaic for Windows
  202.           From NCSA. Available by anonymous FTP from ftp.ncsa.uiuc.edu in
  203.           the directory PC/Mosaic.
  204.           
  205.     Macintosh
  206.     
  207.    NOTE: all of these browsers require that you have SLIP, PPP or other
  208.           TCP/IP networking on your PC. SLIP and PPP can be accomplished
  209.           over phone lines, but only with the active cooperation of your
  210.           network provider or educational institution. If you only have
  211.           normal dialup shell access, your best option at this time is to
  212.           run Lynx on the system you call.
  213.           
  214.    Mosaic for Macintosh
  215.           From NCSA. Full featured. Available by anonymous FTP from
  216.           ftp.ncsa.uiuc.edu in the directory Mac/Mosaic.
  217.           
  218.    Samba  From CERN. Basic. Available by anonymous FTP from info.cern.ch
  219.           in the directory /ftp/pub/www/bin as the file mac.
  220.           
  221.     XWindows
  222.     
  223.    NCSA Mosaic for X
  224.           Browser using X11/Motif. Multimedia magic. Full http 1.0
  225.           support including PUT-method forms, image maps, etc.
  226.           Recommended if you can run it. Available by anonymous FTP from
  227.           ftp.ncsa.uiuc.edu in the directory Mosaic.
  228.           
  229.    tkWWW Browser/Editor for X11
  230.           Browser/Editor for X11. (Beta test version.) Available for
  231.           anonymous ftp from export.lcs.mit.edu in the directory contrib
  232.           as tkWWW-0.10.tar.Z. (Note: this document may be up to date, so
  233.           you may prefer to ftp to this site by hand and look for an even
  234.           newer version rather than using the link above.)
  235.           
  236.    MidasWWW Browser
  237.           From Tony Johnson. (Beta, works well.)
  238.           
  239.    Chimera
  240.           Browser using Athena (doesn't require Motif). Supports forms,
  241.           inline images, etc.; closest to Mosaic in feel of the non-Motif
  242.           X11 browsers. Available for anonymous FTP from ftp.cs.unlv.edu
  243.           in the directory /pub/chimera.
  244.           
  245.     NeXTStep
  246.     
  247.    Browser-Editor on the NeXT
  248.           A browser/editor for NeXTStep. Allows wysiwyg hypertext
  249.           editing. Requires NeXTStep 3.0. Available for anonymous FTP
  250.           from info.cern.ch in the directory /pub/www/src.
  251.           
  252.     Batch Mode
  253.     
  254.    Batch mode browser
  255.           A batch-mode "browser", url_get, which is available through the
  256.           URL <http://wwwhost.cc.utexas.edu/test/zippy/url_get.html>. (I
  257.           am not aware of an anonymous FTP site for the same package at
  258.           present.) This package is intended for use in cron jobs and
  259.           other settings in which fetching a page in a command-line
  260.           fashion is useful.
  261.           
  262.     Unreleased or Unsupported
  263.     
  264.    Browser on CERNVM
  265.           A full-screen browser for VM. Nonexistent. Use the line mode
  266.           www. Might arrive suddenly one day.
  267.           
  268.    Dave Ragget's Browser
  269.           Unreleased. For X11, (later PC?)
  270.           
  271.    Erwise
  272.           X-windows early browser. Unsupported, now of historical
  273.           interest only.
  274.           
  275.    NJIT's Browser
  276.           
  277.    Assumes a character-grid terminal with cursor addressing, and provides
  278.    a full-screen interface to the web.
  279.    
  280. 3.4: How can I provide information to the web?
  281.  
  282.    Information providers run programs that the browsers can obtain
  283.    hypertext from. These programs can either be WWW servers that
  284.    understand the HyperText Transfer Protocol HTTP (best if you are
  285.    creating your information database from scratch), "gateway" programs
  286.    that convert an existing information format to hypertext, or a
  287.    non-HTTP server that WWW browsers can access -- anonymous FTP or
  288.    gopher, for example.
  289.    
  290.    If you only want to provide information to local users, placing your
  291.    information in local files is also an option. This means, however,
  292.    that there can be no off-machine access.
  293.    
  294.   3.4.1: OBTAINING SERVERS
  295.   
  296.    CERN's server is available for anonymous FTP from info.cern.ch and
  297.    many other places. Use archie to search for "www" or "WWW" to find
  298.    copies close to you. NCSA has also released a server, available for
  299.    FTP from ftp.ncsa.uiuc.edu.
  300.    
  301.     See http://info.cern.ch/hypertext/WWW/Daemon/Overview.html for more
  302.    information on writing servers and gateways in general.
  303.    
  304.   3.4.2: PRODUCING HTML DOCUMENTS
  305.   
  306.    There are several ways to produce HTML. One is to simply write it by
  307.    hand; try the "source" button of of your browser to look at the HTML
  308.    for an interesting page. The odds are that it'll be a great deal
  309.    simpler than you would expect. If you're used to marking up text in
  310.    any way (even red-pencilling it), HTML should be rather intuitive. A
  311.    beginner's guide to HTML is available at the URL
  312.    <http://www.ncsa.uiuc.edu/General/Internet/WWW/HTMLPrimer.html>.
  313.    
  314.    Of course, most folks would still prefer to use a friendlier,
  315.    graphical editor. One option is to use an SGML editor with the HTML
  316.    DTD . Another, for EMACS fans, is to use EMACS and html-mode.el .
  317.    
  318.    In addition, there are two collections of filters for converting your
  319.    existing documents (in TeX and other non-HTML formats) into HTML
  320.    automatically:
  321.    
  322.    Rich Brandwein and Mike Sendall's List at CERN .
  323.    
  324.    NCSA's List of Filters and Editors , which also mentions two editors
  325.    for MS Windows.
  326.    
  327.    Finally, TkWWW (listed above under XWindows browsers) supports HTML
  328.    editing.
  329.    
  330. 3.5: How does WWW compare to gopher and WAIS?
  331.  
  332.    While all three of these information presentation systems are
  333.    client-server based, they differ in terms of their model of data. In
  334.    gopher, data is either a menu, a document, an index or a telnet
  335.    connection. In WAIS, everything is an index and everything that is
  336.    returned from the index is a document. In WWW, everything is a
  337.    (possibly) hypertext document which may be searchable.
  338.    
  339.    In practice, this means that WWW can represent the gopher (a menu is a
  340.    list of links, a gopher document is a hypertext document without
  341.    links, searches are the same, telnet sessions are the same) and WAIS
  342.    (a WAIS index is a searchable page, returning a document with no
  343.    links) data models as well as providing extra functionality.
  344.    
  345.    The principal difference between the three systems, it turns out, is
  346.    deployment. WWW does not have as large a user base as gopher, mainly
  347.    because of the small number of WWW browsers that are out. This is
  348.    changing as WWW reaches critical mass (usage of the server at CERN
  349.    doubles every 4 months -- twice the rate of Internet expansion).
  350.    
  351. 3.6: What is on the web?
  352.  
  353.    Currently accessible through the web:
  354.      * anything served through gopher
  355.      * anything served through WAIS
  356.      * anything on an FTP site
  357.      * anything on Usenet
  358.      * anything accessible through telnet
  359.      * anything in hytelnet
  360.      * anything in hyper-g
  361.      * anything in techinfo
  362.      * anything in texinfo
  363.      * anything in the form of man pages
  364.      * sundry hypertext documents
  365.        
  366.    
  367.    
  368.    One of the few limitations of the current networked information
  369.    systems is that there is no simple way to find out what has changed,
  370.    what is new, or even what is out there. As a result, a definitive list
  371.    of the web's contents is impossible at this moment. There are,
  372.    however, several resources which provide a great deal of information
  373.    on new and established servers by topic. These are just two:
  374.      * The WWW Virtual Library at the URL
  375.        <http://info.cern.ch/hypertext/DataSources/bySubject/Overview.html
  376.        >, a good place to find resources on a particular subject
  377.      * What's New With NCSA Mosaic at the URL
  378.        <http://www.ncsa.uiuc.edu/SDG/Software/Mosaic/Docs/whats-new.html>
  379.        , which carries announcements of new servers on the web
  380.        
  381. 3.7: I want to know more
  382.  
  383.    
  384.    
  385.    To find out more, use the web. This FAQ hopefully provides enough
  386.    information for you to locate and install a browser on your system. If
  387.    you have system specific questions regarding FTP, networking and the
  388.    like, please consult newsgroups relevant to your particular hardware
  389.    and operating system!
  390.    
  391.    Later you may return to this FAQ for answers to some of the advanced
  392.    questions covered in the second section. The advanced section contains
  393.    the most-asked technical questions in the group.
  394.    
  395.                              4: ADVANCED QUESTIONS
  396.                                        
  397. 4.1: How do I set up a clickable image map?
  398.  
  399.    
  400.    
  401.    There are really two issues here: how to indicate in HTML that you
  402.    want an image to be clickable, and how to configure your server to do
  403.    something with the clicks returned by Mosaic, Chimera, and other
  404.    clients capable of delivering them.
  405.    
  406.    You can read about image maps and the NCSA server at the URL
  407.    <http://hoohoo.ncsa.uiuc.edu/docs/setup/admin/Imagemap.html>.
  408.    
  409. 4.2: How do I make a "link" that doesn't load a new page?
  410.  
  411.    
  412.    
  413.    Such links are useful when a form is intended to perform some action
  414.    on the server machine without sending new information to the client,
  415.    or when a user has clicked in an undefined area in an image map; these
  416.    are just two possibilities.
  417.    
  418.    Rob McCool of NCSA provided the following wisdom on the subject:
  419.    
  420.  
  421. Yechezkal-Shimon Gutfreund (sg04@gte.com) wrote:
  422. : Ok, here is another bizzare request from me:
  423.  
  424. : I am currently running scripts which I "DO NOT" want to return
  425. : any visible result. That is, not text/plain, not text/HTML, not
  426. : image/gif. The entire results are the side effects of the
  427. : script and nothing should be returned to the viewer.
  428.  
  429. : It would be nice to have an internally supported null viewer
  430. : so that I could do this, more "cleanly" (ok, ok, I hear your groans).
  431.  
  432. HTTP now supports a response code of 204, which is no operation. Some
  433. browsers such as Mosaic/X 2.* support it. To use it, make your script a nph
  434. script and output an HTTP/1.0 204 header. Something like:
  435.  
  436. HTTP/1.0 204 No response
  437. Server: Myscript/NCSA httpd 1.1
  438.  
  439.    
  440.    
  441.    (You can learn more about nph scripts from the NCSA server
  442.    documentation at the URL <http://hoohoo.ncsa.uiuc.edu/docs>.)
  443.    Essentially they are scripts that handle their own HTTP response
  444.    codes.
  445.    
  446. 4.3: Where can I learn how to create fill-out forms?
  447.  
  448.    You can read about the Common Gateway Interface at the URL
  449.    <http://hoohoo.ncsa.uiuc.edu:80/cgi/>. In addition to documenting the
  450.    standard interface for which scripts can now be written for both NCSA
  451.    and CERN-derived servers, these pages also cover HTML forms and how to
  452.    handle the results on the server side.
  453.    
  454. 4.4: How can I save an inline image to disk?
  455.  
  456.    
  457.    
  458.    Here are two ways:
  459.    
  460.    1. Turn on "load to local disk" in your browser, if it has such an
  461.    option; then reload images. You'll be prompted for filenames instead
  462.    of seeing them on the screen. Be sure to shut it off when you're done
  463.    with it.
  464.    
  465.    2. Choose "view source" and browse through the HTML source; find the
  466.    URL for the inline image of interest to you; copy and paste it into
  467.    the "Open URL" window. This should load it into your image viewer
  468.    instead, where you can save it and otherwise muck about with it.
  469.    
  470.                                   5: CREDITS
  471.                                        
  472.      * Thomas Boutell _boutell@netcom.com_
  473.      * Nathan Torkington _Nathan.Torkington@vuw.ac.nz_
  474.      * Marc Andreessen _marca@ncsa.uiuc.edu_
  475.      * Tony Johnson
  476.  
  477.  
  478. -------------------------------------------------------------------------------
  479.