home *** CD-ROM | disk | FTP | other *** search
/ A Beginner's Guide to the Internet / INTERNET.ISO / text / www / info / part2 < prev    next >
Encoding:
Internet Message Format  |  1995-03-15  |  44.3 KB

  1. Path: bloom-beacon.mit.edu!senator-bedfellow.mit.edu!faqserv
  2. From: boutell@netcom.com (Thomas Boutell)
  3. Newsgroups: comp.infosystems.www,comp.infosystems.www.misc,comp.infosystems.www.users,comp.infosystems.www.providers,comp.infosystems.wais,comp.infosystems.gopher,comp.infosystems,alt.hypertext,comp.answers,alt.answers,news.answers
  4. Subject: World Wide Web Frequently Asked Questions (FAQ), Part 2/2
  5. Supersedes: <www/faq/part2_794621914@rtfm.mit.edu>
  6. Followup-To: comp.infosystems.www.misc
  7. Date: 15 Mar 1995 20:07:00 GMT
  8. Organization: Nerdsholm
  9. Lines: 936
  10. Approved: news-answers-request@MIT.Edu
  11. Distribution: world
  12. Expires: 5 Apr 1995 20:03:51 GMT
  13. Message-ID: <www/faq/part2_795297831@rtfm.mit.edu>
  14. References: <www/faq/part1_795297831@rtfm.mit.edu>
  15. NNTP-Posting-Host: bloom-picayune.mit.edu
  16. Summary: beginner & advanced world wide web questions-read before posting to comp.infosystems.www.[...] newsgroups
  17. X-Last-Updated: 1995/01/26
  18. Originator: faqserv@bloom-picayune.MIT.EDU
  19. Xref: bloom-beacon.mit.edu comp.infosystems.www.misc:23393 comp.infosystems.www.users:21204 comp.infosystems.www.providers:23169 comp.infosystems.wais:4441 comp.infosystems.gopher:16214 comp.infosystems:4355 alt.hypertext:6438 comp.answers:10666 alt.answers:8098 news.answers:37103
  20.  
  21. Archive-name: www/faq/part2
  22. Last-modified: 1995/26/1
  23.  
  24.    
  25.                 5.1: HOW CAN I PROVIDE INFORMATION TO THE WEB?
  26.                                        
  27.    
  28.    
  29.    Information providers run programs that the browsers can obtain
  30.    hypertext from. These programs can either be WWW servers that
  31.    understand the HyperText Transfer Protocol HTTP (best if you are
  32.    creating your information database from scratch), "gateway" programs
  33.    that convert an existing information format to hypertext, or a
  34.    non-HTTP server that WWW browsers can access -- anonymous FTP or
  35.    gopher, for example.
  36.    
  37.    To learn more about World Wide Web servers, you can consult a www
  38.    server primer by Nathan Torkington, available at the URL
  39.    http://www.vuw.ac.nz/who/Nathan.Torkington/ideas/www-servers.html .
  40.    
  41.    If you only want to provide information to local users, placing your
  42.    information in local files is also an option. This means, however,
  43.    that there can be no off-machine access.
  44.    
  45. 5.2: Obtaining Servers
  46.  
  47.    Servers are available for Unix, Macintosh, MS Windows, Windows NT,
  48.    OS/2, and VMS systems. If you know of a server for another operating
  49.    system, please contact me.
  50.    
  51.    See http://info.cern.ch/hypertext/WWW/Daemon/Overview.html for more
  52.    information on writing servers and gateways in general.
  53.    
  54.   5.2.1: UNIX SERVERS
  55.   
  56.    NCSA httpd
  57.           NCSA has released a server, known as the NCSA httpd; it is
  58.           available at the URL ftp://ftp.ncsa.uiuc.edu/Web/ncsa_httpd .
  59.           
  60.    EIT httpd
  61.           EIT has created the Webmaster's Starter Kit, which installs
  62.           their WWW server on your system via the web through a painless
  63.           forms interface. Recommended for those unfamiliar with server
  64.           installation. You can learn more about the starter kit and the
  65.           EIT httpd at the starter kit site (URL is
  66.           http://wsk.eit.com/wsk/doc/ ).
  67.           
  68.    CERN httpd
  69.           CERN's server is available for anonymous FTP from info.cern.ch
  70.           (URL is http://info.cern.ch/hypertext/WWW/Daemon/Status.html )
  71.           and many other places. Use your local copy of archie to search
  72.           for "www" in order to find a nearby site.
  73.           
  74.    GN Gopher/HTTP server
  75.           The GN server is unique in that it can serve both WWW and
  76.           Gopher clients (in their native modes). This is a good server
  77.           for those migrating from Gopher to WWW, although it does not
  78.           have the server-side-script capabilities of the NCSA and CERN
  79.           servers. See the URL http://hopf.math.nwu.edu/ .
  80.           
  81.    Perl server
  82.           There is also a server written in the Perl scripting language,
  83.           called Plexus, for which documentation is available at the URL
  84.           http://bsdi.com/server/doc/plexus.html .
  85.           
  86.    WN Server
  87.           The WN Server, available at the URL
  88.           http://hopf.math.nwu.edu/docs/manual.html , is designed with an
  89.           emphasis on security and flexibility, and takes a different
  90.           approach from the NCSA and CERN servers. It provides text
  91.           searching facilities as a standard feature.
  92.           
  93.   5.2.2: MACINTOSH SERVERS
  94.   
  95.    There is a server for the Macintosh, MacHTTP, available at the URL
  96.    http://www.uth.tmc.edu/mac_info/machttp_info.html .
  97.    
  98.   5.2.3: MS WINDOWS, IBM OS/2 AND MS WINDOWS NT SERVERS
  99.   
  100.    HTTPS (Windows NT)
  101.           HTTPS is a server for Windows NT systems, both Intel and Alpha
  102.           -- based. It is available via anonymous FTP from emwac.ed.ac.uk
  103.           in the directory pub/https (URL is
  104.           ftp://emwac.ed.ac.uk/pub/https). (Be sure to download the
  105.           version appropriate to your processor.) You can read a detailed
  106.           announcement at the FTP site, or by using the URL
  107.           ftp://emwac.ed.ac.uk/pub/https/https.txt.
  108.           
  109.           A professional version is also available (URL is
  110.           http://emwac.ed.ac.uk/html/internet_toolchest/https/prof.htm ).
  111.           
  112.    NCSA httpd for Windows
  113.           The NCSA httpd for Windows has most of the features of the Unix
  114.           version, including scripts (which generate pages on the fly
  115.           based on user input). It is available by anonymous FTP from the
  116.           ftp site ftp.alisa.com in the directory pub/win-httpd, and
  117.           documentation can be found at the URL
  118.           http://www.alisa.com/win-httpd/index.html .
  119.           
  120.    SerWeb
  121.           A simple, effective server for Windows writtten by Gustavo
  122.           Estrella. Available by anonymous ftp from
  123.           winftp.cica.indiana.edu (or one of its mirror sites, such as
  124.           nic.switch.ch), as the file serweb03.zip, in the directory
  125.           /pub/pc/win3/winsock.
  126.           
  127.           There is also a Windows NT version of SerWeb, available by
  128.           anonymous FTP from emwac.ed.ac.uk as /pub/serweb/serweb_i.zip.
  129.           
  130.    WEB4HAM
  131.           Another Windows-based server, available by anonymous FTP from
  132.           ftp.informatik.uni-hamburg.de as /pub/net/winsock/web4ham.zip.
  133.           
  134.    OS2HTTPD
  135.           An OS/2 server, written by Frankie Fan. See the home page (URL
  136.           is ftp://ftp.netcom.com/pub/kf/kfan/overview.html ) for
  137.           details, or fetch the package by anonymous FTP from
  138.           ftp.netcom.com in the directory pub/kf/kfan.
  139.           
  140.   5.2.4: MSDOS AND NOVELL NETWARE SERVERS
  141.   
  142.    KA9Q   KA9Q NOS (nos11c.exe) is a internet server package for DOS that
  143.           includes HTTP and Gopher servers. It can be obtained via
  144.           anonymous FTP from one of the following sites:
  145.           
  146.  
  147. inorganic5.chem.ufl.edu
  148. biochemistry.cwru.edu
  149.  
  150.    GLACI-HTTPD
  151.           GLACI-HTTPD is a Netware Loadable Module which allows a Novell
  152.           NetWare server to become a World Wide Web server (URL is
  153.           http://www.glaci.com/info/glaci-httpd.html ).
  154.           
  155.    
  156.    
  157.   5.2.5: VMS SERVERS
  158.   
  159.    CERN HTTP for VMS
  160.           A port of the CERN server to VMS. Available at the URL
  161.           http://delonline.cern.ch/disk$user/duns/doc/vms/distribution.html .
  162.           
  163.    Region 6 Threaded HTTP Server
  164.           A native VMS server which uses DECthreads(tm). This is a
  165.           potentially major performance advantage because VMS has a high
  166.           overhead for each process, which is a problem for the
  167.           frequently-forking NCSA and CERN servers that began life under
  168.           Unix. A multithreaded server avoids this overhead. Available at
  169.           the URL http://kcgl1.eng.ohio-state.edu/www/doc/serverinfo.html .
  170.           
  171.    
  172.    
  173.   5.2.6: AMIGA SERVERS
  174.   
  175.    NCSA's Unix server has been ported to the Amiga, and is bundled with
  176.    the AMosaic browser. See the URL
  177.    http://insti.physics.sunysb.edu/AMosaic/home.html for details.
  178.    
  179.   5.2.7: VM/CMS SERVERS
  180.   
  181.    A VM/CMS web server is available; see the URL
  182.    http://ua1vm.ua.edu/~troth/rickvmsw/rickvmsw.html for more
  183.    information. If you don't yet have a web browser to try this URL with,
  184.    check out the VM/CMS Browsers section.
  185.    
  186.   5.2.8: YEAH, BUT WHICH IS BEST?
  187.   
  188.    
  189.    
  190.    To find out which server is best for your needs, you will want to
  191.    consult Paul Hoffman's Server Comparison Chart (URL is
  192.    http://sunsite.unc.edu/boutell/faq/chart.html ). That document is also
  193.    available by anonymous FTP from ftp.netcom.com in the directory
  194.    pub/bo/boutell/faq.
  195.    
  196. 5.3: Producing HTML documents
  197.  
  198.    HTML is the simple markup system used to create hypertext documents.
  199.    There are three ways to produce HTML documents: writing them yourself,
  200.    which is not a very difficult skill to acquire, using an HTML editor,
  201.    which assists in doing the above, and converting documents in other
  202.    formats to HTML. The following three sections cover these
  203.    possibilities in sequence.
  204.    
  205.   5.3.1: WRITING HTML DOCUMENTS YOURSELF
  206.   
  207.    You can write an HTML document with any text editor. Try the "source"
  208.    button of your browser (or "save as" HTML) to look at the HTML for a
  209.    page you find particularly interesting. The odds are that it will be a
  210.    great deal simpler than you would expect. If you're used to marking up
  211.    text in any way (even red-pencilling it), HTML should be rather
  212.    intuitive.
  213.    
  214.    A beginner's guide to HTML is available at the URL
  215.    http://www.ncsa.uiuc.edu/General/Internet/WWW/HTMLPrimer.html . You
  216.    can also find a plain text version (at the URL
  217.    ftp://ftp.ncsa.uiuc.edu/ncsapubs/WWW/HTMLPrimer.txt) and a compressed
  218.    Postscript version (at the URL
  219.    ftp://ftp.ncsa.uiuc.edu/ncsapubs/WWW/HTMLPrimer.ps.Z). (Since the
  220.    latter two are FTP URLs, you can fetch them by hand using FTP if you
  221.    do not yet have a web browser.)
  222.    
  223.    There is also an HTML primer by Nathan Torkington at the URL
  224.    http://www.vuw.ac.nz/who/Nathan.Torkington/ideas/www-html.html .
  225.    
  226.   5.3.2: HTML EDITORS
  227.   
  228.    Of course, most folks would still prefer to use a friendlier,
  229.    graphical editor. Some editors are WYSIWYG (What You See Is What You
  230.    Get), or close to it; others simply assist you in writing HTML by
  231.    plugging in the desired markup tags for you from a menu.
  232.    
  233.    Fans of the EMACS editor can use EMACS and html-helper-mode , an EMACS
  234.    "mode" for HTML editing (URL is http://www.reed.edu/~nelson/tools/ ).
  235.    
  236.    There is also another Emacs HTML mode, html-mode.el (URL is
  237.    ftp://ftp.ncsa.uiuc.edu/Web/html/elisp/html-mode.el ).
  238.    
  239.    For Microsoft Windows users, there is an editor called HTML Assistant
  240.    with features to assist in the creation of HTML documents. It can be
  241.    had by anonymous FTP from ftp.cs.dal.ca in the directory /htmlasst/.
  242.    Read the README.1ST file in this directory for information on which
  243.    files to download.
  244.    
  245.    ANT_HTML.DOT is a Word for Windows 6.0 template designed to convert
  246.    Word documents into HTML documents in a WYSIWYG environment. It
  247.    includes a demo version of the ANT_PLUS utility, which converts HTML
  248.    files to WYSIWYG. ANT_PLUS also converts HTML files to ASCII, RTF, or
  249.    any other format possible in Word 6.0. Contact jswift@freenet.fsu.edu
  250.    if you need more information.
  251.    
  252.    A WYSIWYG editor for the Web, SoftQuad HoTMetaL, is available for
  253.    downloading at NCSA and numerous other sites. Many mirror sites exist;
  254.    if you can't get through to one, try another, don't give up! That's
  255.    what mirror sites are for. (Also be sure to use the copy closest to
  256.    you geographically if possible.) Hotmetal is available for both Sun
  257.    Sparc systems and Windows systems; note that Windows users need at
  258.    least 6 megabytes of free memory. (A 2-megabyte swap file should just
  259.    barely do the trick on a 4MB machine.)
  260.    
  261.    Known mirrors:
  262.      * ftp://ftp.ncsa.uiuc.edu/Web/html/hotmetal/
  263.      * ftp://ftp.ifi.uio.no/pub/SGML/HoTMetaL
  264.      * ftp://sgml1.ex.ac.uk/SoftQuad
  265.      * ftp://src.doc.ic.ac.uk/packages/WWW/ncsa/html/hotmetal/
  266.      *
  267.        ftp://askhp.ask.uni-karlsruhe.de/pub/infosystems/mosaic/contrib/Sof
  268.        tQuad
  269.      * ftp://ftp.cs.concordia.ca/pub/www
  270.      *
  271.        
  272.    You need a Sun SPARC or Microsoft Windows system and 6MB of disk (6MB
  273.    of RAM minimum for MS Windows; swap files count). Other Unix systems
  274.    may be supported by the time you read this; have a look on one of the
  275.    sites above.
  276.    
  277.    Because it is context-sensitive, HoTMetaL guides users in creating new
  278.    HTML documents and in cleaning up old ones. A Publish command changes
  279.    appropriate SRC and HREF attributes from local paths to http
  280.    locations. For more information, FTP the README file from the same
  281.    directory, or send email to hotmetal@sq.com. A HoTMetaL Pro
  282.    commercially supported version is available for purchase from SoftQuad
  283.    and its resellers.
  284.    
  285.    Also see Gabriel White's reviews of MS Windows HTML editors (URL is
  286.    http://werple.mira.net.au/%7Egabriel/web/html/editors/ ). Another
  287.    option, if you have an SGML editor, is to use it with the HTML DTD
  288.    (URL is http://info.cern.ch/hypertext/WWW/MarkUp/DTDHeading.html ).
  289.    
  290.    An editor for all X users: TkWWW (listed above under X browsers)
  291.    supports WYSIWYG HTML editing; and since it's a browser, you can try
  292.    out links immediately after creating them.
  293.    
  294.    Another editor for X users: Phoenix (URL is
  295.    http://www.bsd.uchicago.edu/ftp/pub/phoenix/README.html ) is a fully
  296.    WYSIWYG HTML editor which insulates the user from direct control of
  297.    the HTML tags. Available by anonymous FTP from www.bsd.uchicago.edu in
  298.    the pub/phoenix subdirectory.
  299.    
  300.    Also for X users, there is a package called htmltext which supports
  301.    WYSIWYG HTML editing. More information is available at the URL
  302.    http://web.cs.city.ac.uk/homes/njw/htmltext/htmltext.html .
  303.    
  304.    For Macintosh users, there is a near-WYSIWYG package called HTML
  305.    Editor (URL is http://dragon.acadiau.ca:1667/~giles/HTML_Editor).
  306.    
  307.    ANT_HTML is a Word for the Macintosh template designed to convert Word
  308.    documents into HTML documents in a WYSIWYG environment. It includes a
  309.    demo version of the ANT_PLUS utility, which converts HTML files to
  310.    WYSIWYG. ANT_PLUS also converts HTML files to ASCII, RTF, or any other
  311.    format possible in Word. At the time of this writing it was scheduled
  312.    to have been released on the Macintosh (it has long been available for
  313.    Windows). Contact jswift@freenet.fsu.edu for more information. Also
  314.    for Macintosh users, the BBEdit HTML extensions allow the BBEdit and
  315.    BBEdit Lite text editors for the Macintosh to conveniently edit HTML
  316.    documents. (URL is http://www.uji.es/bbedit-html-extensions.html .)
  317.    You can also obtain the extensions package by anonymous ftp from
  318.    sumex-aim.stanford.edu as info-mac/bbedit-html-ext-b3.hqx.
  319.    
  320.    There is an alternative BBEdit extension package available as well
  321.    (URL is http://www.york.ac.uk/~ld11/BBEditTools.html ). it is
  322.    available by FTP from ftp.york.ac.uk in the directory
  323.    /pub/users/ld11/BBEdit_HTML_Tools.sea.hqx.
  324.    
  325.    NCSA's List of Filters and Editors, for which the URL is
  326.    http://www.ncsa.uiuc.edu/SDG/Software/Mosaic/Docs/faq-software.html#ed
  327.    itors, mentions several editors, including two for MS Windows. In some
  328.    cases, the "editor" amounts to a set of macros for an existing word
  329.    processor, which can provide a near-WYSIWYG environment.
  330.    
  331.    Note that this URL contains uppercase and lowercase letters; certain
  332.    operating systems won't allow mixed case on the command line, or will
  333.    only allow it if it is quoted (VMS), so if you are launching Lynx or
  334.    another client and specifying a URL at the command line, try quoting
  335.    the URL in double-quotes ("URL").
  336.    
  337.   5.3.3: CONVERTING OTHER FORMATS TO HTML
  338.   
  339.    There is a collection of filters for converting your existing
  340.    documents (in TeX and other non-HTML formats) into HTML automatically,
  341.    including filters that can allow more or less WYSIWYG editing using
  342.    various word processors:
  343.    
  344.    Rich Brandwein and Mike Sendall's List at CERN (URL is
  345.    http://info.cern.ch/hypertext/WWW/Tools/Filters.html ).
  346.    
  347.    (Note that this URL contains uppercase and lowercase letters; certain
  348.    operating systems such as VMS require you to quote mixed-case URLs
  349.    when launching a borwser from the command line. This is NOT a bug in
  350.    the browser.)
  351.    
  352.    There is also a Word for Windows template for writing HTML documents,
  353.    available at the URL http://www.gatech.edu/word_html/release.htm .
  354.    
  355.   5.3.4: CHECKING YOUR HTML FOR ERRORS
  356.   
  357.    Tools to validate your HTML documents (check them for errors) are
  358.    available. There is a form at the URL
  359.    http://www.hal.com/%7Econnolly/html-test/service/validation-form.html
  360.    which will check HTML documents for errors according to the latest
  361.    specification; note that you are encouraged to set up the program on
  362.    your own system if you make heavy use of the form. There is also a
  363.    tool which will check the links in your documents for links to
  364.    nonexistent resources, such as pages that have moved (URL is
  365.    http://wsk.eit.com/wsk/dist/doc/admin/webtest/verify_links.html ).
  366.    
  367.    Also try weblint (URL is
  368.    http://www.khoros.unm.edu/staff/neilb/weblint.html ), a Perl script
  369.    that checks your HTML for errors; you can even try it out over the web
  370.    through an HTML form. The script is available by anonymous FTP from
  371.    ftp.khoros.unm.edu in the directory pub/perl/www.
  372.    
  373.    Another such tool is htmlchek (URL is:
  374.    http://uts.cc.utexas.edu/~churchh/htmlchek.html ), which checks HTML
  375.    documents for errors, creates a cross-reference, automatically expands
  376.    entities (such as European characters) to their proper HTML form, and
  377.    performs other useful services. htmlchek is available by anonymous FTP
  378.    from ftp.cs.buffalo.edu in the directory pub/htmlchek.
  379.    
  380. 5.4: How do I publicize my work?
  381.  
  382.    There are several things you can do to publicize your new HTML server
  383.    or other offering:
  384.      * Post to comp.infosystems.www.announce. PLEASE READ THE CHARTER
  385.        POSTING FIRST. In general, always read a newsgroup first to
  386.        familiarize yourself before posting to it.
  387.      * Submit it to the NCSA What's New Page at the URL
  388.        http://www.ncsa.uiuc.edu/SDG/Software/Mosaic/Docs/whats-new.html
  389.        (see the page for details on how to submit your listing!).
  390.      * Post it to the newsgroup comp.infosystems.announce. Please read
  391.        the group first to get a feel for the contents. You should not
  392.        post to comp.infosystems.www.users,.misc,.providers, etc., but if
  393.        you feel compelled to do so, please choose .misc as announcements
  394.        are of interest to both providers and users (and those who wear
  395.        both hats).
  396.      * Submit it to the maintainers of various catalogs, such as the WWW
  397.        Virtual Library (at the URL
  398.        http://info.cern.ch/hypertext/DataSources/bySubject/Overview.html
  399.        ) and the ALIWEB index (at the URL
  400.        http://web.nexor.co.uk/aliweb/doc/aliweb.html ).
  401.      * Read Gareth Rees' guide to publishing on the World Wide Web. (URL
  402.        is http://www.cl.cam.ac.uk/users/gdr11/publish.html ).
  403.        
  404. 5.5: Can I buy space on an existing server?
  405.  
  406.    Yes, you can. A list of sites offering WWW space for lease is
  407.    available (at the URL http://union.ncsa.uiuc.edu/www/leasing.shtml ).
  408.    
  409. 5.6: How fast does my net connection need to be?
  410.  
  411.    The following response to this very-frequently-asked-question was
  412.    provided by Mike Meyer (mwm@contessa.phone.net).
  413.    
  414.      The answer is "It depends." What it depends on is what kind of
  415.      things you want to provide on your server. Here are some rules of
  416.      thumb to use when deciding what kind of connection you need for your
  417.      server.
  418.      
  419.      The first rule of thumb is:
  420.      
  421.      Don't worry about simultaneous access.
  422.      
  423.      Unless you have a very large site, simultaneous access is not a
  424.      problem. If you have a very large site, you need as much bandwidth
  425.      as you can afford. There is a bit more about this below.
  426.      
  427.      The second rule of thumb is:
  428.      
  429.      It should take at most 5 seconds to send a page.
  430.      
  431.      The five second rule dates from command line days, when that was
  432.      about how long people would wait before getting impatient with the
  433.      system. It seems like a reasonable number to use now.
  434.      
  435.      Since external images/audio/etc. are somewhat exceptional, allow
  436.      more time for them. If you think they should have the same
  437.      restrictions as above, buy the bandwidth your site will need to do
  438.      so. However, the rule of thumb for external images/audio/etc is:
  439.      
  440.      It should take at most 30 seconds to send an external file.
  441.      
  442.      Given these rules, it's pretty straightforward to work out how large
  443.      an HTML page and external files can be. At least, it's easy after
  444.      you simplify things by ignoring IP overhead on the line, compression
  445.      on modem lines, and anything that's less than 10% of the total (or
  446.      even a little bit more than 10%).
  447.      
  448.      The one simplification not to ignore is the multiple packet
  449.      round-trips it takes to get data flowing through an HTTP channel.
  450.      For modem lines, this is nearly a second for each HTTP connection,
  451.      which is significant. For leased lines, it's more like .1 or .2
  452.      seconds, which is not significant.
  453.      
  454.      On a 14.4 line assumed to be sending 1.4K bytes of data/second, with
  455.      a 1 second startup, you get 4 * 1.4 or 5.6K of HTML. If you want to
  456.      include a single inline image, that's 2 seconds of startup, so
  457.      you're down to 3 * 1.4 or 4.2K of HTML + image. This means smallish
  458.      HTML pages, and simple inline images. For external files, you get 29
  459.      * 1.4 or 40K, which is still a small image. If you have a 28.8 line,
  460.      you get to double those figures; for a 9600 line, figure 2/3rds of
  461.      that size.
  462.      
  463.      On a 56K leased line assumed to be sending 5K/second, you get 25K of
  464.      HTML, or mixed HTML/data. For external images, it's 150K. That
  465.      should cover any reasonable HTML document, and small to medium
  466.      external files. An MPEG movie might be a bit much.
  467.      
  468.      With a T1 line assumed to be sending 150K/second, you get 750K of
  469.      HTML, or 4.5 megabytes in an external file. Barring very large
  470.      animations, this should be sufficient for anything you want to
  471.      serve. More would be faster, but it also gets drastically more
  472.      expensive.
  473.      
  474.      Given the above guidelines, let's look at simultaneous access again.
  475.      Under the worst case conditions, you're using all of your line for
  476.      HTML pages, each of which takes 5 seconds to send, so your server is
  477.      sending 12 pages a minute, or 720 pages an hour, or 17,000 pages a
  478.      day (pages, not accesses; each inline image in a page generates an
  479.      access, unless the client cached it). This makes you one of the
  480.      busier sites on the web. While you'll have contention problems
  481.      before you get to this point, anything but a modem connection will
  482.      be sending most pages in a small fraction of five seconds, which
  483.      should leave plenty of bandwidth with no contention. If you have
  484.      this kind of access rates on a modem line, you should seriously
  485.      consider upgrading your connection.
  486.      
  487.      The bottom line on simultaneous access is that the WWW server is
  488.      more likely to have contention with other uses of the line than with
  489.      itself. Since I don't know what else you use your line for, I can't
  490.      factor it in. You'll have to consider that issue yourself.
  491.      
  492.    
  493.    
  494.   5.7.1: HOW DO I SET UP A CLICKABLE IMAGE MAP?
  495.   
  496.    
  497.    
  498.    There are really two issues here: how to indicate in HTML that you
  499.    want an image to be clickable, and how to configure your server to do
  500.    something with the clicks returned by Mosaic, Chimera, and other
  501.    clients capable of delivering them.
  502.    
  503.    You can read about image maps and the NCSA server at the URL
  504.    http://hoohoo.ncsa.uiuc.edu/docs/setup/admin/Imagemap.html .
  505.    
  506.    Using imagemaps requires that you create a map file; you can do this
  507.    by hand or with a WYSIWYG tool.
  508.    
  509.    VERY IMPORTANT: Creating imagemaps requires a real web server (not
  510.    an FTP server) and a cooperative web server administrator. It is not
  511.    usually as simple as wrapping a link around an IMG SRC tag and adding
  512.    the ISMAP directive; the server must also be told about the map file,
  513.    and the way to accomplish this varies from server to server. So read
  514.    your server documentation, and don't waste time making maps before
  515.    making sure you have the necessary tools to deliver them.
  516.    
  517.    Mapedit
  518.           Mapedit (URL is:
  519.           http://sunsite.unc.edu/boutell/mapedit/mapedit.html ) is a
  520.           WYSIWYG imagemap editing tool for Microsoft Windows and the X
  521.           Window System.
  522.           
  523.    MapMaker
  524.           For users of John Bradley's xv image display software for the
  525.           X Window System, Mapmaker can turn the miniature images created
  526.           by xv's Visual Schnauzer into an imagemap. This is useful if
  527.           you would like to make an entire directory of images available
  528.           (but note that you should also make textual links to allow
  529.           those with text- based browsers to download the images for
  530.           external viewing). (URL is:
  531.           http://icg.stwing.upenn.edu:80/~mengwong/mapmaker.html )
  532.           
  533.    WebMap
  534.           On the Macintosh, you may want to use WebMap (URL is
  535.           ftp://ftp.uwtc.washington.edu/pub/Mac/Network/WWW ). . It
  536.           produces both NCSA and CERN-compatible maps, which can also be
  537.           used with MacImagemap and a Macintosh-based server (MacImagemap
  538.           is found in the same directory). Alternatively, you may want to
  539.           use MacMapMaker, also available from
  540.           ftp://ftp.uwtc.washington.edu/pub/Mac/Network/WWW (the same
  541.           directory).
  542.           
  543.    Tkmapedit
  544.           For Unix systems and other systems on which the Tk/Tcl language
  545.           toolkit has been installed, Tkmapedit provides a WYSIWYG
  546.           imagemap editor which is capable of directly testing links if
  547.           the tkWWW web browser is available. Available by anonymous FTP
  548.           from the TCL archive on ftp.aud.alcatel.com.
  549.           
  550.    
  551.    
  552.   5.7.2: HOW DO I MAKE A "LINK" THAT DOESN'T LOAD A NEW PAGE?
  553.   
  554.    
  555.    
  556.    Such links are useful when a form is intended to perform some action
  557.    on the server machine without sending new information to the client,
  558.    or when a user has clicked in an undefined area in an image map; these
  559.    are just two possibilities.
  560.    
  561.    Rob McCool of NCSA provided the following wisdom on the subject:
  562.  
  563. Yechezkal-Shimon Gutfreund (sg04@gte.com) wrote:
  564. : Ok, here is another bizzare request from me:
  565.  
  566. : I am currently running scripts which I "DO NOT" want to return
  567. : any visible result. That is, not text/plain, not text/HTML, not
  568. : image/gif. The entire results are the side effects of the
  569. : script and nothing should be returned to the viewer.
  570.  
  571. : It would be nice to have an internally supported null viewer
  572. : so that I could do this, more "cleanly" (ok, ok, I hear your groans).
  573.  
  574.    
  575.    
  576.    HTTP now supports a response code of 204, which is no operation. Some
  577.    browsers such as Mosaic/X 2.* support it. To use it, make your script
  578.    a nph script and output an HTTP/1.0 204 header. Something like:
  579.    
  580.    HTTP/1.0 204 No response Server: Myscript/NCSA httpd 1.1
  581.    
  582.    (You can learn more about nph scripts from the NCSA server
  583.    documentation at the URL http://hoohoo.ncsa.uiuc.edu/docs .)
  584.    Essentially they are scripts that handle their own HTTP response
  585.    codes.
  586.    
  587.   5.7.3: WHERE CAN I LEARN HOW TO CREATE FILL-OUT FORMS?
  588.   
  589.    Writing an HTML form is easy, but the form doesn't accomplish anything
  590.    until you write a CGI program to interpret the results on the server
  591.    side! For more information, see section 5.7.14.
  592.    
  593.    See the section on email forms for a simple solution to the most
  594.    commonly desired form.
  595.    
  596.     5.7.3.1: How can I create hidden fields in forms (keeping state)?
  597.     
  598.    Use INPUT TYPE=hidden. An example:
  599.  
  600. <INPUT TYPE=hidden NAME=state VALUE="hidden info to be returned with form">
  601.  
  602.    By now, most browsers can handle the hidden type, but understand that
  603.    some browsers will fail to hide the field (and probably confuse the
  604.    user). Note that "hidden" doesn't mean "secret"; the user can always
  605.    click on "view source".
  606.    
  607.     5.7.3.2: How can users send me email through their browsers?
  608.     
  609.    There are two ways:
  610.    
  611.    Using a mailto: URL
  612.           You can simply create a link which looks like this:
  613.           
  614.           <A HREF="mailto:me@my.address">Send Me Mail</A>
  615.           
  616.           This works great for browsers that support the mailto: URL.
  617.           Perhaps 80% of web users will be able to use such a link. But
  618.           not all browsers support it.
  619.           
  620.    Installing an email form
  621.           If you have access to the server's configuration files, or if
  622.           your server administrator permits users to create their own CGI
  623.           scripts, you can create a form which sends mail to you from any
  624.           browser that supports forms. I've written a simple email forms
  625.           package (URL is: http://siva.cshl.org/email/index.html ), which
  626.           does it in ANSI C. There is also a package written in Perl,
  627.           known as the WWW Mailto Gateway (URL is
  628.           http://www.mps.ohio-state.edu/mailto/mailto_info.html ).
  629.           GetComments (URL is:
  630.           http://everest.cs.ucdavis.edu/~hoagland/getcomments.html) is a
  631.           more general package, also written in Perl, which can handle
  632.           many different types of comment forms.
  633.           
  634.           If you want to learn how these forms actually work, see section
  635.           5.7.14.
  636.           
  637.    
  638.    
  639.   5.7.4: HOW DO I COMMENT AN HTML DOCUMENT?
  640.   
  641.    
  642.    
  643.    Use the <!-- tag at the beginning of EACH line commented out; close
  644.    this for EACH line with the --> tag. Note that comments do not nest,
  645.    and the sequence "--" may not appear inside a comment except as part
  646.    of the closing --> tag. (It's officially allowed, but some browsers
  647.    won't handle it properly.)
  648.    
  649.    You should not try to use this to "comment out" HTML that would
  650.    otherwise be shown to the user, since some browsers (notably Mosaic)
  651.    will still pay attention to tags inside the comment and close it
  652.    prematurely.
  653.    
  654.    Thanks to Joe English for clearing up this issue.
  655.    
  656.   5.7.5: HOW CAN I CREATE DECENT-LOOKING TABLES AND STOP USING <PRE>... </PRE>?
  657.   
  658.    Tables are a standard feature in HTML Level 3, a new version of HTML.
  659.    Unfortunately, they are at present implemented only by the latest NCSA
  660.    Mosaic versions and the Viola and Emacs-W3 browsers, to my knowledge.
  661.    In addition, most implementations are incomplete. In some
  662.    implementations, at the time of this writing, text in tables cannot be
  663.    selected and/or cannot be a link.
  664.    
  665.    However, there is a way to use HTML Level 3 tables now and convert
  666.    them automatically to HTML, allowing you to design proper tables and
  667.    install those pages directly when table support arrives in the
  668.    majority of clients. You can do this using the html+tables package, by
  669.    Brooks Cutter (bcutter@paradyne.com), which is available for anonymous
  670.    ftp from sunsite.unc.edu in the directory
  671.    pub/packages/infosystems/WWW/tools/html+tables.shar. This package
  672.    requires the shell language Perl, which is primarily used on Unix
  673.    systems but is also available for other systems (such as MSDOS
  674.    machines). html+tables accepts HTML Level 3 and outputs html using the
  675.    <PRE>...</PRE> construct to represent tables, allowing you to write
  676.    HTML Level 3 now, knowing that it will look better when clients are
  677.    ready for it.
  678.    
  679.   5.7.6: WHAT IS HTML LEVEL 3 AND WHERE CAN I LEARN MORE ABOUT IT?
  680.   
  681.    HTML Level 3, also known as HTML+, is an enhanced version of HTML
  682.    designed to address some of the limitations of HTML. HTML Level 3
  683.    supports true tables, right-justified text, centered text, line breaks
  684.    that do not double space, and many other desired features.
  685.    
  686.    However, most clients support only a handful of HTML Level 3 features
  687.    (such as the partial implementation of tables in Mosaic) at the time
  688.    of this writing. If you have access to a Unix system with the X Window
  689.    System installed, you can try out many features of HTML Level 3 using
  690.    the experimental Arena browser.
  691.    
  692.    You can access information about new developments in HTML at the CERN
  693.    server (at the URL
  694.    http://info.cern.ch/hypertext/WWW/MarkUp/MarkUp.html ).
  695.    
  696.    (HTML Level 1 is the original version. HTML Level 2 is essentially the
  697.    same, but with the addition of forms.)
  698.    
  699.   5.7.7: HOW CAN I MAKE TRANSPARENT AND INTERLACED GIFS? AND WHAT ARE THEY?
  700.   
  701.    Transparent GIFs are useful because they appear to blend in smoothly
  702.    with the user's display, even if the user has set a background color
  703.    that differs from that the developer expected. They do this by
  704.    assigning one color to be transparent -- if the web browser supports
  705.    transparency, that color will be replaced by the browser's background
  706.    color, whatever it may be.
  707.    
  708.    Interlaced GIFs appear first with poor resolution and then improve in
  709.    resolution until the entire image has arrived, as opposed to arriving
  710.    linearly from the top row to the bottom row. This is great to get a
  711.    quick idea of what the entire image will look like while waiting for
  712.    the rest. This doesn't do much for you if your web browser doesn't
  713.    support progressive display as the image is downloaded, but
  714.    non-progressive-display web browsers will still display interlaced
  715.    GIFs once they have arrived in their entirety.
  716.    
  717.    To create transparent and interlaced GIFs, check out David Koblas'
  718.    giftool, a program which can manipulate those options and many more
  719.    aspects of your GIF file.
  720.    
  721.    In addition, there is a document explaining transparent GIFs available
  722.    at the URL http://melmac.corp.harris.com/transparent_images.html . You
  723.    can fetch the program giftrans by anonymous ftp from
  724.    ftp.rz.uni-karlsruhe.de at the path /pub/net/www/tools/giftrans.c.
  725.    
  726.    There is also a Perl Script (URL is:
  727.    http://www.omron.co.jp:80/~jfriedl/perl/ ) which makes transparent
  728.    GIFs.
  729.    
  730.    There is also a utility for the Macintosh, Transparency (URL is:
  731.    http://www.med.cornell.edu/~giles/projects.html#transparency).
  732.    
  733.   5.7.8: HOW COME MAILTO: URLS DON'T WORK?
  734.   
  735.    The mailto: URL is a feature found in Lynx, Netscape, Spry Mosaic, the
  736.    latest NCSA Mosaics, Emacs w3 mode and many other browsers. In
  737.    general, about 80% of web browsers support mailto: at the time of this
  738.    writing. However, it is not in numerous older browsers. In the
  739.    meantime, you can set up forms which send mail to you; see Section
  740.    5.7.3.2.
  741.    
  742.   5.7.9: HOW CAN I RESTRICT AND CONTROL ACCESS TO MY SERVER?
  743.   
  744.    All major servers have features that allow you to limit access to
  745.    particular sites, and many clients have authentication features that
  746.    allow you to identify specific users. There is a tutorial on security
  747.    and user authentication with the NCSA server and Mosaic available,
  748.    written by Marc Andreessen (URL is
  749.    http://wintermute.ncsa.uiuc.edu:8080/auth-tutorial/tutorial.html ).
  750.    See your server documentation for further information.
  751.    
  752.   5.7.10: WHICH FORMAT IS BETTER FOR WWW IMAGE PURPOSES, JPEG OR GIF?
  753.   
  754.    
  755.    
  756.    JPEG does a better job with realistic images such as scanned
  757.    photographs. Most browsers cannot handle inline JPEGs, however, so you
  758.    must link to them as external images (using a regular <A HREF...>
  759.    instead of <IMG SRC...>).
  760.    
  761.    GIF does a better job with crisp, sharp images, such as those
  762.    typically used to construct buttons, graphs and the like. All browsers
  763.    that can display graphics at all can display GIFs inline.
  764.    
  765.   5.7.11: HOW CAN I MIRROR PART OF ANOTHER SERVER?
  766.   
  767.    Scripts are available to do this, but at this time they are not very
  768.    friendly to the server you are attempting to mirror; their behavior
  769.    resembles that of the more poorly written WWW robots. If you are
  770.    trying to improve access times to a distant server, you will likely
  771.    find the "proxy" capabilities of CERN's WWW server to be a more
  772.    effective and general solution to your problem.
  773.    
  774.   5.7.12: HOW CAN I KEEP ROBOTS OFF MY SERVER?
  775.   
  776.    Programs that automatically traverse the web can be quite useful, but
  777.    have the potential to make a serious mess of things. Every so often
  778.    someone will write a "depth-first" searching robot that brings servers
  779.    to their knees. See the section on writing robots (4.10) for details.
  780.    
  781.    Fortunately, most robots on the web follow a simple protocol by which
  782.    you can keep them off your server if you wish, or keep them out of
  783.    portions of your server which are robot traps (ie, they contain an
  784.    infinite number of possible links). Read the document World Wide Web
  785.    Robots, Wanderers and Spiders (URL is:
  786.    http://web.nexor.co.uk/mak/doc/robots/robots.html ) and learn about
  787.    the emerging standards for exclusion of robots from areas in which
  788.    they are not wanted. You can also read about existing robots there,
  789.    including useful cataloging robots you probably do not want to keep
  790.    off your server.
  791.    
  792.   5.7.13: HOW CAN I KEEP STATISTICS ABOUT MY WEB SERVER?
  793.   
  794.    There are several tools which can generate statistics about your web
  795.    server:
  796.    
  797.    getstats
  798.           getstats is a versatile log analyzer, also written in C, which
  799.           provides reports for various time periods with a high degree of
  800.           flexibility. Add-on packages have been written to generate
  801.           reports in HTML and also to generate graphs. You can access the
  802.           getstats home page for more information (URL is
  803.           http://www.eit.com/software/getstats/getstats.html ), or obtain
  804.           the package by anonymous FTP from ftp.eit.com in the directory
  805.           /pub/web.software/getstats.
  806.           
  807.    WebStat
  808.           WebStat is a package written in the language Python which
  809.           supplies statistics on usage by domain, country, etc., with
  810.           daily, weekly, monthly and annual reports available. You will
  811.           need Python in order to use it. See the WebStat home page (URL
  812.           is
  813.           http://www.pegasus.esprit.ec.org/people/sijben/statistics/advertisment.html
  814.           ) for details, or obtain Python from ftp.cwi.nl in
  815.           the directory /pub/python and WebStat from
  816.           ftp.pegasus.esprit.ec.org in the directory /pub/misc.
  817.           
  818.    Wusage
  819.           Wusage, which I wrote, is a C program which generates simple
  820.           weekly reports in HTML, with inline image graphs displaying
  821.           server growth and the distribution of accesses by continent.
  822.           You can also exclude irrelevant accesses (inline images, local
  823.           machines, etc.) from the results. Read the Wusage home page
  824.           (URL is http://siva.cshl.org/wusage.html ) for more
  825.           information, or obtain Wusage by anonymous FTP from
  826.           isis.cshl.org in the directory pub/wusage.
  827.           
  828.    wwwstat
  829.           wwwstat is a full-featured log analyzer written in the language
  830.           Perl. (See the newsgroup comp.lang.perl for more information
  831.           about the language.) See the wwwstat home page (URL is
  832.           http://www.ics.uci.edu/WebSoft/wwwstat/ ) for more information,
  833.           or obtain the package by anonymous FTP from liege.ics.uci.edu
  834.           in the directory /pub/arcadia/wwwstat. See also gwstat (URL is
  835.           http://dis.cs.umass.edu/stats/gwstat.html ), a package which
  836.           produces GIF graphs from the output of wwwstat.
  837.           
  838.    
  839.    
  840.   5.7.14: I WANT TO GENERATE WEB PAGES FROM A PROGRAM. DO I HAVE TO WRITE A
  841.   CUSTOM SERVER?
  842.   
  843.    No, you will not need to write a custom server. Most web servers
  844.    support one variation or another of a standard for adding your own
  845.    programs to the web server. The standard is called CGI (Common Gateway
  846.    Interface).
  847.    
  848.    Marc Hedlund has written a FAQ on CGI programming (URL is:
  849.    http://www.halcyon.com/hedlund/cgi-faq/ ) which makes a good
  850.    introduction to the subject. The standard itself can be found at NCSA
  851.    (URL is: http://hoohoo.ncsa.uiuc.edu/ ).
  852.    
  853.     5.7.14.1: How can I generate GIFs on the fly from my CGI scripts?
  854.     
  855.    If you want to generate GIF images on the fly as part of your
  856.    application, examine the gd library (URL is:
  857.    http://siva.cshl.org/gd/gd.html ). Hint: your HTML page and your
  858.    inline images are separate documents with separate URLs. Generate them
  859.    in response to separate requests! (Yes, there are tricks to speed this
  860.    up, but be careful not to break inline images on HTML pages you didn't
  861.    write that refer to your gd-generated image.)
  862.    
  863.    It's also possible to use gnuplot and the pbmplus utilities. This is
  864.    slower, but can require less programming if gnuplot is sufficient for
  865.    your purposes. (See archie for both tools.)
  866.    
  867.                   6: WHERE CAN I DISCUSS THE WORLD WIDE WEB?
  868.                                        
  869. 6.1: What newsgroups discuss the Web?
  870.  
  871.    You can find discussion of World Wide Web topics in three newsgroups,
  872.    and one newsgroup which will soon be removed:
  873.    
  874.    comp.infosystems.www.users
  875.           A forum for the discussion of WWW client software and its use
  876.           in contacting various Internet information sources. New user
  877.           questions, client setup questions, client bug reports,
  878.           resource-discovery questions on how to locate information on
  879.           the web that can't be found by the means detailed in the FAQ
  880.           and comparison between various client packages are among the
  881.           acceptable topics for this group. Please specify what browser
  882.           and what system type (Windows, Mac, Unix, etc.) your post is
  883.           about if you are asking questions about a specific program.
  884.           
  885.    comp.infosystems.www.providers
  886.           A forum for the discussion of WWW server software and the use
  887.           of said software to present information to users. General
  888.           server design, setup questions, server bug reports, security
  889.           issues, HTML page design and other concerns of information
  890.           providers are among the likely topics for this group.
  891.           
  892.    comp.infosystems.www.misc
  893.           A forum for general discussion of WWW (World Wide Web)- related
  894.           topics that are NOT covered by the other newsgroups in the
  895.           hierarchy. This will likely include discussions of the Web's
  896.           future, politicking regarding changes in the structure and
  897.           protocols of the web that affect both clients and servers, et
  898.           cetera.
  899.           
  900.    comp.infosystems.www.announce
  901.           A moderated forum for the announcement of new and updated World
  902.           Wide Web resources and software.
  903.           
  904.    comp.infosystems.www (DEFUNCT)
  905.           The old catch-all newsgroup, which may still exist on your
  906.           system but was officially removed on September 7th, 1994,
  907.           according to David Lawrence, moderator of
  908.           news.announce.newgroups. If your system still carries this
  909.           group, ask your administrator to remove it.
  910.           
  911.    
  912.    
  913. 6.2: What mailing lists discuss the Web?
  914.  
  915.    www-talk@info.cern.ch
  916.           Address: www-talk@info.cern.ch for CONTRIBUTIONS ONLY.
  917.           Administration: listserv@info.cern.ch (robot)
  918.           www-talk-request@info.cern.ch (human). Description: Technical
  919.           discussion, W3 related. Experts to experts. General questions
  920.           to the newsgroups, please. Archive: Not currently served, but
  921.           kept.
  922.           
  923.    www-announce@info.cern.ch
  924.           Address: www-announce@info.cern.ch. NOT FOR GENERAL USE -
  925.           serious low-volume announcements only. Administration:
  926.           listserv@info.cern.ch (robot),
  927.           www-announce-request@info.cern.ch (human). Description: Low
  928.           volume summary announcemements of product releases, etc.
  929.           Archive: Not currently public.
  930.           
  931.    
  932.    
  933.                             7: I WANT TO KNOW MORE
  934.                                        
  935.    
  936.    
  937.    To find out more, use the web. This FAQ hopefully provides enough
  938.    information for you to locate and install a browser on your system. If
  939.    you have system specific questions regarding FTP, networking and the
  940.    like, please consult newsgroups relevant to your particular hardware
  941.    and operating system!
  942.    
  943.    Once you're up and running, you may wish to consult the World Wide Web
  944.    Primer by Nathan Torkington. It is available at the URL
  945.    http://www.vuw.ac.nz/who/Nathan.Torkington/ideas/www-primer.html .
  946.    
  947.    Later you may return to this FAQ for answers to some of the more
  948.    advanced questions. I encourage you to check out the changes listed
  949.    early in the document each time the FAQ appears.
  950.    
  951.                                   8: CREDITS
  952.                                        
  953.    Maintainer (11/93 to present): Thomas Boutell, boutell@netcom.com
  954.    
  955.    Former Maintainer (until 11/93): Nathan Torkington,
  956.    Nathan.Torkington@vuw.ac.nz
  957.