home *** CD-ROM | disk | FTP | other *** search
/ RISC DISC 2 / RISC_DISC_2.iso / the_web / documents / spec / html_spec / intro_sgm < prev    next >
Encoding:
Text File  |  1995-06-15  |  5.1 KB  |  141 lines

  1. <!-- $Id: intro.sgm,v 1.12 1995/06/15 20:17:08 connolly Exp $ -->
  2. <h1>Introduction
  3.  
  4. The HyperText Markup Language (HTML) is a simple data format
  5. used to create hypertext documents that are portable from one platform
  6. to another. HTML documents are SGML documents with generic semantics
  7. that are appropriate for representing information from a wide range of
  8. domains.
  9.  
  10. As HTML is an application of SGML, this specification assumes a
  11. working knowledge of [SGML].
  12.  
  13. <h2>Scope
  14.  
  15. HTML has been in use by the World-Wide Web (WWW) global information
  16. initiative since 1990. This specification corresponds to the
  17. capabilities of HTML in common use prior to June 1994 and referred to
  18. as "HTML 2.0".
  19.  
  20. HTML is an application of ISO Standard 8879:1986 <emph>Information
  21. Processing Text and Office Systems; Standard Generalized Markup
  22. Language</emph> (SGML). The HTML Document Type Definition (DTD) is a
  23. formal definition of the HTML syntax in terms of SGML.
  24.  
  25. This specification also defines HTML as an Internet Media Type[IMEDIA]
  26. and MIME Content Type[MIME] called <code>text/html</>. As such, it
  27. defines the semantics of the HTML syntax and how that syntax should be
  28. interpreted by user agents.
  29.  
  30. <h2>Conformance
  31.  
  32. This specification governs the syntax of HTML documents and aspects of
  33. the behavior of HTML user agents.
  34.  
  35. <h3>Documents
  36.  
  37. A document is a conforming HTML document if:
  38.  
  39. <ul>
  40. <li>It is a conforming SGML document, and it conforms to the HTML DTD
  41. (see <hdref refid=dtd>).
  42. <note>There are a number of syntactic idioms that are not supported or
  43. are supported inconsistently in some historical user agent
  44. implementations. These idioms are identified in notes like this
  45. throughout this specification.
  46. </note>
  47.  
  48. <li>It conforms to the application conventions in this
  49. specification. For example, the value of the <attr/HREF/ attribute of
  50. the <tag/A/ element must conform to the URI syntax.
  51.  
  52. <li>Its document character set includes [ISO-8859-1] and agrees with
  53. [ISO-10646]; that is, each code position listed in <hdref
  54. refid=iso-latin-1> is included, and each code position in the document
  55. character set is mapped to the same character as [ISO-10646] designates
  56. for that code position.
  57. <note>The document character set is somewhat independent of the
  58. character encoding scheme used to represent a document. For example,
  59. the <code/ISO-2022-JP/ character encoding scheme can be used for HTML
  60. documents, since its repertoire is a subset of the [ISO-10646]
  61. repertoire. The critical distinction is that numeric character
  62. references agree with [ISO-10646] regardless of how the document is encoded.
  63. </note>
  64.  
  65. </ul>
  66.  
  67.  
  68. <h3 id=feature-test>Feature Test Entities
  69.  
  70. The HTML DTD defines a standard HTML document type and several
  71. variations, by way of feature test entities. Feature test entities
  72. are declarations in the HTML DTD that control the inclusion or
  73. exclusion of portions of the DTD.
  74.  
  75. <tl>
  76. <tli>HTML.Recommended: Certain features of the language are
  77. necessary for compatibility with widespread usage, but they may
  78. compromise the structural integrity of a document.  This feature test
  79. entity selects a more prescriptive document type definition that
  80. eliminates those features. It is set to <code/IGNORE/ by default.
  81.  
  82. For example, in order to preserve the structure of a document, an
  83. editing user agent may translate HTML documents to the recommended
  84. subset, or it may require that the documents be in the recommended
  85. subset for import.
  86.  
  87. <tli>HTML.Deprecated: Certain features of the language are
  88. necessary for compatibility with earlier versions of the
  89. specification, but they tend to be used and implemented inconsistently,
  90. and their use is deprecated. This feature test entity enables a
  91. document type definition that allows these features.
  92. It is set to <code/INCLUDE/ by default.
  93.  
  94. Documents generated by translation software or editing software should
  95. not contain deprecated idioms.
  96.  
  97. </tl>
  98.  
  99. <h3>User Agents
  100.  
  101. An HTML user agent conforms to this specification if:
  102.  
  103. <ul>
  104. <li>It parses the characters of an HTML document into data characters
  105. and markup according to [SGML].
  106. <note>
  107. In the interest of robustness and extensibility, there are a number
  108. of widely deployed conventions for handling non-conforming documents.
  109. See <hdref refid=conv1> for details.
  110. </note>
  111.  
  112. <li>It supports the <code/ISO-8859-1/ character encoding scheme and
  113. processes each character in the ISO Latin Alphabet No. 1 as specified
  114. in <hdref refid=charlist>.
  115. <note>To support non-western writing systems, HTML user agents are
  116. encouraged to support <code/ISO-10646-UCS-2/ or similar character
  117. encoding schemes and as much of the character repertoire of
  118. [ISO-10646] as is practical.
  119. </note>
  120.  
  121. <li>It behaves identically for documents whose parsed token sequences
  122. are identical.
  123.  
  124. For example, comments and the whitespace in tags disappear during
  125. tokenization, and hence they do not influence the behavior of
  126. conforming user agents.
  127.  
  128. <li>It allows the user to traverse (or at least attempt to traverse,
  129. resources permitting) all hyperlinks from <tag/A/ elements in an HTML
  130. document.
  131.  
  132. </ul>
  133.  
  134. An HTML user agent is a level 2 user agent if, additionally:
  135.  
  136. <ul>
  137. <li>It allows the user to express all form field values specified in
  138. an HTML document and to (attempt to) submit the values as requests to
  139. information services.
  140. </ul>
  141.