home *** CD-ROM | disk | FTP | other *** search
/ Internet Magazine 2003 October / INTERNET108.ISO / pc / software / windows / building / xmlspy / xmlspyentcomplete5.exe / Data1.cab / _FF481D28FE414DF4A5F8D47A306706CB / cshelp.txt < prev    next >
Encoding:
Text File  |  2003-04-04  |  6.1 KB  |  71 lines

  1. .topic 40000
  2. Altova provides many services through our web site, which you can directly access from the Help Menu within XMLSPY 5 or through the help system.
  3.  
  4. Please visit our Home Page frequently to learn about product updates, news, and other XML related information.
  5.  
  6. The Support Center shows available support options that you can access freely as a registered user.
  7.  
  8. The FAQ contains a collection of frequently asked questions and their answers. Please make sure that you check this resource, before submitting a new incident to our technical support staff.
  9.  
  10. If you have been using the evaluation version and want to buy the fully licensed product, or if you need to purchase additional license for your colleagues, please visit our Order Pages to access our secure online shop.
  11.  
  12.  
  13. .topic 50000
  14. This chapter contains useful background information on the technical aspects of XMLSPY 5. If you run across a technical term in the remainder of this help system you may occasionally find a link to some of the background materials provided here.
  15.  
  16. .topic 54000
  17. Unicode is the new 16-bit character-set standard defined by the Unicode Consortium that provides a unique number for every character,
  18.  
  19. no matter what the platform,
  20. no matter what the program,
  21. no matter what the language.
  22.  
  23. Fundamentally, computers just deal with numbers. They store letters and other characters by assigning a number for each one. Before Unicode was invented, there were hundreds of different encoding systems for assigning these numbers. No single encoding could contain enough characters: for example, the European Union alone requires several different encodings to cover all its languages. Even for a single language like English, no single encoding was adequate for all the letters, punctuation, and technical symbols in common use.
  24.  
  25. These encoding systems used to conflict with one another. That is, two encodings used the same number for two different characters, or different numbers for the same character. Any given computer (especially servers) needs to support many different encodings; yet whenever data is passed between different encodings or platforms, that data always runs the risk of corruption.
  26.  
  27. Unicode is changing all that!
  28. Unicode provides a unique number for every character, no matter what the platform, no matter what the program, and no matter what the language. The Unicode Standard has been adopted by such industry leaders as Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Base and many others.
  29.  
  30. Unicode is required by modern standards such as XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, etc., and is the official way to implement ISO/IEC 10646. It is supported in many operating systems, all modern browsers, and many other products. The emergence of the Unicode Standard, and the availability of tools supporting it, are among the most significant recent global software technology trends.
  31.  
  32. Incorporating Unicode into client-server or multi-tiered applications and web sites offers significant cost savings over the use of legacy character sets. Unicode enables a single software product or a single web site to be targeted across multiple platforms, languages and countries without re-engineering. It allows data to be transported through many different systems without corruption.
  33.  
  34. Even though XML is clearly defined to be based on the Unicode standard, XMLSPY 5 is still one of the few XML development tools that fully implements Unicode!
  35.  
  36. .topic 54002
  37. These Windows versions do not include full Unicode capabilities on the operating system layer. Instead support for non-roman writing-systems is provided through so-called code-pages that contain all the required characters mapped to either the available byte-values in the range of 0x80 to 0xFF (in case of single-byte systems, such as Cyrillic or Hebrew) or as double-byte values, where the first most significant bit of the first byte is typically used to indicate that this is a so-called "wide character" (in case of CJK writing-systems).
  38.  
  39. We therefore provider a special Windows 98/ME version of XMLSPY 5 that is automatically installed whenever you are using the Setup program on these operating systems. This version of XMLSPY 5 supports the following code-pages for viewing and editing XML documents (for excellent background information about code-pages please refer to http://czyborra.com/charsets/codepages.html):
  40.  
  41. Code-page    Equivalent XML Encoding
  42. 1252    ISO-8859-1 (Western, Latin-1)
  43. 1250    ISO-8859-2 (Eastern Europe, Latin-2)
  44. 1251    ISO-8859-5 (Cyrillic)
  45. 1253    ISO-8859-7 (Greek)
  46. 1254    ISO-8859-9 (Turkish)
  47. 1255    ISO-8859-8 (Hebrew)
  48. 1256    ISO-8859-6 (Arabic)
  49. 874    ISO-8859-11/TIS-620 (Thai)
  50. 932    Shift-JIS (Japanese)
  51. 936    GB2312 (Chinese)
  52. 949    EUC-KR (Korean)
  53. 950    Big5 (Taiwanese)
  54.  
  55. Whenever you open an XML file, XMLSPY 5 detects the character-set encoding used in that file, expands the file to an internal full Unicode representation and then transforms the document to a code-page supported by Windows 98 in order to enable viewing and editing of the document.
  56.  
  57. In most cases this process will be entirely automatic, as the available ISO-8895-x encodings as well as some of the CJK encodings often correspond with a certain code-page. However, if you open a Unicode encoded file (e.g. UTF-8 or UTF-16) XMLSPY 5 will be unable to determine which code-page to use and will thus bring up a dialog box that asks you to specify a code-page to be used for editing.
  58.  
  59. In order to correctly view and edit a Unicode file under Windows 98/ME it is extremely important that you use this dialog box to:
  60.  
  61. a)    choose the correct code-page that includes all characters contained in the file and
  62. b)    later select a font and script from the settings dialog box that also supports the same code-page.
  63.  
  64. If the file contains any characters that are not available in the selected code-page, the user will receive an error message including a detailed list of offending characters before they will be replaced by a '_' (underscore).
  65.  
  66.  
  67.  
  68. We therefore highly recommend using only the Windows NT/2000 version of XMLSPY 5 for editing XML files that make full use of Unicode!
  69.  
  70.  
  71.