home *** CD-ROM | disk | FTP | other *** search
/ Usenet 1994 January / usenetsourcesnewsgroupsinfomagicjanuary1994.iso / sources / std_unix / volume.18 / text0066.txt < prev    next >
Encoding:
Internet Message Format  |  1990-03-18  |  16.7 KB

  1. From: Dominic Dunlop <domo@tsa.co.uk>
  2.  
  3.        Report on ISO/IEEE JTC1/SC22/WG15 Rapporteur Group on
  4.              Internationalization Meeting of 5th - 7th
  5.                   March, 1990, Copenhagen, Denmark
  6.  
  7.                 Dominic Dunlop   --  domo@tsa.co.uk
  8.  
  9.                       The Standard Answer Ltd.
  10.  
  11.     Denmark.  A small country which has tax rates so high that
  12.     its five million inhabitants complain that, when they buy
  13.     themselves a car, they have to buy one and a half cars for
  14.     the government.  Some part of that tax goes to fund Dansk
  15.     Standardiseringraad (DS), the national standards body, which
  16.     works hard to ensure that the needs of Danes are not
  17.     overlooked when larger nations get together to write
  18.     standards.  DS has got its teeth into international
  19.     standards for computers, and with good reason: we've been
  20.     doing things wrong all along.  We'll have to mend our ways
  21.     if we are to produce standards which really fill
  22.     international needs, even if we don't go as far as building
  23.     in a framework which can easily accommodate Danish taxation.
  24.  
  25.     Metropolitan Chicago today has a population larger than that
  26.     of Denmark.  Imagine that you've just rebuilt the downtown
  27.     area after the fire of 1871, only to have Alexander Graham
  28.     Bell come along with the telephone, Edison deciding to
  29.     generate electricity, and railroad companies starting to
  30.     promote inter-urban lines.  Your reaction might well be
  31.     ``Oh, sh*t!'' All these innovations need new infrastructure
  32.      --  cables and conduits and tunnels which you just hadn't
  33.     known you'd need when you laid the roads, put up the
  34.     buildings, and connected them to gas, water and drainage.
  35.     As a result, competing telephone and electric companies
  36.     string a tangle of wires from poles with little regard to
  37.     safety and no regard for aesthetics or standardization,
  38.     while elevated railways appear above existing roads, cutting
  39.     off light at street level and filling upper floor rooms with
  40.     smoke1.  Only after many years of disruption, digging up
  41.  
  42.     __________
  43.  
  44.      1. In 1887, the West Chicago Protective League complained
  45.         ``... the proposed elevated road would materially and
  46.         irreparably depreciate the value of real estate upon
  47.         said streets... and render the dwellinghouses thereon
  48.         unfit for private residences...''[1], but amid the kind
  49.         of political maneuverings for which the city is justly
  50.         famous, the ``L'' got built anyway.
  51.  
  52.  
  53.                                - 2 -
  54.  
  55.     streets and making holes in the walls of existing buildings
  56.     would telephones, electricity and public transportation be
  57.     safely hidden beneath the ground2, unseen, but playing an
  58.     essential part in supporting the life of the city.
  59.  
  60.     A descendant of Alexander Graham Bell's telephone company
  61.     now supports the UNIX operating system out of Chicago.  UNIX
  62.     is a lot like the Chicago of the last century.  We've got to
  63.     the stage of unifying the major variants in the POSIX
  64.     standards and the commercial System V, release 4, only to
  65.     find that there is an increasing clamor for whole new
  66.     infrastructures to support international needs, to improve
  67.     security, and to show that the system is performing as
  68.     billed.  Suddenly, we've got to add features to handle these
  69.     requirements, and we've got to try to do it while observing
  70.     the three conflicting maxims of standardization: do it once,
  71.     do it right, and do it now.  What's more, we have to try to
  72.     do in a way which remains hidden: existing programs should
  73.     not break, nor should they get noticeably bigger or slower.
  74.  
  75.     POSIX is not alone: those responsible for computer language
  76.     standards face the same problems, and have also been the
  77.     subject of constructive Danish criticism[2][3].  The Danes'
  78.     long-standing interest makes it particularly appropriate
  79.     that the first meeting of the ISO POSIX working group's
  80.     special interest group on internationalization should be
  81.     hosted by DS in Copenhagen.  Internationalization is the
  82.     process of removing cultural bias from a system, and then
  83.     providing tools to allow system administrators to localize
  84.     the system by adding a cultural bias of their own choosing.
  85.     No wonder Dansk Standardiseringr}d  --  sorry, Dansk
  86.     Standardiseringraad  --  is interested in this technology:
  87.     its employees court a syntax error every time they type its
  88.     name at the UNIX shell3.  Internationalization will allow
  89.     Danes to mold systems to their requirements, rather than
  90.     having to rub along with implementation assumptions based on
  91.     American practice.
  92.  
  93.     ____________________________________________________________
  94.  
  95.      2. Well, in the case of Chicago, some of the public
  96.         transportation.  You can still ride the L.
  97.  
  98.      3. ISO 646[4], the earliest ISO standard for information
  99.         technology, is the international derivative of ASCII.
  100.         Its Danish variant replaces ASCII's } with aa.  Around
  101.         the world, #$@[\]^`{|}~, all of which have a special
  102.         meaning to the shell, are replaced by other characters
  103.         in standards derived from ISO 646.  See [5] for much
  104.         more information.
  105.  
  106.  
  107.                                - 3 -
  108.  
  109.     The Japanese are interested too: their cultural differences
  110.     make Denmark look close enough to the U.S.A. to be a fifty-
  111.     first state!  And the U.S.A. is interested because it has
  112.     been charged by ISO with the production of ANSI standards
  113.     base documents for the international POSIX standards, and
  114.     wants them to reflect international needs.  Denmark, Japan
  115.     and the U.S.A. sent representatives to the
  116.     internationalization meeting.  There were also observers
  117.     from EUUG/USENIX (myself), the IEEE's 1003.0 working group,
  118.     and from an ISO study group which is grappling with the
  119.     issues of character set use in computer languages.
  120.  
  121.     The official title of the POSIX internationalization group
  122.     is the ISO/IEEE JTC1/SC22/WG15 Rapporteur Group on
  123.     Internationalization.  (Few things in ISO's world have short
  124.     names.) Just to explore some more of the jargon, a
  125.     rapporteur is a technical expert nominated by a member body
  126.      --  a national standards organization such as ANSI or DS
  127.      --  to take an interest in a specialized aspect of a
  128.     particular standards effort.  WG15, the ISO POSIX working
  129.     group, has rapporteur groups on security, conformance
  130.     testing and internationalization.  The security group met in
  131.     January, in conjunction with the New Orleans meeting of the
  132.     IEEE 1003.4 working group; the conformance test group, which
  133.     corresponds to the IEEE 1003.3 effort, met in Copenhagen
  134.     along with the internationalization group (although this
  135.     report does not cover its meeting).
  136.  
  137.     Internationalization is peculiar in that, although the
  138.     IEEE's POSIX standards are drafted with international needs
  139.     in mind, there is no internationalization working group
  140.     within the POSIX project.  There is a study group which, as
  141.     part of the 1003.0 ``POSIX Guide'' work, is trying to decide
  142.     how to bring internationalization into the official
  143.     structure, so that it can be given officers, schedules,
  144.     terms of reference, and all those other good things which
  145.     make us standards people feel safer.  It's a big problem,
  146.     because the issue really affects every aspect of POSIX  --
  147.     it just took a while to realize that it was an issue at all.
  148.     Unlike  --  say  --  realtime extensions, security
  149.     extensions, or transparent remote file access for POSIX,
  150.     internationalization doesn't really make sense as an add-on
  151.     to a basic operating system interface standard.  Rather, the
  152.     operating system and all its extensions need to be
  153.     internationalized as a matter of course.  Every other
  154.     working group in the IEEE POSIX is charged with producing a
  155.     distinct standard, but it is difficult to see how a new
  156.     group dealing with internationalization group could be given
  157.     such a goal.
  158.  
  159.     ISO has a similar problem, but it's worse because the
  160.     organization has so many balls to keep in the air.  If it is
  161.     to apply the ``do it once'' and ``do it right'' maxims to
  162.  
  163.  
  164.                                - 4 -
  165.  
  166.     internationalization, it seems clear that the issue must be
  167.     handled near the top of Joint Technical Committee 1, the
  168.     information technology standards group.  After all, as well
  169.     as computer languages and operating systems,
  170.     internationalization affects communications, document
  171.     standards, database and much more.  ISO recently bit a
  172.     similar bullet, establishing a new subcommittee (SC27)
  173.     immediately below JTC1 to handle the security issues which
  174.     are beginning to affect so much of its work.  It may yet do
  175.     the same with internationalization.
  176.  
  177.     The ``do it now'' criterion, on the other hand, argues in
  178.     favor of addressing internationalization at a lower level
  179.      --  doing the work in a new department, rather than going
  180.     to the trouble of establishing a whole new division.  SC22,
  181.     which is responsible for language and operating system
  182.     standards, is currently considering the setting up of a new
  183.     working group at the same level as WG14 (C language), WG15
  184.     (POSIX) and the rest.  This proposal has run into
  185.     opposition, both from those who say that the issue should be
  186.     handled at a higher level, and from those who feel that
  187.     there isn't an issue: after all, aren't ISO's standards
  188.     supposed to be international anyway?
  189.  
  190.     Meanwhile, WG15 has established a subordinate group to
  191.     handle internationalization at the lowest level possible.
  192.     As somebody said at the meeting, ``You can't get much lower
  193.     than us.'' We spent our time discussing what we  were
  194.     supposed to be doing  --  and, equally important, what we
  195.     could leave to others.  In the end we came up with a little
  196.     list:
  197.  
  198.                          Terms of Reference
  199.  
  200.           The rapporteur group on internationalization
  201.           (RIN) will study the aspects of
  202.           internationalization related to POSIX and report
  203.           its findings to SC22/WG15.
  204.  
  205.           (Bland, imposing no needless restrictions on
  206.           what we can do.)
  207.  
  208.                           Program of Work
  209.  
  210.       1.  Carry out survey to capture most of the
  211.           requirements relevant to internationalization.
  212.  
  213.           (A job and a half.  We have to search out users
  214.           around the world, and persuade them to tell us
  215.           what features they really want, rather than what
  216.  
  217.  
  218.                                - 5 -
  219.  
  220.           they can put up with, or program their way
  221.           around4.)
  222.  
  223.       2.  Identify and forward requirements with
  224.           recommendations to WG15.
  225.  
  226.           (So WG15 gets to carry the can for us...)
  227.  
  228.       3.  Capture and collect national body profiles for
  229.           reference.
  230.  
  231.           (Denmark and Japan have already done some work
  232.           on ``profiles'' that customize POSIX to suit
  233.           local needs.  Their work suggests that current
  234.           internationalization features are inadequate.)
  235.  
  236.       4.  Perform investigations as needed to advance the
  237.           internationalization work of WG15.
  238.  
  239.           (We can poke our noses into anything that takes
  240.           our fancy...)
  241.  
  242.       5.  Review, from an internationalization
  243.           perspective, documents submitted to WG15 for
  244.           review and comment from an internationalization
  245.           perspective.
  246.  
  247.           (We definitely get to poke our noses into
  248.           anything that comes past WG15...)
  249.  
  250.       6.  Review, and evaluate impact on work of WG15 of,
  251.           other documents relevant to internationalization
  252.           circulated in JTC1 or its subcommittees.
  253.  
  254.           (And we'll try to get our hands on information
  255.           from further afield.)
  256.  
  257.     That's a lot of work.  It defines the function of our
  258.     particular mill, but that mill still needs grist.  That
  259.     feedstock has to come from outside our group, and, because
  260.     of our lowly position, we have to ask WG15 (``daddy'') to
  261.     ask others to supply it.  WG15, in turn, may have to refer
  262.     some requests to higher authority: we want to be aware of
  263.  
  264.     __________
  265.  
  266.      4. But we need to be a lot more diplomatic than asking
  267.         ``What ticks you off most about these dumb American
  268.         machines?''  --  although appeals to chauvinism have
  269.         been known to achieve results...
  270.  
  271.  
  272.                                - 6 -
  273.  
  274.     anything which happens in SC22 which is relevant to POSIX
  275.     internationalization  --  for example, what the C language
  276.     people in WG14 are up to.  That involves going up another
  277.     level in JTC1's hierarchy.  Getting in touch with other
  278.     subcommittees, such as SC2, which looks after character
  279.     sets, potentially involves going right to the top of the
  280.     bureaucracy.  (Luckily, in this particular case, SC22's
  281.     study group on character sets can stand in for SC25.)
  282.     Consequently, when WG15 next meets in Paris in June, it will
  283.     have to deal with several resolutions concerned with turning
  284.     on the taps and starting the information flow to the
  285.     rapporteur group.
  286.  
  287.     One of these taps is a little sticky: WG15 doesn't
  288.     officially have a relationship with the IEEE's 1003.0 group,
  289.     although it can, via ANSI, talk to 1003.1, 1003.2 and 1003.4
  290.     through 1003.9.  The problem is that 1003.0 deals with
  291.     profiles, baskets of standards which, when brought together,
  292.     solve particular classes of problem  --  for example, those
  293.     of transaction processing, realtime or batch-oriented
  294.     systems.  Profiles are outside the scope of the ISO POSIX
  295.     effort, so we can't officially talk to 1003.0, even though
  296.     its study group is currently holding the baton on
  297.     internationalization.  Never mind.  We'll do things
  298.     unofficially until some official pathway is sorted out.
  299.  
  300.     Apart from all this organizational stuff, we did review some
  301.     existing documents.  For example, DTR (draft technical
  302.     report) 10176, a product of SC14, discusses the treatment of
  303.     characters appearing in language constructs, variable names,
  304.     literals and comments, and turns out to have implications
  305.     for sh, awk, yacc and the other ``little languages'' defined
  306.     in DP 9945-2, the forthcoming international standard for the
  307.     shell and tools.  And a document from SC22's study group on
  308.     character sets suggests that source files should have some
  309.     means of announcing the character set that they're using.
  310.     Could this mean typed files or resource forks for POSIX6?
  311.     Gee.  How would we hide that?
  312.  
  313.     __________
  314.  
  315.      5. SC2's answer to life, the universe and everything is DP
  316.         (draft proposal) 10646, which defines a 32-bit wide
  317.         character set with 8- and 16-bit wide canonical versions
  318.         for storage and transmission, and a 24-bit wide
  319.         processing version for those who can get by with only
  320.         eight million characters or so.  As it's still at the DP
  321.         level, it'll be a long time before it hits the streets,
  322.         and, even when it does, there's the little matter of
  323.         getting people to use it...
  324.  
  325.  
  326.                                - 7 -
  327.  
  328.     The group next meets in Paris on June 11th and 12th, just
  329.     before the WG15 meeting.  If you want to come along, you
  330.     have to persuade your national standards body firstly that
  331.     you're a technical expert on POSIX, and then that they
  332.     should appoint you as internationalization rapporteur.  This
  333.     may be surprisingly easy  --  considerably simpler, for
  334.     example, than getting somebody to fund your trip.  To quote
  335.     from [8], ``...standards committees would be hard-pressed to
  336.     find people who participate on their voluntary committees
  337.     with purely rational-economic expectations.  Standards
  338.     committees seem bent on justifying their existences by using
  339.     hard data to prove that standards are good, yet they persist
  340.     in using altruistic appeals to attract committee members.''
  341.     If you feel like responding to the altruistic appeal of this
  342.     article, contact me by electronic mail.
  343.  
  344.     Alternatively, if you're a European, you can remain seated
  345.     in front of your terminal and participate in a news forum on
  346.     ISO 646 and all that: Keld Simonsen of the Danish UNIX
  347.     Users' Group has volunteered to initiate a discussion of the
  348.     European perspective on character sets for POSIX.  Denmark
  349.     may be small, but it's certainly making its voice heard on
  350.     this issue!
  351.  
  352.     ____________________________________________________________
  353.  
  354.      6. UNIX' elegant and flavorless files have already taken a
  355.         beating from X3.159, the ANSI C standard[6], since other
  356.         operating systems tend to support filing schemes which
  357.         are merely tasteless[7].
  358.  
  359.  
  360.                                - 8 -
  361.  
  362.                              References
  363.  
  364.      1. Brian J. Cudhay, Destination Loop, Stephen Green
  365.         Press/Viking Penguin (1982)
  366.  
  367.      3. P. J. Plauger, Quiet Changes, Part I, The C Users
  368.         Journal, vol. 8, no. 2 (February, 1990), pp 9-16.
  369.  
  370.      3. Keld Simonsen, A European Representation for ISO C,
  371.         European UNIX systems User Group Newsletter, vol. 9, no.
  372.         2 (Summer 1989), pp 15-18
  373.  
  374.      4. ISO 646:1983, Information processing  --  ISO 7-bit code
  375.         character set for information interchange
  376.  
  377.      5. Keld Simonsen, An extension to the troff character set
  378.         for Europe, European UNIX systems User Group Newsletter,
  379.         vol. 9, no. 2 (Summer 1989), pp 2-14
  380.  
  381.      6. ANSI X3.159, 1989, Programming Language C
  382.  
  383.      7. P. J. Plauger, Evolution of the C I/O Model, The C Users
  384.         Journal, vol. 7, no. 6 (August, 1989), pp 17-25.
  385.  
  386.      8. Carl F. Cargill, Information Technology Standardization:
  387.         Theory, Process and Organizations, Digital Press (1989)
  388.  
  389.  
  390. Volume-Number: Volume 18, Number 68
  391.  
  392.