home *** CD-ROM | disk | FTP | other *** search
/ Usenet 1994 January / usenetsourcesnewsgroupsinfomagicjanuary1994.iso / sources / std_unix / reports / 1990.03.wg15 < prev    next >
Encoding:
Text File  |  1990-05-09  |  25.1 KB  |  610 lines

  1. echo wg15
  2. cat >wg15 <<'shar.wg15.14933'
  3. From jsq@longway.tic.com  Wed Mar 14 11:29:02 1990
  4. Received: from cs.utexas.edu by uunet.uu.net (5.61/1.14) with SMTP 
  5.     id AA08502; Wed, 14 Mar 90 11:29:02 -0500
  6. Posted-Date: 14 Mar 90 15:46:26 GMT
  7. Received: by cs.utexas.edu (5.59/1.52)
  8.     id AA07316; Wed, 14 Mar 90 10:28:51 CST
  9. Received: by longway.tic.com (4.22/4.16)
  10.     id AA11906; Wed, 14 Mar 90 09:47:32 cst
  11. From: Dominic Dunlop <tsa.co.uk!domo@longway.tic.com>
  12. Newsgroups: comp.std.unix
  13. Subject: Report on WG15 Rapporteur Group
  14. Message-Id: <556@longway.TIC.COM>
  15. Sender: std-unix@longway.tic.com
  16. Reply-To: std-unix@uunet.uu.net
  17. Date: 14 Mar 90 15:46:26 GMT
  18. Apparently-To: std-unix-archive@uunet.uu.net
  19.  
  20. From: Dominic Dunlop <domo@tsa.co.uk>
  21.  
  22.        Report on ISO/IEEE JTC1/SC22/WG15 Rapporteur Group on
  23.              Internationalization Meeting of 5th - 7th
  24.                   March, 1990, Copenhagen, Denmark
  25.  
  26.                 Dominic Dunlop   --  domo@tsa.co.uk
  27.  
  28.                       The Standard Answer Ltd.
  29.  
  30.     Denmark.  A small country which has tax rates so high that
  31.     its five million inhabitants complain that, when they buy
  32.     themselves a car, they have to buy one and a half cars for
  33.     the government.  Some part of that tax goes to fund Dansk
  34.     Standardiseringraad (DS), the national standards body, which
  35.     works hard to ensure that the needs of Danes are not
  36.     overlooked when larger nations get together to write
  37.     standards.  DS has got its teeth into international
  38.     standards for computers, and with good reason: we've been
  39.     doing things wrong all along.  We'll have to mend our ways
  40.     if we are to produce standards which really fill
  41.     international needs, even if we don't go as far as building
  42.     in a framework which can easily accommodate Danish taxation.
  43.  
  44.     Metropolitan Chicago today has a population larger than that
  45.     of Denmark.  Imagine that you've just rebuilt the downtown
  46.     area after the fire of 1871, only to have Alexander Graham
  47.     Bell come along with the telephone, Edison deciding to
  48.     generate electricity, and railroad companies starting to
  49.     promote inter-urban lines.  Your reaction might well be
  50.     ``Oh, sh*t!'' All these innovations need new infrastructure
  51.      --  cables and conduits and tunnels which you just hadn't
  52.     known you'd need when you laid the roads, put up the
  53.     buildings, and connected them to gas, water and drainage.
  54.     As a result, competing telephone and electric companies
  55.     string a tangle of wires from poles with little regard to
  56.     safety and no regard for aesthetics or standardization,
  57.     while elevated railways appear above existing roads, cutting
  58.     off light at street level and filling upper floor rooms with
  59.     smoke1.  Only after many years of disruption, digging up
  60.  
  61.     __________
  62.  
  63.      1. In 1887, the West Chicago Protective League complained
  64.         ``... the proposed elevated road would materially and
  65.         irreparably depreciate the value of real estate upon
  66.         said streets... and render the dwellinghouses thereon
  67.         unfit for private residences...''[1], but amid the kind
  68.         of political maneuverings for which the city is justly
  69.         famous, the ``L'' got built anyway.
  70.  
  71.  
  72.                                - 2 -
  73.  
  74.     streets and making holes in the walls of existing buildings
  75.     would telephones, electricity and public transportation be
  76.     safely hidden beneath the ground2, unseen, but playing an
  77.     essential part in supporting the life of the city.
  78.  
  79.     A descendant of Alexander Graham Bell's telephone company
  80.     now supports the UNIX operating system out of Chicago.  UNIX
  81.     is a lot like the Chicago of the last century.  We've got to
  82.     the stage of unifying the major variants in the POSIX
  83.     standards and the commercial System V, release 4, only to
  84.     find that there is an increasing clamor for whole new
  85.     infrastructures to support international needs, to improve
  86.     security, and to show that the system is performing as
  87.     billed.  Suddenly, we've got to add features to handle these
  88.     requirements, and we've got to try to do it while observing
  89.     the three conflicting maxims of standardization: do it once,
  90.     do it right, and do it now.  What's more, we have to try to
  91.     do in a way which remains hidden: existing programs should
  92.     not break, nor should they get noticeably bigger or slower.
  93.  
  94.     POSIX is not alone: those responsible for computer language
  95.     standards face the same problems, and have also been the
  96.     subject of constructive Danish criticism[2][3].  The Danes'
  97.     long-standing interest makes it particularly appropriate
  98.     that the first meeting of the ISO POSIX working group's
  99.     special interest group on internationalization should be
  100.     hosted by DS in Copenhagen.  Internationalization is the
  101.     process of removing cultural bias from a system, and then
  102.     providing tools to allow system administrators to localize
  103.     the system by adding a cultural bias of their own choosing.
  104.     No wonder Dansk Standardiseringr}d  --  sorry, Dansk
  105.     Standardiseringraad  --  is interested in this technology:
  106.     its employees court a syntax error every time they type its
  107.     name at the UNIX shell3.  Internationalization will allow
  108.     Danes to mold systems to their requirements, rather than
  109.     having to rub along with implementation assumptions based on
  110.     American practice.
  111.  
  112.     ____________________________________________________________
  113.  
  114.      2. Well, in the case of Chicago, some of the public
  115.         transportation.  You can still ride the L.
  116.  
  117.      3. ISO 646[4], the earliest ISO standard for information
  118.         technology, is the international derivative of ASCII.
  119.         Its Danish variant replaces ASCII's } with aa.  Around
  120.         the world, #$@[\]^`{|}~, all of which have a special
  121.         meaning to the shell, are replaced by other characters
  122.         in standards derived from ISO 646.  See [5] for much
  123.         more information.
  124.  
  125.  
  126.                                - 3 -
  127.  
  128.     The Japanese are interested too: their cultural differences
  129.     make Denmark look close enough to the U.S.A. to be a fifty-
  130.     first state!  And the U.S.A. is interested because it has
  131.     been charged by ISO with the production of ANSI standards
  132.     base documents for the international POSIX standards, and
  133.     wants them to reflect international needs.  Denmark, Japan
  134.     and the U.S.A. sent representatives to the
  135.     internationalization meeting.  There were also observers
  136.     from EUUG/USENIX (myself), the IEEE's 1003.0 working group,
  137.     and from an ISO study group which is grappling with the
  138.     issues of character set use in computer languages.
  139.  
  140.     The official title of the POSIX internationalization group
  141.     is the ISO/IEEE JTC1/SC22/WG15 Rapporteur Group on
  142.     Internationalization.  (Few things in ISO's world have short
  143.     names.) Just to explore some more of the jargon, a
  144.     rapporteur is a technical expert nominated by a member body
  145.      --  a national standards organization such as ANSI or DS
  146.      --  to take an interest in a specialized aspect of a
  147.     particular standards effort.  WG15, the ISO POSIX working
  148.     group, has rapporteur groups on security, conformance
  149.     testing and internationalization.  The security group met in
  150.     January, in conjunction with the New Orleans meeting of the
  151.     IEEE 1003.4 working group; the conformance test group, which
  152.     corresponds to the IEEE 1003.3 effort, met in Copenhagen
  153.     along with the internationalization group (although this
  154.     report does not cover its meeting).
  155.  
  156.     Internationalization is peculiar in that, although the
  157.     IEEE's POSIX standards are drafted with international needs
  158.     in mind, there is no internationalization working group
  159.     within the POSIX project.  There is a study group which, as
  160.     part of the 1003.0 ``POSIX Guide'' work, is trying to decide
  161.     how to bring internationalization into the official
  162.     structure, so that it can be given officers, schedules,
  163.     terms of reference, and all those other good things which
  164.     make us standards people feel safer.  It's a big problem,
  165.     because the issue really affects every aspect of POSIX  --
  166.     it just took a while to realize that it was an issue at all.
  167.     Unlike  --  say  --  realtime extensions, security
  168.     extensions, or transparent remote file access for POSIX,
  169.     internationalization doesn't really make sense as an add-on
  170.     to a basic operating system interface standard.  Rather, the
  171.     operating system and all its extensions need to be
  172.     internationalized as a matter of course.  Every other
  173.     working group in the IEEE POSIX is charged with producing a
  174.     distinct standard, but it is difficult to see how a new
  175.     group dealing with internationalization group could be given
  176.     such a goal.
  177.  
  178.     ISO has a similar problem, but it's worse because the
  179.     organization has so many balls to keep in the air.  If it is
  180.     to apply the ``do it once'' and ``do it right'' maxims to
  181.  
  182.  
  183.                                - 4 -
  184.  
  185.     internationalization, it seems clear that the issue must be
  186.     handled near the top of Joint Technical Committee 1, the
  187.     information technology standards group.  After all, as well
  188.     as computer languages and operating systems,
  189.     internationalization affects communications, document
  190.     standards, database and much more.  ISO recently bit a
  191.     similar bullet, establishing a new subcommittee (SC27)
  192.     immediately below JTC1 to handle the security issues which
  193.     are beginning to affect so much of its work.  It may yet do
  194.     the same with internationalization.
  195.  
  196.     The ``do it now'' criterion, on the other hand, argues in
  197.     favor of addressing internationalization at a lower level
  198.      --  doing the work in a new department, rather than going
  199.     to the trouble of establishing a whole new division.  SC22,
  200.     which is responsible for language and operating system
  201.     standards, is currently considering the setting up of a new
  202.     working group at the same level as WG14 (C language), WG15
  203.     (POSIX) and the rest.  This proposal has run into
  204.     opposition, both from those who say that the issue should be
  205.     handled at a higher level, and from those who feel that
  206.     there isn't an issue: after all, aren't ISO's standards
  207.     supposed to be international anyway?
  208.  
  209.     Meanwhile, WG15 has established a subordinate group to
  210.     handle internationalization at the lowest level possible.
  211.     As somebody said at the meeting, ``You can't get much lower
  212.     than us.'' We spent our time discussing what we  were
  213.     supposed to be doing  --  and, equally important, what we
  214.     could leave to others.  In the end we came up with a little
  215.     list:
  216.  
  217.                          Terms of Reference
  218.  
  219.           The rapporteur group on internationalization
  220.           (RIN) will study the aspects of
  221.           internationalization related to POSIX and report
  222.           its findings to SC22/WG15.
  223.  
  224.           (Bland, imposing no needless restrictions on
  225.           what we can do.)
  226.  
  227.                           Program of Work
  228.  
  229.       1.  Carry out survey to capture most of the
  230.           requirements relevant to internationalization.
  231.  
  232.           (A job and a half.  We have to search out users
  233.           around the world, and persuade them to tell us
  234.           what features they really want, rather than what
  235.  
  236.  
  237.                                - 5 -
  238.  
  239.           they can put up with, or program their way
  240.           around4.)
  241.  
  242.       2.  Identify and forward requirements with
  243.           recommendations to WG15.
  244.  
  245.           (So WG15 gets to carry the can for us...)
  246.  
  247.       3.  Capture and collect national body profiles for
  248.           reference.
  249.  
  250.           (Denmark and Japan have already done some work
  251.           on ``profiles'' that customize POSIX to suit
  252.           local needs.  Their work suggests that current
  253.           internationalization features are inadequate.)
  254.  
  255.       4.  Perform investigations as needed to advance the
  256.           internationalization work of WG15.
  257.  
  258.           (We can poke our noses into anything that takes
  259.           our fancy...)
  260.  
  261.       5.  Review, from an internationalization
  262.           perspective, documents submitted to WG15 for
  263.           review and comment from an internationalization
  264.           perspective.
  265.  
  266.           (We definitely get to poke our noses into
  267.           anything that comes past WG15...)
  268.  
  269.       6.  Review, and evaluate impact on work of WG15 of,
  270.           other documents relevant to internationalization
  271.           circulated in JTC1 or its subcommittees.
  272.  
  273.           (And we'll try to get our hands on information
  274.           from further afield.)
  275.  
  276.     That's a lot of work.  It defines the function of our
  277.     particular mill, but that mill still needs grist.  That
  278.     feedstock has to come from outside our group, and, because
  279.     of our lowly position, we have to ask WG15 (``daddy'') to
  280.     ask others to supply it.  WG15, in turn, may have to refer
  281.     some requests to higher authority: we want to be aware of
  282.  
  283.     __________
  284.  
  285.      4. But we need to be a lot more diplomatic than asking
  286.         ``What ticks you off most about these dumb American
  287.         machines?''  --  although appeals to chauvinism have
  288.         been known to achieve results...
  289.  
  290.  
  291.                                - 6 -
  292.  
  293.     anything which happens in SC22 which is relevant to POSIX
  294.     internationalization  --  for example, what the C language
  295.     people in WG14 are up to.  That involves going up another
  296.     level in JTC1's hierarchy.  Getting in touch with other
  297.     subcommittees, such as SC2, which looks after character
  298.     sets, potentially involves going right to the top of the
  299.     bureaucracy.  (Luckily, in this particular case, SC22's
  300.     study group on character sets can stand in for SC25.)
  301.     Consequently, when WG15 next meets in Paris in June, it will
  302.     have to deal with several resolutions concerned with turning
  303.     on the taps and starting the information flow to the
  304.     rapporteur group.
  305.  
  306.     One of these taps is a little sticky: WG15 doesn't
  307.     officially have a relationship with the IEEE's 1003.0 group,
  308.     although it can, via ANSI, talk to 1003.1, 1003.2 and 1003.4
  309.     through 1003.9.  The problem is that 1003.0 deals with
  310.     profiles, baskets of standards which, when brought together,
  311.     solve particular classes of problem  --  for example, those
  312.     of transaction processing, realtime or batch-oriented
  313.     systems.  Profiles are outside the scope of the ISO POSIX
  314.     effort, so we can't officially talk to 1003.0, even though
  315.     its study group is currently holding the baton on
  316.     internationalization.  Never mind.  We'll do things
  317.     unofficially until some official pathway is sorted out.
  318.  
  319.     Apart from all this organizational stuff, we did review some
  320.     existing documents.  For example, DTR (draft technical
  321.     report) 10176, a product of SC14, discusses the treatment of
  322.     characters appearing in language constructs, variable names,
  323.     literals and comments, and turns out to have implications
  324.     for sh, awk, yacc and the other ``little languages'' defined
  325.     in DP 9945-2, the forthcoming international standard for the
  326.     shell and tools.  And a document from SC22's study group on
  327.     character sets suggests that source files should have some
  328.     means of announcing the character set that they're using.
  329.     Could this mean typed files or resource forks for POSIX6?
  330.     Gee.  How would we hide that?
  331.  
  332.     __________
  333.  
  334.      5. SC2's answer to life, the universe and everything is DP
  335.         (draft proposal) 10646, which defines a 32-bit wide
  336.         character set with 8- and 16-bit wide canonical versions
  337.         for storage and transmission, and a 24-bit wide
  338.         processing version for those who can get by with only
  339.         eight million characters or so.  As it's still at the DP
  340.         level, it'll be a long time before it hits the streets,
  341.         and, even when it does, there's the little matter of
  342.         getting people to use it...
  343.  
  344.  
  345.                                - 7 -
  346.  
  347.     The group next meets in Paris on June 11th and 12th, just
  348.     before the WG15 meeting.  If you want to come along, you
  349.     have to persuade your national standards body firstly that
  350.     you're a technical expert on POSIX, and then that they
  351.     should appoint you as internationalization rapporteur.  This
  352.     may be surprisingly easy  --  considerably simpler, for
  353.     example, than getting somebody to fund your trip.  To quote
  354.     from [8], ``...standards committees would be hard-pressed to
  355.     find people who participate on their voluntary committees
  356.     with purely rational-economic expectations.  Standards
  357.     committees seem bent on justifying their existences by using
  358.     hard data to prove that standards are good, yet they persist
  359.     in using altruistic appeals to attract committee members.''
  360.     If you feel like responding to the altruistic appeal of this
  361.     article, contact me by electronic mail.
  362.  
  363.     Alternatively, if you're a European, you can remain seated
  364.     in front of your terminal and participate in a news forum on
  365.     ISO 646 and all that: Keld Simonsen of the Danish UNIX
  366.     Users' Group has volunteered to initiate a discussion of the
  367.     European perspective on character sets for POSIX.  Denmark
  368.     may be small, but it's certainly making its voice heard on
  369.     this issue!
  370.  
  371.     ____________________________________________________________
  372.  
  373.      6. UNIX' elegant and flavorless files have already taken a
  374.         beating from X3.159, the ANSI C standard[6], since other
  375.         operating systems tend to support filing schemes which
  376.         are merely tasteless[7].
  377.  
  378.  
  379.                                - 8 -
  380.  
  381.                              References
  382.  
  383.      1. Brian J. Cudhay, Destination Loop, Stephen Green
  384.         Press/Viking Penguin (1982)
  385.  
  386.      3. P. J. Plauger, Quiet Changes, Part I, The C Users
  387.         Journal, vol. 8, no. 2 (February, 1990), pp 9-16.
  388.  
  389.      3. Keld Simonsen, A European Representation for ISO C,
  390.         European UNIX systems User Group Newsletter, vol. 9, no.
  391.         2 (Summer 1989), pp 15-18
  392.  
  393.      4. ISO 646:1983, Information processing  --  ISO 7-bit code
  394.         character set for information interchange
  395.  
  396.      5. Keld Simonsen, An extension to the troff character set
  397.         for Europe, European UNIX systems User Group Newsletter,
  398.         vol. 9, no. 2 (Summer 1989), pp 2-14
  399.  
  400.      6. ANSI X3.159, 1989, Programming Language C
  401.  
  402.      7. P. J. Plauger, Evolution of the C I/O Model, The C Users
  403.         Journal, vol. 7, no. 6 (August, 1989), pp 17-25.
  404.  
  405.      8. Carl F. Cargill, Information Technology Standardization:
  406.         Theory, Process and Organizations, Digital Press (1989)
  407.  
  408.  
  409. Volume-Number: Volume 18, Number 68
  410.  
  411. shar.wg15.14933
  412. echo wg15.a
  413. cat >wg15.a <<'shar.wg15.a.14933'
  414. From jsq@longway.tic.com  Thu Mar 15 13:05:08 1990
  415. Received: from cs.utexas.edu by uunet.uu.net (5.61/1.14) with SMTP 
  416.     id AA08775; Thu, 15 Mar 90 13:05:08 -0500
  417. Posted-Date: 15 Mar 90 02:43:27 GMT
  418. Received: by cs.utexas.edu (5.59/1.52)
  419.     id AA12139; Thu, 15 Mar 90 12:01:42 CST
  420. Received: by longway.tic.com (4.22/4.16)
  421.     id AA14670; Thu, 15 Mar 90 10:44:00 cst
  422. From: Randall Atkinson <uvaarpa.virginia.edu!randall@longway.tic.com>
  423. Newsgroups: comp.std.unix
  424. Subject: Re: Report on WG15 Rapporteur Group
  425. Message-Id: <561@longway.TIC.COM>
  426. References: <556@longway.TIC.COM>
  427. Sender: std-unix@longway.tic.com
  428. Reply-To: randall@uvaarpa.virginia.edu (Randall Atkinson)
  429. Organization: University of Virginia, Charlottesville
  430. Date: 15 Mar 90 02:43:27 GMT
  431. Apparently-To: std-unix-archive@uunet.uu.net
  432.  
  433. From: randall@uvaarpa.virginia.edu (Randall Atkinson)
  434.  
  435. As one who is fairly active in the multilingual computing
  436. side of things, I'm fairly certain that it just isn't worth
  437. it to try to make ISO 646 the basis of *anything* for the
  438. practical reason that it wasn't well thought out to begin with
  439. and has already been superceded by the ISO 8859/* family of
  440. 8-bit character sets.
  441.  
  442. The latter fully support European linguistic needs (yes, including
  443. Danish and Icelandic and ...) and can be used quite nicely with
  444. most UNIX shells that I'm familiar with.
  445.  
  446. I thought that trigraphs got excessive attention back when ANSI C
  447. was being developed and I fear that excessive attention will be
  448. devoted to ISO 646 when there are other areas of internationalisation
  449. that really deserve being thought about and solved cleanly.
  450.  
  451. Most of the vendors of hardware in Europe are supporting ISO 8859/1
  452. now, so it is the real long term solution to European needs anyway.
  453. Worrying about support for ISO 646 is a mistake, worrying about
  454. supporting ISO 8859/* and the Asian need for larger character sets 
  455. being fully supported and ways of handling date formats and such
  456. aren't a mistake at all.
  457.  
  458. Volume-Number: Volume 18, Number 73
  459.  
  460. shar.wg15.a.14933
  461. echo wg15.b
  462. cat >wg15.b <<'shar.wg15.b.14933'
  463. From jsq@longway.tic.com  Fri Mar 16 22:43:46 1990
  464. Received: from cs.utexas.edu by uunet.uu.net (5.61/1.14) with SMTP 
  465.     id AA20308; Fri, 16 Mar 90 22:43:46 -0500
  466. Posted-Date: 16 Mar 90 22:44:27 GMT
  467. Received: by cs.utexas.edu (5.59/1.52)
  468.     id AA19884; Fri, 16 Mar 90 21:43:08 CST
  469. Received: by longway.tic.com (4.22/4.16)
  470.     id AA02441; Fri, 16 Mar 90 21:18:51 cst
  471. From: Marius Olafsson <rhi.hi.is!marius@longway.tic.com>
  472. Newsgroups: comp.std.unix
  473. Subject: Re: Report on WG15 Rapporteur Group
  474. Message-Id: <565@longway.TIC.COM>
  475. References: <556@longway.TIC.COM> <561@longway.TIC.COM>
  476. Sender: std-unix@longway.tic.com
  477. Reply-To: std-unix@uunet.uu.net
  478. Organization: University of Iceland
  479. Date: 16 Mar 90 22:44:27 GMT
  480. Apparently-To: std-unix-archive@uunet.uu.net
  481.  
  482. From: marius@rhi.hi.is (Marius Olafsson)
  483.  
  484. randall@uvaarpa.virginia.edu (Randall Atkinson) writes:
  485.  
  486. >                I'm fairly certain that it just isn't worth
  487. >it to try to make ISO 646 the basis of *anything* for the
  488. >practical reason that it wasn't well thought out to begin with
  489. >and has already been superceded by the ISO 8859/* family of
  490. >8-bit character sets.
  491.  
  492. I agree. The ISO 8859 series of charactersets have the (in my opinion
  493. neccessary) quality that the *complete* set of ASCII characters can be 
  494. represented. If ISO 646 will be taken into consideration must we then
  495. allow alternate syntax in the varius shells and utilites that make 
  496. use of the characters {}[]@\| and ` - I think that is a can of worms
  497. best left unopened.
  498.  
  499. >The latter fully support European linguistic needs (yes, including
  500. >Danish and Icelandic and ...) and can be used quite nicely with
  501. >most UNIX shells that I'm familiar with.
  502.  
  503. And it seems that most major manufacturers already have (or have announced)
  504. support for ISO 8859 - at least HP-UX, Ultrix, AIX, SunOS and
  505. more I am sure. The X window system now supports ISO 8859 fonts, the
  506. latest Adobe rel of Postscripts support ISO 8859 encoding of the fonts,
  507. and the list goes on ... NONE provide any support for or consideration
  508. for ISO 646 (fortunately).
  509.  
  510.  
  511. >                        I fear that excessive attention will be
  512. >devoted to ISO 646 when there are other areas of internationalisation
  513. >that really deserve being thought about and solved cleanly.
  514.  
  515. Definately, and serious consideration should be given to the way X/Open
  516. has defined some of these other areas. That system actually works pretty
  517. well in practice.  It has been used here for about two years (on HP-UX).
  518.  
  519. --
  520. Marius Olafsson         internet: marius@rhi.hi.is
  521. University of Iceland        UUCP:     {mcsun,sunic,uunet}!isgate!rhi!marius
  522.  
  523.  
  524. Volume-Number: Volume 18, Number 77
  525.  
  526. shar.wg15.b.14933
  527. echo wg15.c
  528. cat >wg15.c <<'shar.wg15.c.14933'
  529. From jsq@longway.tic.com  Sat Mar 17 16:45:25 1990
  530. Received: from cs.utexas.edu by uunet.uu.net (5.61/1.14) with SMTP 
  531.     id AA16941; Sat, 17 Mar 90 16:45:25 -0500
  532. Posted-Date: 16 Mar 90 23:35:09 GMT
  533. Received: by cs.utexas.edu (5.59/1.52)
  534.     id AA17980; Sat, 17 Mar 90 15:45:08 CST
  535. Received: by longway.tic.com (4.22/4.16)
  536.     id AA04625; Sat, 17 Mar 90 14:06:42 cst
  537. From: David Wheeler <ida.org!wheeler@longway.tic.com>
  538. Newsgroups: comp.std.unix
  539. Subject: Re: Report on WG15 Rapporteur Group
  540. Message-Id: <568@longway.TIC.COM>
  541. Sender: std-unix@longway.tic.com
  542. Reply-To: std-unix@uunet.uu.net
  543. Date: 16 Mar 90 23:35:09 GMT
  544. Apparently-To: std-unix-archive@uunet.uu.net
  545.  
  546. From: wheeler@ida.org (David Wheeler)
  547.  
  548. domo@tsa.co.uk (Dominic Dunlop):
  549. = From: Dominic Dunlop <domo@tsa.co.uk>
  550. =        Report on ISO/IEEE JTC1/SC22/WG15 Rapporteur Group on
  551. =              Internationalization Meeting of 5th - 7th
  552. =                   March, 1990, Copenhagen, Denmark
  553. =                 Dominic Dunlop   --  domo@tsa.co.uk
  554. =                       The Standard Answer Ltd.
  555.  
  556. I enjoyed your posting, thank you!  You included a lot of "what this
  557. phrase really means" that I appreciated.
  558.  
  559. =      3. ISO 646[4], the earliest ISO standard for information
  560. =         technology, is the international derivative of ASCII.
  561. =         Its Danish variant replaces ASCII's } with aa.  Around
  562. =         the world, #$@[\]^`{|}~, all of which have a special
  563. =         meaning to the shell, are replaced by other characters
  564. =         in standards derived from ISO 646.  See [5] for much
  565. =         more information.
  566.  
  567. Isn't there an 8-bit standard character set that defines the first 128
  568. characters as a standard set (say as USASCII, provincial I'm afraid but it
  569. would break no Unix tools), then includes all the international
  570. characters as those with values > 127?   If this were used in the POSIX
  571. standard, wouldn't this solve many problems for those using a
  572. Latin-based alphabet? Or is this standard unused in the real world?
  573. Admittedly this eliminates the non-Latin alphabet world, and that
  574. is a weakness.
  575.  
  576. =     Apart from all this organizational stuff, we did review some
  577. =     existing documents.  For example, DTR (draft technical
  578. =     report) 10176, a product of SC14, discusses the treatment of
  579. =     characters appearing in language constructs, variable names,
  580. =     literals and comments, and turns out to have implications
  581. =     for sh, awk, yacc and the other ``little languages'' defined
  582. =     in DP 9945-2, the forthcoming international standard for the
  583. =     shell and tools.  And a document from SC22's study group on
  584. =     character sets suggests that source files should have some
  585. =     means of announcing the character set that they're using.
  586. =     Could this mean typed files or resource forks for POSIX6?
  587. =     Gee.  How would we hide that?
  588.  
  589. Some C programs would have to be fixed to deal with signed characters
  590. but at least the rules would be simple: 128+ are ordinary characters &
  591. can be used in identifiers, etc.
  592.  
  593. Source file tagging for language sounds like an abomination!
  594.  
  595. --- David A. Wheeler
  596.     wheeler@ida.org
  597.  
  598.  
  599. Volume-Number: Volume 18, Number 80
  600.  
  601. shar.wg15.c.14933
  602. exit
  603.