home *** CD-ROM | disk | FTP | other *** search
/ Internet Standards / CD2.mdf / ccitt / 1992 / e / e550.asc < prev    next >
Text File  |  1991-12-30  |  24KB  |  426 lines

  1.          All drawings appearing in this Recommendation have been done in Autocad.
  2.          Recommendation E.550
  3.              GRADE-OF-SERVICE AND NEW PERFORMANCE CRITERIA UNDER FAILURE
  4.                    CONDITIONS IN INTERNATIONAL TELEPHONE EXCHANGES
  5.          1      Introduction
  6.          1.1    This Recommendation is confined to failures in a single exchange and their
  7.          impact on calls within that exchange - network impacts are not covered  in  these
  8.          Recommendations.
  9.                   1.2    This Recommendation from the viewpoint of exchange Grade of Service (GOS) has been established.
  10.          1.3   In conformity with Recommendation E.543 for transit exchanges
  11.          under normal operation, this Recommendation  applies  primarily  to
  12.          international  digital  exchanges.  However,  Administrations   may
  13.          consider these Recommendations for their national networks.
  14.          1.4   The GOS seen  by  a  subscriber  (blocking  and/or  delay  in
  15.          establishing calls) is not  only  affected  by  the  variations  in
  16.          traffic loads but also by the partial or complete faults of network
  17.          components. The concept of customer-perceived GOS is not restricted
  18.          to specific fault and  restoration  conditions.  For  example,  the
  19.          customer is usually not aware of the fact that  a  network  problem
  20.          has occurred, and he is unable to distinguish a  failure  condition
  21.          from a number of other conditions such as peak traffic  demands  or
  22.          equipment shortages due to  routine  maintenance  activity.  It  is
  23.          therefore necessary that  suitable  performance  criteria  and  GOS
  24.          objectives for international telephone exchanges be formulated that
  25.          take account of the impact of partial and  total  failures  of  the
  26.          exchange. Further, appropriate definitions, models and  measurement
  27.          and calculation methods need  to  be  developed  as  part  of  this
  28.          activity.
  29.          1.5   From the subscriber's point of view, the GOS should not  only
  30.          be defined by the level of unsatisfactory service but also  by  the
  31.          duration of the intervals in which the GOS is unsatisfactory and by
  32.          the frequency with which it occurs. Thus, in its most general  form
  33.          the performance criteria should take into account such factors  as:
  34.          intensity of failures and duration  of  resulting  faults,  traffic
  35.          demand at time of failures, number of subscribers affected  by  the
  36.          failures and the distortions in  traffic  patterns  caused  by  the
  37.          failures.
  38.               However, from a practical viewpoint, it will be  desirable  to
  39.          start with simpler criteria that could be  gradually  developed  to
  40.          account for all the factors mentioned above.
  41.          1.6   Total or partial failures within the international part of the 
  42.          network have a much more severe effect than similar failures in the
  43.          national networks because the failed  components  in  the  national
  44.          networks can be isolated and affected traffic can be rerouted.
  45.               Failures  in  the  international  part  of  the  network   may
  46.          therefore lead to degraded service in terms of  increased  blocking
  47.          delays and even complete denial  of  service  for  some  time.  The
  48.          purpose of this Recommendation is to set  some  service  objectives
  49.          for international  exchanges  so  that  the  subscribers  demanding
  50.          international connections are assured a certain level of service.
  51.               It should be noted however that where there are  multi-gateway
  52.          exchanges providing access to and from a country, with diversity of
  53.          circuits and provision for restoration,  the  actual  GOS  will  be
  54.          better than that for the single exchange.
  55.          2      General considerations
  56.          2.1    The new performance criteria being sought involve concepts from the  field
  57.          of "availability" (intensity of failures and duration  of  faults)  and  "traffic
  58.          congestion" (levels of blocking and/or delay). It is therefore necessary that the
  59.          terminology, definitions and models considered  should  be  consistent  with  the
  60.          appropriate CCITT Recommendations on terminology and vocabulary.
  61.          2.2    During periods of heavy congestion, caused either by traffic peaks or  due
  62.          to malfunction in the exchange, a significant increase in  repeated  attempts  is
  63.          likely to occur. Further, it is expected that due to accumulated demands during a
  64.          period of complete faults, the exchange will  experience  a  heavy  traffic  load
  65.          immediately after a failure condition has been removed and service restored.  The
  66.  
  67.  
  68.  
  69.                                                         Fascicle II.3 - Rec. E.550   PAGE1
  70.  
  71.        potential effects of these phenomena on the proposed GOS under failure conditions
  72.        should be taken into account (for further study).
  73.        3      Exchange performance characteristics under fault situations
  74.        3.1    The exchange is considered to be in a fault situation if  any  failure  in
  75.        the exchange (hardware, software, human errors) reduces its throughput when it is
  76.        needed to handle traffic. The following  four  classes  of  exchange  faults  are
  77.        included in this Recommendation:
  78.              a)  complete exchange faults;
  79.              b)  partial faults resulting in capacity reduction in all traffic flows to
  80.                the same extent;
  81.              c)  partial faults in which traffic flows to or from a particular point are 
  82.                restricted or totally isolated from their intended route;
  83.              d)  intermittent fault affecting a certain proportion of calls.
  84.        3.2    To the extent practical, an  exchange  should  be  designed  so  that  the
  85.        failure of a unit (or units)  within  the  exchange  should  have  as  little  as
  86.        possible adverse affect on its throughput. In addition, the  exchange  should  be
  87.        able to take measures  within  itself  to  lessen  the  impact  of  any  overload
  88.        resulting from failure of any of  its  units.  Units  within  an  exchange  whose
  89.        failure reduces the exchange throughput  by  greater  amounts  than  other  units
  90.        should have proportionally higher availability (Recommendation Q.504, S 4).
  91.        3.3    When a failure reduces exchange  throughput  and  congestion  occurs,  the
  92.        exchange should be able to  initiate  congestion  control  indications  to  other
  93.        exchanges and network management systems so as to help control the  offered  load
  94.        to the exchange, (Recommendations E.410 and Q.506).
  95.        4      GOS and applicable models
  96.        4.1    In this section, the terms "accessible" and "inaccessible" are used in the
  97.        sense defined in Recommendation G.106 (Red Book). The  GOS  for  exchanges  under
  98.        failure conditions can be formulated at the following two conceptual levels  from
  99.        a subscriber's viewpoint:
  100.        4.1.1  Instantaneous service accessibility (inaccessibility)
  101.              At this  level,  one  focuses  on  the  probability  that  the  service  is
  102.        accessible (not accessible) to the subscriber at the instant he places a demand.
  103.        4.1.2  Mean service accessibility (inaccessibility)
  104.              At this level, one extends the concept of "downtime" used  in  availability
  105.        specifications for exchanges to include  the  effects  of  partial  failures  and
  106.        traffic overloads over a long period of time.
  107.        4.2    Based on the GOS concept  outlined  in  S  4.1,  the  GOS  parameters  for
  108.        exchanges under failure conditions are defined as follows:
  109.        4.2.1  instantaneous exchange inaccessibility is the probability that 
  110.        the exchange in question cannot perform the required function (i.e.
  111.        cannot successfully process calls) under stated conditions  at  the
  112.        time a request for service is placed.
  113.        4.2.2 mean exchange  service  inaccessibility  is  the  average  of
  114.        instantaneous exchange service inaccessibility over a  prespecified
  115.        observation period (e.g. one year).
  116.        4.2.3 Note 1 - The GOS model in the case of instantaneous  exchange
  117.        inaccessibility parallels the concept of  the  call  congestion  in
  118.        traffic theory and  needs  to  be  extended  to  include  the  call
  119.        congestion caused by exchange failures classified in S 3.1. The GOS
  120.        value can then be assigned on a  basis  similar  to  Recommendation
  121.        E.543 for transit exchanges under normal operation.
  122.             Note  2  -  A  model  for   estimating   the   mean   exchange
  123.        inaccessibility is provided in Annex A. Though the model provides a
  124.        simple and hence attractive approach, some practical issues related
  125.        to measurement and monitoring and the potential effects of  network
  126.        management controls and  scheduled  maintenance  on  the  GOS  need
  127.        further study.
  128.  
  129.  
  130.  
  131.  
  132.  
  133.  
  134.  
  135.  
  136.  
  137.  
  138.  
  139.  
  140.        PAGE8   Fascicle II.3 - Rec. E.550
  141.  
  142.          4.3   The model in Figure 1/E.550 outlines the change in the nature
  143.          of traffic offered under failure conditions.
  144.                                         Figure 1/E.550 - T0200870-87
  145.  
  146.                In normal conditions the congestion factor B is low  and  there  should  be
  147.          few repeat attempts: as a consequence the traffic At approximates Ao.
  148.                Under failure  conditions  there  is  a  reduction  in  resources  and  the
  149.          congestion factor B increases. This provokes the phenomenon  of  repeat  attempts
  150.          and hence the load At on the exchange becomes greater than the original Ao.
  151.                Therefore it is necessary to evaluate the congestion with the new  load  At
  152.          assuming system stability exists, which may not always be the case.
  153.                Recommendation  E.501  furnishes  the  appropriate  models  to  detect  the
  154.          traffic offered from the carried traffic taking into account the repeat attempts.
  155.          4.4    The impact on the GOS  for  each  of  the  exchange  fault  modes  can  be
  156.          characterized by:
  157.                -   load in Erlangs (At) and busy hour call attempts (BHCA);
  158.                -    inaccessibility  (instantaneous  and  mean),  congestion  and   delay
  159.                   parameters (call set-up, through-connection, etc.);
  160.                -   fault duration;
  161.                -   failure intensity.
  162.          5      GOS standards and inaccessibility
  163.          5.1    Exchange fault situations can create similar effects to  overload  traffic
  164.          conditions applied to an exchange under fault free conditions.
  165.                In general, digital exchanges operating in the network  should  be  capable
  166.          of taking action to ensure maximum throughput when  they  encounter  an  overload
  167.          condition, including any that have been caused by a fault  condition  within  the
  168.          exchange.
  169.                Calls that have  been  accepted  for  processing  by  the  exchange  should
  170.          continue to be processed  as  expeditiously  as  possible,  consistent  with  the
  171.          overload protection strategies recommended in S 3 of Recommendation Q.543.
  172.          5.2    One of the actions the exchange  may  take  to  preserve  call  processing
  173.          capacity is to initiate  congestion  controls  and/or  other  network  management
  174.          actions, to control the load offered  to  the  exchange  (Recommandations  E.410,
  175.          E.413 and Q.506). The most obvious impact from the caller's viewpoint  may  be  a
  176.          lowering of the probability that the network as a whole will be able to  complete
  177.          some portion of the call attempts that the exchange is unable  to  accept  during
  178.          the failure condition.
  179.          5.3    International exchanges occupy a prominent place in the network and it  is
  180.          important that their processing capacity have high availability. There are likely
  181.          to be many  variations  in  exchange  architectures  and  sizes  that  will  have
  182.          different impacts in  the  categories  of  failure  and  the  resulting  loss  of
  183.          capacity.
  184.                In general, failures that cause large proportions of exchange  capacity  to
  185.          be lost must have a low probability of occurring and  a  short  downtime.  It  is
  186.          important  that  maintenance   procedures   to   achieve   appropriate   exchange
  187.          availability performance be adopted.
  188.          5.4     The  formal  expression  of  the  criterion  of  mean  exchange   service
  189.          inaccessibility is as follows:
  190.          Let:
  191.                y(t):  Intensity of call attempts  gaining  access  through  the  exchange
  192.                   assuming no failures.
  193.                s(t):  Intensity of  call  attempts  actually  given  access  through  the
  194.                   exchange, taking into account the fault conditions which occur  in  the
  195.                   exchange.
  196.          Then the mean exchange service inaccessibility during a period of time T is given
  197.          by
  198.                       P = eq \f( 1, T)    \i(0,T, ) eq \f( y(t) - s(t), y(t)) dt
  199.                Annex A describes a practical implementation of this criterion.
  200.                For periods in which the exchange experiences a complete fault,  i.e.  s(t)
  201.          = 0, the expression:
  202.                             eq \f(y(t) - s(t), y(t))     is equal to 1.
  203.                The contribution of such periods to the  total  criterion  P  may  then  be
  204.          expressed simply as the fraction Ptotal of the evaluation peri   T  during  which
  205.          complete exchange outage due to failure occurred.
  206.                The objective for Ptotal is given as Ptotal not more than 0.4 hours per year.
  207.  
  208.  
  209.  
  210.  
  211.                                                         Fascicle II.3 - Rec. E.550   PAGE1
  212.  
  213.                For the period of partial failure, it is convenient  to  also  express  the
  214.          objective as equivalent hours per year - the term equivalent is used because  the
  215.          duration of partial faults is weighted by the fraction:
  216.                                       eq \f(y(t) - s(t), y(t))
  217.          of call attempts denied access. The objectives for the contribution of period  of
  218.          partial exchange faults to the total criterion P is given by:
  219.                Ppartial not more than 1.0 equivalent hours per year.
  220.                Note that by definition P = Ptotal + Ppartial
  221.                The inaccessibility criterion does not cover:
  222.                -   planned outages
  223.                -   faults with duration of less than 10 seconds
  224.                -   accidental damage to equipment during maintenance
  225.                -   external failures such as power failures, etc.
  226.                It does cover failures resulting from both hardware and software faults.
  227.                In addition, the objectives relate to the exchange under  normal  operating
  228.          conditions and do not include failures just after cutover of an exchange or those
  229.          during the end of the period it is in service, i.e. the  well  known  "bath  tub"
  230.          distribution.
  231.          6      Performance monitoring
  232.                Certain failure conditions [i.e. the type mentioned in S 3.1,  b)]  usually
  233.          will be reflected in the  normal  GOS  performance  measurements  called  for  in
  234.          Recommendation E.543.
  235.                Other failure conditions [i.e. the type mentioned in S 3.1, c)] can  result
  236.          in a reduced performance for a portion of traffic flows but  with  little  or  no
  237.          impact on measured exchange GOS. For example if  a  trunk  module  in  a  digital
  238.          exchange fails, the traffic normally associated with that  module  is  completely
  239.          blocked, but since the attempts are also not measured the failure does not change
  240.          the monitoring of the exchange GOS.
  241.                For this second situation,  the  mean  inaccessibility  can  be  calculated
  242.          using direct measurement of unit outages to provide mi  and  ti  information  and
  243.          estimates of bi together with  the  model  of  Annex  A.  (See  Annex  A  for  an
  244.          explanation of these symbols.)
  245.                The estimates of bi can incorporate both fixed factors  based  on  exchange
  246.          architecture and variable factors based on traffic measurements just prior to the
  247.          time of failure.
  248.                                                    ANNEX A
  249.                                      (to Recommendation E.550)
  250.                        A model for mean exchange inaccessibility
  251.          A.1    Let P be the probability that a call attempt is not  processed  due  to  a
  252.          fault in the exchange, then:
  253.                                      eq P = \i\su(i=1,N, )pi bi                       (A-1)
  254.          where:
  255.                pi  is the probability of fault mode i. Each fault mode denotes a specific
  256.                   combination of faulty exchange components
  257.                N   is the number of the fault mode
  258.                bi  is the average proportion of traffic which cannot be processed due  to
  259.                   the fault mode i. It is a function of the specific  fault  present  and
  260.                   the offered traffic load at the time of the failure condition.
  261.                During a period of time T, the fault probability pi may be estimated by:
  262.                             pi = eq \f( mi . ti, T)   i = 1, 2, . . . N               (A-2)
  263.          where:
  264.                mi  is the number of occurrences of fault mode i during the period T
  265.                ti  is the average duration of occurrences of fault mode i
  266.                As a practical matter, one may wish to exclude from the calculation  faults
  267.          of duration less than 15 seconds.
  268.                Note 1 - A given fault mode causes the exchange to enter the  corresponding
  269.          fault state, which is characterized by a given mean duration and  a  function  bi
  270.          giving the proportion of offered traffic affected.  In  principle,  the  possible
  271.          number of fault modes can be very large because of  the  number  of  combinations
  272.          which can occur. In practice this number can be reduced by considering all  fault
  273.          modes with the same bi and ti as equivalent.
  274.                Note 2 - bi should take into account the distribution of traffic  during  a
  275.          day and the probability of fault mode i occurring in a  given  time  period.  The
  276.          value assigned in the above model should be the average bi value  for  all  hours
  277.          considered in these distributions. For example, a partial fault affecting 20%  of
  278.  
  279.  
  280.  
  281.  
  282.          PAGE8   Fascicle II.3 - Rec. E.550
  283.  
  284.           the exchange traffic throughput in the busy hour and 2 similar  hours,  could  be
  285.           evaluated to effect a 10% reduction in 4 other moderately busy hours and to  have
  286.           negligible impact during all other hours. If  this  fault  is  considered  to  be
  287.           equally probable in time, the average value of bi can be obtained as follows:
  288.                        bi = Sum ofeq \b\bc\( (\f( Percentage of traffic affected x number 
  289.           of relevant busy hours, 24 hours)) =
  290.                        =eq \f( 0.2 x 3, 24) +eq \f( 0.1 x 4, 24) +eq \f( 0.0 x 17, 24) = 
  291.           0.025 + 0.0167 = 0.0417
  292.                 Note 3 - The probability that a call attempt is not  processed  relates  to
  293.           the category of traffic affected by the fault. Other traffic  will  experience  a
  294.           different GOS depending on system architecture which is not taken into account in
  295.           this Recommendation. For example, partial faults which remove from service blocks
  296.           of trunks connected to an exchange have the effect of reducing the total  traffic
  297.           offered to the exchange. The traffic flows not using the failed trunks could thus
  298.           have a slightly improved GOS.
  299.           A.2    Example for calculating the inaccessibility, P
  300.                 See Table A-1/E.550.
  301.                                                 TABLE A.1/E.550
  302.                       An example of using the model for calculating the inaccessibility P
  303.                                            (T = 1 year = 8760 hours)
  304.                    bi                    mi                    ti                  pi . bi
  305.            Average proportion     Number of failures    Average duration of    Probability that a 
  306.             of traffic which              of               failure type i      call attempt is not 
  307.            cannot be processed      type i per year            (hours)           processed (x 10-5)
  308.                   1.00                    2                     0.2                   4.56
  309.                   0.40                    3                    0.22                  3.01
  310.                   0.20                    4                     0.3                   2.74
  311.                   0.10                    6                     0.4                   2.74
  312.                   0.05                   10                    0.5                   2.85
  313.  
  314.  
  315.  
  316.  
  317.  
  318.  
  319.  
  320.  
  321.  
  322.  
  323.  
  324.  
  325.  
  326.  
  327.  
  328.  
  329.  
  330.  
  331.  
  332.  
  333.  
  334.  
  335.  
  336.  
  337.  
  338.  
  339.  
  340.  
  341.  
  342.  
  343.  
  344.  
  345.  
  346.  
  347.  
  348.  
  349.  
  350.  
  351.  
  352.  
  353.                                                          Fascicle II.3 - Rec. E.550   PAGE1
  354.  
  355.                The value of  P  is  the  sum  of  the  individual  pi.bi  terms  in  Table
  356.          A-1/E.550. In this example P = 15.90 x 10-5 which is equivalent to 1.39 hours  of
  357.          inaccessibility per year (1.39 = 15.90 x 10-5 x 8760). P decomposes as follows:
  358.                Ptotal  = 0.40 hours per year (4.56 x 10-5 x 8760)
  359.                Ppartial = 0.99 hours per year (the remaining part of P)
  360.          A.3    As a further example consider a circuit group where exchange failures  may
  361.          occur which disable one or more circuits (see Figure A-1/E.550). It  is  possible
  362.          to expand the formula (A-1).
  363.                                        Figure A-1/E.550 - T0200880-87
  364.  
  365.                The average proportion of traffic b(n, k, A),  which  cannot  be  processed
  366.          due to failures on circuits is now a function of:
  367.                -   n, the size of the circuit group;
  368.                -   k, number of circuits out of order because of the failure;
  369.                -   A, the mean traffic offered to the circuit group, in  the  absence  of
  370.                   faults.
  371.          Let the throughput of a circuit group of size n with a traffic offered A be Cn(A)
  372.          - then the throughput of the same circuit group is Cn-k(A) where k  circuits  are
  373.          out of order - hence the average proportion of traffic b(n, k, A) which cannot be
  374.          processed because of the failure is given by:
  375.                           b(n, k, A) = eq \f( [Cn(A) - Cn-k (A)], Cn(A))              (A-3)
  376.          Let
  377.                f(k, A) be the probability for having k circuits in a fault  condition  and
  378.          the mean offered traffic A. The probability, Pn,  that  a  call  attempt  is  not
  379.          processed due to a failure on a circuit group of size n, is given by:
  380.                       Pn = eq \i\su(k\l(,)A, , ) f (k, A) . b(n, k, A)      k = 1, 2, . . 
  381.          . n    (A-4)
  382.                If k and A are independent then
  383.                                      f (k, A) = f1(k) . f2(A)                         (A-5)
  384.          where  f1  (k)  may  satisfy  a  binomial  distribution  and  f2(A)   a   Poisson
  385.          distribution.
  386.                Suppose the traffic follows an Erlang distribution, Cn(A)  is  proportional
  387.          to A . (1 - En(A)), where En(A) is the  blocking  probability  expressed  by  the
  388.          Erlang loss formula. Hence:
  389.                          b (n, k, A) = eq \f( En-k (A) - En (A), 1 - En (A))            (A-6)
  390.          can be found by using the  Erlang  tables  and  then  inserting  the  value  into
  391.          equation (A-4).
  392.  
  393.  
  394.  
  395.  
  396.  
  397.  
  398.  
  399.  
  400.  
  401.  
  402.  
  403.  
  404.  
  405.  
  406.  
  407.  
  408.  
  409.  
  410.  
  411.  
  412.  
  413.  
  414.  
  415.  
  416.  
  417.  
  418.  
  419.  
  420.  
  421.  
  422.  
  423.  
  424.          PAGE8   Fascicle II.3 - Rec. E.550
  425.  
  426.