home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / drafts / draft_s_z / draft-wang-mpls-scaling-atm-00.txt < prev    next >
Text File  |  1997-07-31  |  13KB  |  368 lines

  1.  
  2.  
  3.  
  4. MPLS Working Group                       Zheng Wang
  5. Internet Draft                       Grenville Armitage
  6. Expiration: Dec    1997               Bell Labs, Lucent Technologies
  7.                                 July 1997
  8.  
  9.  
  10.          Scalability Issues    in Label Switching over    ATM
  11.  
  12.  
  13. Status of this Memo
  14.  
  15.    This    document is an Internet    Draft. Internet    Drafts are working
  16.    documents of    the Internet Engineering Task Force (IETF), its    Areas,
  17.    and its Working Groups. Note    that other groups may also distribute
  18.    working documents as    Internet Drafts.
  19.  
  20.    Internet Drafts are draft documents valid for a maximum of six
  21.    months. Internet Drafts may be updated, replaced, or    obsoleted by
  22.    other documents at any time.    It is not appropriate to use Internet
  23.    Drafts as reference material    or to cite them    other than as a    "working
  24.    draft" or "work in progress."
  25.  
  26.    Please check    the 1id-abstracts.txt listing contained    in the
  27.    internet-drafts Shadow Directories on nic.ddn.mil, nnsc.nsf.net,
  28.    nic.nordu.net, ftp.nisc.sri.com, or munnari.oz.au to    learn the
  29.    current status of any Internet Draft.
  30.  
  31.  
  32. 1.  Introduction
  33.  
  34.    The scalability of label switching over ATM is one of fundamental
  35.    issues in MPLS that has not been fully understood. Whether or not one
  36.    should assume stream    merging    in ATM is a major design decision that
  37.    has many implications to MPLS protocols and ATM hardware design.  The
  38.    issues are also common to any proposals for setting up labels
  39.    [1,2,3,4,5].
  40.  
  41.    In this document, we    present    an analysis of scalability of label
  42.    switching over ATM, and examine some    possible solutions. The    document
  43.    is intended to do two things:
  44.  
  45.    - Facilitate    discussions in the MPLS    WG that    lead to    realistic
  46.      assessments of the    label space issues,
  47.    - Result in additional text for the FrameWork document that captures    the
  48.      refined assessments.
  49.  
  50.  
  51.  
  52.  
  53.  
  54. Wang & Armitage          Expiration: Dec 1997            [Page 1]
  55.  
  56.  
  57.  
  58.  
  59.  
  60.  
  61. Internet Draft          Scalability Issues               July 1997
  62.  
  63.  
  64. 2.  Consequences of Conventional VPI/VCI Use
  65.  
  66.  
  67.    In the absence of non-standard ATM switch hardware, the need    to avoid
  68.    interleaving    of cells from different    AAL5 PDUs on a single VCC makes
  69.    it necessary    to use a different label for each source/destination
  70.    pair. Therefore the number of labels    required is O(N**2) for    N end-
  71.    points (sources and destinations) in    a cloud.
  72.  
  73.    We now look at the worst-case label requirement, namely the maximum
  74.    number labels required on a single link in one direction. To    set up
  75.    switched paths based    on destination-based routing tables for    a net-
  76.    work    with of    N endpoints, the worst-case label requirement is as fol-
  77.    lows:
  78.  
  79.    (N**2)/4 if N is an even number
  80.  
  81.    (N**2 - 1)/4    if N is    an odd number
  82.  
  83.    It should be    emphasized that    this is    the worst-case scenario    which
  84.    may never happen in real networks. However, the worst-case analysis
  85.    gives us a very conservative    estimation of the scalability of label
  86.    switching over ATM.
  87.  
  88.    The worse-case scenario occurs only when the    following two extreme
  89.    conditions are met:
  90.  
  91.    1) a    network    is divided into    two parts with N/2 endpoints each (or
  92.    with    (N+1)/2, (N-1)/2 each if N is an odd number), and the two parts
  93.    are connected with a    single link
  94.  
  95.    2) each endpoint in one part    is simultaneously communicating    with all
  96.    endpoints in    the other part.
  97.  
  98.    Note    that it    is the link between the    two parts that will hit    the
  99.    worst-case label requirement.
  100.  
  101.    To set up switched paths between all    N endpoints based on
  102.    destination-based routing, it translates into an upper limit    of
  103.    2**(0.5*M + 1) endpoints, where M is    the length of the label    in bits.
  104.    For simplicity, we assume here that both N and M are    even numbers.
  105.  
  106.    If we use the 28 bits VPI/VCI space in ATM for labels, the upper
  107.    limit is 32K    endpoints and maximum flows is 256M on a single    link.
  108.  
  109.    The results has a number of implications on the way we deal with the
  110.    scalability issues which we will discuss in the next    a few sections.
  111.  
  112.  
  113.  
  114. Wang & Armitage          Expiration: Dec 1997            [Page 2]
  115.  
  116.  
  117.  
  118.  
  119.  
  120.  
  121. Internet Draft          Scalability Issues               July 1997
  122.  
  123.  
  124. 3.  Cloud Size
  125.  
  126.    Given that each endpoint represents an Edge LSR of an MPLS domain (a
  127.    edge    router of the overlying    routing    domain), 32K endpoints would
  128.    seem    to be a    fairly large figure for    majority of current networks.
  129.    Furthermore,    the worst-case scenario    occurs when a network can be
  130.    divided into    two parts and there is only a single link between the
  131.    two.    However, in most real network topology,    there are usually multi-
  132.    ple connections between any two parts of a network. Therefore the
  133.    upper limit can be several times bigger than    32K.
  134.  
  135.    On the other    hand, the results assume that we only have best-effort
  136.    destination-based forwarding. Other types of    traffic    such as    multi-
  137.    cast, RSVP/explicit routes will also    consume    label space. However, it
  138.    is difficult    to quantify the    level of such traffic in the future
  139.    Internet, and it is likely that associated switched paths will be
  140.    established on an 'as needed' basis.
  141.  
  142.    If we wanted    to pre-establish switched paths    for a few different
  143.    classes of traffic such as low delay, high throughput, high reliabil-
  144.    ity etc, the    worst-case upper limit is then reduced by K*N, where K
  145.    is the maximum number of classes and    N is the number    of endpoints.
  146.    This    will reduce the    scalability significantly. The implication is
  147.    that    for traffic other than best-effort, on-demand/on-request label
  148.    setup is a more scalable approach as    the likelihood of all the flows
  149.    for all possible classes active on a    single link is very small.
  150.  
  151.    Note, the theoretical limit imposed by the size of the VPI/VCI bit-
  152.    space actually overstates the case by ignoring the practical    limits
  153.    imposed by the ATM NICs of Ingress and Egress LSRs. Typical NICs can
  154.    support in the order    of a few thousand simultaneous SAR instances. An
  155.    Ingress LSR with a NIC that supports    4k SAR instances can at    most
  156.    have    only 4k    labeled    paths originating from it and terminating on it.
  157.    Any MPLS domain built with Edge LSRs    supporting Y SAR instances will
  158.    have    substantially less than    Y edge LSRs. This has a    consequential
  159.    impact on the number    of labels demanded through the core LSRs of the
  160.    MPLS    domain.
  161.  
  162.  
  163. 4.  Setup On-Demand/On-Request
  164.  
  165.    Instead of pre-establishing switched    paths among all    endpoints, one
  166.    can set up switched paths on-demand or on-request. Such setup is use-
  167.    ful for the following reasons:
  168.  
  169.    1) For many traffic types such as multicast and QoS/explicit    routes,
  170.    pre-establishment of    switched paths is not possible.
  171.  
  172.  
  173.  
  174. Wang & Armitage          Expiration: Dec 1997            [Page 3]
  175.  
  176.  
  177.  
  178.  
  179.  
  180.  
  181. Internet Draft          Scalability Issues               July 1997
  182.  
  183.  
  184.    2) On-demand/on-request setup can exploit the locality of the traffic
  185.    flows thus improves the scalability.
  186.  
  187.    With    on-demand/on-request setup, the    theoretical scalability    issue
  188.    becomes the probability of having 256M flows    simultaneously active on
  189.    a single link. Even on backbone links, and given the    limited    abili-
  190.    ties    of Ingress and Egress LSRs to source and sink thousands    of
  191.    labeled paths, this number of independent and non-aggregatable flows
  192.    is arguably unlikely.
  193.  
  194.    With    on-demand/on-request setup, the    scalability issue becomes the
  195.    probability of having 256M flows simultaneously active on a single
  196.    link. Even on backbone links, this number of    independent and    non-
  197.    aggregatable    flows is arguably unlikely.
  198.  
  199.    Even    if this    becomes    a problem in the future, intra-LSR solutions are
  200.    possible (e.g. the virtual VC space,    which is discussed in the next
  201.    section).
  202.  
  203.  
  204. 5.  Virtual Label Space
  205.  
  206.    It is conceivable that an unusual topology could result in the worst
  207.    case    label consumption predicted above (e.g.    some hot spots in a
  208.    backbone network connecting two large networks by a single link).
  209.    However, since the worst-case label consumption is localized, it is
  210.    arguably preferable to find a localized solution (rather than some-
  211.    thing that would affect all switches    in an MPLS domain).
  212.  
  213.    One simple solution is to use the the Virtual label space. At such
  214.    hot spots, we can have multiple parallel physical links instead of a
  215.    single physical link. For example, if we have L smaller physical
  216.    links distributed across L ports between two    LSRs, the total    usable
  217.    label space (on the link, and in the    port cards of the LSRs)    is
  218.    expanded by L times relative    to what    a single link could support.
  219.  
  220.  
  221. 6.  VP Merge
  222.  
  223.    VP merge allows multiple VPIs to be merged and uses different VCIs
  224.    for distinguishing flows or packets within the merged VP. So    each
  225.    egress router can be    represented with a single VPI, and packets from
  226.    different ingress routers going to the same egress router simply use
  227.    different VCI at the    mergeing point.    With VP    merge the total    number
  228.    of labels available is not changed when compared to simply using the
  229.    whole VPI/VCI space as a single label. However, since VPIs are set up
  230.    for forwarding and VCIs are allocated "as needed" to    resolve    cell
  231.    interleaving, So VP merge does improve the scalability by exploiting
  232.  
  233.  
  234. Wang & Armitage          Expiration: Dec 1997            [Page 4]
  235.  
  236.  
  237.  
  238.  
  239.  
  240.  
  241. Internet Draft          Scalability Issues               July 1997
  242.  
  243.  
  244.    the locaility of the    flows. In this sense, it is similar to the On-
  245.    Demand/On-Request setup discussed in    section    4. However, the    differ-
  246.    ence    is that    in VP merge, VPI space is pre-allocated    while VCI space
  247.    is allocated    "as-needed".  This feature does    seem to    be a good trade-
  248.    off between setting all label switched paths    in advance and allocat-
  249.    ing on a purely "as-needed" basis. VP merge also reduces the    number
  250.    of labels that have to be managed by    the switches. However, the down-
  251.    side    of VP merge is that it requires    collision detection and    resolu-
  252.    tion    when allocating    VCIs to    make it    work. Another problem is that
  253.    the VPI space is limited to 4096.
  254.  
  255.  
  256. 7.  VC Merge
  257.  
  258.    VC merge can    reduce the worst-case label requirement    to N, where N is
  259.    the number of endpoints. However, VC    merge requires modifications to
  260.    current ATM cell switching. In VC merge, a switch has to wait until
  261.    the last cell of a packet to    arrive before it can start to forward
  262.    the cells. In effect, the switch operates in    a frame-forwarding mode.
  263.    VC merge may    introduce extra    buffering, depending on    whether    inter-
  264.    leaving of cells from packets going to different destinations.  For
  265.    FIFO    queuing, no such interleaving takes place. Thus    a VC-merged net-
  266.    work    has the    same performance as a frame-based network.  If we assume
  267.    per-flow round-robin, cells from packets to different destinations
  268.    may interleave, at the next switch, the cells have to be sorted out
  269.    in the re-assemble buffer. At the cell level, the switch now    operates
  270.    in a    non-work-conserving mode which introduces extra    delay and
  271.    buffering, particularly when    the utilization    is low.
  272.  
  273.  
  274. 8.  Security Issues
  275.  
  276.  
  277.    Security Issues are not discussed here.
  278.  
  279.  
  280. 9.  Conclusion
  281.  
  282.  
  283.    Based on the    above analysis,    our conclusion is that combined    VPI/VCI
  284.    space in ATM    should be able to support networks of sufficient sizes,
  285.    and even label space    is exhausted on    some hot spots,    simple solutions
  286.    exist to extend label space at such points.
  287.  
  288.  
  289.  
  290.  
  291.  
  292.  
  293.  
  294. Wang & Armitage          Expiration: Dec 1997            [Page 5]
  295.  
  296.  
  297.  
  298.  
  299.  
  300.  
  301. Internet Draft          Scalability Issues               July 1997
  302.  
  303.  
  304. 10.  References
  305.  
  306.  
  307.    [1] Y. Rekhter, B. Davie, D.    Katz, E. Rosen,    G. Swallow,
  308.    "Cisco Systems' Tag Switching Architecture Overview",
  309.    RFC2105, Feb    1997
  310.  
  311.    [2] A. Viswanathan, N. Feldman, R. Boivie, R. Woundy,
  312.    "Aggregate Route-Based IP Switching",
  313.    Internet-Draft, Mar 1997
  314.  
  315.    [3] Y. Katsube, K. Nagami, H. Esaki,
  316.    "Cell Switch    Router - Basic Concept and Migration Scenario"
  317.    Networld+Interop'96 Engineer    Conference, July 1996
  318.  
  319.    [4] Peter Newman, Tom Lyon, Greg Minshall,
  320.    "Flow Labelled IP: A    Connectionless Approach    to ATM"
  321.    IEEE    Infocom, March 1996
  322.  
  323.    [5] Arup Acharya, Rajiv Dighe, Furquan Ansari,
  324.    "IPSOFACTO: IP Switching Over Fast ATM Cell Transport",
  325.    Internet Draft, July    1997
  326.  
  327.    [6] Indra Widjaja, Anwar Elwalid, "Performace issues    in VC-Merged
  328.    Capable Switches for    IP over    ATM Networks", pre-print, 1997.
  329.  
  330. Authors' Address:
  331.  
  332.    Zheng Wang
  333.    Bell    Labs Lucent Technologies
  334.    101 Crawfords Corner    Road
  335.    Holmdel, NJ 07733
  336.    Email: zhwang@bell-labs.com
  337.  
  338.    Grenville Armitage
  339.    Bell    Labs Lucent Technologies
  340.    101 Crawfords Corner    Road
  341.    Holmdel, NJ 07733
  342.    Email: gja@lucent.com
  343.  
  344.  
  345.  
  346.  
  347.  
  348.  
  349.  
  350.  
  351.  
  352.  
  353.  
  354. Wang & Armitage          Expiration: Dec 1997            [Page 6]
  355.  
  356.  
  357.  
  358.  
  359.  
  360.  
  361.  
  362.  
  363.  
  364.  
  365.  
  366.  
  367.  
  368.