home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / compress / 3018 < prev    next >
Encoding:
Text File  |  1992-08-14  |  7.0 KB  |  172 lines

  1. Newsgroups: comp.compression
  2. Path: sparky!uunet!gatech!destroyer!caen!nic.umass.edu!noc.near.net!gateway!pictel!garys
  3. From: garys@pictel.com (Gary Sullivan)
  4. Subject: Re: Comparison: BMA vs. PRA
  5. Message-ID: <1992Aug14.153217.4146@pictel.com>
  6. Organization: PictureTel Corporation
  7. References: <1992Aug12.052132.9017@kum.kaist.ac.kr>
  8. Date: Fri, 14 Aug 1992 15:32:17 GMT
  9. Lines: 161
  10.  
  11. In article <1992Aug12.052132.9017@kum.kaist.ac.kr> hckim@camars.kaist.ac.kr (Hyung Chul Kim) writes:
  12. >Hi folks,
  13. >
  14. >BMA(Block Matching Algorithm) and PRA(Pel Recursive Algorithm) are
  15. >motion estimation algorithms for motion video compression.
  16. >Anyone knows whether there is any comparison study about them from the point of
  17. >view of speed and compression rate?
  18. >If you have ever studied or have any information about it,
  19. >please let me know.
  20. >
  21.  
  22. Here is an excerpt from the LaTeX source of my motion compensation article in '91 ICASSP.
  23.  
  24. Reference: @inproceedings{sullivanCGI91conf,
  25.     author = "G. J. Sullivan and R. L. Baker",
  26.     title = "Motion Compensation for Video Compression using Control Grid Interpolation",
  27.     booktitle = icassp,
  28.     pages = "2713--2716",
  29.     month = may,
  30.     year = 1991}
  31.  
  32. I have included some lines of the original source that were commented out
  33. (using "%") in the actual paper due to constraints on the length of the
  34. paper, as I think these lines may be helpful in some cases.  However, the
  35. text is not guaranteed to make sense with these lines included.  It is presumed
  36. to make sense without them.
  37.  
  38. The summary of what is below is this:
  39. (1) PRAs are fairly useless for low rate video compression, since they require
  40.     sequential encoding, not block-oriented methods such as DCT or large-block VQ.
  41. (2) PRAs are more normally more computationally complex than BMAs but can
  42.     produce a better motion vector field estimation under some circumstances.
  43.  
  44. ----------------- Included description below --------------------------
  45. The dominant methods of motion compensation are {\em block matching
  46. algorithms} (BMAs)~[1--3]\nocite{musmann85,rao85,MPEGSM3}.
  47. In a BMA,
  48. the input image is decomposed into a regular
  49. grid of rectangular blocks.  One MV is found for each block, and all pels
  50. in the block are displaced equally.  The chosen MVs
  51. are entropy coded and sent to the receiver.
  52. %The focus of much of the research to date on BMAs consists of
  53. %various methods for efficiently searching for the best MV for each block.
  54. A straightforward but computationally intense way of choosing these MVs is
  55. called {\em full-search}, which consists of measuring the distortion for every
  56. allowable MV value and choosing the best directly.
  57. %Many methods for reducing the
  58. %number of tested vectors have been proposed, each of which by construction 
  59. %has performance somewhat below that of full-search.
  60.  
  61. There are several well-known problems with BMAs.
  62. %The borders of moving objects
  63. %do not normally coincide with the borders of the blocks used for the BMA.
  64. When objects undergoing different types of motion are found in the same block,
  65. the use of the same MV for every pel in the block becomes
  66. inappropriate.  Also, when adjacent blocks use different MVs, they
  67. form a straight-line discontinuity in the prediction image.
  68. Since the human visual system is very sensitive to straight lines, these
  69. errors appear as {\em blocking artifacts}.  Since the motion vectors are
  70. determined independently for each block, the motion vector field
  71. is discontinuous, difficult to compress, and may have little relation to
  72. true object motion.
  73. Further, since each block can
  74. undergo only translational motion, BMAs have difficulty with other types of
  75. motion such as rotation and depth changes.  These problems
  76. demonstrate the need for methods which operate on individual pels, rather
  77. than large blocks.
  78.  
  79. The next most common class of methods for motion compensation is
  80. {\em pel-recursive algorithms}
  81. (PRAs)~\cite{musmann85}.
  82. These operate on a pel basis and overcome
  83. many of the problems associated with BMAs.
  84. %They produce
  85. %less distortion and have no blocking artifacts.
  86. %In a PRA each individual pel or small block of pels
  87. %has its own motion vector, which is
  88. %calculated by an iterative method.  In their preferred implementation,
  89. %PRAs do not send these motion vectors to the receiver,
  90. %because to do so would require large
  91. %amounts of side information.  Instead, they use
  92. %previously decoded data from the current frame
  93. %to find a MV that is appropriate for the area surrounding
  94. %the next pel to be decoded.
  95. %Since this requires that each pel be decoded individually, it
  96. However, in their preferred implementation, PRAs require that each
  97. pel be decoded sequentially, thus making them
  98. incompatible with block coding methods, such as DCT or VQ.
  99. %PRAs also have high complexity, since they involve an iterative
  100. %optimization procedure for every pel.
  101. %
  102. Several other methods for motion compensation have been proposed.  
  103. Predictive segmentation uses a BMA and data
  104. from prior frames to divide a block into regions having differing
  105. MVs~\cite{orchard90}.  This method shows promise, but requires
  106. extra rate to identify the segmentation.
  107. %Also, since segmentation is
  108. %a hard (rather than soft) decision, errors can produce large residuals.
  109. Other methods based on object modeling may be useful in the future, but
  110. have yet to be developed for real-time application to general, complex
  111. scenes typical of videoconferencing or broadcast video.
  112.  
  113. In this paper, we describe a new class of motion compensation methods based on
  114. control grid interpolation (CGI)~\cite{castle79}.
  115. CGI is a spatial transformation method which can be used to create a smooth
  116. interpolated motion field.
  117. The authors are
  118. unaware of any prior study of CGI in motion compensation.
  119. We show that BMA is a special case of CGI, and
  120. describe a new CGI algorithm that is compatible with nearly any BMA coding
  121. system, yet
  122. produces no blocking artifacts.  It uses the same or less rate
  123. than the corresponding BMA, and has about the same mean-square distortion.
  124. Nearly all of the theory developed for BMA searching and for encoding BMA
  125. motion vector data is easily applied to the CGI system.
  126.  
  127. Citations:
  128.  
  129. @article{musmann85,
  130.     author = "H. G. Musmann and P. Pirsch and H-J. Grallert",
  131.     title = "Advances in Picture Coding",
  132.     journal = procieee,
  133.     volume = "73",
  134.     number = 4,
  135.     pages = "523--548",
  136.     month = apr,
  137.     year = 1985}
  138.  
  139. @article{rao85,
  140.     author = "R. Srinivasan and K. R. Rao",
  141.     title = "Predictive Coding Based on Efficient Motion Estimation",
  142.     journal = ieeetransCOM,
  143.     volume = "COM-33",
  144.     pages = "888-896",
  145.     month = aug,
  146.     year = 1985}
  147.  
  148. @unpublished{MPEGSM3,
  149.     author = "{MPEG Video Editorial Group}",
  150.     title = "{MPEG} Video Simulation Model Three",
  151.     month = aug,
  152.     note = "Int. Standards Org.",
  153.     year = 1990}
  154.  
  155. @inproceedings{orchard90,
  156.     author = "M. T. Orchard",
  157.     title = "Predictive Motion Field Segmentation for Image Sequence Coding",
  158.     booktitle = icassp,
  159.     month = apr,
  160.     volume = "4",
  161.     pages = "1977--1980",
  162.     year = 1990}
  163.  
  164. @book{castle79,
  165.     author = "K. R. Castleman",
  166.     title = "Digital Image Processing",
  167.     address = "Englewood Cliffs, NJ",
  168.     publisher = "Prentice-Hall",
  169.     year = 1979}
  170. ---------------------------------
  171. Gary Sullivan  (garys@pictel.com)
  172.