Individuazione e ordinamento dei blocchi di testo quali avvengono in una pagina scansionata. Ci sono 3 tipi di zone: testo, zone grafiche che contengono delle foto, illustrazioni ecc., e zone di tabella.
La scomposizione della pagina risulta particolarmente utile quando si esegue l’OCR di testi formati da colonne e di documenti dal complesso layout di pagina.
L’analisi della pagina è in grado di gestire linee oblique ed è estremamente accurata - individua forme irregolari.