Maximum CD 2010 November

home *** CD-ROM | disk | FTP | other *** search

/ Maximum CD 2010 November / maximum-cd-2010-11.iso / DiscContents / calibre-0.7.13.msi / file_1021 (.txt) < prev next >

Wrap

Python Compiled Bytecode | 2010-08-06 | 8.3 KB | 230 lines

# Source Generated with Decompyle++ # File: in.pyc (Python 2.6) __license__ = 'GPL v3' __copyright__ = '2009, John Schember <john@nachtimwald.com>' __docformat__ = 'restructuredtext en' import os import re import struct import zlib from calibre import CurrentDir from calibre.ebooks import DRMError from calibre.ebooks.metadata.opf2 import OPFCreator from calibre.ebooks.pdb.ereader import EreaderError from calibre.ebooks.pdb.formatreader import FormatReader class HeaderRecord(object): def __init__(self, raw): (self.compression,) = struct.unpack('>H', raw[0:2]) (self.non_text_offset,) = struct.unpack('>H', raw[12:14]) (self.chapter_count,) = struct.unpack('>H', raw[14:16]) (self.image_count,) = struct.unpack('>H', raw[20:22]) (self.link_count,) = struct.unpack('>H', raw[22:24]) (self.has_metadata,) = struct.unpack('>H', raw[24:26]) (self.footnote_count,) = struct.unpack('>H', raw[28:30]) (self.sidebar_count,) = struct.unpack('>H', raw[30:32]) (self.chapter_offset,) = struct.unpack('>H', raw[32:34]) (self.small_font_page_offset,) = struct.unpack('>H', raw[36:38]) (self.large_font_page_offset,) = struct.unpack('>H', raw[38:40]) (self.image_data_offset,) = struct.unpack('>H', raw[40:42]) (self.link_offset,) = struct.unpack('>H', raw[42:44]) (self.metadata_offset,) = struct.unpack('>H', raw[44:46]) (self.footnote_offset,) = struct.unpack('>H', raw[48:50]) (self.sidebar_offset,) = struct.unpack('>H', raw[50:52]) (self.last_data_offset,) = struct.unpack('>H', raw[52:54]) self.num_text_pages = self.non_text_offset - 1 self.num_image_pages = self.metadata_offset - self.image_data_offset class Reader132(FormatReader): def __init__(self, header, stream, log, options): self.log = log self.encoding = options.input_encoding self.log.debug('132 byte header version found.') self.sections = [] for i in range(header.num_sections): self.sections.append(header.section_data(i)) self.header_record = HeaderRecord(self.section_data(0)) if self.header_record.compression not in (2, 10): if self.header_record.compression in (260, 272): raise DRMError('eReader DRM is not supported.') self.header_record.compression in (260, 272) raise EreaderError('Unknown book compression %i.' % self.header_record.compression) self.header_record.compression not in (2, 10) get_metadata = get_metadata import calibre.ebooks.metadata.pdb self.mi = get_metadata(stream, False) def section_data(self, number): return self.sections[number] def decompress_text(self, number): if self.header_record.compression == 2: decompress_doc = decompress_doc import calibre.ebooks.compression.palmdoc return None(decompress_doc(self.section_data(number)).decode if self.encoding is None else self.encoding, 'replace') if self.header_record.compression == 10: return self.header_record.compression == 2(zlib.decompress(self.section_data(number)).decode if self.encoding is None else self.encoding, 'replace') def get_image(self, number): if number < self.header_record.image_data_offset or number > self.header_record.image_data_offset + self.header_record.num_image_pages - 1: return ('empty', '') data = self.section_data(number) name = data[4:36].strip('\x00') img = data[62:] return (name, img) def get_text_page(self, number): if number not in range(1, self.header_record.num_text_pages + 1): return '' return self.decompress_text(number) def extract_content(self, output_dir): footnote_to_html = footnote_to_html sidebar_to_html = sidebar_to_html import calibre.ebooks.pml.pmlconverter PML_HTMLizer = PML_HTMLizer import calibre.ebooks.pml.pmlconverter output_dir = os.path.abspath(output_dir) if not os.path.exists(output_dir): os.makedirs(output_dir) title = self.mi.title if not isinstance(title, unicode): title = title.decode('utf-8', 'replace') html = u'<html><head><title>%s</title></head><body>' % title pml = u'' for i in range(1, self.header_record.num_text_pages + 1): self.log.debug('Extracting text page %i' % i) pml += self.get_text_page(i) hizer = PML_HTMLizer() html += hizer.parse_pml(pml, 'index.html') toc = hizer.get_toc() if self.header_record.footnote_count > 0: html += '<br /><h1>%s</h1>' % _('Footnotes') footnoteids = None(re.findall, '\\w+(?=\x00)'(self.section_data(self.header_record.footnote_offset).decode if self.encoding is None else self.encoding)) for fid, i in enumerate(range(self.header_record.footnote_offset + 1, self.header_record.footnote_offset + self.header_record.footnote_count)): self.log.debug('Extracting footnote page %i' % i) html += footnote_to_html(footnoteids[fid], self.decompress_text(i)) if self.header_record.sidebar_count > 0: html += '<br /><h1>%s</h1>' % _('Sidebar') sidebarids = None(re.findall, '\\w+(?=\x00)'(self.section_data(self.header_record.sidebar_offset).decode if self.encoding is None else self.encoding)) for sid, i in enumerate(range(self.header_record.sidebar_offset + 1, self.header_record.sidebar_offset + self.header_record.sidebar_count)): self.log.debug('Extracting sidebar page %i' % i) html += sidebar_to_html(sidebarids[sid], self.decompress_text(i)) html += '</body></html>' CurrentDir(output_dir).__enter__() try: try: index = _[1] self.log.debug('Writing text to index.html') index.write(html.encode('utf-8')) finally: pass finally: pass images = [] CurrentDir(os.path.join(output_dir, 'images/')).__enter__() try: for i in range(0, self.header_record.num_image_pages): (name, img) = self.get_image(self.header_record.image_data_offset + i) images.append(name) try: imgf = _[2] self.log.debug('Writing image %s to images/' % name) imgf.write(img) finally: pass finally: pass opf_path = self.create_opf(output_dir, images, toc) return opf_path def create_opf(self, output_dir, images, toc): CurrentDir(output_dir).__enter__() try: opf = OPFCreator(output_dir, self.mi) manifest = [ ('index.html', None)] for i in images: manifest.append((os.path.join('images', i), None)) opf.create_manifest(manifest) opf.create_spine([ 'index.html']) opf.set_toc(toc) try: opffile = _[1] try: tocfile = _[2] opf.render(opffile, tocfile, 'toc.ncx') finally: pass finally: pass finally: pass return os.path.join(output_dir, 'metadata.opf') def dump_pml(self): pml = '' for i in range(1, self.header_record.num_text_pages + 1): pml += self.get_text_page(i) return pml def dump_images(self, output_dir): if not os.path.exists(output_dir): os.makedirs(output_dir) CurrentDir(output_dir).__enter__() try: for i in range(0, self.header_record.num_image_pages): (name, img) = self.get_image(self.header_record.image_data_offset + i) try: imgf = _[1] imgf.write(img) finally: pass finally: pass