Maximum CD 2010 November

home *** CD-ROM | disk | FTP | other *** search

/ Maximum CD 2010 November / maximum-cd-2010-11.iso / DiscContents / calibre-0.7.13.msi / file_3605 < prev next >

Wrap

Text File | 2010-01-19 | 2.1 KB | 58 lines

__license__ = 'GPL v3' __copyright__ = '2009-2010, Darko Miletic <darko.miletic at gmail.com>' ''' spectator.org ''' from calibre.web.feeds.news import BasicNewsRecipe class TheAmericanSpectator(BasicNewsRecipe): title = 'The American Spectator' __author__ = 'Darko Miletic' description = 'News from USA' category = 'news, politics, USA, world' publisher = 'The American Spectator' oldest_article = 7 max_articles_per_feed = 100 no_stylesheets = True use_embedded_content = False language = 'en' INDEX = 'http://spectator.org' conversion_options = { 'comments' : description ,'tags' : category ,'language' : language ,'publisher' : publisher } keep_only_tags = [ dict(name='div', attrs={'class':'post inner'}) ,dict(name='div', attrs={'class':'author-bio'}) ] remove_tags = [ dict(name='object') ,dict(name='div', attrs={'class':['col3','post-options','social']}) ,dict(name='p' , attrs={'class':['letter-editor','meta']}) ] feeds = [ (u'Articles', u'http://feeds.feedburner.com/amspecarticles')] def get_cover_url(self): cover_url = None soup = self.index_to_soup(self.INDEX) link_item = soup.find('a',attrs={'class':'cover'}) if link_item: soup2 = self.index_to_soup(link_item['href']) link_item2 = soup2.find('div',attrs={'class':'post inner issues'}) cover_url = self.INDEX + link_item2.img['src'] return cover_url def print_version(self, url): return url + '/print' def get_article_url(self, article): return article.get('guid', None)