home *** CD-ROM | disk | FTP | other *** search
/ Maximum CD 2011 January / maximum-cd-2011-01.iso / DiscContents / calibre-0.7.26.msi / file_4435 < prev    next >
Encoding:
Text File  |  2010-10-14  |  3.1 KB  |  86 lines

  1. #!/usr/bin/env python
  2. # vim:fileencoding=UTF-8:ts=4:sw=4:sta:et:sts=4:ai
  3. from __future__ import with_statement
  4.  
  5. __license__   = 'GPL v3'
  6. __copyright__ = '2009, Kovid Goyal <kovid@kovidgoyal.net>'
  7. __docformat__ = 'restructuredtext en'
  8.  
  9. '''
  10.  Modified by Tony Stegall
  11.  on 10/10/10 to include function to grab print version of articles
  12. '''
  13.  
  14. from datetime import date
  15. from calibre.web.feeds.news import BasicNewsRecipe
  16. '''
  17. added by Tony Stegall
  18. '''
  19. #######################################################
  20. from calibre.ptempfile import PersistentTemporaryFile
  21. #######################################################
  22.  
  23. class AdvancedUserRecipe1249039563(BasicNewsRecipe):
  24.     title          = u'De Volkskrant'
  25.     __author__     = 'acidzebra'
  26.     oldest_article = 7
  27.     max_articles_per_feed = 100
  28.     no_stylesheets = True
  29.     language = 'nl'
  30.  
  31.     extra_css      = '''
  32.                         body{font-family:Arial,Helvetica,sans-serif; font-size:small;}
  33.                         h1{font-size:large;}
  34.                      '''
  35.     '''
  36.       Change Log:
  37.         Date:       10/10/10  - Modified code to include obfuscated to get the print version
  38.         Author:   Tony Stegall
  39.     '''
  40.    #######################################################################################################
  41.     temp_files = []
  42.     articles_are_obfuscated = True
  43.  
  44.     def get_obfuscated_article(self, url):
  45.         br = self.get_browser()
  46.         print 'THE CURRENT URL IS: ', url
  47.         br.open(url)
  48.         year = date.today().year
  49.  
  50.         try:
  51.           response = br.follow_link(url_regex='.*?(%d)(\\/)(article)(\\/)(print)(\\/)'%year, nr = 0)
  52.           html = response.read()
  53.         except:
  54.           response = br.open(url)
  55.           html = response.read()
  56.  
  57.         self.temp_files.append(PersistentTemporaryFile('_fa.html'))
  58.         self.temp_files[-1].write(html)
  59.         self.temp_files[-1].close()
  60.         return self.temp_files[-1].name
  61.  
  62.    ###############################################################################################################
  63.  
  64.     '''
  65.       Change Log:
  66.        Date: 10/15/2010
  67.        Feeds updated by Martin Tarenskeen
  68.     '''
  69.  
  70.     feeds          = [
  71.                       (u'Laatste Nieuws', u'http://www.volkskrant.nl/rss/laatstenieuws.rss'),
  72.                       (u'Binnenland', u'http://www.volkskrant.nl/rss/nederland.rss'),
  73.                       (u'Buitenland', u'http://www.volkskrant.nl/rss/internationaal.rss'),
  74.                       (u'Economie', u'http://www.volkskrant.nl/rss/economie.rss'),
  75.                       (u'Sport', u'http://www.volkskrant.nl/rss/sport.rss'),
  76.                       (u'Cultuur', u'http://www.volkskrant.nl/rss/kunst.rss'),
  77.                       (u'Gezondheid & Wetenschap', u'http://www.volkskrant.nl/rss/wetenschap.rss'),
  78.                       (u'Internet & Media', u'http://www.volkskrant.nl/rss/media.rss') ]
  79.  
  80.  
  81. '''
  82. example for formating
  83. '''
  84. # original url: http://www.volkskrant.nl/vk/nl/2668/Buitenland/article/detail/1031493/2010/10/10/Noord-Korea-ziet-nieuwe-leider.dhtml
  85. # print url :   http://www.volkskrant.nl/vk/nl/2668/2010/article/print/detail/1031493/Noord-Korea-ziet-nieuwe-leider.dhtml
  86.