diff --git a/dumpgenerator.py b/dumpgenerator.py index ae0d9be..22fc526 100644 --- a/dumpgenerator.py +++ b/dumpgenerator.py @@ -30,7 +30,6 @@ import urllib2 # curonly and all history (curonly si puede acumular varias peticiones en un solo GET, ara full history pedir cada pagina una a una) # usar api o parsear html si no está disponible # http://www.mediawiki.org/wiki/Manual:Parameters_to_Special:Export -# threads para bajar más rápido? pedir varias páginas a la vez # Special:Log? uploads, account creations, etc # download Special:Version to save whch extension it used # que guarde el index.php (la portada) como index.html para que se vea la licencia del wiki abajo del todo @@ -379,7 +378,6 @@ def saveImageFilenamesURL(config={}, images=[]): print 'Image filenames and URLs saved at...', imagesfilename def getImageFilenamesURL(config={}): - #fix start is only available if parsing from API, if not, reload all the list from special:imagelist is mandatory print 'Retrieving image filenames' r_next = r'(?\d+)&' # (?