lunes, 12 de julio de 2010

Cambiar lineas dentro de un HTML

Ante un determinado problema X, tenía que modificar un determinado dato de muuuuchos archivos HTML. No tenía ganas de ponerme a investigar como hacerlo con bash, así que lo solucioné con el amigo Python:

import os, glob, shutil

origen = '/Leyes sin encriptar/a Nuevo/'
origen_2 = '/Leyes\ sin\ encriptar/a\ Nuevo/'
destino = "/Leyes sin encriptar/a Nuevo/html_procesado/"
destino_2 = "/Leyes\ sin\ encriptar/a\ Nuevo/html_procesado/"

for archivo_actual in glob.glob(os.path.join(origen, '*.htm')):
....archivo_entrada = open(archivo_actual,"r")
....archivo_salida = open(archivo_actual + ".1","w")

....print "Archivo Actual: " + archivo_actual
....for linea in archivo_entrada:
........if linea.startswith("
............archivo_salida.write("'\n'")

........elif linea.endswith('charset=utf-8">\n') or linea.endswith('charset=utf-8">\n'):
............archivo_salida.write('\n')

........else:
............archivo_salida.write(linea)
archivo_salida.close()

#######################################
for archivo in os.listdir(origen):
....if archivo.endswith(".1"):
........print "Copiando: " + archivo[:-2]
........shutil.copyfile(origen + archivo, destino + archivo[:-2])
os.system('rm '+ origen_2 + '*.1 ')

No hay comentarios.: