Hola a todos. Estoy intentando extraer información de imágenes de un código html ( http://en.wikipedia.org/wiki/Data_URI_scheme)
El formato sería el siguiente: <img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAXcAAAEACAYAAABI5zaHAAAABHNCSVQICAgIfAhkiAAAAAlwSFlz AAALEgAACxIB0t1+/AAA" /> Me interesa extraer la extensión de la imagen (png en el anterior ejemplo) y los datos que vienen después de 'base64,' hasta el cierre de comillas '"', es decir, 'iVBORw0KGgoAAAANSUhEUgAAAXcAAAEACAYAAABI5zaHAAAABHNCSVQICAgIfAhkiAAAAAlwSFlz AAALEgAACxIB0t1+/AAA'. Tengo un ejemplo aquí, https://gist.github.com/anonymous/75ab61f586c19e767cf0, pero estoy seguro de que mi regex me va a fallar en cuanto encuentre alguna cosa más rara. ¿Alguien me podría indicar si el regex vale o si debería modificarlo para que no me dé falsos positivos o acepte falsos negativos? Muchas gracias por adelantado.
_______________________________________________ Python-es mailing list Python-es@python.org https://mail.python.org/mailman/listinfo/python-es FAQ: http://python-es-faq.wikidot.com/