MalaCiencia: Ampliando imágenes (III)

miércoles, octubre 10, 2007

Ampliando imágenes (III)

Ya he comentado en un par de ocasiones la dificultad de ampliar una imagen más allá de su resolución original. Normalmente no suelo repetirme, pero en el episodio de esta semana de CSI: NY, se superan a sí mismos, y merece ser mencionado. Veamos, en el episodio, hay dos crímenes sin relación, pero en edificios contiguos. Resulta que en el primer crimen, uno de los elementos de la investigación es un vídeo grabado de forma oculta, con la cámara de un teléfono móvil, y que podría ser el móvil del crimen (valga el juego de palabras). El vídeo se centra en una chica, casi en primer plano, y de fondo se atisba el edificio donde se comete el segundo crimen. Cuando la encargada de dicho caso se da cuenta, se pone a analizar la grabación. Tras un proceso que sólo podemos calificar de «mágico», obtiene un vídeo de la ventana donde se comete el segundo crimen, donde puede ver perfectamente a la asesina. La resolución es perfecta, y la cámara está fija, a pesar de que la grabación se hizo desde un móvil, sujeto por una persona, y con otros elementos delante.

Aquí se mezclan varios elementos, que hacen que en el mundo real, esto nunca pueda ocurrir. Por un lado, tenemos el nivel de detalle del vídeo. Creo que todos sabemos más o menos la baja calidad de un vídeo hecho por un móvil. Además de la baja calidad de la óptica del aparato, lo más importante aquí es la baja resolución. Como comenté en aquellas dos ocasiones, no se puede aumentar el nivel de detalle más allá de la resolución original. Se pueden interpolar datos para que la apariencia no sea tan pixelada, pero estaremos «inventando» datos. Como dije entonces, «de donde no hay, no se puede sacar».

Pero además, tenemos otro factor importante: el movimiento de la cámara. El vídeo estaba tomado por una chica, que tenía oculto el móvil en la ropa (o en un bolso). La chica se movía, y efectivamente, cuando vemos el vídeo completo, comprobamos que la cámara se mueve. Si alguna vez habéis grabado vídeo con zoom, habréis comprobado que cuanto mayor es el nivel de zoom, más difícil es mantener la imagen fija, si sujetamos la cámara con una mano. Un leve movimiento, se traduce en un enorme desplazamiento en la imagen. Eso es debido a que cuando ampliamos la imagen, no estamos acercando la cámara al objeto de nuestra grabación, sino únicamente aumentando el tamaño de una zona de la imagen. Y al hacerlo, también aumentan lógicamente los pequeños desplazamientos debidos a movimientos de la cámara.

En fin, me gustaría saber qué clase de tratamiento de imagen puede obtener a partir de un vídeo movido de baja resolución, una ampliación a cámara fija, de alta definición.

Y ya que hablo de CSI: NY, no quiero terminar sin mostrar mi indignación por la eliminación injustificada por parte de Tele 5, de los créditos iniciales de la serie. Y es que tras el teaser del episodio (esos primeros segundos antes de los créditos), cortan y se saltan los créditos de inicio, para ir directamente a la continuación del mismo. Ya me molesta cuando lo hacen en una serie, al emitir dos episodios seguidos (sólo ponen los créditos del primer episodio). Pero es que en este caso no tiene ningún sentido. ¿O es que en T5 no saben que CSI: Miami y CSI: NY son dos series diferentes?

25 comentarios:

Davidmh10 octubre, 2007 20:08
Huy, ayer en RIS científica lo hicieron varias veces. Hasta una cámara de seguridad de un garaje que graba el reflejo del retrovisor a través de los cristales un poco guarretes de una furgoneta y enfoca justo a la puerta del lugar que querían ver. Allí, por lo menos, la calidad era relativamente mala. Se le reconocía la cara al tipo, pero lo justo y además el ordenador necesitaba diez minutos para procesar cada imagen (a veinticinco por segundo, en un intervalo de diez, cosa abreviable tomando, por ejemplo, uno cada medio segundo y luego afinar cuando se vea algo).

Es algo que hacen bastante. El otro día, de una foto que se corrió por completo por el agua hasta formarse una masa uniforme que cubría el ochenta por ciento de la imagen, sacaron la original con unas pocas horas de procesado.

Yo quiero un ordenador de esos.
ResponderEliminar
Respuestas
Anónimo10 octubre, 2007 21:03
solo ponen los creditos del segundo.

y...realmente esperas que tele 5 entienda la sutiliza de que dos series con el mismo nombre y similar argumento y diferente director, productor, guionista, actores, localizacion, camaras, luces, acciones bla bla bla son series distintas? le añades un CI que no tienen, chaval :P
ResponderEliminar
Respuestas
Anónimo10 octubre, 2007 21:40
Por mis justos conocimientos adquiridos en un curso de doctorado en Informatica, sé (por que lo presencié) que a partir de varias imagenes en movimiento (video) se puede reconstruir una única imagen estática de mayor resolución que las imagenes bases. Por decirlo de alguna forma, se modifican las imagenes del video individualmente para que coincida la region a estudiar y se "desinterpola" las imagenes interpoladas (limitadas a una resolucion) que no estan alineadas gracias al movimiento

En definitiva, pude comprobar que a partir de un video en movimiento si que se puede obtener un imagen estática de mayor resolucion aunque quizas no de una forma tan exagerada como se ve en CSI
ResponderEliminar
Respuestas
Anónimo11 octubre, 2007 07:44
Pero qué podemos esperar, si el otro día en un telediario oí decir (no recuerdo si era el que lo contaba o un "sientífico") que a partir de una imagen con mala calidad se podía aumentar su resolución.

pedropr: es posible conseguir una imagen de mayor calidad a partir de una secuencia de imágenes, porque puedes combinar la información que hay en cada fotograma para mejorar una imagen estática, pero también tiene limitaciones la técnica. Teoría de la información pura y dura :)
ResponderEliminar
Respuestas
Hairanakh11 octubre, 2007 09:07
En efecto, como dice pedropr, es posible aumentar la resolución de una única imagen con técnicas de "superresolución" (suena muy místico, pero no lo es). Pero para ello necesitas tener más datos que los de la imagen original, es decir, necesitas tener más imágenes muy parecidas (levemente desplazadas). En cuanto los píxeles de las dos imágenes no se superpongan por completo, sino que cada píxel de una tenga "trozos" de varios píxeles de la otra, lo que conseguimos es aumentar el número total de puntos en los que se muestrea. Cada uno de esos puntos, claro, tiene una imagen "borrosa" (está mezclado con los puntos de alrededor), pero eso se puede reconstruir (aunque no completamente) mediante técnicas de procesado de imágenes.

Las imágenes parecidas se pueden obtener de secuencias de vídeo, o bien tomando las imágenes de los sensores de distinto color en cámaras RGB.

De todas formas, estas técnicas sólo consiguen mejoras en la resolución relativamente pequeñas. Además, en un caso real (no de laboratorio) los métodos de tratamiento de imágenes suelen dar resultados bastante modestos. Y lo de CSI NY desde luego no tiene ni pies ni cabeza, ni por la resolución, ni por el encuadre. (Aunque en CSI se ven unas cosas...)
ResponderEliminar
Respuestas
Anónimo11 octubre, 2007 12:00
Sobre el zoom fijo, comentar que con programas de edición de vídeo (yo he manejado combustion) se pueden fijar elementos (como filtros, ventanas, etc) a una parte de la imagen en movimiento (similar al típico círculo que tapa la cara de un policía o similar o más comunmente, para cambiar el envase de un producto en un anuncio publicitario). Esto se hace para que si el elemento se mueve, nuestro filtro o ventana se mueva con la imagen, pero tambien se puede utilizar para estabilizar una imagen cuando se hace un zoom. Normalmente se utilizan pixels de colores vivos en el fondo de la imagen para facilitarle el trabajo al ordenador. No he visto el capítulo y aunque en este tipo de cosas se pasan de fantasía, no son imposibles. Eso sí, tal y como dice Alf, de donde no hay no se puede sacar y no se puede hacer con cualquier imagen ni tampoco hasta el extremo (ni con la rapidez) con que nos suele maravillar hollywood.
ResponderEliminar
Respuestas
Anónimo11 octubre, 2007 13:06
¿Recordáis que el 'cazareplicantes' de Blade Runner ya usaba esta técnica? Yo fui la primera vez que la vi.
ResponderEliminar
Respuestas
Erynus D'Alecto Graeme11 octubre, 2007 15:02
Pero es que Decca hasta cambiaba el angulo de la imagen para ver detras de las esquinas XD.
Yo quiero uno de esos.
ResponderEliminar
Respuestas
Anónimo12 octubre, 2007 05:31
Creo que se te ha olvidado comentar (ya que vamos a ello) el enfoque, aunque quizá estoy metiendo la patorra porque no sé mucho de fotografía.

El tema es... Si la cámara está enfocando a una chica en primer plano, ¿con qué nitidez va a registrar entonces (independientemente de lo bueno de la óptica y de la resolución) una imagen que está en el fondo a unas decenas de metros?
ResponderEliminar
Respuestas
Davidmh12 octubre, 2007 12:33
Las cámaras de los móviles que he visto creo que ni siquiera tienen la capacidad de enfocar. Aprovechan el efecto estenopeico* para tener una buen profundidad de campo (intervalo de distancias a la que la imagen se ve enfocada).

De todas formas, a esas resoluciones, poca diferencia hay entre enfocado y no enfocado, por lo que puedes sacar fotos al infinito y a medio metro, que probablemente no notarás la diferencia.

*Efecto estenopeico, definición rápida e imprecisa: cuanto más pequeño es el agujero por el que pasa la luz, más enfocado estarán los objetos.
ResponderEliminar
Respuestas
Cris12 octubre, 2007 13:44
jaja sisi,eso mismo pensé yo..¿como es posible que tenga una resolucion tan buena la imagen de video cuando la amplian y encima hecho con movil?? ay..como se han colado.. jaja. No se yo,a veces pienso que se creen q somos tontos o algo por el estilo..

estoy totalmente de acuerdo contigo ^^

me gusta mucho tu blog,esta genial!
besos! :**
ResponderEliminar
Respuestas
Unknown13 octubre, 2007 14:45
Davidmh, el efecto estenopeico del que hablas, no es el que se utiliza en las cámaras de los celulares. La apertura del diafragma de estas cámaras será similar a la de las cámaras tradicionales. Al fin y al cabo, la luz tiene que entrar ahí.

El caso es que hay otra variable que influye en la profundidad de campo que es la longitud focal del objetivo. Cuanto más corta es, mayor profundidad de campo. Y los objetivos de los celulares son realmente cortísimos, lo que da una profundidad de campo grandísima, por eso no necesitan ser enfocados.

Un saludo. mg
ResponderEliminar
Respuestas
Davidmh14 octubre, 2007 22:10
Interesante, no recordaba ese detalle. De todas formas, comparando la cámara de un móvil con una «de verdad», ésta última supera por bastante en tamaño.
ResponderEliminar
Respuestas
Luna Carmesi15 octubre, 2007 08:02
Un blog genial.
Efectivamente... tengo una amiga que trabaja en Imp. Digital y tratamiento de imagenes y 'flipa' con algunos 'milagros' del CSI.
Saludos.
ResponderEliminar
Respuestas
Anónimo15 octubre, 2007 14:03
Si con el tratamiento de imagenes se pasan, deberiais oir las carcajadas que nos echamos los cerrajeros cada vez que les vemos abrir una puerta con sus ganzuas.
Tdavía me duele la mandibula de cuando ví a Antonio Banderas abrir una puerta en "Atame" (de Almodovar) girando la cerradura ¡al reves!
ResponderEliminar
Respuestas
Minerva15 octubre, 2007 18:46
La verdad es que el rigor científico de la serie deja mucho que desear. Utilizan muchos tecnicismos pero la mitad de las cosas que hacen son imposibles. Una vez escuché una frase al respecto de un cromatógrafo de gases (ese aparatito donde inyectan los restos biológicos como si fueran agua) que pensaba que era un chiste de lo absurda que era.
ResponderEliminar
Respuestas
Anónimo15 octubre, 2007 19:22
Uno de los mejores ejemplos de lo que se pueden hacer con imágenes de baja resolución se encuentra en la astronomía.

Con un pequeño telescopio y una webcam se toman 10000 imágenes del cielo, Júpiter o Saturno por ejemplo. Tras el procesado se obtienen imágenes dignas del Hubble. Se pueden encontrar muchos ejemplos en la red.

Hasta ahí la realidad, después CSI.
ResponderEliminar
Respuestas
Anónimo16 octubre, 2007 00:52
Gana dinero por postear visita: http://soloportadas.com/foros
ResponderEliminar
Respuestas
Anónimo16 octubre, 2007 01:07
Si de verdad se pudiera hacer ese tipo de conversiones a ese nivel ¿para qué necesitaríamos internet de banda ancha? Bastaría enviar las películas con resolución de 6 pixels de ancho por cuatro de alto (y te caben cien canales de TV por un modem telefónico). Luego, un ordenadorcito potente procesa la información y te muestra una peli de alta definición.

(El único inconveniente es que a lo mejor envías una de Tarzán y en el otro lado sale una de romanos).
ResponderEliminar
Respuestas
Anónimo16 octubre, 2007 16:06
No me he leído todos los comentarios, así que perdón si me repito.

Con las caras (información muy compleja) está claro que es más difícil sacar de donde no hay... Pero con cosas como matrículas de coches es diferente. Con cualquier imagen en que tengamos una serie de candidatos limitados (aunque sean muchos) siempre se pueden emplear algoritmos de máxima verosimilitud (ver http://en.wikipedia.org/wiki/Maximum_likelihood y http://en.wikipedia.org/wiki/Expectation-maximization_algorithm por ejemplo).

Para aclaralo con las matrículas: a pesar de la baja resolución de la foto, si la matrícula es algo como "XX-12345", no hay tantas variantes como para que un ordenador no encuentre una combinación que, una vez distorsionada adecuadamente, encaje (más o menos, y esta es la clave) con la imagen original tan mala. Así, como por arte de magia, se puede encontrar una solución de enorme resolución...

Se podría hacer también con las caras, si tenemos una buena base de datos de posibles candidatos.

Con esto en realidad no se restaura la imagen original para tener más resolución, pero "parece como si".
ResponderEliminar
Respuestas
Triangulum17 octubre, 2007 18:47
hola! me parece muy interesante tu blog, por eso te escribo un comentario.
Ahora me teneis que escribir un comentario a mí-
www.saraserranoamaro.blogspot.com
un beso
sara
ResponderEliminar
Respuestas
Anónimo18 octubre, 2007 19:20
Eso es como el comparar huellas con la base de datos de todos los fichados de EE.UU., porque no es sólo de las Vegas o de Miami o de NY, porque hay veces que salen de otros condados.

¿De verdad la gente cree que tarda unos minutos en hacerse? En realidad no se lo que debe tardar, pero muchas horas fijo.

Y estamos hablando que estos trabajan en un turno. Anda ya!
ResponderEliminar
Respuestas
Kryztoval31 octubre, 2007 19:23
Comentarios al margen:

Mi celular graba a 640x480 a 30fps...
Su camara es de 5 MegaPixeles...
Tiene anulador de movimiento...
Yo he estudiado procesamiento de imagenes...

Conclusion: CSI utiliza algo que se conoce comunmente como Holliwood-OS o Movie-OS... un sistema operativo capaz de buscar en millones de huellas digitales en minutos encontrando SOLO UNA coincidencia o ninguna (opuesto a traerte muchas posibles para revision ocular despues de muchas horas, como sucede en la vida real) ampliar fotografias mas alla del doble de su resolucion original, etc.

he podido hacer que un video se deje de mover si tengo puntos de referencia.. es decir, centrar la imagen con respecto a algo que existe haciendo un video mas grande, de cierta forma el efecto que tendria una lampara de mano en un escena, pero subirle la calidad? nah, imposible, solo en las series de television/peliculas!

buen articulo!
ResponderEliminar
Respuestas
gfunho01 noviembre, 2007 10:48
Si que es posible subir la calidad de un video bajando su frame-rate.

Como bien decía Hainarakh, la idea consiste en utilizar la información de cada uno de los frames (al final son 30 fotos fijas por segundo a una resolucion de 640x480) de las que se puede obtener informacion suficiente para ampliar una foto fija (o varias) con mejor resolución.

Aunque los resultados todavía no son buenos, ya se pueden ver cosas bastante sorprendentes.

Sin embargo, hay una cosa que se ha pasado por alto y esa es la compresión del video. En un teléfono móvil, la compresion realizada es muy alta para poder guardarlo en la tarjeta de memoria. No me refiero a una compresión sin perdidas, que reconstruye el original perfectamente, sino a una con pérdidas, que elimina casi toda la información que podríamos utilizar para reconstruir algo de mayor resolución.
ResponderEliminar
Respuestas
Alfonso de Terán Riva05 noviembre, 2007 19:51
Tienes razón. No había caído en lo de la compresión con pérdidas.
ResponderEliminar
Respuestas

Añadir comentario

Nota: solo los miembros de este blog pueden publicar comentarios.

Búsqueda

miércoles, octubre 10, 2007

Ampliando imágenes (III)

25 comentarios: