Bioinformatics Unit   -   CNIO
 Práctica de clustering
para datos de DNA arrays
 

2. Pasos a seguir

2.1 De la imagen a los datos

Si partieramos directamente de las imágenes, tendríamos que empezar por cuantificar la cantidad de cada tipo de fluoróforo unida a los spots. Luego tendríamos que filtrar aquellos puntos para los que la medida estuviera fuera de los límites de detección o que no hayan pasado con éxito todos los controles de calidad que se hayan seguido. Finalmente, tendríamos que normalizar los valores a nivel de cDNA array para eliminar las diferencias debidas a la cantidad de mRNA que se hay extraido o a la incorporación de una sonda u otra.

Sin embargo, para esta práctica, vamos usar los datos de otros grupos que hayan publicado sus experimentos.

2.2 De los datos a los patrones

Lo primero es asegurarse de que entendemos bien los datos que tenemos entre manos para poder usarlos correctamente. Habrá que dividir los datos de expresión de las condiciones en estudio por los valores de las condiciones de referencia si no está hecho. También habrá que asegurarse de que los datos están ya transformados logarítmicamente o hacerlo uno mismo.

Sólo si se va a usar una distancia euclídea para agrupar los patrones: en este caso hay que eliminar los genes para los cuales las diferencias de expresión no sean significativas, es decir, los "patrones planos" para luego poder estandarizar el resto de los patrones de modo que la medida euclídea refleje diferencias en las tendencias como si fuera una correlación.

2.3 Hacer el clustering

Usaremos los procedimientos de clustering previamente descritos y compararemos los resultados.

CNIO, Unidad de Bioinformática. Abril de 2002