SOFT COMPUTING PARA LA CLASIFICACIÓN DE SERIES DINÁMICAS APLICADAS A PERFILES DE EXPRESIÓN GENÉTICA

Soft Computing de diseño propio que engloba diferentes algoritmos propios para la agrupación de genes coexpresados en microarrays de análisis de datos (MDA). Adecuado, para el uso de investigadores, que traten determinar los genes importantes y las relaciones co-expresadas entre ellos, para grandes conjuntos dinámicos de datos, de modo que se permita optimizar una característica de salida.

Algunos de los algoritmos diseñados que integra el software son:

  • Shape Index(SC). Agrupación sin tener en cuenta la salida de cada muestra.
  • Output Shape Index (SOC). Agrupación teniendo en cuenta la correlación del gen con la salida.
  • Dynamic Shape Index (DSC).Versión dinámica del método SC.
  • Output Dynamic Shape Index (DSOC). Versión dinámica cel método SOC.
  • Relaxed Shape Index (RSC). Ampliación del método SOC

El software integra métodos de fusión que combinan en una única agrupación las agrupaciones creadas a partir de cada una de las series temporales de los datos de microarrays realizadas de forma independiente. La detección de los clusters más importantes dentro de los posibles se realiza usando diferentes medidas sobre los genes, entre las que destacan el Coeficiente de Correlación de la Información (ICC), Coeficiendo de Correlación de Pearson (PCC) y las medidas Shape Increase.

Software para clusterización de genes desarrollado por ITCL

Ejemplo de Cluster de genes obtenido por el software, con perfiels de expresión similar para la optimización de la producción de inmunodepresores -streptomycecs tsukubaensis-, para la obtención de tacrolimus