class: center, middle, inverse, title-slide # Toxicidad Acuática Aguda ### Grupo E --- # *Pimephales promelas* <div class="figure" style="text-align: center"> <img src="images/pez.jpg" alt="Especie en estudio" /> <p class="caption">Especie en estudio</p> </div> --- # Conceptos generales -- - **Toxicidad** -- - **Proceso de toxicidad** -- - **Algunas propiedades** <div class="figure" style="text-align: center"> <img src="images/medio_acuatico.jpg" alt="Medio acuatico" /> <p class="caption">Medio acuatico</p> </div> --- background-image: url("images/potential_consequences_exposure_to_chemicals.JPG") background-size: 800px 600px --- # Conceptos generales: Pruebas de toxicidad -- - **Pruebas de toxicidad acuática** -- - **Punto final tóxico** --- # Sobre los datos - **Conjunto de datos** -- - **Variable respuesta:** `\(\mathrm{LC}_{50}\)` -- - **Atributos: Descriptores Moleculares** <div class="figure" style="text-align: center"> <img src="images/data.jpg" alt="Universidad de California en Irvine" /> <p class="caption">Universidad de California en Irvine</p> </div> --- # Una definición de Descriptor Molecular -- - Una definición dada por Todeschini y Consonni (2000), es > *Un descriptor molecular es el resultado final de un procedimiento matemático que transforma información química codificada en la representación simbólica de una molécula a un valor numérico...*. -- - Es otras palabras, puede considerarse el resultado de un algoritmo que codifica información contenida en la representación de una molécula. `$$\text{molécula}\Longrightarrow\text{descriptor molecular}\Longrightarrow\text{modelo}$$` --- # Variable respuesta: LC50 -- - `\(\mathrm{LC}_{50}\)` es la concentracion de una sustancia tóxica necesaria para matar al **50%** de una población -- - En nuestro caso la población es de la especie *Pimephales promelas*. (peces) -- - El índice `\(\mathrm{LC}_{50}\)` será nuestra variable respuesta. -- - Se pretende estimar el `\(\mathrm{LC}_{50}\)` para **908** compuestos. --- # Resumen de LC50 <img src="presentacion_files/figure-html/unnamed-chunk-1-1.png" style="display: block; margin: auto;" /> | Media| Moda| Mediana| Min.| Max.| |-----:|----:|-------:|-----:|-----:| | 4.064| 3.75| 3.987| 0.053| 9.612| --- # Descriptores Moleculares - Las variables explicativas estan dadas por los siguientes **descriptores:** -- - **CIC0** y **SM1_Dz(Z)**. Estos se relacionan con la cantidad de elementos diferentes en un compuesto. -- - **MLOGP** y **GATS1i**. Relacionados con la afinidad hacia los lípidos de un compuesto. -- - **NdsCH** y **NdssC**. Los cuales guardan relación con la capacidad de atraer electrones de un compuesto. --- # Definición del descriptor **CIC0** - Podemos considerar una estructura molecular (2D) como un grafo. -- - Cada átomo en la molecula es un vértice del grafo. -- - Este índice cuantifica la *simetría* a distancia *0*. -- - El valor de **CIC0** es inversamente proporcional la cantidad de *elementos químicos* distintos presentes en una molécula. --- # Descripción **CIC0** <img src="presentacion_files/figure-html/unnamed-chunk-2-1.png" style="display: block; margin: auto;" /> | Media| Moda| Mediana| Min.| Max.| |-----:|----:|-------:|-----:|-----:| | 2.898| 3.1| 2.934| 0.667| 5.926| --- # Regresión para **CIC0** Un modelo de regresión simple para el descriptor CIC0 es `\(\mathrm{y}_i = 2.43\,+\,0.56\mathrm{x}_i\)` y tiene correlación `0.292` con LC50. <img src="presentacion_files/figure-html/unnamed-chunk-4-1.png" style="display: block; margin: auto;" /> --- # Definición del descriptor **SM1_Dz(Z)** - Se calcula mediente una mátriz 2D. -- - Matriz contiene información sobre el orden de enlace y el número atómico. -- - Recordar que el número atómico es único. -- - Heteroátomos. --- # Descripción **SM1_Dz(Z)** <img src="presentacion_files/figure-html/unnamed-chunk-5-1.png" style="display: block; margin: auto;" /> | Media| Moda| Mediana| Min.| Max.| |-----:|----:|-------:|----:|-----:| | 0.628| 0.25| 0.57| 0| 2.171| --- # Regresión para **SM1_Dz(Z)** El modelo de regresión simple para el decriptor molecular SM1_Dz(Z) es `\(\mathrm{y}_i = 3.18\,+\,1.39\mathrm{x}_i\)` y tiene correlación `0.411` con LC50. <img src="presentacion_files/figure-html/unnamed-chunk-7-1.png" style="display: block; margin: auto;" /> --- # Definición del descriptor **MLOGP** - MLOGP es el coeficiente de reparto octanol-agua de Moriguchi. -- - Coeficiente de reparto octanol-agua (log P) es la relación de concentración de un compuesto (soluto) en octanol y agua. -- `$$\log P_{oct/agua} = \log\Bigg(\frac{[\text{soluto}]_{oct}}{[\text{soluto}]_{agua}}\Bigg)$$` -- - Calculo mediante el Modelo de Moriguchi. -- - Estimación de la afinidad de los compuestos orgánicos hacia los lípidos. -- - Afinidad base de la **narcosis**. --- # Descripción **MLOGP** <img src="presentacion_files/figure-html/unnamed-chunk-8-1.png" style="display: block; margin: auto;" /> | Media| Moda| Mediana| Min.| Max.| |-----:|----:|-------:|------:|-----:| | 2.109| 1.75| 2.127| -2.884| 6.515| --- # Regresión para **MLOGP** El modelo de regresión simple para el descriptor molecular MLOGP es `\(\mathrm{y}_i = 2.66\,+\,0.66\mathrm{x}_i\)` y tiene correlación `0.652` con LC50. <img src="presentacion_files/figure-html/unnamed-chunk-10-1.png" style="display: block; margin: auto;" /> --- # Definición del descriptor **GATS1i** - Cuantifica la diferencia en el potencial de ionización entre dos átomos enlazados. -- - Tiende a tener valores pequeños para moléculas con gran cantidad de enlaces carbono - carbono. -- - La diferencia en el potencial de ionización entre 2 átomos de carbono es pequeña. -- - Esta información se considera relevante para predecir la afinidad hacia los lípidos de una molécula. --- # Descripción **GATS1i** <img src="presentacion_files/figure-html/unnamed-chunk-11-1.png" style="display: block; margin: auto;" /> | Media| Moda| Mediana| Min.| Max.| |-----:|----:|-------:|-----:|----:| | 1.294| 0.95| 1.24| 0.396| 2.92| --- # Regresión para **GATS1i** El modelo de regresión simple para el descriptor molecular GATS1i es `\(\mathrm{y}_i = 5.96\,-\,1.46\mathrm{x}_i\)` y tiene correlación `-0.398` con LC50. <img src="presentacion_files/figure-html/unnamed-chunk-13-1.png" style="display: block; margin: auto;" /> --- # Definición del descriptor **NdsCH** - *NdsCH* cuenta el número de átomos con una característica específica presentes en una molécula. -- - En particular átomos de carbono insaturados `\(sp^2\)` del tipo **=CH-**. -- - *NdsCH* se acepta como un buen predictor de la capacidad de atraer electrones de una molécula. --- # Descripción **NdsCH** <img src="presentacion_files/figure-html/sum_v4-1.png" style="display: block; margin: auto;" /> | Media| Moda| Mediana| Min.| Max.| |-----:|----:|-------:|----:|----:| | 0.229| 0| 0| 0| 4| --- # Regresión para **NdsCH** El modelo de regresión simple para el descriptor molecular NdsCH es `\(\mathrm{y}_i = 3.96\,+\,0.41\mathrm{x}_i\)` y tiene correlación `0.172` con LC50. <img src="presentacion_files/figure-html/unnamed-chunk-15-1.png" style="display: block; margin: auto;" /> --- # Definición del descriptor **NdssC** - *NdssC* cuenta el número de átomos con una característica específica presentes en una molécula -- - En particular átomos de carbono insaturados `\(sp^2\)` del tipo **=CH<**. -- - *NdssC* se acepta como un buen predictor de la capacidad de atraer electrones de una molécula. --- # Descripción **NdssC** <img src="presentacion_files/figure-html/sum_v5-1.png" style="display: block; margin: auto;" /> | Media| Moda| Mediana| Min.| Max.| |-----:|----:|-------:|----:|----:| | 0.486| 0| 0| 0| 6| --- # Regresión para **NdssC** El modelo de regresión simple para el descriptor molecular NdssC es `\(\mathrm{y}_i = 3.92\,+\,0.29\mathrm{x}_i\)` y tiene correlación `0.172` con LC50. <img src="presentacion_files/figure-html/unnamed-chunk-17-1.png" style="display: block; margin: auto;" /> --- # Resumen de los Gráficos <img src="presentacion_files/figure-html/plots_matrix-1.png" style="display: block; margin: auto;" /> --- # Conclusiones - El descriptor con mayor correlación es *MLOGP*. (**0.65**) -- - Cabe destacar, que en el estudio se consideró como el descriptor más relavante y se restringió como necesario para crear cualquier modelo de regresión lineal múltiple. -- - Tal como en el estudio, el descriptor que mejor se relaciona con el `\(LC_{50}\)` es el **MLOGP**. --- # Modelo Propuesto - Por lo tanto, en la primera etapa, el modelo de regresión lineal simple que proponemos es: `$$LC_{50} = 2.66\,+\,0.66 * X_i$$` -- - Aquí `\(X_i\)` es el descriptor **MLOGP**, con `\(\beta_0 = 2.66\)` y `\(\beta_1 = 0.66\)`. -- - Podemos estimar la variabilidad del error como: `\(\hat{\sigma}^{2} = \frac{1}{n -2}Rss(*) =\)` `1.221` --- # *Agradecimientos* <div class="figure" style="text-align: center"> <img src="images/pez.jpg" alt="Gracias!!!" /> <p class="caption">Gracias!!!</p> </div> --- # Bibliografía - QSAR fish toxicity Data Set - Davide Ballabio, Matteo Cassotti, Viviana Consonni, Roberto Todeschini, Milano Chemometrics and QSAR Research Group - Handbook of Computational Chemistry (pp.2065-2093)- Jerzy Leszczynski - Chemical Applications of Topology and Graph Theory (pp.178–191) - R. B. King & D. H. Rouvray - Correlation Properties of the Autocorrelation Descriptor for Molecules - Boris Hollas - Electrotopological State Indices for Atom Types: A Novel Combination of Electronic, Topological, and Valence State Information - Lowell H. Hall and Lemont B. Kier - QSAR study of aquatic toxicity by chemometrics methods in the framework of REACH regulation - M. Casotti