HTML-BIST-proyecto.utf8

1. Documentación artículos estudiados.

- “Differential Gene Expression Analysis”

1. La expresión génica diferencial

El análisis de expresión diferencial significa tomar los datos de recuento de lecturas normalizados y realizar un análisis estadístico para descubrir cambios cuantitativos en los niveles de expresión entre grupos experimentales. Por ejemplo, utilizamos pruebas estadísticas para decidir si, para un gen dado, una diferencia observada en el recuento de lecturas es significativa, es decir, si es mayor de lo que se esperaría simplemente debido a una variación aleatoria natural. estos análisis incluyen lecturas de pruebas estadísticas, cálculo del valor P del gen diferencial y una estimación de la expresión de este gen dada una hipótesis nula.

¿Por qué se requiere la expresión genética diferencial?

Se realizan diferentes experimentos biológicos para visualizar el efecto sobre los genes de interés bajo múltiples condiciones, como cambio en su expresión. Por ejemplo, los efectos de un fármaco sobre ciertos genes o la identificación de genes altamente expresados durante una etapa de desarrollo. Los experimentos como la secuenciación de ARN o el microarray proporcionan los recuentos leídos de todos los genes de nuestra muestra. Sin embargo, esto no es suficiente para alcanzar el objetivo, para poder completarlo se requiere la normalización de los recuentos de lectura para comparar la expresión entre muestras, además de varias réplicas biológicas, ya que estas son imprescindibles para encontrar si el gen se expresa significativamente en la muestra de prueba y por último para tener en cuenta, se debe tener en cuenta el problema de las pruebas múltiples. Este es un fenómeno estadístico que ocurre cuando se realizan miles de comparaciones (por ejemplo, la comparación de la expresión de múltiples genes en múltiples condiciones) para una pequeña cantidad de muestras (la mayoría de los experimentos de microarrays tienen menos de cinco réplicas biológicas por condición). Esto conduce a una mayor probabilidad de resultados falsos positivos.

Sin embargo, se presentan algunas limitaciones con este tratamiento de datos ya que los valores de expresión génica registrados por estos experimentos son relativos, por lo que solo tiene sentido comparar los valores entre muestras en un estudio y no tratarlos como absolutos además de que el diseño experimental es muy importante. Los métodos estadísticos pueden tener en cuenta los errores experimentales, pero no pueden ayudar si el experimento está mal diseñado.

Para el procesamiento de los datos primero se deben normalizar para ingresarlos en Limma que es una herramienta de R para el análisis de expresión diferencial, para la normalización se pueden usar técnicas cómo corregir el tamaño de la biblioteca, la transformación del registro, normalización cuantifica, aplicación de filtros, efectos técnicos por lotes [(1. PCA (análisis de componentes principales) 2.MDS (escalamiento multidimensional)] y la eliminación de efectos por lotes por ejemplo en R Limma el método incorporado de removeBatchEffect o el paquete sva para paquetes de alta dimensión, cómo paquetes para de expresión génica, de secuenciación de ARN, metilación y datos de imágenes cerebrales, ya que puede crear variables a partir de los datos de las bases; Gracias a este tipo de mecanismos Se ha demostrado que la eliminación de los efectos por lotes y el uso de variables sustitutas en el análisis de expresión diferencial reduce la dependencia, estabiliza las estimaciones de la tasa de error y mejora la reproducibilidad

2. Métodos para el análisis de expresión diferencial

Existen diferentes canalizaciones para el análisis de expresión diferencial en R, como edgeR y DESeq, basadas en distribuciones binomiales negativas (NB). Es importante considerar el diseño experimental al elegir un método de análisis. Si bien algunas de las herramientas de expresión diferencial solo pueden realizar comparaciones por pares, otras como edgeR, limma-voom, DESeq pueden realizar múltiples comparaciones. DESeq2 y edgeR se basan en un modelo binomial negativo para ajustar los conteos de lectura observados para llegar a la estimación de la diferencia. Originalmente, los recuentos de lectura se habían modelado utilizando la distribución de Poisson porque:

Las lecturas individuales pueden interpretarse como datos binarios (ensayos de Bernoulli): se originan o no a partir de un solo gen A.

El conjunto de lecturas posibles que podrían estar presentes es grande, mientras que la proporción de lecturas que pertenecen al gen A es bastante pequeña.

La característica conveniente de una distribución de Poisson es que varianza = media.

Por lo tanto, si el experimento de RNA-seq nos da una estimación precisa de los recuentos de lectura promedio por condición, sabemos implícitamente qué tipo de varianza esperar para los recuentos de lectura que no cambian realmente entre dos condiciones. Esto, a su vez, nos permite identificar aquellos genes que muestran mayores diferencias entre las dos condiciones de lo esperado por casualidad.

3. Metodología y tratamiento de los datos

Las lecturas sin procesar (archivos FASTQ) se someten a una evaluación y filtrado de calidad.

Las lecturas filtradas por calidad se alinean con el genoma de referencia mediante alineadores como HiSat o TopHat2.

Las lecturas mapeadas se resumen y agregan sobre genes mediante HTSeq. Para la expresión de la línea de base, los FPKM se calculan a partir de los recuentos brutos mediante iRAP.

Los resultados se promedian para cada conjunto de réplicas técnicas y luego se normalizan cuantiles dentro de cada conjunto de réplicas biológicas usando limma.

Finalmente, se promedian para todas las réplicas biológicas (si las hay). Para la expresión diferencial, los genes expresados diferencialmente entre la prueba y los grupos de referencia de cada contraste por pares se identifican utilizando DESeq2.

4. Interpretación biológica de los datos de expresión génica

El mapa de calor es de los métodos más comúnmente usados también se puede combinar con métodos de agrupación de genes o muestras en función de la similitud de su patrón de expresión génica.

Esto puede ser útil para identificar genes que comúnmente están regulados positivamente o negativamente basados en valores de cambio, o por firmas biológicas asociadas con una condición particular (por ejemplo, una enfermedad o una condición ambiental).

Otro enfoque común para interpretar los datos de expresión génica es el análisis de enriquecimiento de conjuntos de genes basado en la anotación funcional de los genes expresados diferencialmente.

Esto es útil para averiguar si los genes expresados diferencialmente están asociados con un determinado proceso biológico o función molecular.

La ontología genética, que contiene la anotación estandarizada de productos génicos, se usa comúnmente para este propósito. Funciona comparando genes diferenciales contra una llista de referencia.

5. Glosario

Hipótesis nula: Una hipótesis nula es una suposición que se utiliza para negar o afirmar un suceso en relación a algún o algunos parámetros de una población o muestra.

Siempre que se llega a una conclusión acerca un experimento, el investigador debe establecer dos hipótesis, la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) se refiere a la afirmación contraria a la que ha llegado el investigador. Es la hipótesis que el investigador pretender rechazar. Si tiene la evidencia suficiente para ello, podrá probar que lo contrario es cierto. Por lo tanto, la hipótesis alternativa (H1) es la conclusión a la que el investigador ha llegado a través de su investigación.

Bioconductor: Es un software que proporciona herramientas para el análisis y la comprensión de datos genómicos de alto rendimiento. Bioconductor utiliza el lenguaje de programación estadístico R y es de código abierto y desarrollo abierto.

6. Referencias https://www.kaggle.com/usharengaraju/differential-gene-expression-analysis

https://www.ebi.ac.uk/training/online/course/functional-genomics-ii-common-technologies-and-data-analysis-methods/differential-gene

https://economipedia.com/definiciones/hipotesis-nula.html#:~:text=Por%20lo%20tanto%2C%20la%20hip%C3%B3tesis,demostrar%20que%20%C3%A9sta%20es%20falsa.

https://www.bioconductor.org/packages/release/bioc/html/sva.html

- “Classifying/Predicting Molecular Subtypes in Breast Cancer Tumors”

1. Resumen

El cáncer de mama, es el segundo tipo de cáncer más común en las mujeres, el cual consiste en una enfermedad causada por el efecto combinado de diferentes genes y con ellos distintos factores que intervienen en su formación y la determinada función. Es por ello que el cáncer de mama, es una enfermedad bastante complicada de estudiar debido a la versatilidad de la masa anormal formada, es decir, varían su posición, de tamaño, forma y grado de gravedad, todos estos factores dependientes del paciente. El estudio de dicha patología ha sido complejo pero fructífero, puesto que se han generado investigaciones para el diagnóstico y el tratamiento del cáncer, generando un aumento de tasa de supervivencia a la patología.

El artículo contiene el estudio y el análisis de información de pacientes de cáncer de mama, los cuales se dividen en 4 tipos moleculares con la patología presente, Luminal A, Luminal B, HER2 Enriched, Basal (triple negative), de igual manera implementa datos de pacientes con datos moleculares normales para generar una comparación adecuada, y con ello planificar un tratamiento eficaz identificando correctamente los subtipos moleculares de los tumores por medio de las diferencias dada la expresión génica. Para la investigación se implementaron 12553 genes únicos de una población de 80 pacientes de los cuales 3 eran individuos sanos, datos tomados de base de datos clínicos (clinical_data_breast_cancer.csv), (77_cancer_proteomes_CPTAC_itraq.csv), el último grupo de datos que se usó, fue un conjunto de datos a los cuales se le aplicó una técnica de reducción para recortar variables que producen “ruido” en la expresión génica conjunta, y consiste en el principal conjuntos de datos en el proyecto (BCGENES.csv).

2. Datos

Al llevar a cabo la manipulación de los datos génicos en primera instancia se unificaron las bases de datos, es decir se implementó en Rstudio el paquete string para unificar los ID de las secuencias dadas en la base de datos. para la reducción de datos se usó un método de reducción Lasso el cual regulariza de manera equivalente las variables con los coeficientes. Para realizar la clasificación se llevaron a cabos distintos modelos de clasificación con el objetivo de demostrar cual es el más eficiente.

3. Modelos en estudio

1. Molecular Tumor Type Using Ensemble-Boosting Regression Tree: 1.1. Método de técnica de aprendizaje secuencial, el cual se construye ajustado los valores de los “ruidos” del modelo inicial.

2. Molecular Tumor Type Using K- Nearest-Neighbors: 2.1. Método implementado para el reconocimiento de patrones, este usa el promedio promedio ponderado y calcula la distancia euclidiana, algoritmo más manual, es decir requiere de muchos datos de la entrada humana. Excelente para el manejo de datos mixtos. 2.2. Arrojó un puntaje de clasificación del 89%

3. Molecular Tumor Type Using Support Vector Machines: 3.1. Es un algoritmo para la clasificación binaria, determina a través de un hiperplano y da la clasificación dependiendo en que parte del plano se encuentre el dato registrado, y con ello arroja un claro margen de separación de los datos. 3.2. Arrojó un puntaje de clasificación del 97%.

4. Molecular Tumor Type Using Naïve Bayes Methods: 4.1. Es un clasificador basado en el teorema de Bayes, en que todas las características del conjunto de datos son independientes, este se basa en la teoría de probabilidad de un evento el cual debe basarse en pruebas de múltiples ensayos, este trabaja con datos mixtos. 4.2. Arrojó un puntaje de clasificación del 82%.

5. Molecular Tumor Type Using Multinomial Method: 5.1. Es un método que se utiliza para predecir las probabilidades de los distintos resultados de categorías dependientes. 5.2. Arrojó un puntaje de clasificación del 90%.

6. Molecular Tumor Type Using eXtreme Gradient Boosting: 6.1. Es un método predictor de aprendizaje automático que produce un modelo de conjunto de resultados de predicción débil. La reducción de sobrecarga es un punto óptimo.
6.2. Arrojó un puntaje de clasificación del 77%.

7. Molecular Tumor Type Using Neural Network: 7.1. Es un método inspirados en redes neuronales biológicas, que consiste de un algoritmo de aprendizaje automático compuesto de capas de neuronas variables que cubren al vector entrada, las cuales reconocen los datos registrados y de esta manera realiza la predicción. 7.2. Arrojó un puntaje de clasificación del 96%.

8. Molecular Tumor Type Using eXtreme Gradient Boosting With Random Variables: 8.1. Es un método que realiza la selección de variables para aumentar la precesión de una predicción.

4. Conclusión

En conclusión, el método de machine learning con el porcentaje más alto de precisión fueron (SVM) Molecular Tumor Type Using Support Vector Machines y Molecular Tumor Type Using Neural Network, con la implementación de estos métodos es posible generara una clasificación de expresión genética de la patología de cáncer de mama, y por ende generar un tiramiento génico mas profundo.

5. Glosario - Enfermedad multifactorial: enfermedad que son causada por la combinación de diversos genes frente a complicación ambientales desconocidos. - HER2 enriquecido: es la proteina que promueve el crecimiento en las células mamarias, cuando estas se encunetran en abundacia se consideran postivas y por ende un generador de cancer.

6. Referencias * https://www.cancer.org/es/cancer/cancer-de-seno/comprension-de-un-diagnostico-de-cancer-de-seno/estado-de-her2-del-cancer-de-seno.html * https://www.stanfordchildrens.org/es/topic/default?id=herencia-multifactorial-90-P05241 * http://neuralnetworksanddeeplearning.com/chap1.html

-Protein Expression Analysis

1. Resumen:

El conjunto de datos consta de los niveles de expresión de 77 proteínas / modificaciones de proteínas que produjeron señales detectables en la fracción nuclear de la corteza. Hay 38 ratones de control y 34 ratones trisómicos (síndrome de Down), para un total de 72 ratones. En los experimentos, se registraron 15 mediciones de cada proteína por muestra / ratón. El conjunto de datos contiene un total de 1080 mediciones por proteína. Cada medición se consideró como una muestra / ratón independiente.

Las ocho clases de ratones se describen en función de características como el genotipo, el comportamiento y el tratamiento. Según el genotipo, los ratones pueden ser control o trisómicos. Según el comportamiento, algunos ratones han sido estimulados para aprender (contexto-shock) y otros no (shock-contexto) y para evaluar el efecto del fármaco memantina en la recuperación de la capacidad de aprendizaje en ratones trisómicos, algunos ratones han sido inyectados con la droga y otros no.

2. Objetivo:

El propósito de este proyecto es intentar identificar subconjuntos de proteínas que son discriminantes para cada clase.

¿Qué es el síndrome de Down?

En cada célula del cuerpo humano hay un núcleo, donde el material genético se almacena en los genes. Los genes llevan los códigos responsables de todos nuestros rasgos heredados y están agrupados a lo largo de estructuras en forma de varillas llamadas cromosomas. Normalmente, el núcleo de cada célula contiene 23 pares de cromosomas, la mitad de los cuales se heredan de cada padre. El síndrome de Down ocurre cuando una persona tiene una copia adicional total o parcial del cromosoma 21.

Este material genético adicional altera el curso del desarrollo y provoca las características asociadas con el síndrome de Down. Algunos de los rasgos físicos comunes del síndrome de Down son bajo tono muscular, baja estatura, ojos inclinados hacia arriba y un único pliegue profundo en el centro de la palma, aunque cada persona con síndrome de Down es un individuo único y puede poseer estas características en diferentes grados, o en absoluto.

3. Tipos de tratamiento:

·Memantine Drug: La memantina se usa para tratar los síntomas de la enfermedad de Alzheimer (Alzheimer’s Disease, AD; una enfermedad del cerebro que destruye lentamente la memoria y la capacidad para pensar, aprender, comunicarse y manejar las actividades diarias). La memantina pertenece a una clase de medicamentos llamados antagonistas del receptor de NMDA. Funciona al reducir la actividad anormal en el cerebro. La memantina puede mejorar la capacidad para pensar y recordar o puede desacelerar la pérdida de estas capacidades en las personas que tienen AD. Sin embargo, la memantina no curará la AD ni evitará la pérdida de estas capacidades en algún momento en el futuro.

Saline: La solución salina, también conocida como solución salina, es una mezcla de cloruro de sodio en agua y tiene varios usos en medicina. Aplicado en el área afectada, se usa para limpiar heridas, ayudar a quitar los lentes de contacto y ayudar con los ojos secos. Inyectado en una vena, se usa para tratar la deshidratación, como la de gastroenteritis y cetoacidosis diabética. También se utiliza para diluir otros medicamentos que se administrarán mediante inyección.

4. Tipos de datos

ID del ratón
Valores de los niveles de expresión de 77 proteínas; los nombres de las proteínas van seguidos de N, lo que indica que se midieron en la fracción nuclear. Por ejemplo: DYRK1A_n
Genotipo: control (c) o trisomía (t)
Tipo de tratamiento: memantina (m) o solución salina (s)
Comportamiento: contexto-choque (CS) o choque-contexto (SC)
Clase: c-CS-s, c-CS-m, c-SC-s, c-SC-m, t-CS-s, t-CS-m, t-SC-s, t-SC –metro

c-CS-s: ratones de control, estimulados para aprender, inyectados con solución salina (9 ratones)

c-CS-m: ratones de control, estimulados para aprender, inyectados con memantina (10 ratones)

c-SC-s: ratones de control, no estimulados para aprender, inyectados con solución salina (9 ratones)

c-SC-m: ratones de control, no estimulados para aprender, inyectados con memantina (10 ratones)

t-CS-s: ratones con trisomía, estimulados para aprender, inyectados con solución salina (7 ratones)

t-CS-m: ratones con trisomía, estimulados para aprender, inyectados con memantina (9 ratones)

t-SC-s: ratones con trisomía, no estimulados para aprender, inyectados con solución salina (9 ratones)

t-SC-m: ratones con trisomía, no estimulados para aprender, inyectados con memantina (9 ratones)

5. Glosario:

Receptor de NMDA: están asociados con los procesos de aprendizaje y memoria, el desarrollo y la plasticidad neural, así como con los estados de dolor agudo y crónico. Intervienen en el inicio y mantenimiento de la sensibilización central asociada a daño o inflamación de los tejidos periféricos.

AD: Alzheimer’s Disease – Enfermedad de Alzheimer

Genotipo: Conjunto de los genes que existen en el núcleo celular de cada individuo

Ratones Trisomicos: aquellos que poseen síndrome de Down

6. Bibliografía:

https://medlineplus.gov/spanish/druginfo/meds/a604006-es.html#:~:text=La%20memantina%20se%20usa%20para,y%20manejar%20las%20actividades%20diarias).

http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1134-80462004000400005

2. Marco teórico: Protein Expression Analysis.

I.Sindrome de Down El Síndrome de Down no es una enfermedad, sino una alteración genética que se produce por la presencia de un cromosoma extra (los cromosomas con las estructuras que contienen el ADN, que es el principal constituyente del material genético de los seres vivos) o una parte de él. Las células del cuerpo humano tienen 46 cromosomas distribuidos en 23 pares. Las personas con síndrome de Down tienen tres cromosomas en el par 21 en lugar de los dos que existen habitualmente. Por eso, también se conoce como trisomía 21.

Afecta al desarrollo cerebral y del organismo y es la principal causa de discapacidad intelectual y también la alteración genética humana más común. También puede ocasionar problemas médicos, como trastornos digestivos o enfermedades cardiacas.

II.Descripcion de las Proteinas Para la realización de este proyecto escogimos 8 proteínas de las 77 utilizadas para el experimento, esto con el propósito de facilitar el análisis de datos, a continuación, se dará una breve explicación de la función de las 8 proteínas escogidas. * 1. DYR1A Puede desempeñar un papel en una vía de señalización que regula las funciones nucleares de la proliferación celular. Tiene función pro-supervivencia y regula negativamente el proceso apoptótico. Promueve la supervivencia celular ante estrés genotóxico, Detectado en el cerebro (a nivel de proteínas). Se expresa en una variedad de tejidos embrionarios y adultos, así como también abundantemente en neuronas del cerebro, médula espinal y retina en embriones en desarrollo. * 2. pMTOR_N es un regulador central del metabolismo celular, crecimiento y supervivencia en respuesta a hormonas, factores de crecimiento, nutrientes, energía y señales de estrés, se expresa principalmente en el epitelio cristalino los testículos y riñones. * 3. pCAMKII_N esta proteína esta involucrada en la señalización celular, así como también de manera activa en procesos de aprendizaje y memoria, se expresa mas que todo en el lóbulo frontal adulto, en la corteza y cerebelo adultos. * 4. pS6_N realiza el proceso de fosforilación y por esto está involucrada también en el proceso de regulación del tamaño celular y proliferación de la misma, se expresa mas que todo en la vejiga adulta del organismo * 5. TIAM1 su función es controlar o modular la actividad de las y conectar las señales extracelulares con las actividades del citoesqueleto. Muy expresado en cerebro y testículos y en niveles bajos o moderados en casi todos los demás tejidos normales. * 6. GluR4 funciona como canal iónico controlado por ligando en el sistema nervioso central y juega un papel importante en la transmisión sináptica excitadora, por lo tanto, convierte la señal química en un impulso eléctrico y se Expresa más que todo en cerebelo adulto y lóbulo frontal adulto * 7. BRAF Está Involucrado en la transducción de señales mitogénicas desde la membrana celular al núcleo. Puede desempeñar un papel en las respuestas postsinápticas de las neuronas del hipocampo. se expresa más que todo en el cuerpo pineal, estriado dorsal e hipotálamo * 8. CDK5 Esencial para la detención y diferenciación del ciclo celular neuronal y puede estar involucrada en la muerte celular apoptótica en enfermedades neuronales desencadenando la reentrada abortiva del ciclo celular, Regula varios procesos fisiológicos y de desarrollo neuronal Se expresa en la glándula submandibular, cerebro y corteza frontal principalmente.

III.Razon para escoger el articulo: Dentro de los 3 artículos que documentamos escogimos este artículo en específico para realizar el proyecto porque al ser el síndrome de Dow una condición o alteración genética tan usual en nuestro planeta es necesario poder entenderlo, saber porque y que sucede en el organismo que tiene este tipo de circunstancia para en un futuro poder corregirla o eliminarla por completo, ya que Según los Centros para el Control y la Prevención de Enfermedades (CDC por sus siglas en inglés), en los Estados Unidos nacen aproximadamente 6.000 bebés con síndrome de Down cada año, es decir, que el síndrome afecta a alrededor de 1 de cada 691 nacimientos vivos, siendo así el síndrome de Down la causa más común de discapacidades intelectuales leves a moderadas por anormalidades cromosómicas, y este tipo de investigaciones al tener un nivel de complejidad óptimo para que usuarios no especializados como nosotros, pueda hacer uso y tratamiento de los datos para análisis estadístico básico es ideal para poder entender este tipo de situaciones de nuestra vida cotidiana y que muy probablemente apliquemos en un futuro como ingenieros Biomédicos.

3. Análisis de datos de expresión proteica.

library(tidyverse)
library(dendextend)
library(reshape2)
library(tibble)
library(purrr)
library(ape)
library(knitr)
library(broom)
datas <- read_csv("Data_Cortex_Nuclear.csv")

str(datas)

## tibble [1,080 × 82] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ MouseID        : chr [1:1080] "309_1" "309_2" "309_3" "309_4" ...
##  $ DYRK1A_N       : num [1:1080] 0.504 0.515 0.509 0.442 0.435 ...
##  $ ITSN1_N        : num [1:1080] 0.747 0.689 0.73 0.617 0.617 ...
##  $ BDNF_N         : num [1:1080] 0.43 0.412 0.418 0.359 0.359 ...
##  $ NR1_N          : num [1:1080] 2.82 2.79 2.69 2.47 2.37 ...
##  $ NR2A_N         : num [1:1080] 5.99 5.69 5.62 4.98 4.72 ...
##  $ pAKT_N         : num [1:1080] 0.219 0.212 0.209 0.223 0.213 ...
##  $ pBRAF_N        : num [1:1080] 0.178 0.173 0.176 0.176 0.174 ...
##  $ pCAMKII_N      : num [1:1080] 2.37 2.29 2.28 2.15 2.13 ...
##  $ pCREB_N        : num [1:1080] 0.232 0.227 0.23 0.207 0.192 ...
##  $ pELK_N         : num [1:1080] 1.75 1.6 1.56 1.6 1.5 ...
##  $ pERK_N         : num [1:1080] 0.688 0.695 0.677 0.583 0.551 ...
##  $ pJNK_N         : num [1:1080] 0.306 0.299 0.291 0.297 0.287 ...
##  $ PKCA_N         : num [1:1080] 0.403 0.386 0.381 0.377 0.364 ...
##  $ pMEK_N         : num [1:1080] 0.297 0.281 0.282 0.314 0.278 ...
##  $ pNR1_N         : num [1:1080] 1.022 0.957 1.004 0.875 0.865 ...
##  $ pNR2A_N        : num [1:1080] 0.606 0.588 0.602 0.52 0.508 ...
##  $ pNR2B_N        : num [1:1080] 1.88 1.73 1.73 1.57 1.48 ...
##  $ pPKCAB_N       : num [1:1080] 2.31 2.04 2.02 2.13 2.01 ...
##  $ pRSK_N         : num [1:1080] 0.442 0.445 0.468 0.478 0.483 ...
##  $ AKT_N          : num [1:1080] 0.859 0.835 0.814 0.728 0.688 ...
##  $ BRAF_N         : num [1:1080] 0.416 0.4 0.4 0.386 0.368 ...
##  $ CAMKII_N       : num [1:1080] 0.37 0.356 0.368 0.363 0.355 ...
##  $ CREB_N         : num [1:1080] 0.179 0.174 0.174 0.179 0.175 ...
##  $ ELK_N          : num [1:1080] 1.87 1.76 1.77 1.29 1.32 ...
##  $ ERK_N          : num [1:1080] 3.69 3.49 3.57 2.97 2.9 ...
##  $ GSK3B_N        : num [1:1080] 1.54 1.51 1.5 1.42 1.36 ...
##  $ JNK_N          : num [1:1080] 0.265 0.256 0.26 0.26 0.251 ...
##  $ MEK_N          : num [1:1080] 0.32 0.304 0.312 0.279 0.274 ...
##  $ TRKA_N         : num [1:1080] 0.814 0.781 0.785 0.734 0.703 ...
##  $ RSK_N          : num [1:1080] 0.166 0.157 0.161 0.162 0.155 ...
##  $ APP_N          : num [1:1080] 0.454 0.431 0.423 0.411 0.399 ...
##  $ Bcatenin_N     : num [1:1080] 3.04 2.92 2.94 2.5 2.46 ...
##  $ SOD1_N         : num [1:1080] 0.37 0.342 0.344 0.345 0.329 ...
##  $ MTOR_N         : num [1:1080] 0.459 0.424 0.425 0.429 0.409 ...
##  $ P38_N          : num [1:1080] 0.335 0.325 0.325 0.33 0.313 ...
##  $ pMTOR_N        : num [1:1080] 0.825 0.762 0.757 0.747 0.692 ...
##  $ DSCR1_N        : num [1:1080] 0.577 0.545 0.544 0.547 0.537 ...
##  $ AMPKA_N        : num [1:1080] 0.448 0.421 0.405 0.387 0.361 ...
##  $ NR2B_N         : num [1:1080] 0.586 0.545 0.553 0.548 0.513 ...
##  $ pNUMB_N        : num [1:1080] 0.395 0.368 0.364 0.367 0.352 ...
##  $ RAPTOR_N       : num [1:1080] 0.34 0.322 0.313 0.328 0.312 ...
##  $ TIAM1_N        : num [1:1080] 0.483 0.455 0.447 0.443 0.419 ...
##  $ pP70S6_N       : num [1:1080] 0.294 0.276 0.257 0.399 0.393 ...
##  $ NUMB_N         : num [1:1080] 0.182 0.182 0.184 0.162 0.16 ...
##  $ P70S6_N        : num [1:1080] 0.843 0.848 0.856 0.76 0.768 ...
##  $ pGSK3B_N       : num [1:1080] 0.193 0.195 0.201 0.184 0.186 ...
##  $ pPKCG_N        : num [1:1080] 1.44 1.44 1.52 1.61 1.65 ...
##  $ CDK5_N         : num [1:1080] 0.295 0.294 0.302 0.296 0.297 ...
##  $ S6_N           : num [1:1080] 0.355 0.355 0.386 0.291 0.309 ...
##  $ ADARB1_N       : num [1:1080] 1.34 1.31 1.28 1.2 1.21 ...
##  $ AcetylH3K9_N   : num [1:1080] 0.17 0.171 0.185 0.16 0.165 ...
##  $ RRP1_N         : num [1:1080] 0.159 0.158 0.149 0.166 0.161 ...
##  $ BAX_N          : num [1:1080] 0.189 0.185 0.191 0.185 0.188 ...
##  $ ARC_N          : num [1:1080] 0.106 0.107 0.108 0.103 0.105 ...
##  $ ERBB4_N        : num [1:1080] 0.145 0.15 0.145 0.141 0.142 ...
##  $ nNOS_N         : num [1:1080] 0.177 0.178 0.176 0.164 0.168 ...
##  $ Tau_N          : num [1:1080] 0.125 0.134 0.133 0.123 0.137 ...
##  $ GFAP_N         : num [1:1080] 0.115 0.118 0.118 0.117 0.116 ...
##  $ GluR3_N        : num [1:1080] 0.228 0.238 0.245 0.235 0.256 ...
##  $ GluR4_N        : num [1:1080] 0.143 0.142 0.142 0.145 0.141 ...
##  $ IL1B_N         : num [1:1080] 0.431 0.457 0.51 0.431 0.481 ...
##  $ P3525_N        : num [1:1080] 0.248 0.258 0.255 0.251 0.252 ...
##  $ pCASP9_N       : num [1:1080] 1.6 1.67 1.66 1.48 1.53 ...
##  $ PSD95_N        : num [1:1080] 2.01 2 2.02 1.96 2.01 ...
##  $ SNCA_N         : num [1:1080] 0.108 0.11 0.108 0.12 0.12 ...
##  $ Ubiquitin_N    : num [1:1080] 1.045 1.01 0.997 0.99 0.998 ...
##  $ pGSK3B_Tyr216_N: num [1:1080] 0.832 0.849 0.847 0.833 0.879 ...
##  $ SHH_N          : num [1:1080] 0.189 0.2 0.194 0.192 0.206 ...
##  $ BAD_N          : num [1:1080] 0.123 0.117 0.119 0.133 0.13 ...
##  $ BCL2_N         : num [1:1080] NA NA NA NA NA NA NA NA NA NA ...
##  $ pS6_N          : num [1:1080] 0.106 0.107 0.108 0.103 0.105 ...
##  $ pCFOS_N        : num [1:1080] 0.108 0.104 0.106 0.111 0.111 ...
##  $ SYP_N          : num [1:1080] 0.427 0.442 0.436 0.392 0.434 ...
##  $ H3AcK18_N      : num [1:1080] 0.115 0.112 0.112 0.13 0.118 ...
##  $ EGR1_N         : num [1:1080] 0.132 0.135 0.133 0.147 0.14 ...
##  $ H3MeK4_N       : num [1:1080] 0.128 0.131 0.127 0.147 0.148 ...
##  $ CaNA_N         : num [1:1080] 1.68 1.74 1.93 1.7 1.84 ...
##  $ Genotype       : chr [1:1080] "Control" "Control" "Control" "Control" ...
##  $ Treatment      : chr [1:1080] "Memantine" "Memantine" "Memantine" "Memantine" ...
##  $ Behavior       : chr [1:1080] "C/S" "C/S" "C/S" "C/S" ...
##  $ class          : chr [1:1080] "c-CS-m" "c-CS-m" "c-CS-m" "c-CS-m" ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   MouseID = col_character(),
##   ..   DYRK1A_N = col_double(),
##   ..   ITSN1_N = col_double(),
##   ..   BDNF_N = col_double(),
##   ..   NR1_N = col_double(),
##   ..   NR2A_N = col_double(),
##   ..   pAKT_N = col_double(),
##   ..   pBRAF_N = col_double(),
##   ..   pCAMKII_N = col_double(),
##   ..   pCREB_N = col_double(),
##   ..   pELK_N = col_double(),
##   ..   pERK_N = col_double(),
##   ..   pJNK_N = col_double(),
##   ..   PKCA_N = col_double(),
##   ..   pMEK_N = col_double(),
##   ..   pNR1_N = col_double(),
##   ..   pNR2A_N = col_double(),
##   ..   pNR2B_N = col_double(),
##   ..   pPKCAB_N = col_double(),
##   ..   pRSK_N = col_double(),
##   ..   AKT_N = col_double(),
##   ..   BRAF_N = col_double(),
##   ..   CAMKII_N = col_double(),
##   ..   CREB_N = col_double(),
##   ..   ELK_N = col_double(),
##   ..   ERK_N = col_double(),
##   ..   GSK3B_N = col_double(),
##   ..   JNK_N = col_double(),
##   ..   MEK_N = col_double(),
##   ..   TRKA_N = col_double(),
##   ..   RSK_N = col_double(),
##   ..   APP_N = col_double(),
##   ..   Bcatenin_N = col_double(),
##   ..   SOD1_N = col_double(),
##   ..   MTOR_N = col_double(),
##   ..   P38_N = col_double(),
##   ..   pMTOR_N = col_double(),
##   ..   DSCR1_N = col_double(),
##   ..   AMPKA_N = col_double(),
##   ..   NR2B_N = col_double(),
##   ..   pNUMB_N = col_double(),
##   ..   RAPTOR_N = col_double(),
##   ..   TIAM1_N = col_double(),
##   ..   pP70S6_N = col_double(),
##   ..   NUMB_N = col_double(),
##   ..   P70S6_N = col_double(),
##   ..   pGSK3B_N = col_double(),
##   ..   pPKCG_N = col_double(),
##   ..   CDK5_N = col_double(),
##   ..   S6_N = col_double(),
##   ..   ADARB1_N = col_double(),
##   ..   AcetylH3K9_N = col_double(),
##   ..   RRP1_N = col_double(),
##   ..   BAX_N = col_double(),
##   ..   ARC_N = col_double(),
##   ..   ERBB4_N = col_double(),
##   ..   nNOS_N = col_double(),
##   ..   Tau_N = col_double(),
##   ..   GFAP_N = col_double(),
##   ..   GluR3_N = col_double(),
##   ..   GluR4_N = col_double(),
##   ..   IL1B_N = col_double(),
##   ..   P3525_N = col_double(),
##   ..   pCASP9_N = col_double(),
##   ..   PSD95_N = col_double(),
##   ..   SNCA_N = col_double(),
##   ..   Ubiquitin_N = col_double(),
##   ..   pGSK3B_Tyr216_N = col_double(),
##   ..   SHH_N = col_double(),
##   ..   BAD_N = col_double(),
##   ..   BCL2_N = col_double(),
##   ..   pS6_N = col_double(),
##   ..   pCFOS_N = col_double(),
##   ..   SYP_N = col_double(),
##   ..   H3AcK18_N = col_double(),
##   ..   EGR1_N = col_double(),
##   ..   H3MeK4_N = col_double(),
##   ..   CaNA_N = col_double(),
##   ..   Genotype = col_character(),
##   ..   Treatment = col_character(),
##   ..   Behavior = col_character(),
##   ..   class = col_character()
##   .. )

ggplot(datas, aes(class)) +
  geom_bar(aes(fill = class))+
  theme_light() +
  scale_fill_manual(values=c("#F4A582", "#92C5DE","#FDDBC7","7d98cf", "96c577", "#F4A582", "#d9b5b5","#2dafc2"))+
  ggtitle("        clasificación de ratones según el estudio seleccionado")

Gráfica 1 Para identificar los subconjuntos de las proteinas discriminantes en las muestras, se clasificaron a los ratones dependiendo del medicamento y del comportamiento que sería aplicado, así:

Clasificación dada en ratones de control.

c-CS-s: ratones de control, estimulados para aprender, inyectados con solución salina (9 ratones)
c-CS-m: ratones de control, estimulados para aprender, inyectados con memantina (10 ratones)
c-SC-s: ratones de control, no estimulados para aprender, inyectados con solución salina (9 ratones)
c-SC-m: ratones de control, no estimulados para aprender, inyectados con memantina (10 ratones)

Clasificación dada en ratones con trisomia.

t-CS-s: ratones con trisomía, estimulados para aprender, inyectados con solución salina (7 ratones)
t-CS-m: ratones con trisomía, estimulados para aprender, inyectados con memantina (9 ratones)
t-SC-s: ratones con trisomía, sin estimulación para aprender, inyectados con solución salina (9 ratones)
t-SC-m: ratones con trisomía, no estimulados para aprender, inyectados con memantina (9 ratones)

datas%>%
  count(class)

## # A tibble: 8 x 2
##   class      n
##   <chr>  <int>
## 1 c-CS-m   150
## 2 c-CS-s   135
## 3 c-SC-m   150
## 4 c-SC-s   135
## 5 t-CS-m   135
## 6 t-CS-s   105
## 7 t-SC-m   135
## 8 t-SC-s   135

set.seed(7)
muestras <- sample(2:77,5, replace = FALSE)
protein<-datas[,c(82,muestras) ]

protein%>%
  group_by(class)%>%
  summarise(pro1=mean(TIAM1_N), conteo=n(), suma=sum(TIAM1_N), pro1_1=min(TIAM1_N))%>%
  
  ggplot(aes(class, pro1, fill= class))+
  geom_col()+
  scale_fill_manual(values=c("#F4A582", "#92C5DE","#FDDBC7","7d98cf", "96c577", "#F4A582", "#d9b5b5","#2dafc2"))+
  ggtitle("        Niveles de expresión proteinca con respecto a la proteina TIAM1_N ")

## `summarise()` ungrouping output (override with `.groups` argument)

## Warning: Removed 1 rows containing missing values (position_stack).

protein%>%
  ggplot(aes(TIAM1_N, APP_N, col=class))+
  geom_point()+
  scale_fill_manual(values=c("#F4A582", "#92C5DE","#FDDBC7","7d98cf", "96c577", "#F4A582", "#d9b5b5","#2dafc2"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

En la gráfica se observa la relación entre los niveles de expresión proteica de “TIAM1” y “APP” para las distintas clases de tratamientos con los que se estudiaron los ratones, por ende si se conoce que la proteina TIAM1 actua direnctamente en el proceso de regulación de vias de señalización para llevar a cabo procesos celulares tales como el envejecimiento y la proteina APP por otra parte codifica para un recepctor de de la superficie celular precursora de campos en el estudio del pacientes con alzheimer (envejecimiento neuronal).

Dada las gráficas resultantes se puede deducir que en los ratones de control, estimulados para aprender e inyectos con solución salina y memantine se observa una relación directamente proporcional, en los cuales los datos se mantienen en un rango establecido. Por otra parte se encuentran los ratones de control, no estimulados para aprender e inyectos con solución salina y memantine, los cuales obtuvieron un rango de relación de niveles de expresión proteico más bajo y con menor dispersión lo que indica que estos poseen menor expresión en las proteinas indican un envejecimiento cerebral.

Por último se obtinen los niveles de expresión de ratrones con trisomía estimulados para aprender e inyectos con solución salina y memantine, los cuales arrojan un relación proporcional pero con una dispersión mayor en un rango bastante amplio(0.3-0.7), esto indica que al implementar este tratamiento en los ratones se estimula de manera irregluar la expresión de dichas proteinas.

Gráfica 2 Para el siguiente análisis proteico se estudiaron 8 proteinas escogidas por relevancia e importanica en la expressión dada en el comportamiento según el tratamiento aplicado al sujeto de investigación.

ggplot(datas, aes(x=pS6_N,Behavior,color="")) +
  geom_point(alpha=0.11)+
  scale_color_manual(values=c("#4393C3"))+
  facet_wrap(~class)

ggplot(datas, aes(x=pS6_N,Genotype,color="")) +
  geom_point(alpha=0.11)+
  scale_color_manual(values=c("#4393C3"))+
  facet_wrap(~class)

Gráfico 3

La proteina RPS6,es una proteina ribosomal, esta es el producto principal de las proteinas quinasas en el ribosoma, esto significa que relaliza fosforilación y por ende está involucrada en el proceso regulación del tamañano celular y en la proliferación de la misma. Es por ello que como se observa en las gráficas, los valores de la proteina RPS6_N se optienen de la siguiente manera:

Presentan mayor disperción en la clase “c-CS-s” en donde se aplicaron estímulas de aprendizaje, lo que indica que esta prteina en este tipo de tramamiento se expresade forma heterogenia, alcanzando niveles de expresión bajos y altos. Se deduce que los niveles de relugación de tamaño y proliferación celular son dispersos en ratones de control, inyectados con solución salina.
En el preceso “c-CS-m” se obtienen los datos resultantes en un rango pequeño (0.10-0.14) de expresión, lo que indica que para los ratones con estimulo de apredización inyectados con mematine, obtuvieron una regulación de tamaño y proliferación celular moderado.
En el proceso “c-SC-s” se obtuvo los niveles altos de expresión proteica de la proteina RPS6_N en ratones que no fueron estimulados para aprender y fueron inyectados con solución salina, los que indica que obtuvieron una regulación de tamaño y proliferación celular optima.
En el proceso “c-SC-m” se obtuvo los niveles altos de expresión proteica (0.13-0.15)de la proteina RPS6_N en ratones que no fueron estimulados para aprender y fueron inyectados con mematine, los que indica que obtuvieron una regulación de tamaño y proliferación celular optima.
En el proceso “t-CS-t” se obtuvo niveles intermedios de expresión prteica ribosomal en un rango de (0.10-0.12) en ratones con trisomía que dueron estimulados para aprender e inyectados con memantine. lo que indica que obtuvieron una regulación de tamaño y proliferación celular moderado.
En el proceso “t-CS-s” se obtinen los datos resultantes de niveles de expresión proteica ribosomal de la RPS6, en un rango ampliO de (0.08-0.15) en ratones con trisomía, estimulados para aprender e inyectados con solución salina. Lo que indica que en este tipo de ratones el tamaño y la proliferación celular es desigual.
En el proceso “t-CS-m” se obtuvo los niveles de expreción de la proteina ribosomal más altos e irregulares en un rango de (0.10-0.16) en ratones con trisomía, estimulados para aprender inyectados con memantine. Lo que indica que con este proceso se hhalan los niveles mas adecuados con respecto a el tamaño y la proliferación celular.

ggplot(datas, aes(x=DYRK1A_N,Behavior,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#F4A582"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

ggplot(datas, aes(x=DYRK1A_N,Genotype,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#F4A582"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

Gráfico 4

La proteina DYRK1A_N, de igual manera representa un grupo de quinansas, esta contiene una secuencia señal para el direccionamiento nuclear, es por ello que representa un papel importante en la señalización que regula la proliferación celular. Debido a la participación en señalización del sistema nervioso central y su localización en el cromosoma 21, interviene de manera directa en la patología del síndrome de down. Es por ello que como se observa en las gráficas, los valores de la proteina DYRK1A se optienen de la siguiente manera:

En el proceso “c-CS-s” se obtuvo niveles de expresión bajos en un rango de (0.2-0.75) en ratones de control, estimulados para aprender e inyectados con solución salina. Es de esperar estos resultados pues ninguno de los ratones en este esstudio posee el sindrome de down por ello se encuentra que la expresión de la proteina DYRK1A_N es baja.
En el proceso “c-CS-m” se obtuvo niveles de espresión bastantes dispersas, gran parte en niveles de expresión proteica bajos (0.3-0.6) en ratones de control estimulados para aprender e inyectados con memantine, sin embargo se encontraron valores de exresión bastante altos en un rango de (2.0-2.5) lo que indica esta dispersión puede ser causada por la solcuón inyectada.
En los procesos “c-SC-s” y “c-SC-m” los resultados arojaron niveles bastantes bajos (0.2-0.5)de expresión de la proteina DYRK1A_N en ratones de control, no estimulados para aprender e inyectados con solución salina y memantine respetivamente. Por lo que se deduce que la estimulación para aprender es un factor directo en la expresión del gen.
En los procesos de “t-CS-m” y “t-CS-s” se obtuvo un nivel de expresión los resultados arrojaron niveles altos en un rango de (0.5-1.2) en ratones con trisomía estimulados para aprender e inyectados con memantine y solución salina respetivamente. Lo que significa que con respetos a los otros sujetos de estudio los de estas clases poseen una expresión proteicxa más alto por poseer la patología.
Para el proceso “t-SC-m” los datos arrojaron niveles bajos de expresión proteica en un rango de (0.2-0.5) en ratones con trisomia no estimulados para aprender e inyectados con memantine, lo que indica que el tratamiento generado es optimo.

ggplot(datas, aes(x=pCAMKII_N ,Behavior,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#92C5DE"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

ggplot(datas, aes(x=pCAMKII_N ,Genotype,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#92C5DE"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

Gráfica 5 La proteina es una proteina pCAMKII_N quinasa que está involucrada en la señalización celular y de igual manera esta activa en procesos de aprendizaje y memoria. Es por ello que como se observa en las gráficas, los valores de la proteina pCAMKII_N se optienen de la siguiente manera:

En el proceso de “c-CS-m” se obtuvo datos de con niveles de expresión dispersos en un rango de (1.5-5) en ratones de control estimulados para aprender e inyectados con memantine, por ende se comprende que en este tratamiento no se estimula la proteina obteniendo niveles básicos de expresión.
En el proceso de “c-CS-s”en esta gráfica se observan valores de expresión menos dispersos en un rango de (2-5) en ratones de control estimulados para aprender e inyectados con solución salina. A partir de ello se de deduce que se encuentra en niveles normales de modo que el tratamiento es parcial dentro del estado de los sujetos de estudio.
En el proceso “c-SC-s” se obtienen valores altos de expresión proteica en un rango amplio (2-6) en ratones de control, no estimulados para aprender e inyectados con solución salina, lo que indica que la proteina pCAMKII_N se encuentra en nivelkes medios en este estudio.
En el proceso “t-CS-m” se arrojaron datos de todos los valores en un rango amplio (1-6) en ratones con trisomía, estimulados para aprender e inyectados con memantine, lo que indica que el tratamiento en este grupo de ratones no es claro debido a que unos presentan altos niveles de expresión y otros bajos niveles, esto mismo pasa en los otros tres tratamientos (“t-CS-s, t-SC-m, t-SC-s”), de ello se puede deducir que este fenómeno sucede en los ratones que poseen tisomía.

ggplot(datas, aes(x=pMTOR_N ,Behavior,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#8eef8a"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

ggplot(datas, aes(x=pMTOR_N ,Genotype,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#8eef8a"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

Gráfica 6

La proteina pMTOR_N interviene en los procesos de regulación de la síntesis y degradación de proteinas, es decir cuando esta se encuentra inestable, se producen eventos tales como evejecimiento prematuro, diabetes, cancer entre otros, todo ello debido a que se activa en la via de señalización cuando se desencadenan procesos tales como la sintesis de ADN, metabolismo de glucosa, inhibe la apoptosis y otros procesos fundamentales para el funcionamiento correto del sistema. Dadas las alteraciones de mTOR se puede producir una demencia similar a la enfermedad de alzheimer en sujetos con la patología del sindrome de Down. Como se observa en las gráficas, los valores de la proteina pmTOR_N se optienen de la siguiente manera:

En los dos primeros procesos llevados a cabo de la proteina “c-CS-m”, “c-CS-s”, se obtuvo valores en un rango de (0.6-0.9) en ratones de control, estimulados para aprender e inyectados con memantine y solución salina respetivamente, de esto se puede comprender que el tipo de solución inyectada no interviene en los resultados dados, es decir en dichos procesos se encuentran niveles intermedios de la expresión proteica, un regulación de síntesis y degradación celular optima.
En los procesos “c-SC-m”, “c-SC-s”, la gráfica muestra datos más dispersos en un rango dado entre (0.5-0.10) en ratones de conto, no estimulados para aprender e inyectados con memantine y solución salina respectivamente. A partir de ellos se observa que a los ratones los cuales se le aplicó solución salina poseen un desplazamiento ligeron de datos hacia valores menores de expresión proteica, por otro lado a los ratones que se le aplicó memantine, los datos poseen un breve desplazamiento a valores mayores de niveles de expresión.
En el proceso de “t-CS-m” se obtuvo valores de exprexión medios en un rango de (0.5-0.7) en ratones con trisomia, estimulados para aprender e inyectados con memantine, lo que indica que al arrojar los datos tan unidos se mantuvo los valores de expresión proteica en el tratamiento.
En el proceso de “t-CS-s” se arrojaron valores bajos de la expresión proteica en un rango de (0.1-0.5) en ratones con trisomía estimulados para aprender e inyectados con solución salina, lo que indica que con dicho tratamiento no se genera un balance en los niveles de expresión que es lo esperado para evitar el progreso de la patología.
En el proceso de “t-SC-m” se obtuvo valores regulados con tenddencia a niveles altos en un mismo rango entre (0.7-1) en ratones con trisomia, no estimulados para aprender e inyectados con memantine, a partir de ellos se deduce que los ratones en este proceso presetan mayor expresión proteica.
En el proceso de “t-SC-s” se obtinen valores con alteraciónes no uniformes ya que los niveles de expresión proteica para mTOR, oscilan entre (0.5-1.0) para ratones con trisomía, sin estimulación para aprender e inyectados son solución salina. Esto indica que en este tratamiento no se registran cambios con respecto a el comportamiento nomral de la expresión esta proteina por consiguiente se deduce que toma valores heterogéneos y distantas para cada uno de los sujetos de estudio.

ggplot(datas, aes(x=pBRAF_N ,Behavior,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#e99e03"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

ggplot(datas, aes(x=pBRAF_N ,Genotype,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#e99e03"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

Gráfica 7 • Proteína BRAF

Está Involucrado en la transducción de señales mitogénicas desde la membrana celular al núcleo. Fosforila MAP2K1 y, por lo tanto, activa la vía de transducción de señales de MAP quinasa. Puede desempeñar un papel en las respuestas postsinápticas de las neuronas del hipocampo. se expresa más que todo en el cuerpo pineal, estriado dorsal e hipotálamo.Con respecto a Los valores de la proteína BRAF_N obtenemos que:

Para el análisis de este grupo de graficas podemos deducir que uno de los cuatro organismos que presentan trisomía que son los que pertenece a la clase de t-CS-m tienen una mayor expresión de la proteína en comparación con los otros 3 organismos y que 2 de los 4 organismos de control presentan en igual proporción una mayor expresión de la misma, que son los de las clases c-CS-m y c-CS-s evidenciando así que estas tres clase de ratones en específico están todas estimuladas para aprender, concluyendo con esto que la proteína se expresa mejor en aquellos organismos que fueron estimulados para aprender .

ggplot(datas, aes(x=GluR4_N ,Behavior,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#2945d1"))+
  facet_wrap(~class)

ggplot(datas, aes(x=GluR4_N ,Genotype,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#2945d1"))+
  facet_wrap(~class)

Gráfica 8 • Proteína GluR4

Los receptores de glutamato son los receptores neurotransmisores excitadores predominantes en el cerebro de los mamíferos y se activan en una variedad de procesos neurofisiológicos normales. funciona como canal iónico controlado por ligando en el sistema nervioso central y como ya dijimos juega un papel importante en la transmisión sináptica excitadora, por lo tanto, convierte la señal química en un impulso eléctrico y se Expresa más que todo en cerebelo adulto y lóbulo frontal adulto. Los datos de la proteina GluR4_N se optienen de la siguiente manera:

Al realizar el análisis de las graficas correspondientes pudimos notar cierto patrón en el comportamiento de la expresión de la proteína ya que en todos los organismos, independientemente de que tuvieran o no trisomía, fueran estimulados para aprender o no e incluyo inyectados con diferentes soluciones como lo son la memantina y la solución salina, en todos tenía un comportamiento similar ya que se expresaba en un rango general de 0.5 para todos los organismos expresándose así en una cantidad aproximadamente igual en el cerebelo y lóbulo frontal de los mismos.

ggplot(datas, aes(x=CDK5_N ,Behavior,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#48271e"))+
  facet_wrap(~class)

ggplot(datas, aes(x=CDK5_N ,Genotype,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#48271e"))+
  facet_wrap(~class)

Gráfica 9 • Proteína CDK5

Esencial para la detención y diferenciación del ciclo celular neuronal y puede estar involucrada en la muerte celular apoptótica en enfermedades neuronales desencadenando la reentrada abortiva del ciclo celular, Regula varios procesos fisiológicos y de desarrollo neuronal, incluida la supervivencia, migración y diferenciación neuronal, crecimiento axonal y neurítico, sinaptogénesis, diferenciación de oligodendrocitos, plasticidad sináptica y neurotransmisión. Se expresa en glándula submandibular, cerebro y corteza frontal principalmente. Teniendo en cuenta la gráfica CDK5_N obtenemos los siguientes valores:

Al analizar estas graficas podemos decir que esta proteína se expresa dentro de un rango similar que va desde 0.2 a 0.4 para todas las clases de ratones, pero donde la mayor concentración o donde mejor se expresa la proteína es entre 0.25 y 0.35 equivalente al 0.05 de expresión en las clases en donde el organismo es de control, es decir que no presenta trisomía, mientras que en aquellos que si la presentan la proteína se expresa en una menor proporción equivalente al 0.025 aproximadamente pero en un rango desde 0.275 a 0.325

ggplot(datas, aes(x=TIAM1_N ,Behavior,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#273191"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

ggplot(datas, aes(x=TIAM1_N ,Genotype,color="")) +
  geom_point(alpha=0.1)+
  scale_color_manual(values=c("#273191"))+
  facet_wrap(~class)

## Warning: Removed 3 rows containing missing values (geom_point).

Gráfica 10 • Proteína TIAM1 La proteína TIAM1 es la Invasión del linfoma T y proteína inductora de metástasis 1 su función es controlar o modular la actividad de las proteínas de unión a Rho GTP y conecta las señales extracelulares con las actividades del citoesqueleto. Muy expresado en cerebro y testículos y en niveles bajos o moderados en casi todos los demás tejidos normales. Esta se encuentra en prácticamente todas las líneas de células tumorales, neuroblastomas , melanomas y carcinomas. De acuerdo con Los datos de la grafica de la proteína TIAM1_N obteneos que :

Para los ratones de clase c-CS-m que son aquellos que están estimulados para aprender y fueron inyectados con memantina encontramos que la proteína se expresa en un rango de 0,35-0.6 pero con una mayor proporción entre el 0,375 y 0,45 que equivale aproximadamente al 0,075 deduciendo así que esta proteína se expresa en su mayoría en niveles moderados para este tipo de tratamiento
Al igual que los ratones de la clase anterior, en los de clase c-CS-s que son los que también están estimulados para aprender, pero son inyectados con solución salina, la proteína TIAM1 en su mayoría se expresa en una proporción aproximadamente igual pero con un rango diferente ya que este va desde 0,35 hasta 0,7, pudiendo evidenciar que la proteína se sigue expresando la mayor parte entre el 0,375 y 0,45 lo que corresponde a tejidos normales del organismo Para aquellos ratones que pertenecen a la clase c-SC-m que son *los que no están estimulados para aprender y fueron inyectados con memantina encontramos que la proteína se expresa en igual cantidad que los grupos anteriores, pero en un rango de 0.35 y 0.45 lo que indicaría que se esta expresando en los tejidos normales del organismo
Para los de la clase c-SC-s que son estimulados para no aprender, pero inyectados con solución salina la proteína se expresa en un rango total de 0.25 y 0.5 aproximadamente, pero con una mayor concentración en 0.35 y 0.425 lo que equivaldría aproximadamente al 0.5, expresándose en una menor proporción que en las clases anteriores, pero en los mismos tejidos *Los que pertenecen a la clase t-CS-m son estimulados para no aprender e inyectados con memantina, pero la diferencia con los ratones que tienen el mismo tratamiento es que estos tienen trisomía y para este caso la proteína se expresa en un rango total entre 0.275 y 0.575 con una mayor proporción en 0.35 y 0.4125 y continúa expresándose en los tejidos normales del organismo
Los de la clase t-CS-s son estimulados para aprender e inyectados con solución salina, pero estos al igual que los anteriores tienen trisomía, en estos ratones la proteína se expresa en su mayoría en igual proporción que los de la clase c-CS-s, pero con un rango total diferente, ya que este se expresa desde 0.325 hasta 0.55 aproximadamente y se sigue expresando en los mismos tejidos que todas las clases anteriores
Los ratones que pertenecen a la clase t-SC-m fueron estimulados para no aprender e inyectados con memantina y padecen trisomía y para este caso la proteína se expresa en un rango de 0.475 y 0.65 con una mayor concentración en 0.425 y 0.5 pero estos a diferencia de todos los anteriores podríamos decir que la proteína se expresa en los tejidos normales, testículos o cabeza de los individuos.
Para la última clase de ratones que expresan la proteína TIAM1 que son los que pertenecen a t-SC-s podemos decir que es la clase en la que mayor proporción se expreso esta, ya que presenta un rango total de 0.3 a 0.725 y con una mayor concentración entre 0.375 y 0.5125 que equivaldría aproximadamente a 0.12916 siendo así la mayor concentración registrada para esta grafica y al igual que la clase anterior se está expresando mas que todo en tejidos normales así como también en testículos y el cerebro de los individuos.

Proceso de conversión de datos para realizar la gráfica

map(datas[,2:9],as.numeric) ## mapeo de los datos

mean(datas$DYRK1A_N, na.rm=TRUE) ##media de los datos excluyendo los datos con NA
is.na(datas[,2]) ## función lógica para saber si los datos son o no caracteres
posiciones2=is.na(datas[,2]) ## vector de las posiciones verdaderas de la función lógica
mean(datas$DYRK1A_N, na.rm = TRUE) ## promedio excluyendo los valores de NA
Prom2=mean(datas$DYRK1A_N, na.rm = TRUE) ## vector del promedio
datas$DYRK1A_N[posiciones2] ## no recuerdo que es esto
datas$DYRK1A_N[posiciones2]=Prom2 ## vector de lo de arriba jaja
mean(datas$DYRK1A_N) ##promedio x2
datas$DYRK1A_N[posiciones2] ## asignación del valor promédio a los valores de NA


mean(datas$ITSN1_N, na.rm=TRUE)
is.na(datas[,3])
posiciones3=is.na(datas[,3])
mean(datas$ITSN1_N, na.rm = TRUE)
Prom3=mean(datas$ITSN1_N, na.rm = TRUE)
datas$ITSN1_N[posiciones3] 
datas$ITSN1_N[posiciones3]=Prom3
mean(datas$ITSN1_N) 
datas$ITSN1_N[posiciones3]


mean(datas$BDNF_N, na.rm=TRUE)
is.na(datas[,4])
posiciones4=is.na(datas[,4])
mean(datas$BDNF_N, na.rm = TRUE)
Prom4=mean(datas$BDNF_N, na.rm = TRUE)
datas$BDNF_N[posiciones4] 
datas$BDNF_N[posiciones4]=Prom4
mean(datas$BDNF_N) 
datas$BDNF_N[posiciones4]


mean(datas$NR1_N, na.rm=TRUE)
is.na(datas[,5])
posiciones5=is.na(datas[,5])
mean(datas$NR1_N, na.rm = TRUE)
Prom5=mean(datas$NR1_N, na.rm = TRUE)
datas$NR1_N[posiciones5] 
datas$NR1_N[posiciones5]=Prom5
mean(datas$NR1_N) 
datas$NR1_N[posiciones5]


mean(datas$NR2A_N, na.rm=TRUE)
is.na(datas[,6])
posiciones6=is.na(datas[,6])
mean(datas$NR2A_N, na.rm = TRUE)
Prom6=mean(datas$NR2A_N, na.rm = TRUE)
datas$NR2A_N[posiciones6] 
datas$NR2A_N[posiciones6]=Prom6
mean(datas$NR2A_N) 
datas$NR2A_N[posiciones6]

Gráfica de coorelación

library(corrplot)

## corrplot 0.84 loaded

matriz=cor(datas[,2:6])
corrplot(matriz)

Gráfica 11

4. Referencias:

Lauretti E, Dincer O, Praticò D. Glycogen synthase kinase-3 signaling in Alzheimer’s disease. Biochim Biophys Acta Mol Cell Res. 2020 May;1867(5):118664. doi: 10.1016/j.bbamcr.2020.118664. Epub 2020 Jan 30. PMID: 32006534; PMCID: PMC7047718.
Atanasova T, Kharybina Z, Kaarela T, Huupponen J, Luchkina NV, Taira T, Lauri SE. GluA4 Dependent Plasticity Mechanisms Contribute to Developmental Synchronization of the CA3-CA1 Circuitry in the Hippocampus. Neurochem Res. 2019 Mar;44(3):562-571. doi: 10.1007/s11064-017-2392-8. Epub 2017 Aug 31. PMID: 28856535.
Pbrm1 polybromo 1 Mus musculus (house mouse)
CDK5 cyclin dependent kinase 5 Homo sapiens (human)
Karim MR, Fisher CR, Kapphahn RJ, Polanco JR, Ferrington DA. Investigating AKT activation and autophagy in immunoproteasome-deficient retinal cells. PLoS One. 2020 Apr 10;15(4):e0231212. doi: 10.1371/journal.pone.0231212. PMID: 32275682; PMCID: PMC7147741.
Rrp1 ribosomal RNA processing 1 Mus musculus (house mouse)
CERRO, Susana García. Estudio del efecto de la reducción del número de copias del gen Dyrk1A sobre distintos fenotipos funcionales y neuromorfológicos encontrados en un modelo murino de Síndrome de Down y en ratones euploides. 2015. Tesis Doctoral. Universidad de Cantabria.
PARDO, Andrea Corrales. Estudio de los efectos protectores del tratamiento crónico con melatonina sobre los déficits cognitivos del ratón Ts65Dn: un modelo de síndrome de Down. 2015. Tesis Doctoral. Universidad de Cantabria.
Síndrome de Down
¿Que es el sindrome de Down - sindrome de Down
¿Cuántas personas tienen el síndrome de Down o corren riesgo de tenerlo?
Sindrome de Down

Proyecto Análisis estadístico de datos génicos

Proyecto Análisis estadístico de datos génicos

Protein Expression Analysis

Paula Alexandra Amado, Maria Alejandra Bonilla, Juan Esteban Rubiano

15 de octubre 2020