Marcos Augusto Elgueta Salas
2022-07-06
La bioinformatica es una disciplina que lleva a cabo el análisis de base de datos de origen biológico. Requiere el uso y el desarrollo de técnicas y herramientas del área de la matemática, estadística, programación, entre otros, para el análisis de datos, simulación de sistemas o mecanismos de origen biológico. Por ejemplo, el análisis de secuencias de moléculas biológicas como el ADN, el ARN o proteínas.
“Figura 1: Virus del papiloma humano visto en un microscopio de electrones”
“Figura 2: Virus Epstein Barr visto en un microscopio de transición”
En Chile hay muchos virus comunes que viven con la población y gran parte desconoce que es portador o portadora. Un par de ejemplo de ello, son el VPH(Virus del papiloma humano) y el VEB(Virus Epstein Barr).
Los virus del papiloma son ADN bicatenarios y sin envoltura. Se han identificado más de 100 tipos de Virus Papiloma Humano (VPH) y aproximadamente la mitad de ellos infectan el tracto genital. Muchos tipos de VPH se han encontrado asociados a cánceres de cuello uterino y se clasifica en VPH de «alto y bajo riesgo». En las mujeres, los VPH de alto riesgo causan más del 70% de los cánceres de cuello uterino, además de los cánceres de vulva, vagina y ano. En los hombres, pueden producir cáncer de ano y de pene. De acuerdo al estudio realizado por Ferreccio et al (2004), se calculó una prevalencia de 14% de infección por VPH para las mujeres chilenas, donde el 71% era de alto riesgo. Los VPH de bajo riesgo pueden causar verrugas genitales, también llamados condilomas y se consideran la enfermedad de transmisión sexual (ITS) más frecuente en jóvenes de ambos sexos, en Chile y el mundo. La mayoría de las personas, tanto hombres como mujeres, se infectarán con VPH en algún momento de sus vidas y, en ciertos casos, algunos se infectarán en repetidas ocasiones.
Enfermedad infectocontagiosa producida por la primoinfección del
virus Epstein Barr (VEB). Es una enfermedad infiltrativa (habitualmente
benigna) del tejido linfático faríngeo, ganglionar y
hepatoesplénico.
Se puede hablar de síndrome mononucleósico, que en el 90% de las veces
es producido por VEB, pero que puede ser causado también por CMV, VIH,
HHV-6, Hepatitis virales, Rubéola, Toxoplasma, TBC, así como fármacos
tales como fenitoína y carbamazepina. Adquirida mayoritariamente
mediante transmisión de secreciones respiratorias (llamada “la
enfermedad del beso”) es sintomática en el 70% de los expuestos, con un
período de incubación de 30 a 50 días (promedio 6 sem). El VEB es
altamente difusible en hacinamiento por vía aérea. A los 25 años, más
del 90% tiene seroprevalencia (+). Los enfermos excretan el VEB en
saliva por 2 meses. Hoy sabemos que su prevalencia tiene que ver con la
esclerosis multiple.
Habilitar el paquete Biostring
library(Biostrings)
Crear objeto L1 con la secuencia del gen L1 VPH
L1 <- readDNAStringSet(file="NC_027779.1[4941..7108].fasta")
Verificamos el nombre, el largo y el anchode la secuencia:
names(L1)
length(L1)
width(L1)
Frecuencia de nucleótidos en la secuencia del gen L1
alphabetFrequency(L1)
Selección de los primeros 75 nucleotidos
subseq(L1, start=1, end=75)
Traducción de ARN a proteína
aa_seq <-translate(L1)
aa_seq
La secuencia de ADN contiene al nucleótido Timina (T) en cambio en la secuencia de ARN se cambia la Timina por el nucleótido Uracilo (U). Seleccionar los últimos 65 nucleótidos del gen L1
subseq(L1, start=2104, end=2168)
Traducción de ARN a proteína
aa_seq <-translate(L1)
aa_seq
Importa secuencia de a.a. en formato fasta
L1_prot <- readAAStringSet(file="YP_009163896.1.fasta")
Frecuencia de aminoácidos de la secuencia
alphabetFrequency(L1_prot)
Crear objeto L1 con la secuencia del gen HHV4tp2_gp27 BLLF1 [ Human herpesvirus 4 type 2 (Epstein-Barr virus type 2) ]
HHV4 <- readDNAStringSet(file="NC_009334.1[76876..80334](-).fasta")
Verificamos el nombre, el largo y el anchode la secuencia:
names(HHV4)
length(HHV4)
width(HHV4)
Frecuencia de nucleótidos en la secuencia del gen HHV4tp2_gp27
alphabetFrequency(HHV4)
Selección de los primeros 75 nucleotidos
subseq(HHV4, start=1, end=75)
Traducción de ARN a proteína
aa_seq <-translate(HHV4)
aa_seq
La secuencia de ADN contiene al nucleótido Timina (T) en cambio en la secuencia de ARN se cambia la Timina por el nucleótido Uracilo (U). Seleccionar los últimos 65 nucleótidos del gen HHV4tp2_gp27
subseq(HHV4, start=3395, end=3459)
Traducción de ARN a proteína
aa_seq <-translate(HHV4)
aa_seq
Importa secuencia de a.a. en formato fasta
HHV4_prot <- readAAStringSet(file="YP_001129462.1.fasta")
Frecuencia de aminoácidos de la secuencia
alphabetFrequency(HHV4_prot)