Trabajo final

Marcos Augusto Elgueta Salas

2022-07-06

Bioinformática: Virus y genes.

Introducción

La bioinformatica es una disciplina que lleva a cabo el análisis de base de datos de origen biológico. Requiere el uso y el desarrollo de técnicas y herramientas del área de la matemática, estadística, programación, entre otros, para el análisis de datos, simulación de sistemas o mecanismos de origen biológico. Por ejemplo, el análisis de secuencias de moléculas biológicas como el ADN, el ARN o proteínas.

“Figura 1: Virus del papiloma humano visto en un microscopio de electrones”

“Figura 2: Virus Epstein Barr visto en un microscopio de transición”

Virus más comunes en Chile

En Chile hay muchos virus comunes que viven con la población y gran parte desconoce que es portador o portadora. Un par de ejemplo de ello, son el VPH(Virus del papiloma humano) y el VEB(Virus Epstein Barr).

VPH

Human papillomavirus:

Los virus del papiloma son ADN bicatenarios y sin envoltura. Se han identificado más de 100 tipos de Virus Papiloma Humano (VPH) y aproximadamente la mitad de ellos infectan el tracto genital. Muchos tipos de VPH se han encontrado asociados a cánceres de cuello uterino y se clasifica en VPH de «alto y bajo riesgo». En las mujeres, los VPH de alto riesgo causan más del 70% de los cánceres de cuello uterino, además de los cánceres de vulva, vagina y ano. En los hombres, pueden producir cáncer de ano y de pene. De acuerdo al estudio realizado por Ferreccio et al (2004), se calculó una prevalencia de 14% de infección por VPH para las mujeres chilenas, donde el 71% era de alto riesgo. Los VPH de bajo riesgo pueden causar verrugas genitales, también llamados condilomas y se consideran la enfermedad de transmisión sexual (ITS) más frecuente en jóvenes de ambos sexos, en Chile y el mundo. La mayoría de las personas, tanto hombres como mujeres, se infectarán con VPH en algún momento de sus vidas y, en ciertos casos, algunos se infectarán en repetidas ocasiones.

VEP

Human gammaherpesvirus 4 (Epstein-Barr virus):

Enfermedad infectocontagiosa producida por la primoinfección del virus Epstein Barr (VEB). Es una enfermedad infiltrativa (habitualmente benigna) del tejido linfático faríngeo, ganglionar y hepatoesplénico.
Se puede hablar de síndrome mononucleósico, que en el 90% de las veces es producido por VEB, pero que puede ser causado también por CMV, VIH, HHV-6, Hepatitis virales, Rubéola, Toxoplasma, TBC, así como fármacos tales como fenitoína y carbamazepina. Adquirida mayoritariamente mediante transmisión de secreciones respiratorias (llamada “la enfermedad del beso”) es sintomática en el 70% de los expuestos, con un período de incubación de 30 a 50 días (promedio 6 sem). El VEB es altamente difusible en hacinamiento por vía aérea. A los 25 años, más del 90% tiene seroprevalencia (+). Los enfermos excretan el VEB en saliva por 2 meses. Hoy sabemos que su prevalencia tiene que ver con la esclerosis multiple.

R-Script gen L1 del VPH.

Habilitar el paquete Biostring

library(Biostrings)

Crear objeto L1 con la secuencia del gen L1 VPH

L1 <- readDNAStringSet(file="NC_027779.1[4941..7108].fasta")

Verificamos el nombre, el largo y el anchode la secuencia:

names(L1)
length(L1)
width(L1)

Frecuencia de nucleótidos en la secuencia del gen L1

alphabetFrequency(L1)

Selección de los primeros 75 nucleotidos

subseq(L1, start=1, end=75)

Traducción de ARN a proteína

aa_seq <-translate(L1)
aa_seq

La secuencia de ADN contiene al nucleótido Timina (T) en cambio en la secuencia de ARN se cambia la Timina por el nucleótido Uracilo (U). Seleccionar los últimos 65 nucleótidos del gen L1

subseq(L1, start=2104, end=2168)

Traducción de ARN a proteína

aa_seq <-translate(L1)
aa_seq

Importa secuencia de a.a. en formato fasta

L1_prot <- readAAStringSet(file="YP_009163896.1.fasta")

Frecuencia de aminoácidos de la secuencia

alphabetFrequency(L1_prot)

R-script gen HHV4 del VEB

Crear objeto L1 con la secuencia del gen HHV4tp2_gp27 BLLF1 [ Human herpesvirus 4 type 2 (Epstein-Barr virus type 2) ]

HHV4 <- readDNAStringSet(file="NC_009334.1[76876..80334](-).fasta")

Verificamos el nombre, el largo y el anchode la secuencia:

names(HHV4)
length(HHV4)
width(HHV4)

Frecuencia de nucleótidos en la secuencia del gen HHV4tp2_gp27

alphabetFrequency(HHV4)

Selección de los primeros 75 nucleotidos

subseq(HHV4, start=1, end=75)

Traducción de ARN a proteína

aa_seq <-translate(HHV4)
aa_seq

La secuencia de ADN contiene al nucleótido Timina (T) en cambio en la secuencia de ARN se cambia la Timina por el nucleótido Uracilo (U). Seleccionar los últimos 65 nucleótidos del gen HHV4tp2_gp27

subseq(HHV4, start=3395, end=3459)

Traducción de ARN a proteína

aa_seq <-translate(HHV4)
aa_seq

Importa secuencia de a.a. en formato fasta

HHV4_prot <- readAAStringSet(file="YP_001129462.1.fasta")

Frecuencia de aminoácidos de la secuencia

alphabetFrequency(HHV4_prot)

Referencias