Defina Saccharomyces cerevisiae y explore su relevancia en la industria alimentaria y la investigación médica. (Máximo 250 palabras).
Es una levadura (organismo unicelular) que obtiene la energía a partir de la glucosa y tiene una elevada capacidad fermentativa. Puede aislarse con facilidad en plantas y tierra, así como del tracto gastrointestinal y genital humano [1].
En la industria medica, la levadura es un componente relevante en algunos medicamentos en los cuales destacan las vacunas contra la hepatitis A y B, la hirudina (anticoagulante) y la insulina. Además, en la industria biotecnológica y farmacéutica, la levadura tiene uso en la producción de proteínas, péptidos, vacunas y compuestos altamente valorados, como por ejemplo, artemisinina (droga antimalárica), taxol (droga para el tratamiento del cáncer), la morfina, el opio (analgésico y narcótico), el beta-caroteno (color zanahoria) y la astaxantina (color salmón) [2].
En la industria alimentaria la levadura cumple un papel importante en la elaboración de pan, creación de la cerveza (dado que esta produce un fermentado alcohólico), sidras de manzana y la industria vitivinícola [3].
Explore el papel fundamental del National Center for Biotechnology Information (NCBI) en la recopilación y distribución de información biomédica. (Máximo 250 palabras).
El Centro Nacional para la Información Biotecnológica (NCBI; National Center for Biotechnology Information) es un repositorio que pertenece a la Biblioteca Nacional de Medicina de los Estados Unidos de América. Éste fue creado en 1988 para desarrollar sistemas de información en materia de biología molecular y mantiene la base de datos de GenBank, que contiene secuencias de ácidos nucleicos y proteínas que a su vez, recibe información mediante la colaboración del Banco de Datos de ADN de Japón y la base de datos de secuencias de nucleótidos del Laboratorio Europeo de Biología Molecular. Por otra parte, el NCBI proporciona distintos sistemas de recuperación de información y recursos computacionales para el análisis de muchos otros tipos de sistemas biológicos, que se complementa con contribuciones de la comunidad científica en general [4].
Explore la documentación de Bioconductor y las diversas bibliotecas disponibles en R. Además de las bibliotecas Biostrings y rentrez elija otras tres y proporcione descripciones detalladas de sus funcionalidades respectivas.(Máximo 250 palabras).
1.- NeuCA: Es un método basado en redes neuronales para la anotación de datos scRNA-seq. Puede ajustar automáticamente su estrategia de clasificación según las correlaciones del tipo de celda, para anotar las celdas con precisión. NeuCA puede utilizar automáticamente la información estructural de los tipos de células a través de un árbol jerárquico para mejorar la precisión de la anotación. Es especialmente útil cuando los datos contienen tipos de células estrechamente correlacionados [5].
2.- miRBaseConverter: Una herramienta integral para convertir y recuperar información de nombre, acceso, secuencia, versión, historial y familia de miARN en diferentes versiones de miRBase. Puede procesar una gran cantidad de miARN en poco tiempo sin otras dependencias [6].
3.- GenomicRanges: La capacidad de representar y manipular eficientemente anotaciones y alineaciones genómicas desempeña un papel central cuando se trata de analizar datos de secuenciación de alto rendimiento (también conocidos como datos NGS). El paquete GenomicRanges define contenedores de uso general para almacenar y manipular intervalos genómicos y variables definidas a lo largo de un genoma. En los paquetes GenomicAlignments y SummarizedExperiment, respectivamente, se definen contenedores más especializados para representar y manipular alineaciones cortas con respecto a un genoma de referencia, o un resumen en forma de matriz de un experimento. Ambos paquetes se basan en la infraestructura de GenomicRanges [7].
# Actividad en código
# Paso 1: Instalación de la biblioteca rentrez para interactuar con NCBI
library("rentrez")
# Paso 2: Definición del nombre estándar del gen
nombre_gen = "YGR289C"
# Paso 3: Búsqueda del código específico del gen en NCBI
query_busqueda = paste("(Saccharomyces cerevisiae)","AND",paste0("(gene:", nombre_gen,")"))
resultado_busqueda = entrez_search(db = "gene", term = query_busqueda)
id_gen_numero = as.numeric(resultado_busqueda$ids[1])
# Paso 4: Descarga de los datos base asociados al gen
todos_los_enlaces = entrez_link(dbfrom='gene', id=id_gen_numero, db='all')
# Paso 5: Búsqueda del código específico de la secuencia en NCBI
id_secuencia_numero = todos_los_enlaces$links$gene_nucleotide[[1]]
# Paso 6: Descarga de la secuencia completa del gen en formato FASTA
secuencia = entrez_fetch(db = "nucleotide", id = id_secuencia_numero, rettype = "fasta")
# Paso 7: Mostrar la secuencia en pantalla
print(secuencia)
## [1] ">NM_001181418.3 Saccharomyces cerevisiae S288C alpha-glucoside permease (MAL11), partial mRNA\nATGAAAAATATCATTTCATTGGTAAGCAAGAAGAAGGCTGCCTCAAAAAATGAGGATAAAAACATTTCTG\nAGTCTTCAAGAGATATTGTAAACCAACAGGAGGTTTTCAATACTGAAGATTTTGAAGAAGGGAAAAAGGA\nTAGTGCCTTTGAGCTAGACCACTTAGAGTTCACCACCAATTCAGCCCAGTTAGGAGATTCTGACGAAGAT\nAACGAGAATGTGATTAATGAGATGAACGCTACTGATGATGCAAATGAAGCTAACAGCGAGGAAAAAAGCA\nTGACTTTGAAGCAGGCGTTGCTAAAATATCCAAAAGCAGCCCTGTGGTCCATATTAGTGTCTACTACCCT\nGGTTATGGAAGGTTATGATACCGCACTACTGAGCGCACTGTATGCCCTGCCAGTTTTTCAGAGAAAATTC\nGGTACTTTGAACGGGGAGGGTTCTTACGAAATTACTTCCCAATGGCAGATTGGTTTAAACATGTGTGTCC\nTTTGTGGTGAGATGATTGGTTTGCAAATCACGACTTATATGGTTGAATTTATGGGGAATCGTTATACGAT\nGATTACAGCACTTGGTTTGTTAACTGCTTATATCTTTATCCTCTACTACTGTAAAAGTTTAGCTATGATT\nGCTGTGGGACAAATTCTCTCAGCTATACCATGGGGTTGTTTCCAAAGTTTGGCTGTTACTTATGCTTCGG\nAAGTTTGCCCTTTAGCATTAAGATATTACATGACCAGTTACTCCAACATTTGTTGGTTATTTGGTCAAAT\nCTTCGCCTCTGGTATTATGAAAAACTCACAAGAGAATTTAGGGAACTCCGACTTGGGCTATAAATTGCCA\nTTTGCTTTACAATGGATTTGGCCTGCTCCTTTAATGATCGGTATCTTTTTCGCTCCTGAGTCGCCCTGGT\nGGTTGGTGAGAAAGGATAGGGTCGCTGAGGCAAGAAAATCTTTAAGCAGAATTTTGAGTGGTAAAGGCGC\nCGAGAAGGACATTCAAGTTGATCTTACTTTAAAGCAGATTGAATTGACTATTGAAAAAGAAAGACTTTTA\nGCATCTAAATCAGGATCATTCTTTAATTGTTTCAAGGGAGTTAATGGAAGAAGAACGAGACTTGCATGTT\nTAACTTGGGTAGCTCAAAATAGTAGCGGTGCCGTTTTACTTGGTTACTCGACATATTTTTTTGAAAGAGC\nAGGTATGGCCACCGACAAGGCGTTTACTTTTTCTCTAATTCAGTACTGTCTTGGGTTAGCGGGTACACTT\nTGCTCCTGGGTAATATCTGGCCGTGTTGGTAGATGGACAATACTGACCTATGGTCTTGCATTTCAAATGG\nTCTGCTTATTTATTATTGGTGGAATGGGTTTTGGTTCTGGAAGCAGCGCTAGTAATGGTGCCGGTGGTTT\nATTGCTGGCTTTATCATTCTTTTACAATGCTGGTATCGGTGCAGTTGTTTACTGTATCGTTGCTGAAATT\nCCATCAGCGGAGTTGAGAACTAAGACTATAGTGCTGGCCCGTATTTGCTACAATCTCATGGCCGTTATTA\nACGCTATATTAACGCCCTATATGCTAAACGTGAGCGATTGGAACTGGGGTGCCAAAACTGGTCTATACTG\nGGGTGGTTTCACAGCAGTCACTTTAGCTTGGGTCATCATCGATCTGCCTGAGACAACTGGTAGAACCTTC\nAGTGAAATTAATGAACTTTTCAACCAAGGGGTTCCTGCCAGAAAATTTGCATCTACTGTGGTTGATCCAT\nTCGGAAAGGGAAAAACTCAACATGATTCGCTAGCTGATGAGAGTATCAGTCAGTCCTCAAGCATAAAACA\nGCGAGAATTAAATGCAGCTGATAAATGTTAA\n\n"
# Paso 1. Limpia secuencia
secuencia = unlist(strsplit(secuencia, "\n"))
secuencia = paste(secuencia[-1], collapse = "")
# Paso 2. Calcula su longitud o número de nucleótidos
longitud_secuencia = nchar(secuencia)
# Paso 3. Calcula el contenido CG
# Cuenta las bases G y C
conteo_G = nchar(gsub("[^G]", "", secuencia))
conteo_C = nchar(gsub("[^C]", "", secuencia))
# Cuenta las bases G y C
contenido_GC = round((conteo_G + conteo_C) / longitud_secuencia * 100,2)
cat(paste("El largo de la secuencia asociada al gen", nombre_gen, "de la levadura Saccharomyces cerevisiae es de", longitud_secuencia,"bases nitrogenadas y el porcentaje de contenido GC es" , contenido_GC,"%"))
## El largo de la secuencia asociada al gen YGR289C de la levadura Saccharomyces cerevisiae es de 1851 bases nitrogenadas y el porcentaje de contenido GC es 40.68 %
Indique qué significa guanina, citosina y el contenido CG. (Máximo 250 palabras).
Guanina: base púrica que se combina especificamente con la citosina mediante enlaces de hidrogeno, formando asi pares de bases de triple enlace.
Citosina: base pirimídica que se une a la guanina mediante un triple enlace.
Contenido CG: tambien llamado porcentaje CG, es un indicador importante de la estabilidad y la estructura del ADN debido a que esta union se forma por un triple enlace, a diferencia de la union de AT (adenina y timina) que se conforma por un doble enlace.
Mientras mayor sea el porcentaje CG, mayor estabilidad tendrá la cadena de ADN. Esto es relevante en términos de la estabilidad y la función del ADN en la replicación, la transcripción y otros procesos biológicos.
[1] Suárez-Machín, “Levadura Saccharomyces cerevisiae .” Available: https://www.redalyc.org/pdf/2231/223148420004.pdf (accessed Sep. 02, 2023).
[2] L. Palma, “Levaduras: Las múltiples aplicaciones de un ‘organismo modelo’ | Ciencia en Chile,” Cienciaenchile.cl, Jun. 25, 2019. https://www.cienciaenchile.cl/levaduras-las-multiples-aplicaciones-de-un-organismo-modelo/ (accessed Sep. 02, 2023).
[3] “Uso de microorganismos vivos en la industria alimentaria,” Mundo Agropecuario BET, Jul. 04, 2020. https://mundoagropecuario.net/uso-de-microorganismos-vivos-en-la-industria-alimentaria/ (accessed Sep. 02, 2023).
[4] O. Guzmán-López, C. Ricaño-Rodríguez, D. Luis-Yong, and J. Ricaño-Rodríguez, “NCBI: GENERALIDADES DEL REPOSITORIO Y BREVE DESCRIPCIÓN DE RECURSOS APLICABLES AL ESTUDIO DE LA FITOGENÉTICA,” Revista Fitotecnia Mexicana, vol. 46, no. 1, p. 63, Mar. 2023, doi: https://doi.org/10.35196/rfm.2023.1.63.
[5] “NeuCA,” Bioconductor, 2023. https://bioconductor.org/packages/release/bioc/html/NeuCA.html (accessed Sep. 03, 2023).
[6] “miRBaseConverter,” Bioconductor, 2023. https://bioconductor.org/packages/release/bioc/html/miRBaseConverter.html (accessed Sep. 03, 2023).
[7] “GenomicRanges,” Bioconductor, 2016. https://bioconductor.org/packages/release/bioc/html/GenomicRanges.html (accessed Sep. 03, 2023).