Eberhard Dieter Neserke Molina
2022-06-22
## Loading required package: BiocGenerics
##
## Attaching package: 'BiocGenerics'
## The following objects are masked from 'package:stats':
##
## IQR, mad, sd, var, xtabs
## The following objects are masked from 'package:base':
##
## anyDuplicated, append, as.data.frame, basename, cbind, colnames,
## dirname, do.call, duplicated, eval, evalq, Filter, Find, get, grep,
## grepl, intersect, is.unsorted, lapply, Map, mapply, match, mget,
## order, paste, pmax, pmax.int, pmin, pmin.int, Position, rank,
## rbind, Reduce, rownames, sapply, setdiff, sort, table, tapply,
## union, unique, unsplit, which.max, which.min
## Loading required package: S4Vectors
## Loading required package: stats4
##
## Attaching package: 'S4Vectors'
## The following objects are masked from 'package:base':
##
## expand.grid, I, unname
## Loading required package: IRanges
## Loading required package: XVector
## Loading required package: GenomeInfoDb
##
## Attaching package: 'Biostrings'
## The following object is masked from 'package:base':
##
## strsplit
En este trabajo se buscó obtener información sobre el genoma de Oryza sativa, más conocido como arroz, perteneciente a la familia de las Poáceas, donde su semilla es el órgano de interés. Se eligió esta especie,ya que, es un cereal con gran importancia para la alimentación humana y es el segundo cultivo después del trigo en superficie cosechada a nivel mundial. Además el arroz es el cereal que otorga más calorias por hectárea cultivada.
La cadena ADN de interés se obtuvo de Boldsystems.
Para analizar la secuencia de nucleótidos se utilizó R studio.
alphabetFrequency(race)-> para saber la frecuencia de cada base nitrogenada.
width(rice) -> para saber el número total de bases nitrogenadas.
aa_seq <- translate(rice), aa_seq -> para determinar cantidad total de aminoácidos.
rna_seq <- RNAString(dna_seq), rna_seq -> transcripción de ADN a ARN.
aa_seq <- translate(dna_seq), aa_seq -> traducción de ADN a proteina.
El genoma del arroz consta de 1186 pares de base en total, donde la adenina tiene mayor presencia con 422, luego sigue timina con 353, después guaina con 213 y final mente con menos presencia la citocina, con 198. Despúes de hacer la traducción de ADN a proteina, y utilizar “aa_seq <- translate(rice), aa_seq” para obtener la cantidad de aminoácidos presentes, se obtuvo como resultado que se generan 395 Aa en total.
## [1] "RICE011-12|Oryza sativa|matK"
## [1] 1
## [1] 1186
## A C G T M R W S Y K V H D B N - + .
## [1,] 422 198 213 353 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 1186-letter DNAString object
## seq: CTTGCTCTTCTTCCGTAAAAAATTCTTCTAAAAATA...AAAAAAATTGTTGTAATCCAATAATCGATCTTGGTT
## Warning in .Call2("DNAStringSet_translate", x, skip_code,
## dna_codes[codon_alphabet], : last base was ignored
## 395-letter AAString object
## seq: LALLP*KILLKIPNPTIA*KLVPCFYVYELKF*RMK...LVARMGFLQRSQTPQIESENKTQNKKNCCNPIIDLG
La adenina configura el 35% de la cadena de ADN de Oryza sativa, siendo el mayor porcentaje, al contrario como lo es la citocina, la cual integra el 16% de la cadena, correspondiendo al menor porcentaje. Con esto, se puede determinar que la diferencia de frecuencia de las bases nitrogenadas no es muy significativa.
Ministerio de agricultura, pesca y alemntación. 2017 https://www.mapa.gob.es/es/agricultura/temas/producciones-agricolas/cultivos-herbaceos/arroz/default.aspx#:~:text=El%20arroz%20(Oryza%20sativa%20y,o%20en%20v%C3%ADas%20de%20desarrollo.
Specimen Record boldsystems. 2022. https://boldsystems.org/index.php/Public_RecordView?processid=RICE011-12