En este reporte incluyo el importe de los datos de SNPs obtenidos de los beadarray de la plataforma Illumina GoldenGate a R mediante el uso del paquete beadArraySNP.
El archivo .opa contiene información del tipo de SNP analizado, los oligos usados, ubicación cromosómica y detalles de anotación del organismo como se muestra en el siguiente output.
pathOpa <- "~/dataBases/GoldenGate_U15_025 AT/GenomeStudio/GS0014416-OPA.opa"
readLines(pathOpa,n = 13)
## [1] "\xa9 Illumina, Inc. 2004"
## [2] "[Heading]"
## [3] "OPA,GS0014416-OPA"
## [4] "Test Version,10104574"
## [5] "Test Version Name,10104574"
## [6] "Test Name,10104574"
## [7] "Bundle Index,1 of 1"
## [8] "SNP Position,1"
## [9] "Assay Format,Golden Gate"
## [10] "Date Manufactured,5/12/15"
## [11] "Loci Count,1536 of 1536"
## [12] "Comment,"
## [13] "Ilmn ID,Name,oligo1,oligo2,oligo3,IllumiCode name,Illumicode Seq,Ilmn Strand,SNP,CHR,Ploidy,Species,MapInfo,TopGenomicSeq,CustomerStrand"
El archivo SampleSheet_ID.csv contiene información acerca de los IDs de cada beadArray y su posición en el arreglo. En la documentación de beadArraySNP este archivo corresponde al archivo 4samples_opa4.csv.
La información incluida en SampleSheet_ID.csv se muestra a continuación.
pathSampleSheet <- "~/dataBases/GoldenGate_U15_025 AT/GenomeStudio/SampleSheet_ID.csv"
readLines(pathSampleSheet,n=13)
## [1] "[Header],,,,"
## [2] "INVESTIGATOR NAME,BeadStudio User,,,"
## [3] "PROJECT NAME,U15_025,,,"
## [4] "EXPERIMENT NAME,U15_025,,,"
## [5] "DATE,05/01/2017 01:03:30 p.m.,,,"
## [6] "[Manifests],,,,"
## [7] "A,GS0014416-OPA,,,"
## [8] "[Data],,,,"
## [9] "Sample_ID,SentrixBarcode_A,SentrixPosition_A,Path,Aux"
## [10] "AU_118_1,101035450001,R01C01,\\\\192.168.102.41\\UMi-2\\ILLUMINA\\Servicios_2017\\DrNicolini\\U15_025\\101035450001,0"
## [11] "AU_103_1,101035450001,R02C01,\\\\192.168.102.41\\UMi-2\\ILLUMINA\\Servicios_2017\\DrNicolini\\U15_025\\101035450001,0"
## [12] "1004,101035450001,R03C01,\\\\192.168.102.41\\UMi-2\\ILLUMINA\\Servicios_2017\\DrNicolini\\U15_025\\101035450001,0"
## [13] "AU_126_1,101035450001,R04C01,\\\\192.168.102.41\\UMi-2\\ILLUMINA\\Servicios_2017\\DrNicolini\\U15_025\\101035450001,0"
El siguiente código es un intento por cargar los datos a beadArraySNP basado en las siguientes notas, véase también.
library(beadarraySNP)
## rutas a archivos locales
path2SampleMap <- "~/scripts/autismProject/Sample_Map.txt"
path2report <- "~/scripts/autismProject/autism_FinalReport.txt"
## Cargando datos
SNPData <- read.SnpSetIllumina(Sample_Map2Samplesheet(path2SampleMap),
reportfile = path2report)
## Warning in read.SnpSetIllumina(Sample_Map2Samplesheet(path2SampleMap),
## reportfile = path2report): OPA info file could not be (uniquely) identified
## for pool_id Using chromosomal position from report file
reportGenomeIntensityPlot(SNPData,smoothing = "mean")