En este reporte incluyo el importe de los datos de SNPs obtenidos de los beadarray de la plataforma Illumina GoldenGate a R mediante el uso del paquete beadArraySNP.

Tipos de datos proveídos por Illumina

El archivo .opa

El archivo .opa contiene información del tipo de SNP analizado, los oligos usados, ubicación cromosómica y detalles de anotación del organismo como se muestra en el siguiente output.

pathOpa <- "~/dataBases/GoldenGate_U15_025 AT/GenomeStudio/GS0014416-OPA.opa"
readLines(pathOpa,n = 13)
##  [1] "\xa9 Illumina, Inc. 2004"                                                                                                                
##  [2] "[Heading]"                                                                                                                               
##  [3] "OPA,GS0014416-OPA"                                                                                                                       
##  [4] "Test Version,10104574"                                                                                                                   
##  [5] "Test Version Name,10104574"                                                                                                              
##  [6] "Test Name,10104574"                                                                                                                      
##  [7] "Bundle Index,1 of 1"                                                                                                                     
##  [8] "SNP Position,1"                                                                                                                          
##  [9] "Assay Format,Golden Gate"                                                                                                                
## [10] "Date Manufactured,5/12/15"                                                                                                               
## [11] "Loci Count,1536 of 1536"                                                                                                                 
## [12] "Comment,"                                                                                                                                
## [13] "Ilmn ID,Name,oligo1,oligo2,oligo3,IllumiCode name,Illumicode Seq,Ilmn Strand,SNP,CHR,Ploidy,Species,MapInfo,TopGenomicSeq,CustomerStrand"

Archivo SampleSheet.csv

El archivo SampleSheet_ID.csv contiene información acerca de los IDs de cada beadArray y su posición en el arreglo. En la documentación de beadArraySNP este archivo corresponde al archivo 4samples_opa4.csv.

La información incluida en SampleSheet_ID.csv se muestra a continuación.

pathSampleSheet <- "~/dataBases/GoldenGate_U15_025 AT/GenomeStudio/SampleSheet_ID.csv"
readLines(pathSampleSheet,n=13)
##  [1] "[Header],,,,"                                                                                                         
##  [2] "INVESTIGATOR NAME,BeadStudio User,,,"                                                                                 
##  [3] "PROJECT NAME,U15_025,,,"                                                                                              
##  [4] "EXPERIMENT NAME,U15_025,,,"                                                                                           
##  [5] "DATE,05/01/2017 01:03:30 p.m.,,,"                                                                                     
##  [6] "[Manifests],,,,"                                                                                                      
##  [7] "A,GS0014416-OPA,,,"                                                                                                   
##  [8] "[Data],,,,"                                                                                                           
##  [9] "Sample_ID,SentrixBarcode_A,SentrixPosition_A,Path,Aux"                                                                
## [10] "AU_118_1,101035450001,R01C01,\\\\192.168.102.41\\UMi-2\\ILLUMINA\\Servicios_2017\\DrNicolini\\U15_025\\101035450001,0"
## [11] "AU_103_1,101035450001,R02C01,\\\\192.168.102.41\\UMi-2\\ILLUMINA\\Servicios_2017\\DrNicolini\\U15_025\\101035450001,0"
## [12] "1004,101035450001,R03C01,\\\\192.168.102.41\\UMi-2\\ILLUMINA\\Servicios_2017\\DrNicolini\\U15_025\\101035450001,0"    
## [13] "AU_126_1,101035450001,R04C01,\\\\192.168.102.41\\UMi-2\\ILLUMINA\\Servicios_2017\\DrNicolini\\U15_025\\101035450001,0"

Importe de datos a BeadArraySNP

El siguiente código es un intento por cargar los datos a beadArraySNP basado en las siguientes notas, véase también.

library(beadarraySNP)

## rutas a archivos locales
path2SampleMap <- "~/scripts/autismProject/Sample_Map.txt"
path2report <- "~/scripts/autismProject/autism_FinalReport.txt"

## Cargando datos
SNPData <- read.SnpSetIllumina(Sample_Map2Samplesheet(path2SampleMap),
                               reportfile = path2report)
## Warning in read.SnpSetIllumina(Sample_Map2Samplesheet(path2SampleMap),
## reportfile = path2report): OPA info file could not be (uniquely) identified
## for pool_id Using chromosomal position from report file
reportGenomeIntensityPlot(SNPData,smoothing = "mean")