ChIP-seq-counts exploration

plot with ggplot2

library(ggplot2)

ggplot(counts) + geom_point(aes(x=log2(subRead_Mcf7Rep1 +1 ), y=log2(bedtools_Mcf7Rep1 +1))) +
        geom_abline(intercept = 0, slope = 1, col="red")

Subread counts and bedtools counts are very similar. see correlation below.

cor(log2(counts$subRead_Mcf7Rep1+1), log2(counts$bedtools_Mcf7Rep1+1))

## [1] 0.999985

counts between replicates:

ggplot(counts) + geom_point(aes(x=log2(subRead_Mcf7Rep1 +1 ), y=log2(subRead_Mcf7Rep2 +1))) +
        geom_abline(intercept = 0, slope = 1, col="red")

ggplot(counts) + geom_point(aes(x=log2(subRead_Panc1Rep1 +1 ), y=log2(subRead_Panc1Rep2 +1))) +
        geom_abline(intercept = 0, slope = 1, col="red")

counts between different cell lines

ggplot(counts) + geom_point(aes(x=log2(subRead_Mcf7Rep1 +1 ), y=log2(subRead_Panc1Rep1 +1))) +
        geom_abline(intercept = 0, slope = 1, col="red")

It is more variable between cell lines. See paper Sequence and chromatin determinants of cell-type–specific transcription factor binding Fig5B.

pearson correlation of different counts

cor(log2(counts$subRead_Mcf7Rep1+1), log2(counts$subRead_Mcf7Rep2+1))

## [1] 0.9742128

cor(log2(counts$subRead_Panc1Rep1+1), log2(counts$subRead_Panc1Rep2+1))

## [1] 0.960262

cor(log2(counts$subRead_Mcf7Rep1+1), log2(counts$subRead_Panc1Rep1+1))

## [1] 0.5210859

ChIP-seq-counts exploration

Ming Tang

August 31, 2015

plot with ggplot2

PCA analysis