Wczytywanie danych

Dane wykorzystane w projekcie byłyby bardzo trudne do wczytania w podstawowej formie. Utworzono więc wiele plików .csv łatwych do wczytania. Na wczytanych danych wykonano serię poleceń, które umożliwiły ich praktyczne wykorzystanie.

library("tidyverse")

mezofile_dwutlenek <- read.csv("mezofile_dwutelenek.csv", header = T, dec = ',')
mezofile_podchloryn <- read.csv("mezofile_podchloryn.csv", header = T, dec = ',')
dezynfekant_podchloryn <- read.csv("dezynfekant_podchloryn.csv", header = T, dec = ',')
dezynfekant_dwutlenek <- read.csv("dezynfekant_dwutlenek.csv", header = T, dec = ',')
grzyby_dwutlenek <- read.csv("grzyby_dwutlenek.csv", header = T, dec = ',')
grzyby_podchloryn <- read.csv("grzyby_podchloryn.csv", header = T, dec = ',')

UV_dwutlenek <- read.csv("UV_dwutlenek.csv", header = T, dec = ',', sep = ';')
UV_podchloryn <- read.csv("UV_podchloryn.csv", header = T, dec = ',', sep = ';')
PEW_dwutlenek <- read.csv("PEW_dwutlenek.csv", header = T, dec = ',', sep = ';')
PEW_podchloryn <- read.csv("PEW_podchloryn.csv", header = T, dec = ',', sep = ';')

ChZT_podchloryn <- read.csv("ChZT_podchloryn.csv", header = T, dec = ',', sep = ';')
ChZT_dwutlenek <- read.csv("ChZT_dwutlenek.csv", header = T, dec = ',', sep = ';')
NH_dwutlenek <- read.csv("NH_dwutlenek.csv", header = T, dec = ',', sep = ';')
NH_podchloryn <- read.csv("NH_podchloryn.csv", header = T, dec = ',', sep = ';')

ludzie1_podchloryn <- read.csv("ludzie1__podchloryn.csv", header = T, dec = '.', sep = ',')
ludzie1_dwutlenek <- read.csv("ludzie1__dwutlenek.csv", header = T, dec = '.', sep = ',')
ludzie_suma_dwutlenek <- read.csv("ludzie_suma_dwutlenek.csv", header = T, dec = '.', sep = ',')
ludzie_suma_podchloryn <- read.csv("ludzie_suma_podchloryn.csv", header = T, dec = '.', sep = ',')


dane_dwutlenek <- cbind(mezofile_dwutlenek,dezynfekant_dwutlenek[,-1],grzyby_dwutlenek[,-1],
                        UV_dwutlenek[,-1],PEW_dwutlenek[,-1],ChZT_dwutlenek[,-1],NH_dwutlenek[,-1]
                        ,ludzie1_dwutlenek[,-1],ludzie_suma_dwutlenek[,-1])

dane_podchloryn <- cbind(mezofile_podchloryn,dezynfekant_podchloryn[,-1],grzyby_podchloryn[,-1],
                        UV_podchloryn[,-1],PEW_podchloryn[,-1],ChZT_podchloryn[,-1],
                        NH_podchloryn[,-1],ludzie1_podchloryn[,-1],ludzie_suma_podchloryn[,-1])

Następnie przedstawiono dane w formie tabeli:

pomiar_3 <- seq(4,46,5)

pomiary_podchloryn <- dane_podchloryn[pomiar_3]

pomiary_dwutlenek <- dane_dwutlenek[pomiar_3]
pomiary_podchloryn_3 <- pomiary_podchloryn
pomiary_dwutlenek_3 <- pomiary_dwutlenek
pomiary_podchloryn_3$dezynfekator <- "podchloryn"
pomiary_dwutlenek_3$dezynfekator <- "dwutlenek"

colnames(pomiary_podchloryn_3) <- c("Mezofile",
                               "Dezynfekant",
                               "Grzyby",
                               "UV",
                               "PEW",
                               "ChZT",
                               "NH4",
                               "Ludzie",
                               "Ludzie_Suma",
                               "Dezynfekator")


colnames(pomiary_dwutlenek_3) <- c("Mezofile",
                               "Dezynfekant",
                               "Grzyby",
                               "UV",
                               "PEW",
                               "ChZT",
                               "NH4",
                               "Ludzie",
                               "Ludzie_Suma",
                               "Dezynfekator")

colnames(pomiary_podchloryn) <- c("Mezofile",
                               "Dezynfekant",
                               "Grzyby",
                               "UV",
                               "PEW",
                               "ChZT",
                               "NH4",
                               "Ludzie",
                               "Ludzie_Suma")


colnames(pomiary_dwutlenek) <- c("Mezofile",
                               "Dezynfekant",
                               "Grzyby",
                               "UV",
                               "PEW",
                               "ChZT",
                               "NH4",
                               "Ludzie",
                               "Ludzie_Suma")

total <- rbind(pomiary_podchloryn_3, pomiary_dwutlenek_3)

total$UV[10] <- (total$UV[9]+total$UV[11])/2
total$PEW[10] <- (total$PEW[9]+total$PEW[11])/2
total_czas <- add_column(total,Czas = c(0,15,30,45,60,75,90,0,15,30,45,60,75,90))

library("DT")

datatable(total_czas)

Podstawowe statystyki

Poniżej przedstawiono podstawowe statystyki dla używanych danych:

summary(total)
##     Mezofile        Dezynfekant          Grzyby              UV        
##  Min.   :    1.0   Min.   :0.02500   Min.   :   0.00   Min.   :0.1190  
##  1st Qu.:  190.6   1st Qu.:0.03375   1st Qu.:  53.19   1st Qu.:0.1770  
##  Median : 2207.0   Median :0.10000   Median : 306.90   Median :0.1975  
##  Mean   : 7515.0   Mean   :0.24429   Mean   : 512.34   Mean   :0.2219  
##  3rd Qu.:11069.5   3rd Qu.:0.38000   3rd Qu.: 591.30   3rd Qu.:0.2645  
##  Max.   :30380.0   Max.   :1.00000   Max.   :2376.00   Max.   :0.3270  
##       PEW              ChZT             NH4             Ludzie     
##  Min.   :0.4888   Min.   : 1.540   Min.   :0.0300   Min.   : 0.00  
##  1st Qu.:0.4988   1st Qu.: 5.293   1st Qu.:0.1400   1st Qu.: 2.25  
##  Median :0.7575   Median : 8.080   Median :0.1700   Median : 4.50  
##  Mean   :0.7659   Mean   : 7.304   Mean   :0.1786   Mean   : 7.50  
##  3rd Qu.:1.0264   3rd Qu.: 9.320   3rd Qu.:0.2175   3rd Qu.:11.25  
##  Max.   :1.0710   Max.   :11.530   Max.   :0.3000   Max.   :32.00  
##   Ludzie_Suma    Dezynfekator      
##  Min.   : 0.00   Length:14         
##  1st Qu.:10.75   Class :character  
##  Median :21.50   Mode  :character  
##  Mean   :31.64                     
##  3rd Qu.:50.75                     
##  Max.   :82.00

Współczynnik korelacji Pearsona

Następnie przedstawiono wykresy korelacji pomiędzy danymi.

Korelacje dla podchlorynu sodu:

library(corrplot)
library(Hmisc)


col <- colorRampPalette(c("#6699ff", "#FFFFFF", "#ff00cc"))

corr3p <- rcorr(as.matrix(pomiary_podchloryn))


corr_r3p <- corr3p$r


corr_p3p <- corr3p$P


corrplot(corr_r3p, method = "color", col = col(200),  
         type = "upper", order = "hclust", addCoef.col = "black", diag = FALSE,
         tl.col = "black", tl.srt = 45, p.mat = corr_p3p, sig.level = 0.9)

Korelacje dla dwutlenku chloru:

corr3d <- rcorr(as.matrix(pomiary_dwutlenek))


corr_r3d <- corr3d$r


corr_p3d <- corr3d$P


corrplot(corr_r3d, method = "color", col = col(200),  
         type = "upper", order = "hclust", addCoef.col = "black", diag = FALSE,
         tl.col = "black", tl.srt = 45, p.mat = corr_p3d, sig.level = 0.9)

Wykresy

Na końcu przedstawiono wykresy zależności między danymi z kategorii mikrobiologii,fizyki,chemii i badanych:

library("ggplot2")

ggplot(total_czas, aes(as.factor(Czas), Mezofile)) +
  geom_col(aes(fill = Dezynfekator), position = "dodge") +
  labs(title = "Stężenie mezofili w zależności od czasu",subtitle = "Pomiar 3",
       x="Czas [min]",y="Stężenie [mg/dm3]") +
  scale_fill_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) +
  scale_y_continuous(breaks = seq(0,150000,10000)) -> wykres_biologia_1

ggplot(total_czas, aes(as.factor(Czas), Grzyby)) +
  geom_col(aes(fill = Dezynfekator), position = "dodge") +
  labs(title = "Liczba grzybów i pleśni w zależności od czasu",subtitle = "Pomiar 3",
       x="Czas [min]", y="Grzyby i pleśń") +
  scale_fill_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) +
  scale_y_continuous(breaks = seq(0,10000,500)) -> wykres_biologia_2

ggplot(total_czas, aes(as.factor(Czas), Dezynfekant)) +
  scale_y_continuous(breaks = seq(0,1,0.1))+
  scale_fill_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) +
  geom_col(aes(fill = Dezynfekator), position = "dodge") +
  labs(title = "Stężenie dezynfekanta w zależności od czasu",subtitle = "Pomiar 3",
       x="Czas [min]", y="Stężenie [mg/dm3]") -> wykres_biologia_3

wykres_biologia_1

wykres_biologia_2

wykres_biologia_3

ggplot(total_czas, aes(as.factor(Czas), UV)) +
  geom_col(aes(fill = Dezynfekator), position = "dodge") +
  labs(title = "Wartość po zastosowaniu UV w zależności od czasu",subtitle = "Pomiar 3",
       x="Czas [min]",y="UV") +
  scale_fill_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) +
  scale_y_continuous(breaks = seq(0,0.5,0.05)) -> wykres_fizyka_1

ggplot(total_czas, aes(as.factor(Czas), PEW)) +
  geom_col(aes(fill = Dezynfekator), position = "dodge") +
  labs(title = "Przewodność elektryczna gleby w zależności od czasu",subtitle = "Pomiar 3",
       x="Czas [min]",y="PEW [mS/cm]") +
  scale_fill_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) +
  scale_y_continuous(breaks = seq(0,1.2,0.1)) -> wykres_fizyka_2

wykres_fizyka_1

wykres_fizyka_2

ggplot(total_czas, aes(as.factor(Czas), ChZT)) +
  geom_col(aes(fill = Dezynfekator), position = "dodge") +
  labs(title = "Stężenie ChZT w zależności od czasu",subtitle = "Pomiar 3",
       x="Czas [min]",y="ChZT [mg/dm3]") +
  scale_fill_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) +
  scale_y_continuous(breaks = seq(0,12,1)) -> wykres_chemia_1

ggplot(total_czas, aes(as.factor(Czas), NH4)) +
  geom_col(aes(fill = Dezynfekator), position = "dodge") +
  labs(title = "Wartość po zastosowaniu UV w zależności od czasu",subtitle = "Pomiar 3",
       x="Czas [min]",y="NH4 [mg/dm3]") +
  scale_fill_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) +
  scale_y_continuous(breaks = seq(0,0.3,0.05)) -> wykres_chemia_2


wykres_chemia_1

wykres_chemia_2

ggplot(total_czas, aes(as.factor(Czas), Ludzie)) +
  geom_col(aes(fill = Dezynfekator), position = "dodge") +
  labs(title = "Liczba ludzi w zależności od czasu",subtitle = "Pomiar 3",
       x="Czas [min]",y="Liczba ludzi") +
  scale_fill_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) +
  scale_y_continuous(breaks = seq(0,32,4)) -> wykres_ludzie_1

wykres_ludzie_1

ludzie_wykres1 <- data.frame(czas = ludzie_suma_dwutlenek$czas,ludzie_suma = ludzie_suma_dwutlenek$ludzie_wch_dwutlenek_3,rodzaj="dwutlenek")

ludzie_wykres2 <- data.frame(czas = ludzie_suma_podchloryn$czas,ludzie_suma = ludzie_suma_podchloryn$ludzie_suma_podchloryn3,rodzaj="podchloryn")

ludzie_wykres <- rbind(ludzie_wykres1,ludzie_wykres2)

ggplot(ludzie_wykres,aes(czas,ludzie_suma)) + 
  geom_line(aes(color = rodzaj)) +
  labs(title = "Suma ludzi wchodzących w zależności od czasu",
       subtitle = "Pomiar 3",
       x="Czas [min]",
       y="Suma ludzi",
       color = "Dezynfekant") +
  scale_color_manual("Dezynfekator", values = c("#6699ff","#ff00cc")) -> wykres_ludzie_2

wykres_ludzie_2