การจัดการข้อมูลเพื่อหาแนวโน้มความสัมพันธ์

การจัดการกับข้อมูลสิ่งมีชีวิตกับสิ่งแวดล้อมเพื่อหาแนวโน้มความสัมพันธ์

1. นำเข้าข้อมูลสิ่งมีชีวิตและสิ่งแวดล้อมเข้าสู่ R

raw<-read.table("G:\\My Drive\\document for each subject\\senior_project\\67\\to_r.csv", header=TRUE, sep = ",")

2. เปิดใช้งาน package ที่จำเป็น “ggplot2” “vegan” “dplyr”

library(ggplot2)
library(vegan)
Warning: package 'vegan' was built under R version 4.4.2
Loading required package: permute
Loading required package: lattice
This is vegan 2.6-8
library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union

3. เลือกใช้เฉพาะข้อมูลที่สมบูรณ์ (ตัด NA ออก)

data<-as.data.frame(raw)
data$soil_moist[data$soil_moist == 9999]<-NA
data1<-na.omit(data)

4. หาแนวโน้มความสัมพันธ์ของปัจจัยสิ่งแวดล้อมกับจำนวนต้นของชนิดที่สนใจ

-สร้างกราฟแสดงแนวโน้มความสัมพันธ์ระหว่าง “ความชื้นดิน” กับจำนวนของสิ่งมีชีวิตชนิด “MP”

data1 %>% ggplot(aes(x=soil_moist, y=MP)) +
  geom_point(color = "#B3C8CF") + 
  geom_smooth(method = "lm", color = "#295F98", se = FALSE) + 
  ggtitle("Relationship between soil moisture and MP number")+
  theme(
    axis.line = element_line(color = "#B7B7B7"),
    panel.background = element_blank())
`geom_smooth()` using formula = 'y ~ x'

-สร้างกราฟแสดงแนวโน้มความสัมพันธ์ระหว่าง “ระยะห่างจากแหล่งน้ำ” กับจำนวนของสิ่งมีชีวิตชนิด “MP”

data1 %>% ggplot(aes(x=dis_to_water, y=MP)) +
  geom_point(color = "#B3C8CF") + 
  geom_smooth(method = "lm", color = "#295F98", se = FALSE) + 
  ggtitle("Relationship between distance to water and MP number")+
    theme(
    axis.line = element_line(color = "#B7B7B7"),
    panel.background = element_blank()
    )
`geom_smooth()` using formula = 'y ~ x'

5. บางครั้งเราต้องการดูแนวโน้มความสัมพันธ์ของปัจจัยสิ่งแวดล้อม 2 ปัจจัยที่ส่งผลต่อสิ่งมีชีวิต

-สร้างกราฟแสดงแนวโน้มความสัมพันธ์ระหว่าง “ระยะห่างจากแหล่งน้ำ” “ความสูงจากแหล่งน้ำ” กับจำนวนของสิ่งมีชีวิตชนิด “MP”

data1 %>% ggplot(aes(x=dis_to_water , y=high_from_water,
           size = MP,
       ))+  
  geom_point(color = "#78ABA8")+labs(x="Height from water body (cm)", y="Distance from water body (m)")+
  theme(
    axis.line = element_line(color = "#B7B7B7"),
    panel.background = element_blank()
    )