미세먼지와 기후 데이터의 상관 관계 분석 (광진구 2018년 데이터 사용, climate_18all)

library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ ggplot2 3.3.5     ✓ purrr   0.3.4
## ✓ tibble  3.1.6     ✓ dplyr   1.0.8
## ✓ tidyr   1.2.0     ✓ stringr 1.4.0
## ✓ readr   2.1.2     ✓ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(lubridate)
## 
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
theme_set(theme_grey(base_family='NanumGothic'))

필요데이터 불러오기 (climate_18all, air_hour_18n, pm10_bad, pm10_verybad, pm2.5_bad, pm2.5_verybad)

air_hour_18n <- readRDS("/Users/leehyunjhin/Desktop/R/21_mise/air_hour_18n.RDS")
climate_18all <- readRDS("/Users/leehyunjhin/Desktop/R/21_mise/climate_18all.RDS")
pm10_bad <- filter(air_hour_18n, air_hour_18n$pm10 >=80)
pm10_verybad <-filter(pm10_bad, pm10_bad$pm10>=150) 
pm2.5_bad <- filter(air_hour_18n, air_hour_18n$pm2.5 >=35)
pm2.5_verybad <- filter(air_hour_18n, air_hour_18n$pm2.5 >=75)

온도와 미세/초미세 먼지의 상관 관계

ggplot(climate_18all) + geom_point(aes(x=temp,y=pm10),color="blue",alpha=0.1)+
  geom_point(aes(x=temp,y=pm2.5),color="red",alpha=0.1)

기온과 미세먼지는 상관이 없음.

습도와 미세/초미세 먼지의 상관 관계

ggplot(climate_18all) + geom_point(aes(x=humidity,y=pm10),color="blue",alpha=0.1)+
  geom_point(aes(x=humidity,y=pm2.5),color="red",alpha=0.1)

습도와 미세먼지는 상관이 없음.

풍속과 미세/초미세 먼지의 상관 관계

ggplot(climate_18all) + geom_point(aes(x=velocity,y=pm10),color="blue",alpha=0.1)+
  geom_point(aes(x=velocity,y=pm2.5),color="red",alpha=0.1)

풍속과 미세먼지는 상관이 없음.

풍향과 미세/초미세 먼지의 상관 관계

ggplot(climate_18all)+geom_rect(xmin=-Inf,xmax=Inf,ymin=80,ymax=150, fill='grey') + geom_point(aes(x=wind_name,y=pm10),color="blue",alpha=0.5)+
  geom_point(aes(x=wind_name,y=pm2.5),color="red",alpha=0.1)

서쪽 풍향, 특히 서,서북서,북북서 방향은 미세먼지가 많음, 초미세먼지는 별로 관계 없음.

ggplot(climate_18all) + geom_rect(xmin=-Inf,xmax=Inf,ymin=35,ymax=75, fill='grey')+
  geom_point(aes(x=wind_name,y=pm2.5),color="red",alpha=0.5)

시간과 풍향의 변화추이

ggplot(climate_18all)+geom_point(aes(x=time,y=wind_name),color="blue",alpha=0.2)

측정지역은 년간 서북서, 서, 북서, 북풍이 많음, 서/북풍에 미세먼지가 많은 것이 아니라 원래 서/북풍이 많아 미세먼지 측정치도 많음 여름엔 동, 남풍이 있고, 가을, 겨울엔 적음
## 풍향 돗수 분석

ggplot(climate_18all)+geom_bar(aes(x=wind_name),fill="blue")

서북서 풍향이 가장 많음

지역별 미세먼지 현황

ggplot(air_hour_18n)+geom_rect(xmin=-Inf,xmax=Inf,ymin=80,ymax=150, fill='grey')+geom_point(aes(x=place_name1, y=pm10),color="blue", alpha=0.3)+coord_flip()

지역 차이를 명확히 보기 어려움. pm10이 나쁨 이상인 값만 모아서 볼 필요가 있음 미세먼지 나쁨 이상 지수의 데이터 셋 pm10_bad 생성함.

ggplot(pm10_bad)+geom_bar(aes(x=place_name1))+coord_flip()+labs(title = "미세먼지 나쁨 이상값(pm10 80이상)의 지역별 분포")

18년 미세먼지 나쁨 횟수가 가장 많은 지역은 영등포(가장 많음), 마포, 구로, 강동구이다.
이제 아주 나쁨이 많은 지역을 찾아본다.

 ggplot(pm10_verybad)+geom_bar(aes(x=place_name1) ,fill="slateblue4")+coord_flip()+labs(title = "미세먼지 아주 나쁨 이상값(pm10 150이상)의 지역별 분포")

미세먼지 아주 나쁨의 횟수가 많은 곳은 서초, 구로, 강동, 도봉구이다

ggplot(pm2.5_bad)+geom_bar(aes(x=place_name1) )+coord_flip()+labs(title = "초미세먼지  나쁨 이상(pm2.5 35이상)값의 지역별 분포")

초미세먼지가 나쁨 이상이 많은 곳은 은평, 영등포(가장 많음), 마포, 관악구이다.

ggplot(pm2.5_verybad)+geom_bar(aes(x=place_name1) ,fill="slateblue4")+coord_flip()+labs(title = "초미세먼지 아주 나쁨 이상(pm2.5 75이상)값의 지역별 분포")

초미세먼지 아주 나쁨 횟수가 가장 많은 곳은 영등포, 관악구이다. 서쪽 지역에 초미세먼지 나쁨 비중이 크다. 미세먼지 나쁨 횟수 순위와 초미세먼지 나쁨 횟수 순위는 지역 차이가 있다.