혈색소는 네이버 백과사전에 혈액이나 혈구 속에 존재하여 산소의 운반에 관여하는 물질이라고 정의 되어 있다. 콜레스테롤은 콜레스테롤이란 지방 성분의 일종으로 현재는 성인병을 일으키는 동맥 경화증의 원인 중 하나로 나쁜 의미로 많이 사용되고 있지만, 우리 몸이 유지되기 위해서 꼭 필요한 성분이라고 정의 되어있다. 계
아무런 상관이 없어 보이는 두 자료를 비교하여 무언가 새로운 상관관계가 나오지 않을까 하는 마음에 두 자료를 비교하여 보았다.
read.csv('./data/hi.csv', header=TRUE)
install.packages("tidyverse", repos="http://cran.us.r-project.org")
## Installing package into 'C:/Users/ohsan/Documents/R/win-library/3.5'
## (as 'lib' is unspecified)
## package 'tidyverse' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\ohsan\AppData\Local\Temp\RtmpGOH5V5\downloaded_packages
library(tidyverse)
## -- Attaching packages --------------------- tidyverse 1.2.1 --
## √ ggplot2 3.1.0 √ purrr 0.2.5
## √ tibble 1.4.2 √ dplyr 0.7.7
## √ tidyr 0.8.2 √ stringr 1.3.1
## √ readr 1.1.1 √ forcats 0.3.0
## -- Conflicts ------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
ggplot2::ggplot()
pie<- read.csv('./data/hi.csv', header=TRUE)
spa<- ggplot(data=pie)
spa+geom_smooth(mapping=aes(x=총콜레스테롤, y=혈색소), color="blue")
## `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'
## Warning: Removed 55 rows containing non-finite values (stat_smooth).
표를 보고 많이 생각을 해 보았지만 스스로 결론을 내리기에 두 자료는 전혀 연관성이 없다는 자료라는 것을 의미한다는 것을 알 수 있었다. 콜레스테롤 수치가 높아지더라도 혈색소 수치가 늘어나거나 줄어드는게 아닌 그냥 비슷한 수치를 유지하고 있는것을 표를 통해 알 수 있다.