#H0: Chi so BMI không phu thuoc vao gioi tinh
#HA: Chi so BMI phu thuoc vao gioi tinh
# Nhap du lieu
setwd("C:/Users/Admin/Desktop/")
df <- read.csv("Book1.csv")
df
## Gen Weight Height BMI TT Vong2 Vong3 WHR TyLeMo
## 1 Nu 42.0 1.50 18.70 BinhThuong 65.0 88.0 0.74 14.2
## 2 Nu 42.0 1.61 16.20 ThieuCan 62.0 86.0 0.72 13.5
## 3 Nu 40.0 1.51 17.45 BinhThuong 63.0 80.0 0.78 16.6
## 4 Nu 48.8 1.65 18.00 ThieuCan 64.0 89.0 0.72 16.9
## 5 Nu 49.0 1.58 19.60 BinhThuong 68.0 91.0 0.75 18.4
## 6 Nu 65.0 1.57 26.37 BinhThuong 83.0 103.0 0.81 36.0
## 7 Nu 51.7 1.56 21.20 BinhThuong 75.0 93.0 0.81 21.7
## 8 Nu 50.0 1.60 20.00 BinhThuong 67.0 90.0 0.74 23.6
## 9 Nam 55.0 1.72 18.70 BinhThuong 69.0 90.0 0.77 5.0
## 10 Nu 39.0 1.49 17.57 ThieuCan 62.0 82.0 0.76 20.2
## 11 Nu 41.6 1.57 16.90 ThieuCan 59.0 85.0 0.69 17.3
## 12 Nu 52.0 1.65 18.00 BinhThuong 67.0 95.0 0.71 26.4
## 13 Nam 50.0 1.63 18.82 BinhThuong 73.0 81.0 0.90 9.5
## 14 Nam 57.0 1.61 22.00 BinhThuong 79.0 94.0 0.84 14.5
## 15 Nu 46.0 1.54 19.52 BinhThuong 68.2 90.3 0.76 11.0
## 16 Nu 51.0 1.56 20.90 BinhThuong 70.0 90.0 0.78 23.9
## 17 Nu 45.0 1.52 19.40 BinhThuong 67.5 89.0 0.76 16.7
## Cac thong so Thong Ke Mo Ta ()
## Cua Nu
df_Nu = subset(df, Gen == "Nu")
df1<-subset(df_Nu, select = c(BMI,WHR,TyLeMo));
df_Nam=subset(df, Gen=="Nam")
df2<-subset(df_Nam, select = c(BMI,WHR,TyLeMo))
library(pastecs)
stat.desc(df1)
## BMI WHR TyLeMo
## nbr.val 14.0000000 14.000000000 14.0000000
## nbr.null 0.0000000 0.000000000 0.0000000
## nbr.na 0.0000000 0.000000000 0.0000000
## min 16.2000000 0.690000000 11.0000000
## max 26.3700000 0.810000000 36.0000000
## range 10.1700000 0.120000000 25.0000000
## sum 269.8100000 10.530000000 276.4000000
## median 19.0500000 0.755000000 17.8500000
## mean 19.2721429 0.752142857 19.7428571
## SE.mean 0.6724886 0.009502953 1.6999261
## CI.mean.0.95 1.4528232 0.020529883 3.6724671
## var 6.3313720 0.001264286 40.4564835
## std.dev 2.5162218 0.035556796 6.3605411
## coef.var 0.1305626 0.047273992 0.3221692
## Cua Nam
stat.desc(df2)
## BMI WHR TyLeMo
## nbr.val 3.00000000 3.000000000 3.0000000
## nbr.null 0.00000000 0.000000000 0.0000000
## nbr.na 0.00000000 0.000000000 0.0000000
## min 18.70000000 0.770000000 5.0000000
## max 22.00000000 0.900000000 14.5000000
## range 3.30000000 0.130000000 9.5000000
## sum 59.52000000 2.510000000 29.0000000
## median 18.82000000 0.840000000 9.5000000
## mean 19.84000000 0.836666667 9.6666667
## SE.mean 1.08055541 0.037564759 2.7436796
## CI.mean.0.95 4.64925470 0.161628112 11.8051005
## var 3.50280000 0.004233333 22.5833333
## std.dev 1.87157688 0.065064071 4.7521925
## coef.var 0.09433351 0.077765822 0.4916061
## Ma Tran Tuong Quan Nu
cor(df1, use="complete.obs")
## BMI WHR TyLeMo
## BMI 1.0000000 0.7260252 0.7400967
## WHR 0.7260252 1.0000000 0.4012516
## TyLeMo 0.7400967 0.4012516 1.0000000
## Ma Tran Tuong Quan Nam
cor(df2, use="complete.obs")
## BMI WHR TyLeMo
## BMI 1.00000000 0.07637198 0.8955381
## WHR 0.07637198 1.00000000 0.5120792
## TyLeMo 0.89553814 0.51207916 1.0000000
## Thong Ke Tan So
library(readxl)
Book1 <- read_excel("Book1.xlsx")
Book1
## # A tibble: 17 × 10
## `Họ và tên` `giới tính` `cân nặng (kg)` `chiều cao (m)` BMI `Tình trạng`
## <chr> <chr> <dbl> <dbl> <dbl> <chr>
## 1 Huỳnh Thị Lệ … Nữ 42 1.5 18.7 Bình thường
## 2 Huỳnh Thị Diệ… Nữ 42 1.61 16.2 Thiếu cân
## 3 Nguyễn Thị Ki… Nữ 40 1.51 17.4 Thiếu cân
## 4 Nguyễn Hoàng … Nữ 48.8 1.65 18 Thiếu cân
## 5 Bùi Thị Hoàng… Nữ 49 1.58 19.6 Bình thường
## 6 Phạm Thị Ánh … Nữ 65 1.57 26.4 Bình thường
## 7 Phạm Thùy Linh Nữ 51.7 1.56 21.2 Bình thường
## 8 Trần Thị Than… Nữ 50 1.6 20 Bình thường
## 9 Nguyễn Tuấn K… Nam 55 1.72 18.7 Bình thường
## 10 Trần Thị Cẩm … Nữ 39 1.49 17.6 Thiếu cân
## 11 Tạ Ánh Nguyệt Nữ 41.6 1.57 16.9 Thiếu cân
## 12 Ngô Nguyễn Hu… Nữ 52 1.65 18 Bình thường
## 13 Lê Chánh Tính Nam 50 1.63 18.8 Bình thường
## 14 Trần Long Ẩn Nam 57 1.61 22 Bình thường
## 15 Huỳnh Thị Hằn… Nữ 46 1.54 19.5 Bình thường
## 16 Phan Thị Tuyế… Nữ 51 1.56 20.9 Bình thường
## 17 Nguyễn Thị Bí… Nữ 45 1.52 19.4 Bình thường
## # ℹ 4 more variables: `vòng eo (cm)` <dbl>, `Vòng mông (cm)` <dbl>, WHR <dbl>,
## # `tỉ lệ mỡ` <dbl>
table(Book1$`giới tính`,Book1$`Tình trạng`)
##
## Bình thường Thiếu cân
## Nam 3 0
## Nữ 9 5
X<-table(Book1$`Tình trạng`,Book1$`giới tính`)
#Kiem dinh tinh doc lap giua 2 bien dinh tinh
# Kiem dinh khi binh phuong (p>0.05=>H0=right=>DocLap)
chisq.test(X)
## Warning in chisq.test(X): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: X
## X-squared = 0.28502, df = 1, p-value = 0.5934
# Xet 2 bien WHR và BMI de Phan Tich tuong quan
# Ve Do Thi Phan Tan
library(ggplot2)
library(ggpubr)
ggscatter(data=df,x="WHR",y="BMI")+geom_smooth(method = "lm", se=F)
## `geom_smooth()` using formula = 'y ~ x'

# Phan tich tuong quan (BacTuDo=df, p<0.05, DoTinCay, KhoangTinCay, HeSoTuongQuan)
WHR<-df$WHR
BMI<-df$BMI
cor.test(WHR, BMI, method="pearson")
##
## Pearson's product-moment correlation
##
## data: WHR and BMI
## t = 2.2438, df = 15, p-value = 0.04037
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.02720124 0.79128252
## sample estimates:
## cor
## 0.501292
#
ggscatter(data=df,x="WHR",y="BMI")+geom_smooth(method = "lm", se=F)+ stat_cor(method = "pearson",lable.x=3,lable.y=10,size=4,color="red")
## Warning in stat_cor(method = "pearson", lable.x = 3, lable.y = 10, size = 4, :
## Ignoring unknown parameters: `lable.x` and `lable.y`
## `geom_smooth()` using formula = 'y ~ x'
