#H0: Chi so BMI không phu thuoc vao gioi tinh
#HA: Chi so BMI phu thuoc vao gioi tinh
# Nhap du lieu
setwd("C:/Users/Admin/Desktop/")
df <- read.csv("Book1.csv")
df
##    Gen Weight Height   BMI         TT Vong2 Vong3  WHR TyLeMo
## 1   Nu   42.0   1.50 18.70 BinhThuong  65.0  88.0 0.74   14.2
## 2   Nu   42.0   1.61 16.20   ThieuCan  62.0  86.0 0.72   13.5
## 3   Nu   40.0   1.51 17.45 BinhThuong  63.0  80.0 0.78   16.6
## 4   Nu   48.8   1.65 18.00   ThieuCan  64.0  89.0 0.72   16.9
## 5   Nu   49.0   1.58 19.60 BinhThuong  68.0  91.0 0.75   18.4
## 6   Nu   65.0   1.57 26.37 BinhThuong  83.0 103.0 0.81   36.0
## 7   Nu   51.7   1.56 21.20 BinhThuong  75.0  93.0 0.81   21.7
## 8   Nu   50.0   1.60 20.00 BinhThuong  67.0  90.0 0.74   23.6
## 9  Nam   55.0   1.72 18.70 BinhThuong  69.0  90.0 0.77    5.0
## 10  Nu   39.0   1.49 17.57   ThieuCan  62.0  82.0 0.76   20.2
## 11  Nu   41.6   1.57 16.90   ThieuCan  59.0  85.0 0.69   17.3
## 12  Nu   52.0   1.65 18.00 BinhThuong  67.0  95.0 0.71   26.4
## 13 Nam   50.0   1.63 18.82 BinhThuong  73.0  81.0 0.90    9.5
## 14 Nam   57.0   1.61 22.00 BinhThuong  79.0  94.0 0.84   14.5
## 15  Nu   46.0   1.54 19.52 BinhThuong  68.2  90.3 0.76   11.0
## 16  Nu   51.0   1.56 20.90 BinhThuong  70.0  90.0 0.78   23.9
## 17  Nu   45.0   1.52 19.40 BinhThuong  67.5  89.0 0.76   16.7
## Cac thong so Thong Ke Mo Ta ()
## Cua Nu
df_Nu = subset(df, Gen == "Nu")
df1<-subset(df_Nu, select = c(BMI,WHR,TyLeMo));
df_Nam=subset(df, Gen=="Nam")
df2<-subset(df_Nam, select = c(BMI,WHR,TyLeMo))
library(pastecs)
stat.desc(df1)
##                      BMI          WHR      TyLeMo
## nbr.val       14.0000000 14.000000000  14.0000000
## nbr.null       0.0000000  0.000000000   0.0000000
## nbr.na         0.0000000  0.000000000   0.0000000
## min           16.2000000  0.690000000  11.0000000
## max           26.3700000  0.810000000  36.0000000
## range         10.1700000  0.120000000  25.0000000
## sum          269.8100000 10.530000000 276.4000000
## median        19.0500000  0.755000000  17.8500000
## mean          19.2721429  0.752142857  19.7428571
## SE.mean        0.6724886  0.009502953   1.6999261
## CI.mean.0.95   1.4528232  0.020529883   3.6724671
## var            6.3313720  0.001264286  40.4564835
## std.dev        2.5162218  0.035556796   6.3605411
## coef.var       0.1305626  0.047273992   0.3221692
## Cua Nam
stat.desc(df2)
##                      BMI         WHR     TyLeMo
## nbr.val       3.00000000 3.000000000  3.0000000
## nbr.null      0.00000000 0.000000000  0.0000000
## nbr.na        0.00000000 0.000000000  0.0000000
## min          18.70000000 0.770000000  5.0000000
## max          22.00000000 0.900000000 14.5000000
## range         3.30000000 0.130000000  9.5000000
## sum          59.52000000 2.510000000 29.0000000
## median       18.82000000 0.840000000  9.5000000
## mean         19.84000000 0.836666667  9.6666667
## SE.mean       1.08055541 0.037564759  2.7436796
## CI.mean.0.95  4.64925470 0.161628112 11.8051005
## var           3.50280000 0.004233333 22.5833333
## std.dev       1.87157688 0.065064071  4.7521925
## coef.var      0.09433351 0.077765822  0.4916061
## Ma Tran Tuong Quan Nu

cor(df1, use="complete.obs")
##              BMI       WHR    TyLeMo
## BMI    1.0000000 0.7260252 0.7400967
## WHR    0.7260252 1.0000000 0.4012516
## TyLeMo 0.7400967 0.4012516 1.0000000
## Ma Tran Tuong Quan Nam
cor(df2, use="complete.obs")
##               BMI        WHR    TyLeMo
## BMI    1.00000000 0.07637198 0.8955381
## WHR    0.07637198 1.00000000 0.5120792
## TyLeMo 0.89553814 0.51207916 1.0000000
## Thong Ke Tan So
library(readxl)
Book1 <- read_excel("Book1.xlsx")
Book1
## # A tibble: 17 × 10
##    `Họ và tên`    `giới tính` `cân nặng (kg)` `chiều cao (m)`   BMI `Tình trạng`
##    <chr>          <chr>                 <dbl>           <dbl> <dbl> <chr>       
##  1 Huỳnh Thị Lệ … Nữ                     42              1.5   18.7 Bình thường 
##  2 Huỳnh Thị Diệ… Nữ                     42              1.61  16.2 Thiếu cân   
##  3 Nguyễn Thị Ki… Nữ                     40              1.51  17.4 Thiếu cân   
##  4 Nguyễn Hoàng … Nữ                     48.8            1.65  18   Thiếu cân   
##  5 Bùi Thị Hoàng… Nữ                     49              1.58  19.6 Bình thường 
##  6 Phạm Thị Ánh … Nữ                     65              1.57  26.4 Bình thường 
##  7 Phạm Thùy Linh Nữ                     51.7            1.56  21.2 Bình thường 
##  8 Trần Thị Than… Nữ                     50              1.6   20   Bình thường 
##  9 Nguyễn Tuấn K… Nam                    55              1.72  18.7 Bình thường 
## 10 Trần Thị Cẩm … Nữ                     39              1.49  17.6 Thiếu cân   
## 11 Tạ Ánh Nguyệt  Nữ                     41.6            1.57  16.9 Thiếu cân   
## 12 Ngô Nguyễn Hu… Nữ                     52              1.65  18   Bình thường 
## 13 Lê Chánh Tính  Nam                    50              1.63  18.8 Bình thường 
## 14 Trần Long Ẩn   Nam                    57              1.61  22   Bình thường 
## 15 Huỳnh Thị Hằn… Nữ                     46              1.54  19.5 Bình thường 
## 16 Phan Thị Tuyế… Nữ                     51              1.56  20.9 Bình thường 
## 17 Nguyễn Thị Bí… Nữ                     45              1.52  19.4 Bình thường 
## # ℹ 4 more variables: `vòng eo (cm)` <dbl>, `Vòng mông (cm)` <dbl>, WHR <dbl>,
## #   `tỉ lệ mỡ` <dbl>
table(Book1$`giới tính`,Book1$`Tình trạng`)
##      
##       Bình thường Thiếu cân
##   Nam           3         0
##   Nữ            9         5
X<-table(Book1$`Tình trạng`,Book1$`giới tính`)
#Kiem dinh tinh doc lap giua 2 bien dinh tinh
# Kiem dinh khi binh phuong (p>0.05=>H0=right=>DocLap)
chisq.test(X)
## Warning in chisq.test(X): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  X
## X-squared = 0.28502, df = 1, p-value = 0.5934
# Xet 2 bien WHR và BMI de Phan Tich tuong quan
# Ve Do Thi Phan Tan 

library(ggplot2)
library(ggpubr)
ggscatter(data=df,x="WHR",y="BMI")+geom_smooth(method = "lm", se=F)
## `geom_smooth()` using formula = 'y ~ x'

# Phan tich tuong quan (BacTuDo=df, p<0.05, DoTinCay, KhoangTinCay, HeSoTuongQuan)
WHR<-df$WHR
BMI<-df$BMI
cor.test(WHR, BMI, method="pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  WHR and BMI
## t = 2.2438, df = 15, p-value = 0.04037
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.02720124 0.79128252
## sample estimates:
##      cor 
## 0.501292
# 
ggscatter(data=df,x="WHR",y="BMI")+geom_smooth(method = "lm", se=F)+ stat_cor(method = "pearson",lable.x=3,lable.y=10,size=4,color="red")
## Warning in stat_cor(method = "pearson", lable.x = 3, lable.y = 10, size = 4, :
## Ignoring unknown parameters: `lable.x` and `lable.y`
## `geom_smooth()` using formula = 'y ~ x'