R Notebook

This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

library(readr)
library(dplyr)
library(ggplot2) 
library(rmarkdown) 

library(readxl)
alos <- read_excel("C:/Users/thyagu/rmit/applied analytics/Assign2/average-length-of-stay-multilevel-data (2).xlsx",skip=12,col_names = TRUE)

Expecting logical in O30023 / R30023C15: got '‡'Expecting logical in O30024 / R30024C15: got '‡'Expecting logical in O30025 / R30025C15: got '‡'Expecting logical in O30026 / R30026C15: got '‡'Expecting logical in O30027 / R30027C15: got '‡'Expecting logical in O30028 / R30028C15: got '‡'New names:
* `` -> ...9
* `` -> ...11
* `` -> ...13
* `` -> ...15
* `` -> ...17
* ... and 1 more problem

alos <- alos %>% rename(Peer_group = `Peer group`)
alos <- alos %>% rename(Avg_len_stay = `Average length of stay (days)`)
alos$Avg_len_stay <- as.numeric(alos$Avg_len_stay)

NAs introduced by coercion

alos_df <- alos %>% select(Peer_group,Avg_len_stay)
alos_df <- alos_df %>% filter(Peer_group %in% c("Large hospitals","Medium hospitals"))
alos_df <- na.omit(alos_df)
alos_df$Peer_group <- factor(alos_df$Peer_group,ordered = FALSE)
knitr::kable(head(alos_df[52:58,]))

Peer_group	Avg_len_stay
Large hospitals	5.0
Large hospitals	4.8
Large hospitals	4.9
Medium hospitals	3.5
Medium hospitals	3.2
Medium hospitals	2.7


#outliers
summary(alos_df$Avg_len_stay)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.000   2.400   3.500   3.894   4.800  13.200

boxplot(alos_df$Avg_len_stay)
benchmark <- 4.800 + 1.5*IQR(alos_df$Avg_len_stay) #benchmark is 8.4
benchmark

[1] 8.4

dim(alos_df)

[1] 6593    2

head(alos_df,5)

class(alos_df$Avg_len_stay)

[1] "numeric"

alos_clean <- alos_df %>% filter(Avg_len_stay < benchmark)
alos_clean

dim(alos_clean)

[1] 6335    2

#Descriptive Statistics and Visualization
alos_Largehosp <- alos_clean %>% filter(Peer_group == "Large hospitals")
dim(alos_Largehosp)

[1] 4225    2

alos_Mediumhosp <- alos_clean %>% filter(Peer_group == "Medium hospitals")
dim(alos_Mediumhosp)

[1] 2110    2

hist(alos_Largehosp$Avg_len_stay,main = "Avg length of stay in days for Large hospitals",col = "green",xlab = "Avg length of stay",breaks = 20,xlim=c(0,10))

hist(alos_Mediumhosp$Avg_len_stay,main = "Avg length of stay in days for Medium hospitals",col = "blue",xlab = "Avg length of stay",breaks = 20,xlim=c(0,10))


summary_table <- alos_clean %>% group_by(Peer_group)  %>% summarise(Mean=mean(Avg_len_stay,na.rm=TRUE),
                                                                    Median=median(Avg_len_stay,na.rm=TRUE),
                                                                    IQR=IQR(Avg_len_stay,na.rm=TRUE),
                                                                    SD=sd(Avg_len_stay,na.rm=TRUE),
                                                                    Var=var(Avg_len_stay,na.rm=TRUE),
                                                                    Min=min(Avg_len_stay,na.rm=TRUE),
                                                                    Max=max(Avg_len_stay,na.rm=TRUE),
                                                                    Q1=quantile(Avg_len_stay,probs=.25,na.rm=TRUE),
                                                                    Q3=quantile(Avg_len_stay,probs=.75,na.rm=TRUE),
                                                                    n = n(),
                                                                    Missing = sum(is.na(Avg_len_stay)))
knitr::kable(summary_table,digits=round(1))

Peer_group	Mean	Median	IQR	SD	Var	Min	Max	Q1	Q3	n	Missing
Large hospitals	3.7	3.4	2.3	1.6	2.6	1.2	8.3	2.4	4.7	4225	0
Medium hospitals	3.5	3.3	1.9	1.5	2.2	1.0	8.3	2.4	4.3	2110	0


#Hypothesis testing(Normality test)

qqnorm(alos_Largehosp$Avg_len_stay)
qqline(alos_Largehosp$Avg_len_stay)


qqnorm(alos_Mediumhosp$Avg_len_stay)
qqline(alos_Mediumhosp$Avg_len_stay)


install.packages("car")

Error in install.packages : Updating loaded packages

library(car)
leveneTest(Avg_len_stay~Peer_group,data=alos_clean)

Levene's Test for Homogeneity of Variance (center = median)
        Df F value    Pr(>F)    
group    1  18.416 1.802e-05 ***
      6333                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

#0.00001802 

# unequal variance t-test
res <- t.test(Avg_len_stay~Peer_group,data=alos_clean,var.equal = FALSE, alternative = "two.sided")
res


    Welch Two Sample t-test

data:  Avg_len_stay by Peer_group
t = 5.9202, df = 4545.1, p-value = 3.453e-09
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1623117 0.3230370
sample estimates:
 mean in group Large hospitals mean in group Medium hospitals 
                      3.742864                       3.500190

# t value
round(res$statistic,2)

   t 
5.92

# df` degree of freedom
round(res$parameter)

  df 
4545

# p-value
(res$p.value)

[1] 3.453018e-09

# conf.int
round(res$conf.int,2)

[1] 0.16 0.32
attr(,"conf.level")
[1] 0.95

# sample estimates
round(res$estimate,2)

 mean in group Large hospitals mean in group Medium hospitals 
                          3.74                           3.50

Add a new chunk by clicking the Insert Chunk button on the toolbar or by pressing Ctrl+Alt+I.

When you save the notebook, an HTML file containing the code and output will be saved alongside it (click the Preview button or press Ctrl+Shift+K to preview the HTML file).

The preview shows you a rendered HTML copy of the contents of the editor. Consequently, unlike Knit, Preview does not run any R code chunks. Instead, the output of the chunk when it was last run in the editor is displayed.

LS0tDQp0aXRsZTogIlIgTm90ZWJvb2siDQpvdXRwdXQ6DQogIGh0bWxfbm90ZWJvb2s6IGRlZmF1bHQNCiAgaHRtbF9kb2N1bWVudDoNCiAgICBkZl9wcmludDogcGFnZWQNCiAgd29yZF9kb2N1bWVudDogZGVmYXVsdA0KLS0tDQoNClRoaXMgaXMgYW4gW1IgTWFya2Rvd25dKGh0dHA6Ly9ybWFya2Rvd24ucnN0dWRpby5jb20pIE5vdGVib29rLiBXaGVuIHlvdSBleGVjdXRlIGNvZGUgd2l0aGluIHRoZSBub3RlYm9vaywgdGhlIHJlc3VsdHMgYXBwZWFyIGJlbmVhdGggdGhlIGNvZGUuIA0KDQpUcnkgZXhlY3V0aW5nIHRoaXMgY2h1bmsgYnkgY2xpY2tpbmcgdGhlICpSdW4qIGJ1dHRvbiB3aXRoaW4gdGhlIGNodW5rIG9yIGJ5IHBsYWNpbmcgeW91ciBjdXJzb3IgaW5zaWRlIGl0IGFuZCBwcmVzc2luZyAqQ3RybCtTaGlmdCtFbnRlciouIA0KDQpgYGB7cn0NCmxpYnJhcnkocmVhZHIpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeShnZ3Bsb3QyKSANCmxpYnJhcnkocm1hcmtkb3duKSANCg0KbGlicmFyeShyZWFkeGwpDQphbG9zIDwtIHJlYWRfZXhjZWwoIkM6L1VzZXJzL3RoeWFndS9ybWl0L2FwcGxpZWQgYW5hbHl0aWNzL0Fzc2lnbjIvYXZlcmFnZS1sZW5ndGgtb2Ytc3RheS1tdWx0aWxldmVsLWRhdGEgKDIpLnhsc3giLHNraXA9MTIsY29sX25hbWVzID0gVFJVRSkNCmFsb3MgPC0gYWxvcyAlPiUgcmVuYW1lKFBlZXJfZ3JvdXAgPSBgUGVlciBncm91cGApDQphbG9zIDwtIGFsb3MgJT4lIHJlbmFtZShBdmdfbGVuX3N0YXkgPSBgQXZlcmFnZSBsZW5ndGggb2Ygc3RheSAoZGF5cylgKQ0KYWxvcyRBdmdfbGVuX3N0YXkgPC0gYXMubnVtZXJpYyhhbG9zJEF2Z19sZW5fc3RheSkNCmFsb3NfZGYgPC0gYWxvcyAlPiUgc2VsZWN0KFBlZXJfZ3JvdXAsQXZnX2xlbl9zdGF5KQ0KYWxvc19kZiA8LSBhbG9zX2RmICU+JSBmaWx0ZXIoUGVlcl9ncm91cCAlaW4lIGMoIkxhcmdlIGhvc3BpdGFscyIsIk1lZGl1bSBob3NwaXRhbHMiKSkNCmFsb3NfZGYgPC0gbmEub21pdChhbG9zX2RmKQ0KYWxvc19kZiRQZWVyX2dyb3VwIDwtIGZhY3RvcihhbG9zX2RmJFBlZXJfZ3JvdXAsb3JkZXJlZCA9IEZBTFNFKQ0Ka25pdHI6OmthYmxlKGhlYWQoYWxvc19kZls1Mjo1OCxdKSkgDQoNCiNvdXRsaWVycw0Kc3VtbWFyeShhbG9zX2RmJEF2Z19sZW5fc3RheSkNCmJveHBsb3QoYWxvc19kZiRBdmdfbGVuX3N0YXkpDQpiZW5jaG1hcmsgPC0gNC44MDAgKyAxLjUqSVFSKGFsb3NfZGYkQXZnX2xlbl9zdGF5KSAjYmVuY2htYXJrIGlzIDguNA0KYmVuY2htYXJrIA0KZGltKGFsb3NfZGYpDQpoZWFkKGFsb3NfZGYsNSkNCmNsYXNzKGFsb3NfZGYkQXZnX2xlbl9zdGF5KQ0KYWxvc19jbGVhbiA8LSBhbG9zX2RmICU+JSBmaWx0ZXIoQXZnX2xlbl9zdGF5IDwgYmVuY2htYXJrKQ0KYWxvc19jbGVhbg0KZGltKGFsb3NfY2xlYW4pICANCg0KI0Rlc2NyaXB0aXZlIFN0YXRpc3RpY3MgYW5kIFZpc3VhbGl6YXRpb24NCmFsb3NfTGFyZ2Vob3NwIDwtIGFsb3NfY2xlYW4gJT4lIGZpbHRlcihQZWVyX2dyb3VwID09ICJMYXJnZSBob3NwaXRhbHMiKQ0KZGltKGFsb3NfTGFyZ2Vob3NwKQ0KYWxvc19NZWRpdW1ob3NwIDwtIGFsb3NfY2xlYW4gJT4lIGZpbHRlcihQZWVyX2dyb3VwID09ICJNZWRpdW0gaG9zcGl0YWxzIikNCmRpbShhbG9zX01lZGl1bWhvc3ApDQoNCg0KaGlzdChhbG9zX0xhcmdlaG9zcCRBdmdfbGVuX3N0YXksbWFpbiA9ICJBdmcgbGVuZ3RoIG9mIHN0YXkgaW4gZGF5cyBmb3IgTGFyZ2UgaG9zcGl0YWxzIixjb2wgPSAiZ3JlZW4iLHhsYWIgPSAiQXZnIGxlbmd0aCBvZiBzdGF5IixicmVha3MgPSAyMCx4bGltPWMoMCwxMCkpDQoNCmhpc3QoYWxvc19NZWRpdW1ob3NwJEF2Z19sZW5fc3RheSxtYWluID0gIkF2ZyBsZW5ndGggb2Ygc3RheSBpbiBkYXlzIGZvciBNZWRpdW0gaG9zcGl0YWxzIixjb2wgPSAiYmx1ZSIseGxhYiA9ICJBdmcgbGVuZ3RoIG9mIHN0YXkiLGJyZWFrcyA9IDIwLHhsaW09YygwLDEwKSkNCg0Kc3VtbWFyeV90YWJsZSA8LSBhbG9zX2NsZWFuICU+JSBncm91cF9ieShQZWVyX2dyb3VwKSAgJT4lIHN1bW1hcmlzZShNZWFuPW1lYW4oQXZnX2xlbl9zdGF5LG5hLnJtPVRSVUUpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBNZWRpYW49bWVkaWFuKEF2Z19sZW5fc3RheSxuYS5ybT1UUlVFKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgSVFSPUlRUihBdmdfbGVuX3N0YXksbmEucm09VFJVRSksDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIFNEPXNkKEF2Z19sZW5fc3RheSxuYS5ybT1UUlVFKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgVmFyPXZhcihBdmdfbGVuX3N0YXksbmEucm09VFJVRSksDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIE1pbj1taW4oQXZnX2xlbl9zdGF5LG5hLnJtPVRSVUUpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBNYXg9bWF4KEF2Z19sZW5fc3RheSxuYS5ybT1UUlVFKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgUTE9cXVhbnRpbGUoQXZnX2xlbl9zdGF5LHByb2JzPS4yNSxuYS5ybT1UUlVFKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgUTM9cXVhbnRpbGUoQXZnX2xlbl9zdGF5LHByb2JzPS43NSxuYS5ybT1UUlVFKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgbiA9IG4oKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgTWlzc2luZyA9IHN1bShpcy5uYShBdmdfbGVuX3N0YXkpKSkNCmtuaXRyOjprYWJsZShzdW1tYXJ5X3RhYmxlLGRpZ2l0cz1yb3VuZCgxKSkgIA0KDQojSHlwb3RoZXNpcyB0ZXN0aW5nKE5vcm1hbGl0eSB0ZXN0KQ0KDQpxcW5vcm0oYWxvc19MYXJnZWhvc3AkQXZnX2xlbl9zdGF5KQ0KcXFsaW5lKGFsb3NfTGFyZ2Vob3NwJEF2Z19sZW5fc3RheSkgDQoNCnFxbm9ybShhbG9zX01lZGl1bWhvc3AkQXZnX2xlbl9zdGF5KQ0KcXFsaW5lKGFsb3NfTWVkaXVtaG9zcCRBdmdfbGVuX3N0YXkpDQoNCmluc3RhbGwucGFja2FnZXMoImNhciIpDQpsaWJyYXJ5KGNhcikNCmxldmVuZVRlc3QoQXZnX2xlbl9zdGF5flBlZXJfZ3JvdXAsZGF0YT1hbG9zX2NsZWFuKQ0KIzAuMDAwMDE4MDIgDQoNCiMgdW5lcXVhbCB2YXJpYW5jZSB0LXRlc3QNCnJlcyA8LSB0LnRlc3QoQXZnX2xlbl9zdGF5flBlZXJfZ3JvdXAsZGF0YT1hbG9zX2NsZWFuLHZhci5lcXVhbCA9IEZBTFNFLCBhbHRlcm5hdGl2ZSA9ICJ0d28uc2lkZWQiKQ0KcmVzIA0KDQojIHQgdmFsdWUNCnJvdW5kKHJlcyRzdGF0aXN0aWMsMikNCg0KDQojIGRmYCBkZWdyZWUgb2YgZnJlZWRvbQ0Kcm91bmQocmVzJHBhcmFtZXRlcikgDQoNCiMgcC12YWx1ZQ0KKHJlcyRwLnZhbHVlKQ0KDQojIGNvbmYuaW50DQpyb3VuZChyZXMkY29uZi5pbnQsMikgDQoNCiMgc2FtcGxlIGVzdGltYXRlcw0Kcm91bmQocmVzJGVzdGltYXRlLDIpDQoNCg0KDQoNCmBgYA0KDQpBZGQgYSBuZXcgY2h1bmsgYnkgY2xpY2tpbmcgdGhlICpJbnNlcnQgQ2h1bmsqIGJ1dHRvbiBvbiB0aGUgdG9vbGJhciBvciBieSBwcmVzc2luZyAqQ3RybCtBbHQrSSouDQoNCldoZW4geW91IHNhdmUgdGhlIG5vdGVib29rLCBhbiBIVE1MIGZpbGUgY29udGFpbmluZyB0aGUgY29kZSBhbmQgb3V0cHV0IHdpbGwgYmUgc2F2ZWQgYWxvbmdzaWRlIGl0IChjbGljayB0aGUgKlByZXZpZXcqIGJ1dHRvbiBvciBwcmVzcyAqQ3RybCtTaGlmdCtLKiB0byBwcmV2aWV3IHRoZSBIVE1MIGZpbGUpLg0KDQpUaGUgcHJldmlldyBzaG93cyB5b3UgYSByZW5kZXJlZCBIVE1MIGNvcHkgb2YgdGhlIGNvbnRlbnRzIG9mIHRoZSBlZGl0b3IuIENvbnNlcXVlbnRseSwgdW5saWtlICpLbml0KiwgKlByZXZpZXcqIGRvZXMgbm90IHJ1biBhbnkgUiBjb2RlIGNodW5rcy4gSW5zdGVhZCwgdGhlIG91dHB1dCBvZiB0aGUgY2h1bmsgd2hlbiBpdCB3YXMgbGFzdCBydW4gaW4gdGhlIGVkaXRvciBpcyBkaXNwbGF5ZWQuDQo=