Eksplorasi Data (corn)

Author

Marcell Chandra

Data ‘corn’

library (wooldridge)
data("corn")

#Modul 1-7#

str(corn)
'data.frame':   37 obs. of  5 variables:
 $ county : int  1 2 3 4 4 5 5 5 6 6 ...
 $ cornhec: num  165.8 96.3 76.1 185.4 116.4 ...
 $ soyhec : num  8.09 106.03 103.6 6.47 63.82 ...
 $ cornpix: int  374 209 253 432 367 361 288 369 206 316 ...
 $ soypix : int  55 218 250 96 178 137 206 165 218 221 ...
 - attr(*, "time.stamp")= chr "25 Jun 2011 23:03"
summary(corn)
     county          cornhec           soyhec          cornpix     
 Min.   : 1.000   Min.   : 64.75   Min.   :  6.47   Min.   :145.0  
 1st Qu.: 6.000   1st Qu.: 96.32   1st Qu.: 76.49   1st Qu.:246.0  
 Median : 9.000   Median :116.43   Median :102.59   Median :295.0  
 Mean   : 8.243   Mean   :120.43   Mean   : 96.35   Mean   :297.4  
 3rd Qu.:11.000   3rd Qu.:140.43   3rd Qu.:124.44   3rd Qu.:353.0  
 Max.   :12.000   Max.   :206.39   Max.   :174.34   Max.   :459.0  
     soypix     
 Min.   : 55.0  
 1st Qu.:167.0  
 Median :206.0  
 Mean   :203.3  
 3rd Qu.:249.0  
 Max.   :345.0  

Boxplot

boxplot(corn)

Barplot

dt_crn_county <- table(corn$county)
barplot(dt_crn_county, main = "Distribusi Frekuensi County",
        xlab = "County", ylab = "Frekuensi")

dt_crn_cornhec <- table(corn$cornhec)
barplot(dt_crn_cornhec, main = "Distribusi Frekuensi Cornhec",
        xlab = "Cornhec", ylab = "Frekuensi")

dt_crn_soyhec <- table(corn$soyhec)
barplot(dt_crn_soyhec, main = "Distribusi Frekuensi Soyhec",
        xlab = "Soyhec", ylab = "Frekuensi")

dt_crn_cornpix <- table(corn$cornpix)
barplot(dt_crn_cornpix, main = "Distribusi Frekuensi Cornpix",
        xlab = "Cornpix", ylab = "Frekuensi")

dt_crn_soypix <- table(corn$soypix)
barplot(dt_crn_soypix, main = "Distribusi Frekuensi Soypix",
        xlab = "Soypix", ylab = "Frekuensi")

Mean, Median, Modus, Kuartil, Desil, Persentil, Variansi, Standart Deviasi

County

‘Mean’

mean_cnty <- mean(corn$county)
mean_cnty
[1] 8.243243

‘Median’

median_cnty <- median(corn$county)
median_cnty
[1] 9

‘Modus’

freq1 <- table(corn$county)
modus_cnty <- names(freq1 [which.max(freq1)])
modus_cnty
[1] "12"

‘Kuartil’

kuartil_cnty <- quantile(corn$county)
kuartil_cnty
  0%  25%  50%  75% 100% 
   1    6    9   11   12 

‘Desil 0.9’

desil_cnty <- quantile(corn$county, probs = c(0.9))
desil_cnty
90% 
 12 

‘Persentil 0.45’

persentil_cnty <- quantile(corn$county, probs = c(0.45))
persentil_cnty
45% 
8.2 

‘Variansi’

var(corn$county)
[1] 9.633634

‘Standard Deviasi’

sd(corn$county)
[1] 3.10381
Cornhec

‘Mean’

mean_cnhc <- mean(corn$cornhec)
mean_cnhc
[1] 120.4324

‘Median’

median_cnhc <- median(corn$cornhec)
median_cnhc
[1] 116.43

‘Modus’

freq2 <- table(corn$cornhec)
modus_cnhc <- names(freq2 [which.max(freq2)])
modus_cnhc
[1] "88.5899963378906"

‘Kuartil’

kuartil_cnhc <- quantile(corn$cornhec)
kuartil_cnhc
    0%    25%    50%    75%   100% 
 64.75  96.32 116.43 140.43 206.39 

‘Desil 0.9’

desil_cnhc <- quantile(corn$cornhec, probs = c(0.9))
desil_cnhc
    90% 
163.388 

‘Persentil 0.45’

persentil_cnhc <- quantile(corn$cornhec, probs = c(0.45))
persentil_cnhc
    45% 
110.752 

‘Variansi’

var(corn$cornhec)
[1] 1066.472

‘Standard Deviasi’

sd(corn$cornhec)
[1] 32.65688
Soyhec

‘Mean’

mean_syhc <- mean(corn$soyhec)
mean_syhc
[1] 96.34595

‘Median’

median_syhc <- median(corn$soyhec)
median_syhc
[1] 102.59

‘Modus’

freq3 <- table(corn$soyhec)
modus_syhc <- names(freq3 [which.max(freq3)])
modus_syhc
[1] "99.1500015258789"

‘Kuartil’

kuartil_syhc <- quantile(corn$soyhec)
kuartil_syhc
    0%    25%    50%    75%   100% 
  6.47  76.49 102.59 124.44 174.34 

‘Desil 0.9’

desil_syhc <- quantile(corn$soyhec, probs = c(0.9))
desil_syhc
    90% 
143.348 

‘Persentil 0.45’

persentil_syhc <- quantile(corn$soyhec, probs = c(0.45))
persentil_syhc
  45% 
99.15 

‘Variansi’

var(corn$soyhec)
[1] 1537.848

‘Standard Deviasi’

sd(corn$soyhec)
[1] 39.2154
Cornpix

‘Mean’

mean_cnpx <- mean(corn$cornpix)
mean_cnpx
[1] 297.4054

‘Median’

median_cnpx <- median(corn$cornpix)
median_cnpx
[1] 295

‘Modus’

freq4 <- table(corn$cornpix)
modus_cnpx <- names(freq4 [which.max(freq4)])
modus_cnpx
[1] "206"

‘Kuartil’

kuartil_cnpx <- quantile(corn$cornpix)
kuartil_cnpx
  0%  25%  50%  75% 100% 
 145  246  295  353  459 

‘Desil 0.9’

desil_cnpx <- quantile(corn$cornpix, probs = c(0.9))
desil_cnpx
90% 
369 

‘Persentil 0.45’

persentil_cnpx <- quantile(corn$cornpix, probs = c(0.45))
persentil_cnpx
  45% 
293.2 

‘Variansi’

var(corn$cornpix)
[1] 4948.47

‘Standard Deviasi’

sd(corn$cornpix)
[1] 70.34536
Soypix

‘Mean’

mean_sypx <- mean(corn$soypix)
mean_sypx
[1] 203.3243

‘Median’

median_sypx <- median(corn$soypix)
median_sypx
[1] 206

‘Modus’

freq5 <- table(corn$soypix)
modus_sypx <- names(freq5 [which.max(freq5)])
modus_sypx
[1] "221"

‘Kuartil’

kuartil_sypx <- quantile(corn$soypix)
kuartil_sypx
  0%  25%  50%  75% 100% 
  55  167  206  249  345 

‘Desil 0.9’

desil_sypx <- quantile(corn$soypix, probs = c(0.9))
desil_sypx
  90% 
283.2 

‘Persentil 0.45’

persentil_sypx <- quantile(corn$soypix, probs = c(0.45))
persentil_sypx
  45% 
193.6 

‘Variansi’

var(corn$soypix)
[1] 4546.447

‘Standard Deviasi’

sd(corn$soypix)
[1] 67.42735

Plot

plot(corn$county, main = "Plot County",
     xlab = "County", ylab = "Frekuensi", type ="l", col="green")

plot(corn$cornhec, main = "Plot Cornhec",
     xlab = "Cornhec", ylab = "Frekuensi", type ="l", col="green")

plot(corn$soyhec, main = "Plot Soyhec",
     xlab = "Soyhec", ylab = "Frekuensi", type ="l", col="green")

plot(corn$cornpix, main = "Plot Cornpix",
     xlab = "Cornpix", ylab = "Frekuensi", type ="l", col="green")

plot(corn$soypix, main = "Plot Soypix",
     xlab = "Soypix", ylab = "Frekuensi", type ="l", col="green")

Visual QQ Plot

‘Hist’

par(mfrow=c(1,3))
hist(corn$county)

Penjelasan :

- Histogram menunjukkan distribusi yang miring ke kiri (negatively skewed).

- Sebagian besar data terkonsentrasi di bagian kanan histogram.

- Ada beberapa nilai ekstrem di bagian kiri (ekor kiri lebih panjang).

hist(corn$cornhec)

Penjelasan :

- Histogram menunjukkan distribusi yang miring ke kanan (positively skewed).

- Sebagian besar data terkonsentrasi di bagian kiri histogram.

- Ada beberapa nilai ekstrem di bagian kanan (ekor kanan lebih panjang).

hist(corn$soyhec)

Penjelasan :

- Histogram menunjukkan distribusi yang sedikit miring ke kiri.

- Sebagian besar data terkonsentrasi di sekitar nilai tengah dengan beberapa data di bagian kiri.

hist(corn$cornpix)

Penjelasan :

- Histogram menunjukkan distribusi yang hampir simetris (mendekati normal).

- Sebagian besar data terkonsentrasi di sekitar nilai tengah.

- Ekor kanan sedikit lebih panjang tetapi perbedaan ini sangat kecil.

hist(corn$soypix)

Penjelasan :

- Histogram menunjukkan distribusi yang hampir simetris dengan sedikit kemiringan ke kiri (mendekati normal).

- Sebagian besar data terkonsentrasi di sekitar nilai tengah.

- Ekor kiri sedikit lebih panjang tetapi perbedaan ini sangat kecil.

QQ Plot

County
qqnorm(corn$county, main="County Plot")
qqline(corn$county)

Penjelasan :

QQ Plot untuk ‘county’ menunjukkan bahwa titik-titik data mengikuti garis normal dengan sedikit penyimpangan terutama di bagian ekor kiri, ini menunjukkan bahwa data memiliki skewness negatif. Data cenderung memiliki distribusi yang lebih banyak di sisi kanan dengan ekor panjang di sisi kiri.

Cornhec
qqnorm(corn$cornhec,main="Cornhec Plot")
qqline(corn$cornhec)

Penjelasan :

QQ Plot untuk ‘cornhec’ menunjukkan bahwa titik-titik data umumnya mengikuti garis normal dengan penyimpangan kecil terutama di bagian ekor kanan, ini menunjukkan bahwa data memiliki skewness positif. Data cenderung memiliki distribusi yang lebih padat di sisi kiri dengan ekor panjang di sisi kanan.

Soyhec
qqnorm(corn$soyhec,main="Soyhec Plot")
qqline(corn$soyhec)

Penjelasan :

QQ Plot untuk ‘soyhec’ menunjukkan bahwa titik-titik data mengikuti garis normal dengan beberapa penyimpangan di ekor kiri, ini menunjukkan bahwa data memiliki skewness negatif. Data cenderung memiliki distribusi yang lebih banyak di sisi kanan dengan ekor panjang di sisi kiri.

Cornpix
qqnorm(corn$cornpix,main="Cornpix Plot")
qqline(corn$cornpix)

Penjelasan :

QQ Plot untuk ‘cornpix’ menunjukkan bahwa titik-titik data hampir mengikuti garis normal dengan sedikit penyimpangan, ini menunjukkan bahwa data mendekati distribusi normal.

Soypix
qqnorm(corn$soypix,main="Soypix Plot")
qqline(corn$soypix)

Penjelasan :

QQ Plot untuk ‘soypix’ menunjukkan bahwa titik-titik data hampir mengikuti garis normal dengan sedikit penyimpangan, ini menunjukkan bahwa data mendekati distribusi normal.

Statistical Test

Skewness

skewness(corn$county)
[1] -0.5519217

Penjelasan :

Nilai skewness negatif menunjukkan bahwa distribusi data untuk ‘county’ miring ke kiri. Ini berarti bahwa sebagian besar data terpusat di sekitar nilai yang lebih tinggi, dan ekor distribusi memanjang ke arah nilai yang lebih rendah.

skewness(corn$cornhec)
[1] 0.6153242

Penjelasan :

Nilai skewness positif menunjukkan bahwa distribusi data untuk ‘cornhec’ miring ke kanan. Ini berarti bahwa sebagian besar data terpusat di sekitar nilai yang lebih rendah, dan ekor distribusi memanjang ke arah nilai yang lebih tinggi.

skewness(corn$soyhec)
[1] -0.5205229

Penjelasan :

Nilai skewness negatif menunjukkan bahwa distribusi data untuk ‘soyhec’ miring ke kiri. Ini berarti bahwa sebagian besar data terpusat di sekitar nilai yang lebih tinggi, dengan ekor distribusi memanjang ke arah nilai yang lebih rendah.

skewness(corn$cornpix)
[1] 0.0291665

Penjelasan :

Nilai skewness yang mendekati nol menunjukkan bahwa distribusi data untuk ‘cornpix’ hampir simetris. Ini berarti bahwa data terdistribusi secara merata di sekitar nilai rata-rata, tanpa kecenderungan miring yang signifikan.

skewness(corn$soypix)
[1] -0.07870076

Penjelasan :

Nilai skewness yang mendekati nol menunjukkan bahwa distribusi data untuk ‘soypix’ juga hampir simetris. Ini berarti bahwa data terdistribusi secara merata di sekitar nilai rata-rata, tanpa kecenderungan miring yang signifikan.

Test Hypotesis

Shapiro-Wilk

shapiro.test(corn$county)

    Shapiro-Wilk normality test

data:  corn$county
W = 0.92694, p-value = 0.01803

Penjelasan :

Nilai p = 0.01803. Karena p-value < 0.05, kita menolak hipotesis nol bahwa data ‘county’ berasal dari distribusi normal.

Kesimpulan: Data ‘county’ tidak dapat dianggap berasal dari distribusi normal. Ada bukti yang cukup untuk menolak hipotesis nol bahwa data mengikuti distribusi normal.

shapiro.test(corn$cornhec)

    Shapiro-Wilk normality test

data:  corn$cornhec
W = 0.95814, p-value = 0.1763

Penjelasan :

Nilai p = 0.1763. Karena p-value > 0.05, kita tidak memiliki bukti yang cukup untuk menolak hipotesis nol bahwa data ‘cornhec’ berasal dari distribusi normal.

Kesimpulan: Data ‘cornhec’ dapat dianggap berasal dari distribusi normal. Tidak ada bukti yang cukup untuk menolak hipotesis nol bahwa data mengikuti distribusi normal.

shapiro.test(corn$soyhec)

    Shapiro-Wilk normality test

data:  corn$soyhec
W = 0.95895, p-value = 0.1872

Penjelasan :

Nilai p = 0.1872. Karena p-value > 0.05, kita tidak memiliki bukti yang cukup untuk menolak hipotesis nol bahwa data ‘soyhec’ berasal dari distribusi normal.

Kesimpulan: Data ‘soyhec’ dapat dianggap berasal dari distribusi normal. Tidak ada bukti yang cukup untuk menolak hipotesis nol bahwa data mengikuti distribusi normal.

shapiro.test(corn$cornpix)

    Shapiro-Wilk normality test

data:  corn$cornpix
W = 0.97908, p-value = 0.6995

Penjelasan :

Nilai p = 0.6995. Karena p-value > 0.05, kita tidak memiliki bukti yang cukup untuk menolak hipotesis nol bahwa data ‘cornpix’ berasal dari distribusi normal.

Kesimpulan: Data ‘cornpix’ dapat dianggap berasal dari distribusi normal. Tidak ada bukti yang cukup untuk menolak hipotesis nol bahwa data mengikuti distribusi normal.

shapiro.test(corn$soypix)

    Shapiro-Wilk normality test

data:  corn$soypix
W = 0.98303, p-value = 0.8319

Penjelasan :

Nilai p = 0.8319. Karena p-value > 0.05, kita tidak memiliki bukti yang cukup untuk menolak hipotesis nol bahwa data ‘soypix’ berasal dari distribusi normal.

Kesimpulan: Data ‘soypix’ dapat dianggap berasal dari distribusi normal. Tidak ada bukti yang cukup untuk menolak hipotesis nol bahwa data mengikuti distribusi normal.

Estimasi

favstats(~county,data=corn)
 min Q1 median Q3 max     mean      sd  n missing
   1  6      9 11  12 8.243243 3.10381 37       0
favstats(~cornhec,data=corn)
   min    Q1 median     Q3    max     mean       sd  n missing
 64.75 96.32 116.43 140.43 206.39 120.4324 32.65688 37       0
favstats(~soyhec,data=corn)
  min    Q1 median     Q3    max     mean      sd  n missing
 6.47 76.49 102.59 124.44 174.34 96.34595 39.2154 37       0
favstats(~cornpix,data=corn)
 min  Q1 median  Q3 max     mean       sd  n missing
 145 246    295 353 459 297.4054 70.34536 37       0
favstats(~soypix,data=corn)
 min  Q1 median  Q3 max     mean       sd  n missing
  55 167    206 249 345 203.3243 67.42735 37       0
srs_corn <- popsamp(30, corn)
srs_corn
   county cornhec soyhec cornpix soypix
6       5  162.08  43.50     361    137
37     12  157.70  94.49     350    190
32     12   88.59 102.59     220    262
13      7  133.55  76.57     295    147
35     12  104.00  99.15     261    221
25     10  116.90 109.14     271    228
8       5  161.75  42.49     369    165
2       2   96.32 106.03     209    218
27     11   93.48  91.05     221    167
10      6  149.94  76.49     316    221
20      9   98.95  88.59     206    222
15      8  206.39  37.84     459     77
34     12  165.35  69.28     355    160
7       5  152.04  71.43     288    206
26     10   87.41 143.66     237    297
1       1  165.76   8.09     374     55
36     12   88.63 143.66     187    345
12      7  127.07  95.67     355    128
14      7   77.70  94.48     223    204
24     10  127.88 110.88     353    172
5       4  116.43  63.82     367    178
28     11  121.00 132.33     369    191
11      6   64.75 174.34     145    338
30     11  122.66 140.13     342    182
3       3   76.08 103.60     253    250
21      9  131.04 115.58     302    274
9       6   92.88 105.26     206    218
33     12   88.59  29.46     340     87
22     10  114.12  99.15     313    190
19      9  140.43 103.60     293    221
mysample <- popsamp(30, corn)
County
densityplot(~county,data=mysample,
            xlab="County")

ttestGC(~county,data=mysample)


Inferential Procedures for One Mean mu:


Descriptive Results:

variable  mean     sd       n          
county    8.000    3.074    30         


Inferential Results:

Estimate of mu:  8 
SE(x.bar):   0.5612 

95% Confidence Interval for mu:

          lower.bound         upper.bound          
          6.852222            9.147778             
Cornhec
densityplot(~cornhec,data=mysample,
            xlab="Cornhec")

ttestGC(~cornhec,data=mysample)


Inferential Procedures for One Mean mu:


Descriptive Results:

variable  mean     sd       n          
cornhec   116.044  32.137   30         


Inferential Results:

Estimate of mu:  116 
SE(x.bar):   5.867 

95% Confidence Interval for mu:

          lower.bound         upper.bound          
          104.043952          128.044047           
Soyhec
densityplot(~soyhec,data=mysample,
            xlab="Soyhec")

ttestGC(~soyhec,data=mysample)


Inferential Procedures for One Mean mu:


Descriptive Results:

variable  mean     sd       n          
soyhec    97.154   39.213   30         


Inferential Results:

Estimate of mu:  97.15 
SE(x.bar):   7.159 

95% Confidence Interval for mu:

          lower.bound         upper.bound          
          82.511471           111.795861           
Cornpix
densityplot(~cornpix,data=mysample,
            xlab="Cornpix")

ttestGC(~cornpix,data=mysample)


Inferential Procedures for One Mean mu:


Descriptive Results:

variable  mean     sd       n          
cornpix   290.200  70.449   30         


Inferential Results:

Estimate of mu:  290.2 
SE(x.bar):   12.86 

95% Confidence Interval for mu:

          lower.bound         upper.bound          
          263.894093          316.505907           
Soypix
densityplot(~soypix,data=mysample,
            xlab="Soypix")

ttestGC(~soypix,data=mysample)


Inferential Procedures for One Mean mu:


Descriptive Results:

variable  mean     sd       n          
soypix    202.567  67.599   30         


Inferential Results:

Estimate of mu:  202.6 
SE(x.bar):   12.34 

95% Confidence Interval for mu:

          lower.bound         upper.bound          
          177.324762          227.808572           

Hipotesis

County
t_test_less_county <- t.test(corn$county, mu = 0, alternative = "less")
print(t_test_less_county)

    One Sample t-test

data:  corn$county
t = 16.155, df = 36, p-value = 1
alternative hypothesis: true mean is less than 0
95 percent confidence interval:
     -Inf 9.104719
sample estimates:
mean of x 
 8.243243 

Penjelasan :

Uji “less”: Kita tidak dapat menolak hipotesis bahwa rata-rata ‘county’ lebih besar dari atau sama dengan nol (p-value = 1). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘county’ berada di bawah 9.104719.

t_test_greater_county <- t.test(corn$county, mu = 0, alternative = "greater")
print(t_test_greater_county)

    One Sample t-test

data:  corn$county
t = 16.155, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 7.381767      Inf
sample estimates:
mean of x 
 8.243243 

Penjelasan :

Uji “greater”: Kita dapat menolak hipotesis bahwa rata-rata ‘county’ kurang dari atau sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘county’ berada di atas 7.381767.

t_test_twosided_county <- t.test(corn$county, mu = 0, alternative = "two.sided")
print(t_test_twosided_county)

    One Sample t-test

data:  corn$county
t = 16.155, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 7.208382 9.278105
sample estimates:
mean of x 
 8.243243 

Penjelasan :

Uji “two-sided”: Kita dapat menolak hipotesis bahwa rata-rata ‘county’ sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘county’ berada di antara 7.208382 dan 9.278105.

Cornhec
t_test_less_cornhec <- t.test(corn$cornhec, mu = 0, alternative = "less")
print(t_test_less_cornhec)

    One Sample t-test

data:  corn$cornhec
t = 22.432, df = 36, p-value = 1
alternative hypothesis: true mean is less than 0
95 percent confidence interval:
     -Inf 129.4965
sample estimates:
mean of x 
 120.4324 

Penjelasan :

Uji “less”: Kita tidak dapat menolak hipotesis bahwa rata-rata ‘cornhec’ lebih besar dari atau sama dengan nol (p-value = 1). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘cornhec’ berada di bawah 129.4965.

t_test_greater_cornhec <- t.test(corn$cornhec, mu = 0, alternative = "greater")
print(t_test_greater_cornhec)

    One Sample t-test

data:  corn$cornhec
t = 22.432, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 111.3684      Inf
sample estimates:
mean of x 
 120.4324 

Penjelasan :

Uji “greater”: Kita dapat menolak hipotesis bahwa rata-rata ‘cornhec’ kurang dari atau sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘cornhec’ berada di atas 111.3684.

t_test_twosided_cornhec <- t.test(corn$cornhec, mu = 0, alternative = "two.sided")
print(t_test_twosided_cornhec)

    One Sample t-test

data:  corn$cornhec
t = 22.432, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 109.5441 131.3208
sample estimates:
mean of x 
 120.4324 

Penjelasan :

Uji “two-sided”: Kita dapat menolak hipotesis bahwa rata-rata ‘cornhec’ sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘cornhec’ berada di antara 109.5441 dan 131.3208.

Soyhec
t_test_less_soyhec <- t.test(corn$soyhec, mu = 0, alternative = "less")
print(t_test_less_soyhec)

    One Sample t-test

data:  corn$soyhec
t = 14.944, df = 36, p-value = 1
alternative hypothesis: true mean is less than 0
95 percent confidence interval:
     -Inf 107.2304
sample estimates:
mean of x 
 96.34595 

Penjelasan :

Uji “less”: Kita tidak dapat menolak hipotesis bahwa rata-rata ‘soyhec’ lebih besar dari atau sama dengan nol (p-value = 1). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘soyhec’ berada di bawah 107.2304.

t_test_greater_soyhec <- t.test(corn$soyhec, mu = 0, alternative = "greater")
print(t_test_greater_soyhec)

    One Sample t-test

data:  corn$soyhec
t = 14.944, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 85.46154      Inf
sample estimates:
mean of x 
 96.34595 

Penjelasan :

Uji “greater”: Kita dapat menolak hipotesis bahwa rata-rata ‘soyhec’ kurang dari atau sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘soyhec’ berada di atas 85.46154.

t_test_twosided_soyhec <- t.test(corn$soyhec, mu = 0, alternative = "two.sided")
print(t_test_twosided_soyhec)

    One Sample t-test

data:  corn$soyhec
t = 14.944, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
  83.27088 109.42101
sample estimates:
mean of x 
 96.34595 

Penjelasan :

Uji “two-sided”: Kita dapat menolak hipotesis bahwa rata-rata ‘soyhec’ sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘soyhec’ berada di antara 83.27088 dan 109.42101.

Cornpix
t_test_less_cornpix <- t.test(corn$cornpix, mu = 0, alternative = "less")
print(t_test_less_cornpix)

    One Sample t-test

data:  corn$cornpix
t = 25.717, df = 36, p-value = 1
alternative hypothesis: true mean is less than 0
95 percent confidence interval:
     -Inf 316.9301
sample estimates:
mean of x 
 297.4054 

Penjelasan :

Uji “less”: Kita tidak dapat menolak hipotesis bahwa rata-rata ‘cornpix’ lebih besar dari atau sama dengan nol (p-value = 1). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘cornpix’ berada di bawah 316.9301.

t_test_greater_cornpix <- t.test(corn$cornpix, mu = 0, alternative = "greater")
print(t_test_greater_cornpix)

    One Sample t-test

data:  corn$cornpix
t = 25.717, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 277.8807      Inf
sample estimates:
mean of x 
 297.4054 

Penjelasan :

Uji “greater”: Kita dapat menolak hipotesis bahwa rata-rata ‘cornpix’ kurang dari atau sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘cornpix’ berada di atas 277.8807.

t_test_twosided_cornpix <- t.test(corn$cornpix, mu = 0, alternative = "two.sided")
print(t_test_twosided_cornpix)

    One Sample t-test

data:  corn$cornpix
t = 25.717, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 273.9511 320.8597
sample estimates:
mean of x 
 297.4054 

Penjelasan :

Uji “two-sided”: Kita dapat menolak hipotesis bahwa rata-rata ‘cornpix’ sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘cornpix’ berada di antara 273.9511 dan 320.8597.

Soypix
t_test_less_soypix <- t.test(corn$soypix, mu = 0, alternative = "less")
print(t_test_less_soypix)

    One Sample t-test

data:  corn$soypix
t = 18.342, df = 36, p-value = 1
alternative hypothesis: true mean is less than 0
95 percent confidence interval:
     -Inf 222.0391
sample estimates:
mean of x 
 203.3243 

Penjelasan :

Uji “less”: Kita tidak dapat menolak hipotesis bahwa rata-rata ‘soypix’ lebih besar dari atau sama dengan nol (p-value = 1). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘soypix’ berada di bawah 222.0391.

t_test_greater_soypix <- t.test(corn$soypix, mu = 0, alternative = "greater")
print(t_test_greater_soypix)

    One Sample t-test

data:  corn$soypix
t = 18.342, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 184.6096      Inf
sample estimates:
mean of x 
 203.3243 

Penjelasan :

Uji “greater”: Kita dapat menolak hipotesis bahwa rata-rata ‘soypix’ kurang dari atau sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘soypix’ berada di atas 184.6096.

t_test_twosided_soypix <- t.test(corn$soypix, mu = 0, alternative = "two.sided")
print(t_test_twosided_soypix)

    One Sample t-test

data:  corn$soypix
t = 18.342, df = 36, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 180.8429 225.8057
sample estimates:
mean of x 
 203.3243 

Penjelasan :

Uji “two-sided”: Kita dapat menolak hipotesis bahwa rata-rata ‘soypix’ sama dengan nol (p-value < 2.2e-16). Interval kepercayaan 95% menunjukkan bahwa rata-rata ‘soypix’ berada di antara 180.8429 dan 225.8057.

#Modul 8 “Analisis Varian”#

Cornhec-County
anova_result_cornhec_county <- aov(cornhec ~ factor(county), data = corn)
summary(anova_result_cornhec_county)
               Df Sum Sq Mean Sq F value Pr(>F)
factor(county) 11  14989  1362.6   1.456   0.21
Residuals      25  23404   936.2               

Penjelasan :

Nilai F sebesar 1.456 dan p-value sebesar 0.21 menunjukkan bahwa tidak ada perbedaan signifikan dalam nilai ‘cornhec’ di antara berbagai kategori ‘county’. P-value yang lebih besar dari 0.05 mengindikasikan bahwa kita tidak dapat menolak hipotesis nol yang menyatakan bahwa rata-rata ‘cornhec’ adalah sama di semua kategori ‘county’.

Soyhec-County
anova_result_soyhec_county <- aov(soyhec ~ factor(county), data = corn)
summary(anova_result_soyhec_county)
               Df Sum Sq Mean Sq F value Pr(>F)  
factor(county) 11  30589  2780.8   2.806 0.0158 *
Residuals      25  24774   990.9                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Penjelasan :

Nilai F sebesar 2.806 dan p-value sebesar 0.0158 menunjukkan bahwa terdapat perbedaan signifikan dalam nilai ‘soyhec’ di antara berbagai kategori ‘county’. P-value yang kurang dari 0.05 menunjukkan bahwa ada cukup bukti untuk menolak hipotesis nol dan menyimpulkan bahwa rata-rata ‘soyhec’ berbeda di beberapa kategori ‘county’.

Cornpix-County
anova_result_cornpix_county <- aov(cornpix ~ factor(county), data = corn)
summary(anova_result_cornpix_county)
               Df Sum Sq Mean Sq F value Pr(>F)
factor(county) 11  75506    6864   1.672  0.139
Residuals      25 102639    4106               

Penjelasan :

Nilai F sebesar 1.672 dan p-value sebesar 0.139 menunjukkan bahwa tidak ada perbedaan signifikan dalam nilai ‘cornpix’ di antara berbagai kategori ‘county’. P-value yang lebih besar dari 0.05 menunjukkan bahwa kita tidak dapat menolak hipotesis nol yang menyatakan bahwa rata-rata ‘cornpix’ adalah sama di semua kategori ‘county’.

Soypix-County
anova_result_soypix_county <- aov(soypix ~ factor(county), data = corn)
summary(anova_result_soypix_county)
               Df Sum Sq Mean Sq F value Pr(>F)
factor(county) 11  68230    6203   1.625  0.152
Residuals      25  95443    3818               

Penjelasan :

Nilai F sebesar 1.625 dan p-value sebesar 0.152 menunjukkan bahwa tidak ada perbedaan signifikan dalam nilai ‘soypix’ di antara berbagai kategori ‘county’. P-value yang lebih besar dari 0.05 menunjukkan bahwa kita tidak dapat menolak hipotesis nol yang menyatakan bahwa rata-rata ‘soypix’ adalah sama di semua kategori ‘county’.

#Modul 9 “Regresi”#

County
regression_model_cornhec <- lm(cornhec ~ soyhec + cornpix + soypix, data = corn)
summary(regression_model_cornhec)

Call:
lm(formula = cornhec ~ soyhec + cornpix + soypix, data = corn)

Residuals:
    Min      1Q  Median      3Q     Max 
-54.083  -4.720   1.488   8.474  25.325 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 13.81350   29.42155   0.470  0.64180    
soyhec      -0.37485    0.13215  -2.837  0.00773 ** 
cornpix      0.37053    0.06138   6.036 8.67e-07 ***
soypix       0.16002    0.09170   1.745  0.09027 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 17.26 on 33 degrees of freedom
Multiple R-squared:  0.7438,    Adjusted R-squared:  0.7205 
F-statistic: 31.94 on 3 and 33 DF,  p-value: 7.108e-10

Penjelasan :

Intercept (nilai awal): 13.81 (tidak signifikan, p-value = 0.64)

  • ‘soyhec’: Setiap kenaikan 1 unit pada ‘soyhec’ berhubungan dengan penurunan 0.37 unit pada ‘cornhec’ (signifikan, p-value = 0.0077).
  • ‘cornpix’: Setiap kenaikan 1 unit pada ‘cornpix’ berhubungan dengan kenaikan 0.37 unit pada ‘cornhec’ (sangat signifikan, p-value < 0.001).
  • ‘soypix’: Setiap kenaikan 1 unit pada ‘soypix’ berhubungan dengan kenaikan 0.16 unit pada ‘cornhec’ (tidak signifikan pada tingkat 5%, p-value = 0.09).

Model ini menjelaskan 72.05% variasi dalam ‘cornhec’.

Soyhec
regression_model_soyhec <- lm(soyhec ~ cornhec + cornpix + soypix, data = corn)
summary(regression_model_soyhec)

Call:
lm(formula = soyhec ~ cornhec + cornpix + soypix, data = corn)

Residuals:
    Min      1Q  Median      3Q     Max 
-36.831 -10.324  -1.501  13.939  45.995 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.66973   34.86673  -0.019  0.98479    
cornhec     -0.52295    0.18436  -2.837  0.00773 ** 
cornpix      0.20762    0.09876   2.102  0.04325 *  
soypix       0.48322    0.07574   6.380 3.17e-07 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 20.39 on 33 degrees of freedom
Multiple R-squared:  0.7522,    Adjusted R-squared:  0.7296 
F-statistic: 33.38 on 3 and 33 DF,  p-value: 4.141e-10

Penjelasan :

Intercept (nilai awal): -0.67 (tidak signifikan, p-value = 0.98)

  • ‘cornhec’: Setiap kenaikan 1 unit pada ‘cornhec’ berhubungan dengan penurunan 0.52 unit pada ‘soyhec’ (signifikan, p-value = 0.0077).
  • ‘cornpix’: Setiap kenaikan 1 unit pada ‘cornpix’ berhubungan dengan kenaikan 0.21 unit pada ‘soyhec’ (signifikan, p-value = 0.043).
  • ‘soypix’: Setiap kenaikan 1 unit pada ‘soypix’ berhubungan dengan kenaikan 0.48 unit pada ‘soyhec’ (sangat signifikan, p-value < 0.001).

Model ini menjelaskan 72.96% variasi dalam ‘soyhec’.

Cornhec-Soyhec
regression_model_cornhec_soyhec <- lm(cornhec ~ soyhec, data = corn)
summary(regression_model_cornhec_soyhec)

Call:
lm(formula = cornhec ~ soyhec, data = corn)

Residuals:
    Min      1Q  Median      3Q     Max 
-68.548 -14.894   3.489  15.595  53.850 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 173.3057    10.9918  15.767  < 2e-16 ***
soyhec       -0.5488     0.1059  -5.183 9.21e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 24.91 on 35 degrees of freedom
Multiple R-squared:  0.4343,    Adjusted R-squared:  0.4181 
F-statistic: 26.87 on 1 and 35 DF,  p-value: 9.21e-06

Penjelasan :

Intercept (nilai awal): 173.31 (sangat signifikan, p-value < 0.001)

  • ‘soyhec’: Setiap kenaikan 1 unit pada ‘soyhec’ berhubungan dengan penurunan 0.55 unit pada ‘cornhec’ (sangat signifikan, p-value < 0.001).

Model ini menjelaskan 41.81% variasi dalam ‘cornhec’.

Cornhec-Cornpix
regression_model_cornhec_corpix <- lm(cornhec ~ cornpix, data = corn)
summary(regression_model_cornhec_corpix)

Call:
lm(formula = cornhec ~ cornpix, data = corn)

Residuals:
    Min      1Q  Median      3Q     Max 
-48.149 -13.836   2.298  13.909  35.208 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.57559   13.55513   0.485    0.631    
cornpix      0.38283    0.04439   8.625  3.5e-10 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 18.73 on 35 degrees of freedom
Multiple R-squared:  0.6801,    Adjusted R-squared:  0.6709 
F-statistic: 74.39 on 1 and 35 DF,  p-value: 3.5e-10

Penjelasan :

Intercept (nilai awal): 6.58 (tidak signifikan, p-value = 0.63)

  • ‘cornpix’: Setiap kenaikan 1 unit pada ‘cornpix’ berhubungan dengan kenaikan 0.38 unit pada ‘cornhec’ (sangat signifikan, p-value < 0.001).

Model ini menjelaskan 67.09% variasi dalam ‘cornhec’.

Soyhec-Soypix
regression_model_soyhec_soypix <- lm(soyhec ~ soypix, data = corn)
summary(regression_model_soyhec_soypix)

Call:
lm(formula = soyhec ~ soypix, data = corn)

Residuals:
    Min      1Q  Median      3Q     Max 
-37.978 -16.532  -0.395   9.247  54.096 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -1.97418   11.68477  -0.169    0.867    
soypix       0.48356    0.05462   8.853 1.86e-10 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 22.1 on 35 degrees of freedom
Multiple R-squared:  0.6913,    Adjusted R-squared:  0.6825 
F-statistic: 78.38 on 1 and 35 DF,  p-value: 1.857e-10

Penjelasan :

Intercept (nilai awal): -1.97 (tidak signifikan, p-value = 0.87)

  • ‘soypix’: Setiap kenaikan 1 unit pada ‘soypix’ berhubungan dengan kenaikan 0.48 unit pada ‘soyhec’ (sangat signifikan, p-value < 0.001).

Model ini menjelaskan 68.25% variasi dalam ‘soyhec’.