U2A2

Descargar código

xfun::embed_file("U2A2.Rmd")

Download U2A2.Rmd

Descarga de archivos

xfun::embed_file("papablanca.xlsx")

Download papablanca.xlsx

Introducción

Para México, la agricultura es una de las actividades prioritarias y más importantes, ya que no sólo genera gran cantidad de empleos, sino que también responde a las necesidades alimenticias de millones de personas, preserva los entornos naturales y estimula el progreso al mejorar la calidad de vida.

En el estado de Sonora la agricultura toma un lugar muy importante, ya que es uno de los principales motores que impulsan a la economía del estado y uno de los principales cultivos que se cosechan es la papa blanca, en el cual Sonora se mantiene como entidar líder a nivel nacional.

Hipotesis

En la agricultura de Sonora en el tema de la papa blanca durante los años 2009 a 2019 exhiben que, entre mayor superficie cosechada habra una mayor producción.

Hipotesis nula (h0). Se afirma que entre mayor superficie cosechada en hectarias habrá una mayor producción en toneladas de la papa blanca.

Agricultura de sonora (papa blanca)

library(pacman)
library(readr)
library(readxl)
library(prettydoc) 
library(DT)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(ggplot2)
library(data.table)

## 
## Attaching package: 'data.table'

## The following objects are masked from 'package:dplyr':
## 
##     between, first, last

library(scales)

## 
## Attaching package: 'scales'

## The following object is masked from 'package:readr':
## 
##     col_factor

library(plotly)

## 
## Attaching package: 'plotly'

## The following object is masked from 'package:ggplot2':
## 
##     last_plot

## The following object is masked from 'package:stats':
## 
##     filter

## The following object is masked from 'package:graphics':
## 
##     layout

library(tidyverse)

## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --

## v tibble  3.1.1     v stringr 1.4.0
## v tidyr   1.1.3     v forcats 0.5.1
## v purrr   0.3.4

## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x data.table::between() masks dplyr::between()
## x scales::col_factor()  masks readr::col_factor()
## x purrr::discard()      masks scales::discard()
## x plotly::filter()      masks dplyr::filter(), stats::filter()
## x data.table::first()   masks dplyr::first()
## x dplyr::lag()          masks stats::lag()
## x data.table::last()    masks dplyr::last()
## x purrr::transpose()    masks data.table::transpose()

library(modelr)
library(lubridate)

## 
## Attaching package: 'lubridate'

## The following objects are masked from 'package:data.table':
## 
##     hour, isoweek, mday, minute, month, quarter, second, wday, week,
##     yday, year

## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union

library(datos)

setwd("~/R")
papablanca <- read_excel("papablanca.xlsx")
View(papablanca)

Diagrama de dispersión de la papa blanca en el estado de Sonora

Año <- papablanca$Año
d1 <- papablanca$Superficie_sembrada
d2 <- papablanca$Superficie_cosechada
d3 <- papablanca$Produccion
d4 <- papablanca$Rendimiento_obtenido

datos <- data.table(d1, d2, d3, d4)
x <- ggplot(data = datos, aes(x=d3, y = d1)) +
  geom_point(colour="red4") +
  ggtitle("Diagrama de dispersion ") +
  theme_bw() +
 theme(plot.title = element_text(hjust = 0.5))
ggplotly(x)

Histograma de superficie cosechada y producción de papa en el Estado de Sonora

par (mfrow = c(1,2))
hist(papablanca$Superficie_cosechada, breaks = 10, main = "Superficie cosechada", xlab = "superficie cosechada de papa blanca", border="darkred")
hist(papablanca$Produccion, breaks = 10, main = "Producción de papa blanca", xlab = "Producción (ton)", border="blue")

Grafico cuantílico

par(mfrow = c(1,1))
qqnorm(papablanca$Superficie_cosechada, main = "Superficie cosechada", col = "darkred")
qqline(papablanca$Superficie_cosechada)

qqnorm(papablanca$Produccion, main = "Producción (ton)", col = "darkred")
qqline(papablanca$Produccion)

Prueba (test) de hipotesis para el analisis de normalidad

# Test de Shapiro wilk para superficie Cosecha

shapiro.test(papablanca$Superficie_cosechada)

## 
##  Shapiro-Wilk normality test
## 
## data:  papablanca$Superficie_cosechada
## W = 0.9448, p-value = 0.5784

Dado que el valor de P es mayor a 0.05 (5%) los datos son normales

# Test de Shapiro wilk para producción

shapiro.test(papablanca$Produccion)

## 
##  Shapiro-Wilk normality test
## 
## data:  papablanca$Produccion
## W = 0.93836, p-value = 0.5014

Dado que el valor de P es mayor a 0.05 (5%) los datos son normales

Conclusión

En conclusión, se observó tanto que en la superficie cosechada y la producción, el valor de probabilidad (p) es muy superior a nuestro nivel elegido de 0.05 por lo que no rechazamos la hipótesis nula, y decimos que son datos normales. Se puede observar que los dos valores dados de superficie cosechada y producción son normales, por lo tanto no fue necesario usar base logaritmica ya que tuvimos un analisis de normalidad y por lo tanto pasa el test de normalidad.