library(psych)
## Warning: package 'psych' was built under R version 3.5.3
agri2018=read.table("C:\\Users\\juanl\\Downloads\\agri2018.txt", header=TRUE )
agri2017=read.table("C:\\Users\\juanl\\Downloads\\agri2017.txt", header=TRUE )
agri2016=read.table("C:\\Users\\juanl\\Downloads\\agri2017.txt", header=TRUE )
names(agri2018)
## [1] "Sembrada"          "Cosechada"         "Siniestrada"      
## [4] "Volumenproduccion" "Rendimiento"       "Precio"           
## [7] "Valorproduccion"

La presente investigación se refiere al análisis de datos de agricultura en Cajeme a través de los años, que se puede definir como análisis de los cultivos agrícolas en Cajeme en los últimos años. Se hace por el interés de saber la producción agrícola en Cajeme y saber su incremento disminución a través de los años, ya que se a dado los cosas de algunas partes del país donde la agricultura ha disminuido y además si hay algunos factores que dificultan la agricultura.

Antes de se deben de dar algunos datos de la agricultura de Cajeme, el municipio cuenta con aproximadamente 221,000 hectáreas de agricultura bajo riego, de las cuales el 58 por ciento son ejidales y el 42 por ciento de propiedad privada. El sector privado está representado por 4,645 propietarios y el sector social por 19,616 ejidatarios. 9 la actividad agrícola basa su producción principalmente en el cultivo de trigo, frijol, maíz, sorgo, frutales y hortalizas, básicamente.

Como se hará el trabajo es la abstracción de datos de los datos abiertos de agricultura del gobierno y por los distintos métodos estadísticos vistos en clase y algunos otros necesarios para el desarrollo de la investigación, se vera el crecimiento o disminución del sector agrícola. Pero uno de los principales aspectos negativos es que la información es muy estática y no proporciona lo necesario para lo que nos interesa que es los factores que hacen que se aumente o disminuye la producción agrícola en Cajeme, como el fertilizantes, el agua, la temporada, etc. Pero aun así es lo suficiente para ver el crecimiento en el área.

cor(agri2018)
##                      Sembrada   Cosechada  Siniestrada Volumenproduccion
## Sembrada           1.00000000  0.99995658 -0.019625111        0.93368591
## Cosechada          0.99995658  1.00000000 -0.019735074        0.93381124
## Siniestrada       -0.01962511 -0.01973507  1.000000000       -0.01801764
## Volumenproduccion  0.93368591  0.93381124 -0.018017643        1.00000000
## Rendimiento       -0.05633303 -0.05605792 -0.007232866       -0.03551952
## Precio            -0.08207464 -0.08720549  0.005516818       -0.13033779
## Valorproduccion    0.87564410  0.87549937 -0.010711125        0.93902776
##                    Rendimiento       Precio Valorproduccion
## Sembrada          -0.056333034 -0.082074636      0.87564410
## Cosechada         -0.056057915 -0.087205488      0.87549937
## Siniestrada       -0.007232866  0.005516818     -0.01071112
## Volumenproduccion -0.035519520 -0.130337788      0.93902776
## Rendimiento        1.000000000 -0.088386189     -0.05366759
## Precio            -0.088386189  1.000000000     -0.02105180
## Valorproduccion   -0.053667588 -0.021051801      1.00000000
cor(agri2017)
##                      Sembrada   Cosechada Siniestrada Volumenproduccion
## Sembrada           1.00000000  0.99958036  0.01142070        0.96364741
## Cosechada          0.99958036  1.00000000 -0.01266482        0.96456563
## Siniestrada        0.01142070 -0.01266482  1.00000000       -0.02624550
## Volumenproduccion  0.96364741  0.96456563 -0.02624550        1.00000000
## Rendimiento       -0.04681779 -0.04594395 -0.01485193       -0.02650015
## Precio            -0.06157500 -0.06965690 -0.01252855       -0.11014336
## Valorproduccion    0.92297576  0.92365062 -0.02870403        0.97213404
##                   Rendimiento      Precio Valorproduccion
## Sembrada          -0.04681779 -0.06157500      0.92297576
## Cosechada         -0.04594395 -0.06965690      0.92365062
## Siniestrada       -0.01485193 -0.01252855     -0.02870403
## Volumenproduccion -0.02650015 -0.11014336      0.97213404
## Rendimiento        1.00000000 -0.08296051     -0.04220749
## Precio            -0.08296051  1.00000000     -0.02305412
## Valorproduccion   -0.04220749 -0.02305412      1.00000000
cor(agri2016)
##                      Sembrada   Cosechada Siniestrada Volumenproduccion
## Sembrada           1.00000000  0.99958036  0.01142070        0.96364741
## Cosechada          0.99958036  1.00000000 -0.01266482        0.96456563
## Siniestrada        0.01142070 -0.01266482  1.00000000       -0.02624550
## Volumenproduccion  0.96364741  0.96456563 -0.02624550        1.00000000
## Rendimiento       -0.04681779 -0.04594395 -0.01485193       -0.02650015
## Precio            -0.06157500 -0.06965690 -0.01252855       -0.11014336
## Valorproduccion    0.92297576  0.92365062 -0.02870403        0.97213404
##                   Rendimiento      Precio Valorproduccion
## Sembrada          -0.04681779 -0.06157500      0.92297576
## Cosechada         -0.04594395 -0.06965690      0.92365062
## Siniestrada       -0.01485193 -0.01252855     -0.02870403
## Volumenproduccion -0.02650015 -0.11014336      0.97213404
## Rendimiento        1.00000000 -0.08296051     -0.04220749
## Precio            -0.08296051  1.00000000     -0.02305412
## Valorproduccion   -0.04220749 -0.02305412      1.00000000

La relaciones de estos datos en algunos se ve que su relación es mucha y otras pocas, pero es por ser no muy relacionales, solo dos a tres variables en verdad tienen relación, pero nadie depende de la otra, esa es una de las principales problemas de la investigación y de los datos, mucho de ellos son independientes, se necesitarían mas datos relacionales a ellos, espero que en el desarrollo del proyecto nuestro asesor pueda contar con la información suficiente para eso.

str(agri2016)
## 'data.frame':    275 obs. of  7 variables:
##  $ Sembrada         : num  300 856 118 272 1303 ...
##  $ Cosechada        : num  300 856 118 272 1303 ...
##  $ Siniestrada      : int  0 0 0 0 0 0 22 0 0 11 ...
##  $ Volumenproduccion: num  4590 2311 4295 5195 1535 ...
##  $ Rendimiento      : num  15.3 2.7 36.4 19.1 1.18 1.92 0 25.3 7.85 0 ...
##  $ Precio           : num  7541 6808 4323 6326 17252 ...
##  $ Valorproduccion  : num  34614016 15735482 18566861 32864887 26476136 ...
str(agri2017)
## 'data.frame':    275 obs. of  7 variables:
##  $ Sembrada         : num  300 856 118 272 1303 ...
##  $ Cosechada        : num  300 856 118 272 1303 ...
##  $ Siniestrada      : int  0 0 0 0 0 0 22 0 0 11 ...
##  $ Volumenproduccion: num  4590 2311 4295 5195 1535 ...
##  $ Rendimiento      : num  15.3 2.7 36.4 19.1 1.18 1.92 0 25.3 7.85 0 ...
##  $ Precio           : num  7541 6808 4323 6326 17252 ...
##  $ Valorproduccion  : num  34614016 15735482 18566861 32864887 26476136 ...
str(agri2018)
## 'data.frame':    249 obs. of  7 variables:
##  $ Sembrada         : num  230 705 77 140 617 ...
##  $ Cosechada        : num  230 705 77 140 617 ...
##  $ Siniestrada      : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Volumenproduccion: num  5788 1685 3068 2645 1209 ...
##  $ Rendimiento      : num  25.17 2.39 39.84 18.89 1.96 ...
##  $ Precio           : num  6802 7583 3100 5750 18580 ...
##  $ Valorproduccion  : num  39371076 12776352 9509808 15208750 22468984 ...
datosA2018 <- data.frame(agri2018$Sembrada,agri2018$Cosechada,agri2018$Siniestrada,agri2018$Valorproduccion,agri2018$Valorproduccion)
pairs(datosA2018)

La relación con los gráficos es la misma se ve que sembrado y cosecha es muy grande la relación. Porque es casi la misma, pero se ve perdida, pero mínima, cosecha y producción también, pero con el precio no, ya que es algo más independiente, aquí se necesitan esos nuevos datos, como crecimiento, productos, varianza de temporada. Quiero pensar que esos datos los podemos tener con un supervisor.

datosA2017 <- data.frame(agri2017$Sembrada,agri2017$Cosechada,agri2017$Siniestrada,agri2017$Valorproduccion,agri2017$Valorproduccion)
pairs(datosA2017)

No hay mucha diferencia entre años

datosA2016 <- data.frame(agri2016$Sembrada,agri2016$Cosechada,agri2016$Siniestrada,agri2016$Valorproduccion,agri2016$Valorproduccion)
pairs(datosA2016)

No hay mucha diferencia entre años

pairs.panels(agri2016[c(1,2)])
pairs.panels(agri2017[c(1,2)])

pairs.panels(agri2018[c(1,2)])

La relación entre las dos variables está cercana al 1 que mejor ponen como 1, aquí se ve que son casi las mismas variables

pairs.panels(agri2016[c(1,4)])
pairs.panels(agri2017[c(1,4)])

pairs.panels(agri2018[c(1,4)])

Aquí es grande la relación, pero no tan cerca al 1, no se redondea. Pero aquí se ve una variable de dependencia a la otra o de medio, porque si una es grande la otra también

pairs.panels(agri2016[c(1,5)])
pairs.panels(agri2017[c(1,5)])

pairs.panels(agri2018[c(1,5)])

Aquí se ve el punto más grande que decía, no tienen nada que ver, es negativo y con muy chico, nada de relación. Variables que son necesarias para lo que es el archivo, pero no para estos análisis

pairs.panels(agri2016[c(1,6)])
pairs.panels(agri2017[c(1,6)])

pairs.panels(agri2018[c(1,6)])

Aquí se ve el punto más grande que decía, no tienen nada que ver, es negativo y con muy chico, nada de relación. Variables que son necesarias para lo que es el archivo, pero no para estos análisis

pairs.panels(agri2016[c(1,7)])
pairs.panels(agri2017[c(1,7)])

pairs.panels(agri2018[c(1,7)])

Aquí es grande la relación, pero no tan cerca al 1, no se redondea. Pero aquí se ve una variable de dependencia a la otra o de medio, porque si una es grande la otra también