N=2,000 entrevistados de adultos +18. (500 por tel?fono fijo y 1500 por tel?fono m?vil) en espa?ol e ingl?s. Form 1/Form 2: each a random half sample 50 estados(incluyendo a Alaska y a Hawaii) Period: Jan. 7-14, 2016 Pretest: Jan 5, 2016
Este dataset trata de recopilar todo tipo de informaci?n incluyendo religi?n, opini?n sobre esta misma y su influencia en las votaciones, opiniones sobre los candidatos, entre otros. Uno de los que m?s nos llamo la atenci?n fue que hay poca diferencia entre opiniones sobre las creencias y religi?n de los candidatos, pero que es de gran preocupaci?n que estos no se fijen en usar y apoyar doctrinas religiosas.
Este dataset contiene 2009 observaciones y 153 variables, por lo que nos limitaremos a unas cuantas para el an?lisis.
Sample: indica tipo de encuesta (llamada, email, nota de voz email).Tipo: categorical.
Attempt: N?mero de intentos. Tipo: numeric.
Refusal: Si la encuesta se cancela o se le da seguimiento seg?n requerimientos. Tipo: categorical.
Ilang: En que lenguaje se realiz? la encuesta. Tipo: categorical.
Cregion: Regi?n en la que se encuentra el entrevistado. Tipo: categorical.
State: Estado en el que se encuentra el entrevistado. Tipo: categorical.
USR: Si es en el ?rea urbana o rural. *Tipo:+ categorical
Form: tipo de formato utilizado segun tipo de encuesta: Tipo: categorical.
q1-q31: Son preguntas directas. Cada una tiene una serie de x opciones por lo que se le considera categorical. En la mayoria de casos 9= Don’t know/refused.
Los requerimientos necesarios para aplicar a la encuesta son pocos: mayor de 18 a?os y que no est? manejando(o actividades similares que necesiten de mucha atenci?n).
Las variables num?ricas que encontramos fueron: +attempt +density +sdensity
Para analizar el dataset se utiliz? otra librer?a distinta a la habitual ya que este estaba en formato .sav select.() file.choose()
library(foreign)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
dt <- read.spss("/Users/andreaosorio/Documents/Cuarto Semestre '16/DATA S 2/Jan16 public-2.sav",use.value.labels=TRUE, max.value.labels=TRUE, to.data.frame=TRUE)
## Warning in read.spss("/Users/andreaosorio/Documents/Cuarto Semestre '16/
## DATA S 2/Jan16 public-2.sav", : /Users/andreaosorio/Documents/Cuarto
## Semestre '16/DATA S 2/Jan16 public-2.sav: Unrecognized record type 7,
## subtype 14 encountered in system file
## Warning in read.spss("/Users/andreaosorio/Documents/Cuarto Semestre '16/
## DATA S 2/Jan16 public-2.sav", : /Users/andreaosorio/Documents/Cuarto
## Semestre '16/DATA S 2/Jan16 public-2.sav: Unrecognized record type 7,
## subtype 18 encountered in system file
## Warning in read.spss("/Users/andreaosorio/Documents/Cuarto Semestre '16/
## DATA S 2/Jan16 public-2.sav", : /Users/andreaosorio/Documents/Cuarto
## Semestre '16/DATA S 2/Jan16 public-2.sav: Unrecognized record type 7,
## subtype 24 encountered in system file
De los datos pudimos extraer razones estad?sticas de variables num?ricas:
summary(select(dt, attempt, density, sdensity))
## attempt density sdensity
## Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:1.000 1st Qu.:2.000 1st Qu.:2.000
## Median :2.000 Median :3.000 Median :3.000
## Mean :2.332 Mean :2.904 Mean :3.048
## 3rd Qu.:3.000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :9.000 Max. :5.000 Max. :5.000
Attempts <- dt$attempt
Density <- dt$density
SDensity <- dt$sdensity
sd(Attempts)
## [1] 1.535959
sd(Density)
## [1] 1.40532
sd(SDensity)
## [1] 1.417084
var(Attempts)
## [1] 2.359171
var(Density)
## [1] 1.974926
var(SDensity)
## [1] 2.008126
hist(Attempts)
hist(Density)
hist(SDensity)
Y de las variables categ?ricas:
summary(select(dt, ilang, sample,refusal, usr))
## ilang sample refusal usr
## Min. :1.000 Min. :1.000 Min. :0.00000 : 80
## 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:0.00000 R:354
## Median :1.000 Median :2.000 Median :0.00000 S:854
## Mean :1.061 Mean :1.749 Mean :0.03435 U:721
## 3rd Qu.:1.000 3rd Qu.:2.000 3rd Qu.:0.00000
## Max. :2.000 Max. :2.000 Max. :1.00000
factor(dt$ilang)[1]
## [1] 1
## Levels: 1 2
factor(dt$sample)[1]
## [1] 1
## Levels: 1 2
factor(dt$refusal)[1]
## [1] 0
## Levels: 0 1
factor(dt$usr)[1]
## [1] S
## Levels: R S U
q25: Do you think there has been too much, too little or the right amount of expression of religious faith and prayer by political leaders? 1 Too much 2 Too little 3 Right amount 9 Don’t know/Refused (VOL.)
q26: At the present time, do you think religion as a whole is increasing its influence on American life or losing its influence? 1 Increasing influence 2 Losing influence 3 Same (VOL.) 9 Don’t know/refused (VOL.)
q27:All in all, do you think this is a good thing or a bad thing? 1 Good thing 2 Bad thing 3 Both (VOL.) 4 Neither (VOL.) 5 Depends (VOL.) 9 Don’t know/refused (VOL.)
a28: How important is it to you that a president shares your religious beliefs? Is it [READ IN ORDER]? 1 Very important 2 Somewhat important 3 Not too important [OR] 4 Not at all important 9 Don’t know/Refused (VOL.)
hist(dt$q25) #too little
hist(dt$q26) #losing influence
hist(dt$q27) #bad thing
hist(dt$q28)#very similar opinions