Análisis de datos de encuesta.

Establezco el directorio de trabajo y activo las librerías a utilizar.

knitr::opts_chunk$set(warning = FALSE, message = F) 
setwd("C:/Users/ruben/Desktop/Examen")
library(RCurl)
library(stringr)
library(ROAuth)
library(rtweet)
library(dplyr)
library(tidyverse)
library(haven)
library(car)
library(devtools)
library(readxl)
library(tm) 
library(tidytext)
library(data.table)
library(ggplot2)
library(igraph)
library(wordcloud)
library(knitr)
library(RColorBrewer)
library(quanteda)
library(units)
library(ggraph)
library(stringi)
library(plotly)
library(wordcloud2)
library(devtools)

Establezco el documento que contiene nuestro dataframe:

data<-read_dta("CIS3223.dta")

Limpio las variables a utilizar:

data$P23
data$ideol<-data$P23
data$ideol[data$ideol>10]<-NA


data$P30
data$hombre<-data$P30
data$hombre[data$hombre==2]<-0
val_labels(data$hombre)<-c(Mujer=0, Hombre=1)


data$P31
data$edad<-data$P31


data$P33
data$religion<-data$P33
data$religion[data$religion>4]<-NA
data$religion[data$religion>=3 & data$religion<=4]<-2
data$ingresos <- factor(data$ingresos,
                            levels = c(1,2),
                            labels = c("Católico", "No católico") 
                                       
data$P41
data$ingresos<-data$P41
data$ingresos[data$ingresos>11]<-NA
data$ingresos[data$ingresos>=1 & data$ingresos<=4]<-1
data$ingresos[data$ingresos>=5 & data$ingresos<=8]<-2
data$ingresos[data$ingresos>=9 & data$ingresos<=11]<-3
data$ingresos <- factor (data$ingresos,
                            levels = c(1,2,3),
                            labels = c("Clase Baja", "Clase Media", "Clase Alta")) 

data$P14
data$reforma<-data$P14
data$reforma[data$reforma>8]<-NA
data$reforma[data$reforma==8]<-3
data$reforma <- factor (data$reforma,
                            levels = c(1,2,3),
                            labels = c("Reformarla", "Dejarla", "Duda"))

Me quedo con las variables más interesantes para nuestro análisis y elimino el dataframe original:

myvars <- c("ideol", "hombre", "edad", "religion", "ingresos","reforma")
cis<-data[myvars]
cis<- na.omit(cis)
dim(cis)

remove(data)

Una vez he realizado la limpieza de las variables a utilizar y he limpiado el dataframe, procedo a continuación a realizar la regresión:

m.reforma <- glm(reforma ~ ideol + hombre + edad + religion + ingresos, data = cis, family = "binomial")
summary(m.logit)

El resultado de realizar la regresión nos muestra que las variables que son estadísticamente significativas son:

Ideología, al 99,9% de confianza. Implica que según un individuo se identifica más a la derecha, su probabilidad de estar en contra de reformar la Constitución aumenta en 0,218011.
Edad, al 95% de confianza. Implica que según un individuo crece un año en edad, su probabilidad de estar en contra de reformar la Constitución aumenta en 0,008057.
Religión, al 99,9% de confianza. Implica que el hecho de no ser católico respecto a serlo, disminuye la probabilidad de querer mantener la Constitución sin mácula (aumenta el apoyo a la reforma) en -0.626923.
Ser de clase media respecto a ser de clase baja, al 99,9% de confianza. Implica que un individuo de clase media tiene una probabilidad de -0,634797 menos de estar en contra de reformar la Constitución respecto a uno de clase baja.

Ahora expresaré los odds ratio de la regresión para ver de forma más clara qué variables aumentan o disminuyen la probabilidad de apoyar la reforma o el statu quo:

exp(cbind(OR = coef(m.reforma)))

En este caso, parecen tener un efecto positivo sobre querer mantener el statu quo las variables de ideología (en 1,24 veces más), el género masculino sobre el femenino (en 1,03) y la edad (en 1,008). Y parecen tener un efecto negativo sobre la preferencia de mantener el statu quo el no ser católico (en un 47%), la clase media frente a la baja (en un 48%) y la clase alta frente a la baja (en un 51%).

Para completar mi análisis voy a realizar una visualización gráfica de los efectos marginales de las variables analizadas:

margins_reforma <- margins(m.reforma)
summary(margins_reforma)

plot(margins_reforma, main="Preferencia sobre reforma constitucional", col.main="blue", pch=12, las=2, labels=c(
"Ideología", "Hombre", "Edad", "Religión", "Clase media", "Clase Alta"))

A continuación hago un stargazer para únicamente poder exportar la tabla en formato científico en caso de que me interese:

stargazer(m.reforma,
type="text",
dep.var.labels=c("Reforma constitucional"),
covariate.labels=c("Ideología", "Hombre", "Edad", "Religión", "Clase media", "Clase Alta"))

Análisis de datos no estructurados.

tweets<-read.csv("tweets_examen.csv", header = T)

Limpieza de tweets

Debido a que los tweets tienen emoticonos, hipervínculos, hashtags y otros elementos distintos a palabras, procedo a limpiarlos. Empezaré por decodificar los emoticonos:

tweets <- data.frame(text = iconv(tweets$text, "latin1", "ASCII", "byte"), stringsAsFactors = FALSE)

Continuaré con la limpieza de tweets mediante la función limpiar.tweets, con lo que haré desaparecer símbolos, palabras cortas, sustituyendo mayúsuculas por minúsculas y otros elementos indeseables para este análisis.

limpiar.tweets <- function(some_txt)
{
  some_txt = gsub("(RT|via)((?:\\b\\W*@\\w+)+)", "", some_txt)
  some_txt = gsub("@\\w+", "", some_txt)
  some_txt = gsub("[[:punct:]]", "", some_txt)
  some_txt = gsub("[[:digit:]]", "", some_txt)
  some_txt = gsub("http\\w+", "", some_txt)
  some_txt = gsub("[ \t]{2,}", "", some_txt)
  some_txt = gsub("^\\s+|\\s+$", "", some_txt)
  some_txt = gsub("amp", "", some_txt)
  some_txt = gsub('\\b\\w{1,3}\\b','', some_txt)
  some_txt = gsub("[^\x01-\x7F]", "", some_txt)
  some_txt = gsub('\\p{So}|\\p{Cn}', '', some_txt, perl = TRUE)
   try.tolower = function(x)
  {
    y = NA
    try_error = tryCatch(tolower(x), error=function(e) e)
    if (!inherits(try_error, "error"))
      y = tolower(x)
    return(y)
  }
  some_txt = sapply(some_txt, try.tolower)
  names(some_txt) = NULL
  return(some_txt)
}

Una vez definida la función de limpieza de texto, la aplico a la columna del dataframe que contiene el texto de los tweets:

tweets_limpios <- limpiar.tweets(tweets$text)

A continuación, procedo a crear un corpus de palabras, del que eliminaré las stopwords, los espacios en blanco y otros símbolos. Además, me quedo solo con la raíz de las palabras:

signos<-c("t.co", "https", "rt", "rts", "http", "...")
corpus_tweets <- Corpus(VectorSource(tweets$text)) %>%
  tm_map(removePunctuation) %>% 
  tm_map(removeNumbers) %>%     
  tm_map(tolower)  %>%          
  tm_map(removeWords, stopwords("english")) %>%   
  tm_map(removeWords, signos) %>%
  tm_map(stripWhitespace)

Para comprobar que los tweets se han limpiado bien, visualizo los cinco primeros:

for (i in 1:5) {
  cat(paste("[[", i, "]] ", sep = ""))
  writeLines(as.character(corpus_tweets[[i]]))
}

A continuación, elimino del corpus todas las palabras que aparecen con muy poca frecuencia, menos del 0,1% de las veces, y creo el dataframe para empezar el análisis:

tf_tweets <- DocumentTermMatrix(corpus_tweets)  
tf_tweets <- removeSparseTerms(tf_tweets, .999)
tf_tweets <- as.matrix(tf_tweets)
tf_tweets<- as.data.frame(tf_tweets)
dim(tf_tweets)

Análisis exploratorio de las palabras contenidas en el corpus

Procedo a crear, en primer lugar, una nube de palabras con las palabras más frecuentes en nuestro corpus y después, con los hastags más frecuentes:

word.freq <- colSums(tf_tweets)   
word.freq <- data.frame(word = names(word.freq), freq = word.freq)  
rownames(word.freq) <- NULL
head(word.freq[order(-word.freq$freq),], 10)
wordcloud2(data=word.freq, rotateRatio = .15)

word.freq <- (word.freq[order(-word.freq$freq),][1:25,])
word.freq$word <- factor(word.freq$word, levels = word.freq$word[order(-word.freq$freq )])

ggplot(word.freq,aes(word, freq)) +
  geom_bar(stat = "identity", color = "black", fill = "forestgreen") +
  geom_text(aes(hjust = -0.1, label = freq), size=3) + 
  coord_flip() + 
  labs(title = "25 términos más frecuentes",  x = "Palabras", y = "Frecuencia")

Observando los términos más frecuentes del corpus puedo tratar de imaginar que el tema escogido para la minería de datos en Twitter de la que procede el corpus que me hallo analizando fue el de la reciente decisión de Íñigo Errejón de concurrir a las elecciones autonómicas de Madrid con una marca distinta a la de PODEMOS. Continúo con el análisis.

hastag.freq <- colSums(tf_tweets)   
hastag.freq <- data.frame(word = names(hastag.freq), freq = hastag.freq)
rownames(hastag.freq) <- NULL
head(word.freq[order(-hastag.freq$freq),], 10)
wordcloud2(data=hastag.freq, rotateRatio = .15)
hastag <- DocumentTermMatrix(corpus_tweets)
hastag <- removeSparseTerms(hastag, .98) 
hastag <- as.matrix(hastag)
hastag <- as.data.frame(hastag)

Hagor otro grafo de barras para observar cuáles son los hastags mñas frecuentes dentro del corpus:

hashtag <- Corpus(VectorSource(ht)) %>%
  tm_map(removePunctuation) %>% 
  tm_map(removeNumbers) %>%     
  tm_map(tolower)  %>%          
  tm_map(removeWords, stopwords("english")) %>%   
  tm_map(removeWords, signos) %>%  
  tm_map(stripWhitespace) 

hastag.freq <- (hastag.freq[order(-hastag.freq$freq),][1:10,])
hastag.freq$word <- factor(hastag.freq$word, levels = hastag.freq$word[order(-hastag.freq$freq )])

ggplot(hastag.freq,aes(word, freq)) +
  geom_bar(stat = "identity", color = "black", fill = "forestgreen") +
  geom_text(aes(hjust = -0.1, label = freq), size=3) + 
  coord_flip() + 
  labs(title = "10 términos más frecuentes",  x = "Hastags", y = "Frecuencia")

LS0tDQp0aXRsZTogIkV4YW1lbiBBbsOhbGlzaXMgZGUgRGF0b3MiDQphdXRob3I6ICJSdWLDqW4gSm9zdcOpIEdhcmPDrWEgSGVyYXMiDQpkYXRlOiAyMy0wMS0yMDE5DQpvdXRwdXQ6IA0KIGh0bWxfbm90ZWJvb2s6DQogICB0aGVtZTogY2VydWxlYW4NCiAgIGhpZ2hsaWdodDoga2F0ZQ0KICAgdG9jOiB5ZXMNCmVkaXRvcl9vcHRpb25zOiANCiAgY2h1bmtfb3V0cHV0X3R5cGU6IGNvbnNvbGUNCi0tLQ0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjpibGFjayI+KipBbsOhbGlzaXMgZGUgZGF0b3MgZGUgZW5jdWVzdGEqKi48L3NwYW4+DQoNCiMjIyBFc3RhYmxlemNvIGVsIGRpcmVjdG9yaW8gZGUgdHJhYmFqbyB5IGFjdGl2byBsYXMgbGlicmVyw61hcyBhIHV0aWxpemFyLg0KDQpgYGB7ciBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQ0Ka25pdHI6Om9wdHNfY2h1bmskc2V0KHdhcm5pbmcgPSBGQUxTRSwgbWVzc2FnZSA9IEYpIA0KDQpzZXR3ZCgiQzovVXNlcnMvcnViZW4vRGVza3RvcC9FeGFtZW4iKQ0KDQoNCmxpYnJhcnkoUkN1cmwpDQpsaWJyYXJ5KHN0cmluZ3IpDQpsaWJyYXJ5KFJPQXV0aCkNCmxpYnJhcnkocnR3ZWV0KQ0KbGlicmFyeShkcGx5cikNCmxpYnJhcnkobGFiZWxsZWQpDQpsaWJyYXJ5KHRpZHl2ZXJzZSkNCmxpYnJhcnkoaGF2ZW4pDQpsaWJyYXJ5KGNhcikNCmxpYnJhcnkoZGV2dG9vbHMpDQpsaWJyYXJ5KHJlYWR4bCkNCmxpYnJhcnkodG0pIA0KbGlicmFyeSh0aWR5dGV4dCkNCmxpYnJhcnkoZGF0YS50YWJsZSkNCmxpYnJhcnkoZ2dwbG90MikNCmxpYnJhcnkoaWdyYXBoKQ0KbGlicmFyeSh3b3JkY2xvdWQpDQpsaWJyYXJ5KGtuaXRyKQ0KbGlicmFyeShSQ29sb3JCcmV3ZXIpDQpsaWJyYXJ5KHF1YW50ZWRhKQ0KbGlicmFyeSh1bml0cykNCmxpYnJhcnkoZ2dyYXBoKQ0KbGlicmFyeShzdHJpbmdpKQ0KbGlicmFyeShwbG90bHkpDQpsaWJyYXJ5KG1hcmdpbnMpDQpsaWJyYXJ5KHdvcmRjbG91ZDIpDQpsaWJyYXJ5KGRldnRvb2xzKQ0KbGlicmFyeShzdGFyZ2F6ZXIpDQpgYGANCg0KIyMjIEVzdGFibGV6Y28gZWwgZG9jdW1lbnRvIHF1ZSBjb250aWVuZSBudWVzdHJvIGRhdGFmcmFtZToNCmBgYHtyIG1lc3NhZ2U9Riwgd2FybmluZz1GQUxTRX0NCmRhdGE8LXJlYWRfZHRhKCJDSVMzMjIzLmR0YSIpDQpgYGANCg0KIyMjIExpbXBpbyBsYXMgdmFyaWFibGVzIGEgdXRpbGl6YXI6DQpgYGB7ciBtZXNzYWdlPUYsIHdhcm5pbmc9RkFMU0V9DQpkYXRhJFAyMw0KZGF0YSRpZGVvbDwtZGF0YSRQMjMNCmRhdGEkaWRlb2xbZGF0YSRpZGVvbD4xMF08LU5BDQoNCg0KZGF0YSRQMzANCmRhdGEkaG9tYnJlPC1kYXRhJFAzMA0KZGF0YSRob21icmVbZGF0YSRob21icmU9PTJdPC0wDQp2YWxfbGFiZWxzKGRhdGEkaG9tYnJlKTwtYyhNdWplcj0wLCBIb21icmU9MSkNCg0KDQpkYXRhJFAzMQ0KZGF0YSRlZGFkPC1kYXRhJFAzMQ0KDQoNCmRhdGEkUDMzDQpkYXRhJHJlbGlnaW9uPC1kYXRhJFAzMw0KZGF0YSRyZWxpZ2lvbltkYXRhJHJlbGlnaW9uPjRdPC1OQQ0KZGF0YSRyZWxpZ2lvbltkYXRhJHJlbGlnaW9uPj0zICYgZGF0YSRyZWxpZ2lvbjw9NF08LTINCmRhdGEkaW5ncmVzb3MgPC0gZmFjdG9yKGRhdGEkaW5ncmVzb3MsDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgbGV2ZWxzID0gYygxLDIpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxhYmVscyA9IGMoIkNhdMOzbGljbyIsICJObyBjYXTDs2xpY28iKSANCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIA0KZGF0YSRQNDENCmRhdGEkaW5ncmVzb3M8LWRhdGEkUDQxDQpkYXRhJGluZ3Jlc29zW2RhdGEkaW5ncmVzb3M+MTFdPC1OQQ0KZGF0YSRpbmdyZXNvc1tkYXRhJGluZ3Jlc29zPj0xICYgZGF0YSRpbmdyZXNvczw9NF08LTENCmRhdGEkaW5ncmVzb3NbZGF0YSRpbmdyZXNvcz49NSAmIGRhdGEkaW5ncmVzb3M8PThdPC0yDQpkYXRhJGluZ3Jlc29zW2RhdGEkaW5ncmVzb3M+PTkgJiBkYXRhJGluZ3Jlc29zPD0xMV08LTMNCmRhdGEkaW5ncmVzb3MgPC0gZmFjdG9yIChkYXRhJGluZ3Jlc29zLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxldmVscyA9IGMoMSwyLDMpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxhYmVscyA9IGMoIkNsYXNlIEJhamEiLCAiQ2xhc2UgTWVkaWEiLCAiQ2xhc2UgQWx0YSIpKSANCg0KZGF0YSRQMTQNCmRhdGEkcmVmb3JtYTwtZGF0YSRQMTQNCmRhdGEkcmVmb3JtYVtkYXRhJHJlZm9ybWE+OF08LU5BDQpkYXRhJHJlZm9ybWFbZGF0YSRyZWZvcm1hPT04XTwtMw0KZGF0YSRyZWZvcm1hIDwtIGZhY3RvciAoZGF0YSRyZWZvcm1hLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxldmVscyA9IGMoMSwyLDMpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxhYmVscyA9IGMoIlJlZm9ybWFybGEiLCAiRGVqYXJsYSIsICJEdWRhIikpIA0KYGBgDQoNCg0KPHAgYWxpZ249Imp1c3RpZnkiPk1lIHF1ZWRvIGNvbiBsYXMgdmFyaWFibGVzIG3DoXMgaW50ZXJlc2FudGVzIHBhcmEgbnVlc3RybyBhbsOhbGlzaXMgeSBlbGltaW5vIGVsIGRhdGFmcmFtZSBvcmlnaW5hbDo8L3A+DQpgYGB7ciBtZXNzYWdlPUYsIHdhcm5pbmc9RkFMU0V9DQpteXZhcnMgPC0gYygiaWRlb2wiLCAiaG9tYnJlIiwgImVkYWQiLCAicmVsaWdpb24iLCAiaW5ncmVzb3MiLCJyZWZvcm1hIikNCmNpczwtZGF0YVtteXZhcnNdDQpjaXM8LSBuYS5vbWl0KGNpcykNCmRpbShjaXMpDQoNCnJlbW92ZShkYXRhKQ0KYGBgDQoNCg0KPHAgYWxpZ249Imp1c3RpZnkiPlVuYSB2ZXogaGUgcmVhbGl6YWRvIGxhIGxpbXBpZXphIGRlIGxhcyB2YXJpYWJsZXMgYSB1dGlsaXphciB5IGhlIGxpbXBpYWRvIGVsIGRhdGFmcmFtZSwgcHJvY2VkbyBhIGNvbnRpbnVhY2nDs24gYSByZWFsaXphciBsYSByZWdyZXNpw7NuOjwvcD4NCmBgYHtyIG1lc3NhZ2U9Riwgd2FybmluZz1GQUxTRX0NCm0ucmVmb3JtYSA8LSBnbG0ocmVmb3JtYSB+IGlkZW9sICsgaG9tYnJlICsgZWRhZCArIHJlbGlnaW9uICsgaW5ncmVzb3MsIGRhdGEgPSBjaXMsIGZhbWlseSA9ICJiaW5vbWlhbCIpDQpzdW1tYXJ5KG0ubG9naXQpDQpgYGANCg0KPHAgYWxpZ249Imp1c3RpZnkiPkVsIHJlc3VsdGFkbyBkZSByZWFsaXphciBsYSByZWdyZXNpw7NuIG5vcyBtdWVzdHJhIHF1ZSBsYXMgdmFyaWFibGVzIHF1ZSBzb24gZXN0YWTDrXN0aWNhbWVudGUgc2lnbmlmaWNhdGl2YXMgc29uOg0KDQoqIElkZW9sb2fDrWEsIGFsIDk5LDklIGRlIGNvbmZpYW56YS4gSW1wbGljYSBxdWUgc2Vnw7puIHVuIGluZGl2aWR1byBzZSBpZGVudGlmaWNhIG3DoXMgYSBsYSBkZXJlY2hhLCBzdSBwcm9iYWJpbGlkYWQgZGUgZXN0YXIgZW4gY29udHJhIGRlIHJlZm9ybWFyIGxhIENvbnN0aXR1Y2nDs24gYXVtZW50YSBlbiAwLDIxODAxMS4NCiogRWRhZCwgYWwgOTUlIGRlIGNvbmZpYW56YS4gSW1wbGljYSBxdWUgc2Vnw7puIHVuIGluZGl2aWR1byBjcmVjZSB1biBhw7FvIGVuIGVkYWQsIHN1IHByb2JhYmlsaWRhZCBkZSBlc3RhciBlbiBjb250cmEgZGUgcmVmb3JtYXIgbGEgQ29uc3RpdHVjacOzbiBhdW1lbnRhIGVuIDAsMDA4MDU3Lg0KKiBSZWxpZ2nDs24sIGFsIDk5LDklIGRlIGNvbmZpYW56YS4gSW1wbGljYSBxdWUgZWwgaGVjaG8gZGUgbm8gc2VyIGNhdMOzbGljbyByZXNwZWN0byBhIHNlcmxvLCBkaXNtaW51eWUgbGEgcHJvYmFiaWxpZGFkIGRlIHF1ZXJlciBtYW50ZW5lciBsYSBDb25zdGl0dWNpw7NuIHNpbiBtw6FjdWxhIChhdW1lbnRhIGVsIGFwb3lvIGEgbGEgcmVmb3JtYSkgZW4gLTAuNjI2OTIzLg0KKiBTZXIgZGUgY2xhc2UgbWVkaWEgcmVzcGVjdG8gYSBzZXIgZGUgY2xhc2UgYmFqYSwgYWwgOTksOSUgZGUgY29uZmlhbnphLiBJbXBsaWNhIHF1ZSB1biBpbmRpdmlkdW8gZGUgY2xhc2UgbWVkaWEgdGllbmUgdW5hIHByb2JhYmlsaWRhZCBkZSAtMCw2MzQ3OTcgbWVub3MgZGUgZXN0YXIgZW4gY29udHJhIGRlIHJlZm9ybWFyIGxhIENvbnN0aXR1Y2nDs24gcmVzcGVjdG8gYSB1bm8gZGUgY2xhc2UgYmFqYS48L3A+DQoNCjxwIGFsaWduPSJqdXN0aWZ5Ij5BaG9yYSBleHByZXNhcsOpIGxvcyBvZGRzIHJhdGlvIGRlIGxhIHJlZ3Jlc2nDs24gcGFyYSB2ZXIgZGUgZm9ybWEgbcOhcyBjbGFyYSBxdcOpIHZhcmlhYmxlcyBhdW1lbnRhbiBvIGRpc21pbnV5ZW4gbGEgcHJvYmFiaWxpZGFkIGRlIGFwb3lhciBsYSByZWZvcm1hIG8gZWwgc3RhdHUgcXVvOjwvcD4gDQpgYGB7ciBtZXNzYWdlPUYsIHdhcm5pbmc9RkFMU0V9DQpleHAoY2JpbmQoT1IgPSBjb2VmKG0ucmVmb3JtYSkpKQ0KYGBgDQoNCjxwIGFsaWduPSJqdXN0aWZ5Ij5FbiBlc3RlIGNhc28sIHBhcmVjZW4gdGVuZXIgdW4gZWZlY3RvIHBvc2l0aXZvIHNvYnJlIHF1ZXJlciBtYW50ZW5lciBlbCBzdGF0dSBxdW8gbGFzIHZhcmlhYmxlcyBkZSBpZGVvbG9nw61hIChlbiAxLDI0IHZlY2VzIG3DoXMpLCBlbCBnw6luZXJvIG1hc2N1bGlubyBzb2JyZSBlbCBmZW1lbmlubyAoZW4gMSwwMykgeSBsYSBlZGFkIChlbiAxLDAwOCkuIFkgcGFyZWNlbiB0ZW5lciB1biBlZmVjdG8gbmVnYXRpdm8gc29icmUgbGEgcHJlZmVyZW5jaWEgZGUgbWFudGVuZXIgZWwgc3RhdHUgcXVvIGVsIG5vIHNlciBjYXTDs2xpY28gKGVuIHVuIDQ3JSksIGxhIGNsYXNlIG1lZGlhIGZyZW50ZSBhIGxhIGJhamEgKGVuIHVuIDQ4JSkgeSBsYSBjbGFzZSBhbHRhIGZyZW50ZSBhIGxhIGJhamEgKGVuIHVuIDUxJSkuPC9wPg0KDQoNCjxwIGFsaWduPSJqdXN0aWZ5Ij5QYXJhIGNvbXBsZXRhciBtaSBhbsOhbGlzaXMgdm95IGEgcmVhbGl6YXIgdW5hIHZpc3VhbGl6YWNpw7NuIGdyw6FmaWNhIGRlIGxvcyBlZmVjdG9zIG1hcmdpbmFsZXMgZGUgbGFzIHZhcmlhYmxlcyBhbmFsaXphZGFzOjwvcD4NCmBgYHtyIG1lc3NhZ2U9Riwgd2FybmluZz1GQUxTRX0NCm1hcmdpbnNfcmVmb3JtYSA8LSBtYXJnaW5zKG0ucmVmb3JtYSkNCnN1bW1hcnkobWFyZ2luc19yZWZvcm1hKQ0KDQpwbG90KG1hcmdpbnNfcmVmb3JtYSwgbWFpbj0iUHJlZmVyZW5jaWEgc29icmUgcmVmb3JtYSBjb25zdGl0dWNpb25hbCIsIGNvbC5tYWluPSJibHVlIiwgcGNoPTEyLCBsYXM9MiwgbGFiZWxzPWMoDQoiSWRlb2xvZ8OtYSIsICJIb21icmUiLCAiRWRhZCIsICJSZWxpZ2nDs24iLCAiQ2xhc2UgbWVkaWEiLCAiQ2xhc2UgQWx0YSIpKQ0KYGBgDQoNCjxwIGFsaWduPSJqdXN0aWZ5Ij5BIGNvbnRpbnVhY2nDs24gaGFnbyB1biBzdGFyZ2F6ZXIgcGFyYSDDum5pY2FtZW50ZSBwb2RlciBleHBvcnRhciBsYSB0YWJsYSBlbiBmb3JtYXRvIGNpZW50w61maWNvIGVuIGNhc28gZGUgcXVlIG1lIGludGVyZXNlOjwvcD4NCmBgYHtyIG1lc3NhZ2U9Riwgd2FybmluZz1GQUxTRX0NCnN0YXJnYXplcihtLnJlZm9ybWEsDQp0eXBlPSJ0ZXh0IiwNCmRlcC52YXIubGFiZWxzPWMoIlJlZm9ybWEgY29uc3RpdHVjaW9uYWwiKSwNCmNvdmFyaWF0ZS5sYWJlbHM9YygiSWRlb2xvZ8OtYSIsICJIb21icmUiLCAiRWRhZCIsICJSZWxpZ2nDs24iLCAiQ2xhc2UgbWVkaWEiLCAiQ2xhc2UgQWx0YSIpKQ0KYGBgDQoNCg0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjpibGFjayI+KipBbsOhbGlzaXMgZGUgZGF0b3Mgbm8gZXN0cnVjdHVyYWRvcyoqLjwvc3Bhbj4NCg0KYGBge3IgbWVzc2FnZT1GLCB3YXJuaW5nPUZBTFNFfQ0KdHdlZXRzPC1yZWFkLmNzdigidHdlZXRzX2V4YW1lbi5jc3YiLCBoZWFkZXIgPSBUKQ0KYGBgDQoNCiMjI0xpbXBpZXphIGRlIHR3ZWV0cw0KPHAgYWxpZ249Imp1c3RpZnkiPkRlYmlkbyBhIHF1ZSBsb3MgdHdlZXRzIHRpZW5lbiBlbW90aWNvbm9zLCBoaXBlcnbDrW5jdWxvcywgaGFzaHRhZ3MgeSBvdHJvcyBlbGVtZW50b3MgZGlzdGludG9zIGEgcGFsYWJyYXMsIHByb2NlZG8gYSBsaW1waWFybG9zLiBFbXBlemFyw6kgcG9yIGRlY29kaWZpY2FyIGxvcyBlbW90aWNvbm9zOjwvcD4NCg0KYGBge3IgbWVzc2FnZT1GLCB3YXJuaW5nPUZBTFNFfQ0KdHdlZXRzIDwtIGRhdGEuZnJhbWUodGV4dCA9IGljb252KHR3ZWV0cyR0ZXh0LCAibGF0aW4xIiwgIkFTQ0lJIiwgImJ5dGUiKSwgc3RyaW5nc0FzRmFjdG9ycyA9IEZBTFNFKQ0KDQpgYGANCg0KDQojIyMgQ29udGludWFyw6kgY29uIGxhIGxpbXBpZXphIGRlIHR3ZWV0cyBtZWRpYW50ZSBsYSBmdW5jacOzbiBsaW1waWFyLnR3ZWV0cywgY29uIGxvIHF1ZSBoYXLDqSBkZXNhcGFyZWNlciBzw61tYm9sb3MsIHBhbGFicmFzIGNvcnRhcywgc3VzdGl0dXllbmRvIG1hecO6c3VjdWxhcyBwb3IgbWluw7pzY3VsYXMgeSBvdHJvcyBlbGVtZW50b3MgaW5kZXNlYWJsZXMgcGFyYSBlc3RlIGFuw6FsaXNpcy4NCg0KYGBge3IgbWVzc2FnZT1GLCB3YXJuaW5nPUZBTFNFfQ0KbGltcGlhci50d2VldHMgPC0gZnVuY3Rpb24oc29tZV90eHQpDQp7DQogIHNvbWVfdHh0ID0gZ3N1YigiKFJUfHZpYSkoKD86XFxiXFxXKkBcXHcrKSspIiwgIiIsIHNvbWVfdHh0KQ0KICBzb21lX3R4dCA9IGdzdWIoIkBcXHcrIiwgIiIsIHNvbWVfdHh0KQ0KICBzb21lX3R4dCA9IGdzdWIoIltbOnB1bmN0Ol1dIiwgIiIsIHNvbWVfdHh0KQ0KICBzb21lX3R4dCA9IGdzdWIoIltbOmRpZ2l0Ol1dIiwgIiIsIHNvbWVfdHh0KQ0KICBzb21lX3R4dCA9IGdzdWIoImh0dHBcXHcrIiwgIiIsIHNvbWVfdHh0KQ0KICBzb21lX3R4dCA9IGdzdWIoIlsgXHRdezIsfSIsICIiLCBzb21lX3R4dCkNCiAgc29tZV90eHQgPSBnc3ViKCJeXFxzK3xcXHMrJCIsICIiLCBzb21lX3R4dCkNCiAgc29tZV90eHQgPSBnc3ViKCJhbXAiLCAiIiwgc29tZV90eHQpDQogIHNvbWVfdHh0ID0gZ3N1YignXFxiXFx3ezEsM31cXGInLCcnLCBzb21lX3R4dCkNCiAgc29tZV90eHQgPSBnc3ViKCJbXlx4MDEtXHg3Rl0iLCAiIiwgc29tZV90eHQpDQogIHNvbWVfdHh0ID0gZ3N1YignXFxwe1NvfXxcXHB7Q259JywgJycsIHNvbWVfdHh0LCBwZXJsID0gVFJVRSkNCiAgIHRyeS50b2xvd2VyID0gZnVuY3Rpb24oeCkNCiAgew0KICAgIHkgPSBOQQ0KICAgIHRyeV9lcnJvciA9IHRyeUNhdGNoKHRvbG93ZXIoeCksIGVycm9yPWZ1bmN0aW9uKGUpIGUpDQogICAgaWYgKCFpbmhlcml0cyh0cnlfZXJyb3IsICJlcnJvciIpKQ0KICAgICAgeSA9IHRvbG93ZXIoeCkNCiAgICByZXR1cm4oeSkNCiAgfQ0KICBzb21lX3R4dCA9IHNhcHBseShzb21lX3R4dCwgdHJ5LnRvbG93ZXIpDQogIG5hbWVzKHNvbWVfdHh0KSA9IE5VTEwNCiAgcmV0dXJuKHNvbWVfdHh0KQ0KfQ0KYGBgDQoNCjxwIGFsaWduPSJqdXN0aWZ5Ij5VbmEgdmV6IGRlZmluaWRhIGxhIGZ1bmNpw7NuIGRlIGxpbXBpZXphIGRlIHRleHRvLCBsYSBhcGxpY28gYSBsYSBjb2x1bW5hIGRlbCBkYXRhZnJhbWUgcXVlIGNvbnRpZW5lIGVsIHRleHRvIGRlIGxvcyB0d2VldHM6PC9wPg0KYGBge3IgbWVzc2FnZT1GLCB3YXJuaW5nPUZBTFNFfQ0KdHdlZXRzX2xpbXBpb3MgPC0gbGltcGlhci50d2VldHModHdlZXRzJHRleHQpDQpgYGANCg0KPHAgYWxpZ249Imp1c3RpZnkiPkEgY29udGludWFjacOzbiwgcHJvY2VkbyBhIGNyZWFyIHVuIGNvcnB1cyBkZSBwYWxhYnJhcywgZGVsIHF1ZSBlbGltaW5hcsOpIGxhcyAqc3RvcHdvcmRzKiwgbG9zIGVzcGFjaW9zIGVuIGJsYW5jbyB5IG90cm9zIHPDrW1ib2xvcy4gQWRlbcOhcywgbWUgcXVlZG8gc29sbyBjb24gbGEgcmHDrXogZGUgbGFzIHBhbGFicmFzOjwvcD4NCmBgYHtyIGV2YWw9VCwgaW5jbHVkZT1ULCB3YXJuaW5nPUZBTFNFfQ0Kc2lnbm9zPC1jKCJ0LmNvIiwgImh0dHBzIiwgInJ0IiwgInJ0cyIsICJodHRwIiwgIi4uLiIpDQpjb3JwdXNfdHdlZXRzIDwtIENvcnB1cyhWZWN0b3JTb3VyY2UodHdlZXRzJHRleHQpKSAlPiUNCiAgdG1fbWFwKHJlbW92ZVB1bmN0dWF0aW9uKSAlPiUgDQogIHRtX21hcChyZW1vdmVOdW1iZXJzKSAlPiUgICAgIA0KICB0bV9tYXAodG9sb3dlcikgICU+JSAgICAgICAgICANCiAgdG1fbWFwKHJlbW92ZVdvcmRzLCBzdG9wd29yZHMoImVuZ2xpc2giKSkgJT4lICAgDQogIHRtX21hcChyZW1vdmVXb3Jkcywgc2lnbm9zKSAlPiUNCiAgdG1fbWFwKHN0cmlwV2hpdGVzcGFjZSkgDQpgYGANCg0KUGFyYSBjb21wcm9iYXIgcXVlIGxvcyB0d2VldHMgc2UgaGFuIGxpbXBpYWRvIGJpZW4sIHZpc3VhbGl6byBsb3MgY2luY28gcHJpbWVyb3M6IA0KDQpgYGB7ciBtZXNzYWdlPUYsIHdhcm5pbmc9RkFMU0V9DQpmb3IgKGkgaW4gMTo1KSB7DQogIGNhdChwYXN0ZSgiW1siLCBpLCAiXV0gIiwgc2VwID0gIiIpKQ0KICB3cml0ZUxpbmVzKGFzLmNoYXJhY3Rlcihjb3JwdXNfdHdlZXRzW1tpXV0pKQ0KfQ0KYGBgDQoNCjxwIGFsaWduPSJqdXN0aWZ5Ij5BIGNvbnRpbnVhY2nDs24sIGVsaW1pbm8gZGVsIGNvcnB1cyB0b2RhcyBsYXMgcGFsYWJyYXMgcXVlIGFwYXJlY2VuIGNvbiBtdXkgcG9jYSBmcmVjdWVuY2lhLCBtZW5vcyBkZWwgMCwxJSBkZSBsYXMgdmVjZXMsIHkgY3JlbyBlbCBkYXRhZnJhbWUgcGFyYSBlbXBlemFyIGVsIGFuw6FsaXNpczo8L3A+DQpgYGB7ciBtZXNzYWdlPUYsIHdhcm5pbmc9RkFMU0V9DQp0Zl90d2VldHMgPC0gRG9jdW1lbnRUZXJtTWF0cml4KGNvcnB1c190d2VldHMpICANCnRmX3R3ZWV0cyA8LSByZW1vdmVTcGFyc2VUZXJtcyh0Zl90d2VldHMsIC45OTkpDQp0Zl90d2VldHMgPC0gYXMubWF0cml4KHRmX3R3ZWV0cykNCnRmX3R3ZWV0czwtIGFzLmRhdGEuZnJhbWUodGZfdHdlZXRzKQ0KZGltKHRmX3R3ZWV0cykNCmBgYA0KIA0KDQojIyNBbsOhbGlzaXMgZXhwbG9yYXRvcmlvIGRlIGxhcyBwYWxhYnJhcyBjb250ZW5pZGFzIGVuIGVsIGNvcnB1cw0KDQo8cCBhbGlnbj0ianVzdGlmeSI+UHJvY2VkbyBhIGNyZWFyLCBlbiBwcmltZXIgbHVnYXIsIHVuYSBudWJlIGRlIHBhbGFicmFzIGNvbiBsYXMgcGFsYWJyYXMgbcOhcyBmcmVjdWVudGVzIGVuIG51ZXN0cm8gY29ycHVzIHkgZGVzcHXDqXMsIGNvbiBsb3MgaGFzdGFncyBtw6FzIGZyZWN1ZW50ZXM6PC9wPg0KDQpgYGB7cn0NCndvcmQuZnJlcSA8LSBjb2xTdW1zKHRmX3R3ZWV0cykgICANCndvcmQuZnJlcSA8LSBkYXRhLmZyYW1lKHdvcmQgPSBuYW1lcyh3b3JkLmZyZXEpLCBmcmVxID0gd29yZC5mcmVxKSAgDQpyb3duYW1lcyh3b3JkLmZyZXEpIDwtIE5VTEwNCmhlYWQod29yZC5mcmVxW29yZGVyKC13b3JkLmZyZXEkZnJlcSksXSwgMTApDQp3b3JkY2xvdWQyKGRhdGE9d29yZC5mcmVxLCByb3RhdGVSYXRpbyA9IC4xNSkNCg0Kd29yZC5mcmVxIDwtICh3b3JkLmZyZXFbb3JkZXIoLXdvcmQuZnJlcSRmcmVxKSxdWzE6MjUsXSkNCndvcmQuZnJlcSR3b3JkIDwtIGZhY3Rvcih3b3JkLmZyZXEkd29yZCwgbGV2ZWxzID0gd29yZC5mcmVxJHdvcmRbb3JkZXIoLXdvcmQuZnJlcSRmcmVxICldKQ0KDQpnZ3Bsb3Qod29yZC5mcmVxLGFlcyh3b3JkLCBmcmVxKSkgKw0KICBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IiwgY29sb3IgPSAiYmxhY2siLCBmaWxsID0gImZvcmVzdGdyZWVuIikgKw0KICBnZW9tX3RleHQoYWVzKGhqdXN0ID0gLTAuMSwgbGFiZWwgPSBmcmVxKSwgc2l6ZT0zKSArIA0KICBjb29yZF9mbGlwKCkgKyANCiAgbGFicyh0aXRsZSA9ICIyNSB0w6lybWlub3MgbcOhcyBmcmVjdWVudGVzIiwgIHggPSAiUGFsYWJyYXMiLCB5ID0gIkZyZWN1ZW5jaWEiKQ0KYGBgDQoNCjxwIGFsaWduPSJqdXN0aWZ5Ij4gT2JzZXJ2YW5kbyBsb3MgdMOpcm1pbm9zIG3DoXMgZnJlY3VlbnRlcyBkZWwgY29ycHVzIHB1ZWRvIHRyYXRhciBkZSBpbWFnaW5hciBxdWUgZWwgdGVtYSBlc2NvZ2lkbyBwYXJhIGxhIG1pbmVyw61hIGRlIGRhdG9zIGVuIFR3aXR0ZXIgZGUgbGEgcXVlIHByb2NlZGUgZWwgY29ycHVzIHF1ZSBtZSBoYWxsbyBhbmFsaXphbmRvIGZ1ZSBlbCBkZSBsYSByZWNpZW50ZSBkZWNpc2nDs24gZGUgw43DsWlnbyBFcnJlasOzbiBkZSBjb25jdXJyaXIgYSBsYXMgZWxlY2Npb25lcyBhdXRvbsOzbWljYXMgZGUgTWFkcmlkIGNvbiB1bmEgbWFyY2EgZGlzdGludGEgYSBsYSBkZSBQT0RFTU9TLiBDb250aW7Dum8gY29uIGVsIGFuw6FsaXNpcy48L3A+DQoNCmBgYHtyfQ0KaGFzdGFnLmZyZXEgPC0gY29sU3Vtcyh0Zl90d2VldHMpICAgDQpoYXN0YWcuZnJlcSA8LSBkYXRhLmZyYW1lKHdvcmQgPSBuYW1lcyhoYXN0YWcuZnJlcSksIGZyZXEgPSBoYXN0YWcuZnJlcSkNCnJvd25hbWVzKGhhc3RhZy5mcmVxKSA8LSBOVUxMDQpoZWFkKHdvcmQuZnJlcVtvcmRlcigtaGFzdGFnLmZyZXEkZnJlcSksXSwgMTApDQp3b3JkY2xvdWQyKGRhdGE9aGFzdGFnLmZyZXEsIHJvdGF0ZVJhdGlvID0gLjE1KQ0KaGFzdGFnIDwtIERvY3VtZW50VGVybU1hdHJpeChjb3JwdXNfdHdlZXRzKQ0KaGFzdGFnIDwtIHJlbW92ZVNwYXJzZVRlcm1zKGhhc3RhZywgLjk4KSANCmhhc3RhZyA8LSBhcy5tYXRyaXgoaGFzdGFnKQ0KaGFzdGFnIDwtIGFzLmRhdGEuZnJhbWUoaGFzdGFnKQ0KYGBgDQoNCg0KPHAgYWxpZ249Imp1c3RpZnkiPiBIYWdvciBvdHJvIGdyYWZvIGRlIGJhcnJhcyBwYXJhIG9ic2VydmFyIGN1w6FsZXMgc29uIGxvcyBoYXN0YWdzIG3DsWFzIGZyZWN1ZW50ZXMgZGVudHJvIGRlbCBjb3JwdXM6PC9wPg0KYGBge3IgZWNobz1UUlVFfQ0KaGFzaHRhZyA8LSBDb3JwdXMoVmVjdG9yU291cmNlKGh0KSkgJT4lDQogIHRtX21hcChyZW1vdmVQdW5jdHVhdGlvbikgJT4lIA0KICB0bV9tYXAocmVtb3ZlTnVtYmVycykgJT4lICAgICANCiAgdG1fbWFwKHRvbG93ZXIpICAlPiUgICAgICAgICAgDQogIHRtX21hcChyZW1vdmVXb3Jkcywgc3RvcHdvcmRzKCJlbmdsaXNoIikpICU+JSAgIA0KICB0bV9tYXAocmVtb3ZlV29yZHMsIHNpZ25vcykgJT4lICANCiAgdG1fbWFwKHN0cmlwV2hpdGVzcGFjZSkgDQoNCmhhc3RhZy5mcmVxIDwtIChoYXN0YWcuZnJlcVtvcmRlcigtaGFzdGFnLmZyZXEkZnJlcSksXVsxOjEwLF0pDQpoYXN0YWcuZnJlcSR3b3JkIDwtIGZhY3RvcihoYXN0YWcuZnJlcSR3b3JkLCBsZXZlbHMgPSBoYXN0YWcuZnJlcSR3b3JkW29yZGVyKC1oYXN0YWcuZnJlcSRmcmVxICldKQ0KDQpnZ3Bsb3QoaGFzdGFnLmZyZXEsYWVzKHdvcmQsIGZyZXEpKSArDQogIGdlb21fYmFyKHN0YXQgPSAiaWRlbnRpdHkiLCBjb2xvciA9ICJibGFjayIsIGZpbGwgPSAiZm9yZXN0Z3JlZW4iKSArDQogIGdlb21fdGV4dChhZXMoaGp1c3QgPSAtMC4xLCBsYWJlbCA9IGZyZXEpLCBzaXplPTMpICsgDQogIGNvb3JkX2ZsaXAoKSArIA0KICBsYWJzKHRpdGxlID0gIjEwIHTDqXJtaW5vcyBtw6FzIGZyZWN1ZW50ZXMiLCAgeCA9ICJIYXN0YWdzIiwgeSA9ICJGcmVjdWVuY2lhIikNCg0KYGBgDQoNCg==

Examen Análisis de Datos

Rubén Josué García Heras

23-01-2019