DESCRIPTIVA Y PROBABILIDAD

ESAP

EDWIN PRIETO

2024-07-17

PRIMEROS PASOS CON R

#ESTO ES UN COMENTARIO
#OPERACIONES BASICAS :+,-,*,/
#FUNCIONES BASICAS:mean,sd,var,quantile
#creemos un vector de datos con nuestro nombre 
pepe=c(1,4,3,2)
#operemos 
1+2
3*2
1-5
#suma
1+2
[1] 3
#multiplicacion
3*2
[1] 6
#resta
1-5
[1] -4
pepe=c(1,4,3,2)
#suma de elementos 
1+4+3+2
[1] 10
#con sum 
sum(pepe)
[1] 10
#cantidad de elementos
4
[1] 4
#con length
length(pepe)
[1] 4

DESCRIPTIVA

Para datos en bruto( sin agrupar ),sabemos que el promedio se obtiene con la formula \(\frac{\Sigma_{i=1}^nx_i}{n}\)

pepe=c(1,4,3,2)
#met1 
(1+4+3+2)/4
#met2 
sum(pepe)/length(pepe)
#met3 
mean(pepe)
[1] 2.5
[1] 2.5
[1] 2.5

DESCRIPTIVA

#----Calculo de la varianza,la mediana y los percentiles---
var(pepe)
sd(pepe)
median(pepe)
quantile(pepe,c(.1,.4,.5))
#Vamos a revisar si R en el denominador de la var usa a N o N-1
[1] 1.666667
[1] 1.290994
[1] 2.5
10% 40% 50% 
1.3 2.2 2.5 

Tablas

En R encontramos funciones como table con sus variadas posibilidades y metodos como data.frame y as.data.frame.En primer lugar necesitamos un conjunto de datos ,vamos a construir un vector de 20 datos ,con la funcion scan.

Mi vector es c(1,2,4,4,3,2,1,4,5,4,3,2,1,3,4,2,1,2,1,1).

pepe=scan(n=20)
pep=c(1,2,4,4,3,2,1,4,5,4,3,2,1,3,4,2,1,2,1,1)
#verificamos que tiene 20 elementos 
length(pep)
[1] 20
pep=c(1,2,4,4,3,2,1,4,5,4,3,2,1,3,4,2,1,2,1,1)
#primera tabla ..poco estetica
table(pep)
pep
1 2 3 4 5 
6 5 3 5 1 

TABLAS

library(DT)
pep=c(1,2,4,4,3,2,1,4,5,4,3,2,1,3,4,2,1,2,1,1)
table(pep)
pep
1 2 3 4 5 
6 5 3 5 1 
a=as.data.frame(table(pep))
#cambiar nombres por defecto
colnames(a)=c("observacion","frecuencia")
a
  observacion frecuencia
1           1          6
2           2          5
3           3          3
4           4          5
5           5          1

NUBES DE PALABRAS

Para esto necesitaremos usar una herramienta extra ,tenemos dos posibilidades :wordcloud o wordcloud2.Vamos a crear una tabla con 6 palabras y le vamos a asignar

BASES DE DATOS

BASES DE DATOS

BASES DE DATOS

  • Usaremos para esta practica 3 bases de datos : USM,CDEE,X,Y
library(readxl)
USM <- read_excel("excel/Libro 37.xlsx", 
    sheet = "Hoja3") #almacenando la base en la variable USM
tail(USM,n=3)
# A tibble: 3 × 5
  ESTUDIANTE  SEXO  EDAD ESTATURA LOCALIDAD    
       <dbl> <dbl> <dbl>    <dbl> <chr>        
1        489     0    18      160 LA CANDELARIA
2        490     1    20      168 ENGATIVA     
3        491     1    19      173 TEUSAQUILLO  
library(readxl)
USM <- read_excel("excel/Libro 37.xlsx", 
    sheet = "Hoja3") #almacenando la base en la variable USM
head(USM,n=3)
# A tibble: 3 × 5
  ESTUDIANTE  SEXO  EDAD ESTATURA LOCALIDAD    
       <dbl> <dbl> <dbl>    <dbl> <chr>        
1          1     1    19      186 SUBA         
2          2     1    18      177 ENGATIVA     
3          3     0    24      153 SAN CRISTOBAL

GRAFICOS

Tenemos varias posibilidades de gráficos segun la variable con la que estemos trabajando 😃:

  • Histogramas

  • Graficos de barras

  • Caja y bigotes 🐱

  • Densidad,graficos de puntos,ojivas ,violines 🎻,pirámides poblacionales 🧑‍🤝‍🧑 …

GRAFICOS

boxplot(iris$Sepal.Length~iris$Species)

Caja y bigotes
hist(iris$Petal.Length)

Histograma

BASES DE DATOS(EJERCICIOS)

Una vez que tenemos nuestras bases de datos para trabajar ,vamos a consultar información y a trabajar con algunas funciones estadisticas básicas y a realizar gráficos como los anteriormente mencionados.

OPERADORES DE COMPARACION : >,<,==
3>2
[1] TRUE
2==3
[1] FALSE
2!=9
[1] TRUE
OPERADORES LOGICOS : & ,|
TRUE & FALSE
[1] FALSE
FALSE| TRUE
[1] TRUE
(TRUE & FALSE)
[1] FALSE

CONSULTAS BASICAS SUBSET

Vamos a responder algunas preguntas sobre nuestros conjuntos de datos:

  • Número de hombres menores o iguales de 22 años

  • Número de mujeres con una altura mayor al promedio de : a)la estatura de las mujeres b)la estatura de los hombres c) la estatura total

  • ¿Es el promedio de la estatura total igual al promedio de las estatura de los hombres y las mujeres ?

Consultas

  • ¿Cuantos hombres son de edad mediana (esto significa que estan entre los 18 y 24 años incluidos los de 18 y 24 ),hay mas hombres o mujeres de edad mediana ?

  • Una persona se considera con estatura anormal si su estatura satisface que esta a dos desviaciones estandar por arriba o por abajo de la meia de la estatura.¿hay mas hombres con estatura anormal o mujeres?¿cual es el promedio de estas estaturas?¿que pasa si el criterio cambia dos desviaciones por 3 o por 1 ?

RESPUESTAS 📔

OTRAS CONSULTAS

DISTRIBUCIONES

When you click the Render button a document will be generated that includes:

  • Content authored with markdown
  • Output from executable code

Code

👩‍🦰 When you click the Render button a presentation will be generated that includes both content and the output of embedded code. You can embed code like this:

[1] 2

nuevas

otra

\[ \left|\begin{array}{c|c|c} \hline Quintil&Pais A&Pais B \\\hline 1&6.000&4.000\\2&12.000&6.000\\3&18.000&20.000\\4&30.000&40.000\\5&54.000&90.000\\\hline \end{array}\right| \]

PERRO

MAT FIN

cod

import numpy as np
import matplotlib.pyplot as plt

r = np.arange(0, 2, 0.01)
theta = 2 * np.pi * r
fig, ax = plt.subplots(subplot_kw={'projection': 'polar'})
ax.plot(theta, r)
ax.set_rticks([0.5, 1, 1.5, 2])
ax.grid(True)
plt.show()

ult

GRAFO

nuea

pepepe

[1] 3
[1] 6
[1] 9

4

Note

Note that there are five types of callouts, including: note, warning, important, tip, and caution.

Tip With Caption

This is an example of a callout with a caption.

Expand To Learn About Collapse

This is an example of a ‘folded’ caution callout that can be expanded by the user. You can use collapse="true" to collapse it by default or collapse="false" to make a collapsible callout that is expanded by default.

normal

Important

esto es imporatnte 😌

minimal

estop es grave

Pay Attention 👽

Using callouts is an effective way to highlight content that your reader give special consideration or attention.

[1] 4