DEFINICIONES:
MEDIDAS DE TENDENCIA CENTRAL
Media: es el promedio de todos los valores.
Mediana: es el dato que queda en medio en el conjunto de datos, una vez siendo ordenados el conjunto de datos.
Moda: es el numero que aparece mas a menudo.
MEDIDAS DE DISPERSION
Rango: mide la amplitud de los valores de la muestra y se calcula por diferncia entre valor mas elevado y el valor mas bajo.
Varianza: mide la distancia existente entre los valores de la serie y la media.
Desviacion Estandar: es la medida de dispersion mas comun, que indica que tan dispersos estan los datos con respecto a la media.
Cuartiles: son valores que dividen una muestra de datos en cuatro partes iguales.
METODOS GRAFICOS PARA LA INTERPRETACION DE DATOS
Histograma: es una representacion grafica de una variable en forma de barra, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados.
Graficos de Tallo y Hoja: es un formato para representar datos cuantitativos en un formato grafico, similar a la histograma.
Graficos x,y: su funcion principal es la de demostrar la relaion que existe entre los valores numericos de diferentes series de datos sobre los ejes de coordenadas x, y.
Graficos de control: sirven para poder analizar el comportamiento de los diferentes procesos y poder prever posibles fallos de produccion mediante metodos estadisticos.
MODELOS
Minimos cuadrados: Es una tecnica de analisis numerico enmarcada dentro de la optizacion matematica, en la que, dadosun conjunto de pares ordenados variable independiente, variable independiente y una famila de funnciones, se intenta encontrar la funcion continua, dentro de dicha familia, que se aproximea los datos.
METODOS DE FIRMA
Curtosis: Es una caracteristica de forma de su distribucion de frecuencias.
Curtosis: Es una caracteristica de forma de su distribucion de frecuencias.
ESTADISTICA MULTIVARIABLE
Cumulos: Tambien llamado segmentacion o analisis taxonomico es una forma de hacer una particion de un conjunto de objetos, en cumulos, de tal suerte de que los objetos en el mismo cumulo comparte un perfil mientras los objetos en otro cumulo tiene un perfil totalmente diferente. El analisis de cumulos puede llevarse a cabo en cualquier base de datos. Los sujetos en la base de datos deben tener propiedades que puedan ser valoradas de forma numerica.
Dendograma: Es un tipo de representacion grafica o diagrama de datos en forma de arbol que organiza los datos en subcategorias que se van dividiendo en otros hasta llegar al nivel de detalle deseado, este tipo de representacion permite apreciar claramente las relaciones de agrupacion entre los datos e incluso entre grupos de ellos aunque no las relaciones de similitud o cercania entre categorias.
ESPECTOGRAMA
Regresion lineal: Es un modelo matematico usado para aproximar la relacion de dependencia entre una variable dependiente Y, las variables independientes X y un termino aleatorio
data1 <- scan("C:/Users/Hp/Desktop/Da.txt")
library(modes)
library(moments)
##
## Attaching package: 'moments'
## The following objects are masked from 'package:modes':
##
## kurtosis, skewness
modes(data1)
## [,1]
## Value 5
## Length 23
median(data1)
## [1] 5
mean(data1)
## [1] 11.7439
range(data1)
## [1] 1 89
var(data1)
## [1] 379.378
sd(data1)
## [1] 19.47763
quantile(data1)
## 0% 25% 50% 75% 100%
## 1 5 5 7 89
hist(data1)
stem(data1)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 12222223333344444444555555555555555555555556666666666677777777778888
## 1 | 02
## 2 |
## 3 | 4
## 4 | 23
## 5 | 7
## 6 | 5
## 7 | 66
## 8 | 99
plot(data1,data1)
min(data1)
## [1] 1
max(data1)
## [1] 89
summary(data1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 5.00 5.00 11.74 7.00 89.00
kurtosis(data1)
## [1] 10.40368
skewness(data1)
## [1] 2.92744
table(data1)
## data1
## 1 2 3 4 5 6 7 8 9 10 12 34 42 43 57 65 76 89
## 1 6 5 8 23 11 10 4 3 1 1 1 1 1 1 1 2 2
boxplot(data1)
barplot(data1)
qqnorm(data1)