DISEÑO DE EXPERIMENTOS CLASE 1
• Población: Conjunto de unidades en observación, seres humanos, establecimientos u otro tipo de objetos que se van ha estudiar en una ubicación, tiempo y espacio.1
• Superpoblación: Exceso de personas u objetos que pueden estar en una determinada área, espacio o tiempo. 2
• Muestra: Elementos de la población seleccionados con cierta técnica de modo que sea representativos, de los cuales se busca realizar inferencias sobre la población, que sean confiables y con cierto nivel de significancia.3
• Censo: Investigación estadística que consiste en el recuento del total de la población en un tiempo y espacio.
• Parámetro: Cualquier valor característico de la población desconocido.3
• Estadística (estadígrafo): Valor calculado en base a la muestra, una aproximación a de los parámetros.3
• Estimación: Evaluación cualitativa del valor de un resultado probable, normalmente usado en datos de esfuerzo, recursos o costos.1
• Sesgo: Asimetría que presenta una distribución de frecuencias, puede ser negativo o a la izquierda, o puede ser positivo o a la derecha.3
• Simetría: Termino asociado a las distribuciones que tiene un punto central definido (media, mediana, moda.) y sus dos mitades resultantes corresponden con la imagen de una reflejada de la otra.4
• Curtosis: También conocida como mediana de apuntamiento, mide si los valores están alrededor de los valores medios de la muestra.3
• Inferencia: Parte de la estadística cuya finalidad es obtener respecto a la población a partir de los datos de la muestra.3
• Inducción: Extraer a partir de determinadas observaciones el principio general implícito en ellas.5
• Deducción: Sacar una conclusión en base a unos datos.5
• Variable: Característica de la muestra o población cuya medida puede cambiar de valor.3
• Constante: Es un numero arbitrario que no cambia, el cual puede multiplicarse por tasas, razón o proporción para dar una medida más comprensible.2
• Variable Cualitativa: Es una variable que representa cualidades, atributos o características no numéricas.3
• Variable Cuantitativa Discreta: Es la característica de la población cuyos valores están representados mediante números naturales.3
• Variable Cuantitativa Continua: Es la característica de la población cuyos valores están representados mediante números reales.3
• Escala de Medición
Nominal: Dato de una variable cualitativa cuyos valores no se les puede asignar ningún orden.3
Ordinal: Dato de una variable cualitativa cuyos valores solo pueden ser ordenados por algún criterio.3
Intervalo: Conjunto de datos comprendido entre dos valores.3
Razón: es la relación entre un subgrupo de la población y la población total u otro subgrupo la población.
• Variable Categórica: Variable con un numero de datos limitados o categoría.2
• Medida de Tendencia Central Son medidas de resumen que de acuerdo con algún criterio indican un valor alrededor del cual se distribuyen las observaciones.3
• Media Aritmética: Es una medida de la tendencia central que denota el promedio de los datos y se calcula dividiendo la suma del conjunto de datos en el total de datos.3
• Media Geométrica: Es una medida de tendencia central que se obtiene como resultado de la raíz cuadrada del producto de los datos elevados a la N, dado que se repiten n veces.3
• Media Ponderada: Media hallada mediante la multiplicación de cada dato por un valor numérico, y la división de la suma de los productos entre la suma de los valores numéricos.6
• Media Truncada: Es una media que se obtiene calculando un promedio de los datos totales menos un porcentaje o numero de datos que se encuentran en los extremos.6
• Media windsordizada: Es una media que sustituye un porcentaje de los datos en los extremos ordenados con los datos inmediatamente anterior o posterior y se calcula la media.7
• Mediana: Es una medida de tendencia central que divide el conjunto de datos ordenados en un 50% aproximadamente mayor y un 50% aproximadamente menor.3
• Moda: Es una medida de tendencia central, el valor de la variable que tiene mayor frecuencia absoluta.3
• Medida de dispersión: Es aquella medida que de acuerdo a un criterio refleja la heterogeneidad de las observaciones, da una idea de la representatividad de las mediadas de tendencia central.3
• Varianza: Es un estimador de la dispersión de una variable aleatoria respecto a su media.1
• Desviación típica: Es una medida de dispersión que se obtiene como la raíz cuadrada de la varianza.3
• Desviación media: Es una medida de dispersión, medida de los valores absolutos de las desviaciones respecto a su media aritmética.3
• Rango: Es un numero que mide la amplitud de los valores de un conjunto de datos, y se calcula por la diferencia entre el valor mayor y el valor menor.3
• Rango intercuartílico: Es una medida de dispersión que se obtiene como la diferencia entre el tercer cuartil y el primer cualtil.3
• Coeficiente de Variación: Es el coeficiente entre la desviación estándar y la media aritmética.1
• Cuartil Inferior: Es el mayor valor que se podría encontrar en el primer 25% de la distribución ordenada de menor a mayor.3
• Cuartil Superior: Es el mayor valor que se podría encontrar en el 75% de la distribución ordenada de menor a mayor.3
• Cuantiles: Son números de orden p en una distribución de frecuencias si el porcentaje de datos inferiores a el es p.6
• Percentiles: Es el valor que resulta de dividir el numero de datos totales en 100 partes iguales, donde cada parte equivale al 1 %.2
• Indicé: Variable cuantitativa cuyos valores son susceptibles a interpretación en algún campo de conocimientos.1
• Diagrama de barras: Es un grafio utilizado para representar la distribución de frecuencias cualitativa y cuantitativa discreta.3
• Diagrama de sectores: Es un diagrama empleado para representar la distribución de frecuencias relativas de una variable cualitativa (grafico circular).3
• Diagrama de puntos (dispersión): Es un grafico utilizado para representar la relación entre los valores observados de dos variables numéricas.3
• Diagrama de líneas: Diagrama donde se representa con líneas los valores de los datos en dos ejes cartesianos ortogonales entre sí.3
• Pictograma: Representación grafica de los datos recogidos mediante dibujos, como el diagrama de barras pero cambiando las barras por dibujos representativos.3
• Histograma: Grafico utilizado para representar la distribución de frecuencias de una variable continua, describe el comportamiento de los datos, forma y dispersión.3
• Diagrama de cajas: Conocido también como boxplot, es un importante grafico de análisis de datos que da una idea visual de la distribución de los datos.
• Diagrama radial: Se utiliza para mostrar todos loes elementos de un componente principal, con los componentes alrededor.3
• Ojiva: Es un grafico acumulativo de frecuencias o frecuencias relativas, de dos tipos mayor que y menor que.3
• Frecuencia: El numero de veces que se repite un valor concreto en una recogida de datos se llama frecuencia absoluta o simplemente frecuencia.4
• Frecuencia Relativa: Es un valor que se obtiene como el cociente de la frecuencia absoluta acumulada sobre el tamaño de la muestra.3
• Proporción: Es la relación entre un subgrupo de la población y toda la población.2
• Porcentaje: Equivale a la frecuencia relativa expresada como tanto por ciento o porcentaje.
• Tasa (Ratio): Es la frecuencia de los eventos durante un determinado periodo, tiempo y espacio.2 • Coeficiente de Disparidad: Coeficiente disparidad o coeficiente de GINI, es una medida de la desigualdad.
• Verosimilitud: La función de verosimilitud en poblaciones discretas da como resultado la probabilidad de que ocurra el evento, y en poblaciones continuas la función nos proporciona la densidad.5
• Probabilidad: Oportunidad que tiene cada elemento de la población o universo de ser seleccionado en el estudio.1
• Distribución de Probabilidad:
Binomial: Distribución de probabilidad de una variable aleatoria discreta que describe el numero de sucesos que se presentan para un variable de ensayo.
Uniforme: es una distribución de frecuencia de los enteros no negativos.4
Poisson: Es una distribución utilizada para los casos límites de la distribución binomial.4
Hipergeométrica: Es una distribución correcta para calcular valores como el riego del consumidor.4
Normal: Tiene una forma de campana y viene caracterizada por únicamente dos valores; la media y la varianza.4
Exponencial: Es utilizada para la distribución de probabilidad del tiempo de espera entre dos hechos que sigan un proceso de Poisson.6
Beta: Es una distribución que nos permite generar una variedad de perfiles y se utiliza comúnmente para representar variables físicas cuyos valores están restringidos por un intervalo finito, como los límites de tolerancia.8
• Tabla de contingencia: Es una tabla de doble entrada, se representa generalmente como (x, y, n).3
• Distribución Marginal: Es una distribución de frecuencias de una variable independientemente de como se comporta otra variable bidsimensional.3
• Distribución conjunta: Es una tabla de doble entrada donde por el lado de las filas se sitúan las categorías de la variable X, y por el lado de las columnas se sitúan las categorías de la variable Y.5
• Sumas de Cuadrado: Es la suma de las diferencias al cuadrado, entre los datos experimentales y su media.5
• Estimación mínimo-cuadrática: Es el ajuste de una línea de regresión a los puntos de un conjunto de datos que tiene la suma mínima de las desviaciones elevada al cuadrado.1
• Error cuadrático medio: Indica la variabilidad de los puntos con respecto a la línea de regresión.5
• Covarianza: Es la medida de la asociación lineal entre dos variables.3
• Análisis de covarianza: Es una técnica estadística que combina el análisis de varianza y análisis de regresión.5
• Regresión: Es una técnica de análisis para poner de manifiesto la estructura de dependencia que mejor explique la variable independiente o estudiada.3 • Correlación:
Pearson: Índice que cuantifica si hay una relación lineal o no entre dos variables cuantitaivas.5
Spearman: Se utiliza para hallar la relación entre dos variables ordinales.5
• Modelo lineal: Predice el valor de una variable a través de otras que llamaremos factores mediante una función lineal de estos.1
• Modelo no lineal: La variable y los factores no se pueden predecir mediante una función lineal.1
• Factor: Variable que se incluye en un modelo con el fin de la variación de la variable respuesta.
• Variable respuesta: Variable objeto de estudio y que sus resultados se pretenden explicar por medio de variables independientes.5
• Minería de datos: La minería de datos o exploración de datos es un campo de la estadística y las ciencias de la computación que se refiere al proceso que busca patrones en grandes conjuntos de datos.4
• Ciencia de datos: Campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de los datos.5
• Machine Learning: Ciencia de la computación que permite crear técnicas para que las computadoras aprendan.5
• Big data: Conjunto de datos cuyas características dificultan su captura, procesamiento, gestión o análisis.1
• Efecto: Cambio en el resultado después de una intervención experimental.1
• Contraste: Es el proceso que se sigue para tomar decisiones a partir de la información de la muestra.3
• Interacción de factores: Efecto debido a la combinación de varias variables.5
• Dato Faltante: Son datos que no se encuentran en el estudio debido a algún suceso.5
• Dato atípico: Es una observación que es distante de los demás datos.5
• Hipótesis nula: Afirmación que se hace sobre parámetros de una población la cual deseamos contrastar.5
• Hipótesis alterna: Aseveración sobre el valor de un parámetro desconocido de la población.5
• Significación estadística. Es la probabilidad de que un evento no haya ocurrido al azar.5
• Estadístico de prueba: Variable aleatoria calculada a partir de datos de la muestra. 5
• P Valor: Es la probabilidad de obtener un valor u otros menores si se satisface la hipótesis nula.4
• Diagrama de densidad: Genera la visualización de datos en un tiempo o periodo de tiempo continuo.5
• Dependencia espacial: Relación entre datos georreferenciados debido a la naturaleza de la variable bajo estudio, forma y configuración de las variables espaciales.5
• Dependencia temporal. Característica de datos e serie temporal que indica que le pasado afecta el futuro.5
• Técnica de Muestreo:
Aleatorio simple: Muestreo donde la muestra es seleccionada de forma que cada muestra del mismo tamaño tiene la misma probabilidad de ser seleccionada de la población.3
Sistemático: Es la toma de la muestra en una población con algún tipo de orden.3
Estratificado: Toma de muestras cuando la población ha sido dividida en grupos de datos que son mas homogéneos de otros muy distintos.3
• Muestreo Espacial: Consiste en escoger muestras representativas de un modelo con coordenadas o posiciones definidas.5
• Efecto Borde: Efecto que se reconoce cuando los datos de los bordes tienen diferente composición al de las áreas centrales.8
• Efecto de competición: Variabilidad que producen algunos factores y que se deben tener en cuenta al elaborar el experimento.8
• Efecto de solapamiento: Efecto que causa que señales continúan se tornen indistinguibles.8
• Diseño experimental: Técnica estadística que permite identificar y cuantificar las causas que produce un efecto dentro de un estudio experimental.8
• Diseño cuasiexperimental: Son los diseños que carecen de un control absoluto de todas las variables estudiadas.8
• Estudio observacional: Los investigadores meramente observan los valores de algunas características de la muestra.5
• Control:
Absoluto: Se pueden identificar las variables que causan los cambios en los datos.5
Positivo: Es un dato que se utiliza para evaluar la validez de una prueba.8
Negativo: Es el proceso que consiste en utilizar el grupo de control para asegurarse de que ninguna variable de confusión haya afectado los resultados.5
• Unidad experimental: Es un valor matemático que se le da a una variable aleatoria.1
• Unidad de observación: Elemento del cual se obtiene los datos con propósitos estadísticos sobre el conjunto al que pertenece.1
BIBLIOGRAFIA 1. Instituto nacional de geografía, c2012. Glosario de estadística básica. Edificio Sede, México.
Glosario. (27 abril 2021). https://ccp.ucr.ac.cr/cursos/demografia_03/glosario.html
Asurza, H. 2006. Glosario Básico de Términos Estadísticos. Centro de Investigación y Desarrollo. Lima, Perú.
Roldan, A. 2018. Diccionario de Estadística Practica.
Manzano, V. Duran, A. 2001. Compresión y Medida del concepto de Simetría. Universidad de Sevilla. Murcia, España.
Glosario Términos Estadísticos. https://glosarios.servidor-alicante.com/terminos-estadistica. (25 julio 2020).
Román, P. Algunos modelos de distribuciones continuas. CALCULO DE PROBABILIDAD. (Tema 6).
Romania, J C. 2012. Estadística Experimental. Universidad Privada de Tacna. Fondo editorial: Utp-Perú. Sociedad de Estadística e investigación operativa Madrid- España.