Textmining

Mucho Ruido y pocas nueces

¿ A qué se refiere ? ¿ Qué nos quiere decir ?

Ejemplos del texto

Ejemplo 1

Test de inteligencia
“Pretenden ser una muestra del intelecto. Al igual que cualquier otro producto que tenga su origen en la técnica de muestreo, el C.I. es una cifra que presenta un error estadístico”

Ejemplo 2

Calidad del maíz
“Al recoger al azar el maíz de un campo y examinar, se puede formar una idea bastante buena de como era el campo , esta información se usa para comparar este campo con otros”

Ejemplo 3

Cantida de nicotina
“Pero alguien se fijó en una cosa,en las listas figuraba al final la marca Old Gold. Salieron en las revistas que de todos los cigarrillos examinados por la gran revista el Old Gold era el que contenía una menor cantidad de sustancias indeseables”

Ejemplo 4

Interés de los lectores

’’El coste reduce a menudo las muestras de lectores a pocos centenares de personas… resultará que la conclusión de un 35% se basa solamente en un puñado de lectores. El error probable oculto tras la cifra ofrecida puede ser de tal magnitud que el editor que confíe en ella trabajará sobre arenas movedizas”

Conclusiones

-Se llega a la conclusión de que el único modo de considerar los C.I., así como otros muchos resultados derivados de una muestra, es por clases

-Una medida tomada estadísticamente es incorrecto mencionar un valor discreto , lo correcto sería mencionar el valor más una medida de incertidumbre.

Casos en la vida real

Caso 1

Caso 2

Caso 3

Muchas gracias