Key Concepts & Definitions

*robustness: The change of a small number of measurements barely affects a robust statistic. Median, IQR and MAD are all robust. Mean, variance, skewness, kurtosis are all non robust statistics.

PROPERTIES: * E(X+Y)=E(X)+E(Y) * VAR(X+Y)=VAR(X)+VAR(y)+2CoV(X,Y)

Some distributions

Continuous Distributions

  • Distribución uniforme: Es un escalón que va de x=a a x=b y en ese intervalo su densidad vale \(\frac{1}{b-a}\) Simétrica y sin valores negativos

  • Distribución Normal: Para mayor sample number, más cerca está de la forma teórica esperada. Simétrica y con valores negativos.

  • Distribución Chi cuadrado: Es igual a la suma de n variables independientes al cuadrado que provengan de una distribucion normal estandarizada. Tiene n grados de libertad. La media vale n y la varianza 2n. Se usa para calcular los intervalos de confianza para la media y la varianza de una población. Asimétrica y sin valores negativos.

  • Distribución T-student: Es igual al cociente de una distribución normal estandarizada y la raíz cuadrada de una chi-cuadrado dividida por sus n g.d.l.s La media vale 0 y la varianza \(\frac{n}{(n-2)}\). Se utiliza para hallar una estimación de la media cuando la varianza es desconocida. Se utiliza también para encontrar el intervalo de confianza de poblaciones normales. Cuantos mas gdls mas se parece a una normal estandarizada. Simétrica y con valores negativos.

  • Distribución F: Es igual al cociente de dos distribuciones chi cuadrado (U1 y U2) con diferentes grados de libertad (d1, d2), cada una de ellas dividida por su correspondiente g.d.l. Es asimétrica y sin valores negativos Está relacionada con el test ANOVA

Discrete distributions

  • Bernouilli: Is the discrete probability distribution of a random variable which takes the value of 1 (with a probability p) and the value of 0 with a probability q=1−p. Is the probability distribution of any single experiment that asks yes-no question. E.g to toss a coin.

  • Binomial: Sum of n Bernoulli experiments. Let us assume that we carry out experiment and the result of the experiment can be “success” or “failure”. The probability of “success” in one experiment is p. Then probability of failure is q=1−p. We carry out experiments n times. Distribution of k successes is binomial:

  • Hypergeométrica: There are N balls, R are red and we pick n balls. Let X be the number of black balls in the sample, then the distribution of X is the hypergeometric distribution

  • Poisson: Counting the number of occurrence of an event in a certain time period or in a certain region in space, where the event occurs completely at random. It is often used to describe the occurrence of a rare event.

Variables independientes

Condición que deben cumplir dos variables independientes: P(A|B)=P(A) y P(B|A)=P(B)