lunes, 6 de octubre de 2008

MEDIDAS DE TENDENCIA CENTRAL

Medidas de tendencia central
Medidas de Tendencia Central Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo número. Para tal fin, desde luego, no se usará el valor más elevado ni el valor más pequeño como único representante, ya que solo representan los extremos más bien que valores típicos. Entonces sería más adecuado buscar un valor central. Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos más bien que a individuos. Un promedio es una característica de grupo, no individual.
Entre las medidas de tendencia central tenemos:
La Media Aritmética
La medida de tendencia central más obvia que se puede elegir, es el valor obtenido sumando las observaciones y dividiendo esta suma por el número de observaciones que hay en el grupo. La media resume en un valor las características de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas.
Ejemplo:
Notas de 5 alumnos en una prueba:
Alumno Nota
1 6.0 •entonces se suman las Notas:
2 5.4 6.0+5.4+3.1+7.0+6.1=27.6
3 3.1 •Luego el total se divide por la cantidad de alumnos:
4 7.0 27.6/5=5.52
5 6.1 •LA MEDIA ARITMÉTICA EN ESTE PROBLEMA SERIA 5.52

La Media Aritmética
La medida de tendencia central mas ampliamente usada es la media aritmética, usualmente abreviada como media. (promedio)
La media aritmética de un conjunto de n valores es el resultado de la suma de todos ellos dividido entre n.
Propiedades de la media aritmética
1. Puede ser calculada en distribuciones con escala relativa e intervalar.
2. Todos los valores son incluidos en el cómputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy útil para comparar dos o más poblaciones.
5. Es la única medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos.
Desventajas de la media aritmética
1. Si alguno de los valores es extremadamente grande o extremadamente pequeño, la media no es el promedio apropiado para representar la serie de datos.
2. No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.
Media muestral
Si se tiene una muestra estadística de valores (X1,X2,...,Xn) de valores para una variable aleatoria X con distribución de probabilidad F(x,?) [donde ? es un conjunto de parámetros de la distribución] se define la media muestral n-ésima.
Es necesario tener agrupados los datos en forma ascendente o descendente, es decir, que se tenga como primer dato el máximo o el mínimo antes de calcular la media muestral.
Distintas formas de escribir la fórmula
Moda
Es el dato que más se repite en la cuenta. Si existen dos datos que se repite un numero igual de veces entonces el conjunto será bimodal. Ejemplo:
Numero de personas en distintos carros en una carretera :
5-7-4-6-9-5-6-1-5-3-7
en este caso el numero que más se repite es 5 entonces la moda en este caso es 5.
Promedio Geométrico
La media geométrica de un conjunto de observaciones es la raíz en ésima de su producto. El cálculo de la media geométrica exige que todas las observaciones sean positivas.
Percentiles
Los percentiles representan los valores de la variable que están por debajo de un porcentaje, el cual puede ser un valor de 1% a 100% (en otras palabras, el total de los datos es divido en 100 partes iguales).
Observación
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada.
Si x1,x2,...,xn son nuestros datos y w1,w2,...,wn son sus ‘pesos’ respectivos la media ponderada se define de la siguiente forma:
Imagen:JaimeMedia3.JPG
La media es invariante frente a transformaciones lineales (cambio de origen y escala) de las variables, es decir si x es una variable estadística y Imagen:JaimeMedia5.JPG, es otra variable estadística que depende linealmente de x , entonces Imagen:JaimeMedia6.JPG. ( a representa la magnitud del cambio de escala y b la del cambio de origen).
== Propiedades de la Media o Promedio La media o Promedio tienen las siguientes propiedades
Se puede Sumar, Restar y multiplicar de la siguiente forma
Si tenemos :
1 - 2 - 3 - 4
entonces veremos lo siguiente :
Suma : Si sumamos una constante a cada variable veremos lo siguiente.
Datos : 1 - 2 - 3 - 4 Media : Sumatoria de datos / Numero de datos => 10 / 4 => 2.5
Si
Datos : 1 - 2 - 3 - 4 + Constante : 1 Datos : [(1+1) + (2+1) + (3+1) + (4+1)] /4 => 14/4 => 3.5
Entonces Vemos: que si aumentamos una constante a cada dato también deberemos de aumentarla al resultado. De la misma forma se muestra para la resta y multiplicación.
Moda
En estadística la moda es el valor que cuenta con una mayor frecuencia en una distribución de datos.

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal.
Si todas las variables tienen la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:


Siendo ni la frecuencia absoluta del intervalo modal y ni − 1 y ni + 1 las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

Ahora vamos a ver un problema de ejemplo, solucionado con el programa de cálculo SCI-LAB.
Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo):



Vemos que el valor más repetido de calificaciones de alumnos es la nota 6, con un total de 9 alumnos.
Abrimos SCI-LAB; Creamos un vector x; que contendrá el total de notas sacadas por los alumnos;
-->x={1 1 2 2 3 3 3 3 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 7 7 7 7 8 8 8 8 9 9}
x =

column 1 to 13
1. 1. 2. 2. 3. 3. 3. 3. 4. 4. 4. 4. 5.
column 14 to 26
5. 5. 5. 5. 5. 6. 6. 6. 6. 6. 6. 6. 6.
column 27 to 37
6. 7. 7. 7. 7. 8. 8. 8. 8. 9. 9.

Ahorá definimos un vector 'y', como las frecuencias absolutas de el vector 'x', mediante la función 'tabul(x)':
-->y=tabul(x)
y =
9. 2.
8. 4.
7. 4.
6. 9.
5. 6.
4. 4.
3. 4.
2. 2.
1. 2.
-->
Vemos que ahora tenemos en el vector 'y', en la primera columna las calificaciones, y en la segunda columna las freuencias absolutas de éstas. Ahora mediante la función 'max', sacaremos la frecuencia absoluta más alta.
-->[m,i]=max(y(:,2))
i =
4. //'i' nos indica el número de fila.
m =
9. //'m' nos indica la frecuencia absoluta más elevada.
-->
Ya sólo queda introducir el valor de 'i' en la matriz de frecuencias absolutas, eso sí, escogiendo la primera columna, que es la que nos interesa, la de las calificaciones:
-->moda=y(4,1) // el resultado es el elemento contenido en la fila 'i' y la columna 1(calificaciones).
moda =
6.
--> 6 pues, es la moda en cuanto a numero de alumnos que han conseguido esa calificación.
Ejemplo:
En la distribución:
5, 8, 9, 4, 5, 5, 8, 1, 2
La moda es 5, pues es el valor que cuenta con la mayor frecuencia: Aparece 3 veces.
Una distribución puede tener más de una moda si dos o más datos, o clases de datos, tienen la misma frecuencia y esta es la más alta de la distribución.

Moda de datos agrupados:
Para calcular la moda de los valores pertenecientes a una clase se cuenta con la siguiente fórmula.

En donde f es la frecuencia del intervalo y x su marca de clase o punto medio.
Mediana
Definiremos como mediana al valor de la variable que deja el mismo número de datos antes y después que él.
De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra.
Matemáticamente hablando la mediana sería: Me = , si n es impar --> Me será la observación central de los valores, una vez que estos han sido ordenados en orden creciente o decreciente.

Me = , si n es par --> Me será el promedio aritmético de las dos observaciones centrales.
Observaciones:
• La mediana de un conjunto de datos es única.
• El valor de la mediana no es sensible a la presencia de datos extremos.
Uso de la mediana
Al tratar con datos agrupados, tendremos en cuenta que si n/2 coincide con el valor de una frecuencia acumulada, tomaremos como valor de la mediana el valor de la abscisa correspondiente. Si no coincide con el valor de ninguna abscisa, tendremos que calcular esa abscisa a través de semejanza de triángulos en el histograma o polígono de frecuencias acumuladas, utilizando la siguiente equivalencia:


Dónde Ni y Ni-1 son las frecuencias absolutas tales que Ni-1< n/2Ejemplos
Ejemplo (sobre la representatividad)
Supongamos que hay 19 "mendigos" o pobres y un millonario en una habitación. Cada uno pone $5 sobre la mesa pero el millonario aporta un millón. Eso da un total de $1.000.095.
Si el dinero se repartiese por partes iguales, eso daría un promedio (media) de $50.004,75, pero la mediana da $5, ya que si uno divide el grupo en 2, se puede decir que 10 personas aportaron $5 o menos, mientras que las otras 10 personas aportaron $5 o más.
En ese sentido, la mediana representa la cantidad típica que cada persona aportó. En contraste, el promedio es para nada típico, ya que nadie aportó ni cerca de los $50.004.75


Ejemplo ( N impar )
xi fi Fi
1 2 2
2 2 4
3 4 8
4 5 13
5 8 21 > 19.5
6 9 30
7 3 33
8 4 37
9 2 39
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 8 9 3 4 2
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho).
Así, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que hace referencia a las frecuencias absolutas -->
Ni-1< n/2 < Ni = N19 < 19.5 < N20
Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, serán puntos)
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.
Ejemplo ( N par )
Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 6 9 4 4 2
xi fi Fi
1 2 2
2 2 4
3 4 8
4 5 13
5 6 19 = 19
6 9 28
7 4 32
8 4 36
9 2 38
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y basándonos en la fórmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el vigésimo hasta el vigésimo octavo)
con lo que Me = (5+6)/2 = 5,5 puntos.
La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o más

No hay comentarios: