lunes, 6 de octubre de 2008

MEDIDAS DE POSICION(CUARTILES,PERCETILES ETC)

Medidas de posición**

Las medidas de posición son unos estadísticos que nos sintetizan la información sobre los datos que analizamos, facilitando su manejo. En lugar de trabajar con toda la tabla de frecuencias, las medidas de posición resumen los valores que separan a los datos en grupos significativos. Una medida de posición es un indicador que se usa para señalar qué porcentaje de datos dentro de la muestra se encuentra a un lado y a otro del mismo.
Cuartiles
Dados una serie de valores X1,X2,X3...Xn ordenados en forma creciente,
Definimos:
• Primer cuartil (Q1) como la mediana de la primera mitad de valores.
• Segundo cuartil (Q2) como la propia mediana de la serie.
• Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
En estadística descriptiva Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
Datos Agrupados
Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente: k= 1,2,3
Donde:
• Lk = Límite real inferior de la clase del cuartil k
• n = Número de datos
• Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
• fk = Frecuencia de la clase del cuartil k
• c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo siguiente:
• El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones.
Fórmula de Q1, para series de Datos agrupados:
Donde:
• L1 = limite inferior de la clase que lo contiene
• P = valor que representa la posición de la medida
• f1 = la frecuencia de la clase que contiene la medida solicitada.
• Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
• Ic = intervalo de clase

• El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores.
Fórmula de Q2, para series de Datos agrupados:
Donde:
• L1 = limite inferior de la clase que lo contiene
• P = valor que representa la posición de la medida
• f1 = la frecuencia de la clase que contiene la medida solicitada.
• Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
• Ic = intervalo de clase
• El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones.
Fórmula de Q3, para series de Datos agrupados:
Donde:
• L1 = limite inferior de la clase que lo contiene
• P = valor que representa la posición de la medida
• f1 = la frecuencia de la clase que contiene la medida solicitada.
• Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
• Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil.
Para Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:
El primer cuartil:
• Cuando n es par: 1*n/4
• Cuando n es impar: 1(n+1)/4
Para el tercer cuartil
• Cuando n es par: 3*n/4
• Cuando n es impar: 3(n+1)/4
Quintiles
• Se representan con la letra K.
• Es el primer quintil. Separa a la muestra dejando el 20% de los datos a su izquierda.
• Es el segundo quintil. Es el valor que indica que el 40% de los datos son menores.
• Es el tercer quintil. Indica que el 60% de los datos son menores que él.
• Es el cuarto quintil. Separa al 80% de los datos del otro 20%.
Percentiles
• Se representan con la letra C.
• Es el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.
Cuando los datos no están agrupados en intervalos los cuartiles, así como el resto de las medidas de posición, tienen un valor claro. Sin embargo, cuando tenemos una agrupación de los datos ya no es tan sencillo realizar el cálculo. Sí que resulta claro ver en cuál de los intervalos está el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto necesitaremos usar una fórmula.
Cálculos en Scilab / MATLAB:
• Los percentiles de un conjunto de datos son calculados con la instrucción “perctl”.
A esta instrucción hay que introducirle dos vectores. Uno de ellos “x” debe contener los datos que queremos procesar y en el otro “y”, valores enteros comprendidos entre el 1 y el 100. La función calcula cuales son los valores de “x” que se corresponden con los percentiles indicados en “y”. Para probar esta función vamos a introducir un vector x que contenga el conjunto de datos con el que queremos trabajar:
x=[7,12,4,8,3,10,11,5,13,1,12,3,5,1,17,4,8,8,7,19,8,1,7,17,4,7,1,7,3,7,3,13,3,4,7,8,10,2,5,11,5,4,3,5,8];
y=[15,25,60,80]
Con esto calcularemos los percentiles 15, 25, 60 y 80 del conjunto de datos del vector “x”
prctile(x,y)
ans =
3. 43.
3.5 5.