domingo, 28 de septiembre de 2008

Grafica Circular, Diagrama de Puntos y Diagrama de Pareto

Grafica Circular

Se forma al dividir un círculo en sectores circulares de manera que:

a) Cada sector circular equivale al porcentaje correspondiente al dato o grupo que representa.

b) La unión de los sectores circulares forma el círculo y la suma de sus porcentajes es 100.
Diagrama de Puntos

Los diagramas de puntos sirven para presentar gráficamente tablas en las cuales se consideran únicamente una variable y una cantidad asociada a cada valor de la misma.

Hay dos tipos de diagramas de puntos. Los dos muestran esencialmente la misma información, sólo que en diferente forma y con diferente propósito. La construcción de estos diagramas se describe a continuación:

a) El primer tipo de diagrama de puntos se construye colocando en el eje horizontal los valores de la variable (los cuales en muchos casos son arbitrarios) y en el eje vertical las cantidades asociadas a éstos. Finalmente, para cada valor de la variable y cada cantidad asociada se dibujan puntos cuya altura corresponde a la magnitud de dicha cantidad.

Al retomar el ejemplo 1 de los alumnos de nuevo ingreso se tiene:

Programa

Total de Estudiantes

Economía

12

Sociología Rural

9

Estadística

5

Computo Aplicado

7

Con el objeto de simplificar la presentación, primero identificaremos a cada programa con un número; así, por ejemplo, Economía se identificará con el número 1, Sociología Rural con el 2 y así sucesivamente. Ya efectuado lo anterior, se tendrá que la variable en cuestión corresponde a los diferentes programas (X) y los valores numéricos que pueden tomar son 1, 2, 3 y 4. Las cantidades asociadas a estos números son los totales de estudiantes de nuevo ingreso por lo que la gráfica queda de la manera siguiente:

Diagrama de puntos que corresponde a los totales de estudiantes de nuevo ingreso (Y) por diversos programas (X) del Colegio de Postgraduados.

b) Para construir el segundo tipo de diagramas de puntos se colocan en el eje horizontal los valores de la variable y sobre cada valor se dibujan tantos puntos como aparecen éstos.

Al retomar el ejemplo 2 de la tabla de calificaciones del Examen Final de Bases de Datos I.

88

77

49

38

100

95

60

75

100

80

63

69

50

90

82

65

75

100

95

50

80

70

60

100

75

80

100

90

85

75

La gráfica quedará de la manera siguiente:

Diagrama de Pareto

Un diagrama de Pareto se asemeja a un histograma, excepto que es una gráfica de barras de frecuencias de una variable cualitativa, no de datos cuantitativos agrupados en clases. Las barras de la gráfica, que pueden representar frecuencias o frecuencias relativas (porcentajes) se organizan en orden descendente de izquierda a derecha. Esta disposición da como resultado la ubicación de las categorías más importantes de datos, según su frecuencia de ocurrencia, en las posiciones iniciales de la gráfica. Los diagramas de Pareto se usan en el control de procesos para tabular las causas asociadas con variaciones de causas atribuibles en la calidad del producto del proceso. Es común que solamente unas cuantas categorías de causas se asocien con la mayoría de los problemas de calidad, de modo que los diagramas de Pareto permiten que tanto equipos de trabajadores como gerentes se concentren en las áreas más importantes en las que se necesitan acciones correctivas.

EJEMPLO Se encontró que los refrigeradores que no fueron aprobados en la inspección final en una planta ensambladora de aparatos eléctricos durante el último mes tenían defectos debidos a las siguientes causas: ensamble, acabado de laca, fallas eléctricas, abolladuras u otras causas. La figura 1-8, obtenida con Minitab, es el diagrama de Pareto para la representación gráfica tanto de las frecuencias como de las frecuencias relativas de cada causa de falla en inspección. Como puede verse, la gran mayoría de fallas en inspección se deben a defectos en el ensamble y el acabado de laca.





Diagrama de Pareto de: Defectos





Referencias: http://colposfesz.galeon.com/est501/distfrec/metgraf/metgraf.htm

Histograma y Poligono de Frecuencias

Histograma. Se utiliza en datos cuantitativos en distribuciones de frecuencia. Son rectángulos verticales unidos entre sí, en donde sus lados son los límites reales inferior y superior de clase y cuya altura es igual ala frecuencia de clase.

Distribucion de frecuenc
Poligono de Frecuencias

Consiste en una serie de segmentos que unen los puntos cuyas abscisas son los valores centrales de cada clase y cuyas ordenadas son proporcionales a sus frecuencias respectivas.



Diagrama de Cajas y Bigotes

DIAGRAMA DE CAJAS Y BIGOTES (Box and Whisker Plot)

Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.

Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.

Procedimiento

Para el diagrama de cajas y bigotes se requiere

  1. Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
  2. La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.
  3. El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
  4. Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:

    CIi = Q1 - Paso
    CIs = Q
    3 + Paso

    Si la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
  5. Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:

    CEi = CIi - Paso

    CEs = CIs + Paso
  6. Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.
  7. "Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.
  8. "Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.




Considere los siguientes datos, correspondientes a :


De este conjunto de datos tenemos que:

Me = 90.45
Q
1 = 88.25
Q3 = 92.2

Rango intercuartílico = RIC = 92.2-88.25 = 3.95 Þ Paso = 5.925
Cercas interna inferior = 88.25 - 5.925 = 82.325
Cerca interna superior = 92.20 + 5.925 = 98.125
Cerca externa inferior = 82.325 - 5.925 = 76.40
Cerca externa superior = 98.125 + 5.925 = 104.05


Como se observa hay dos valores que merecen especial atención: 98.8 y 100.3 que están entre las cercas interna y externa superior.

Esta informacion fue sacada de: http://siona.udea.edu.co/~bcalderon/1_cajasbigotes.html

Ejercicio - Diagrama de Tallos y Hojas

Ejercicio. Diagrama de Tallos y Hojas

En la tabla se presentan los datos de la resistencia a la compresión de cilindros de concreto.

Elabora un diagrama de Bloque.


Dato menor = 76

Dato mayor = 245

Entonces los tallos serian desde 7 hasta 24.


Tallo

Hoja

Frecuencia

7

6

1

8

7

1

9

7

1

10

15

2

11

058

3

12

013

3

13

133455

6

14

1235689

7

15

01344678888

12

16

0003357789

10

17

0112445668

10

18

0011346

7

19

034699

6

20

0178

4

21

8

1

22

189

3

23

7

1

34

5

1





Diagrama de Tallos y Hojas

Diagrama de Tallos y Hojas


Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.



El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los puntajes individuales dentro de cada grupo.



El tallo esta formado por 1 ó más de los digitos principales y una hoja la cual contiene el resto
de los digitos. En general debe escogerse un número relativamente pequeño de tallos en comparacion con el número de observaciones.
Lo usual es seleccionar entre 5 y 20 tallos.

Bibliografia: http://www.estadistica.cl/~agora/texto/FlashHelp/Diagrama_de_Tallo_y_Hoja.htm


Ejercicio - Percentiles

Ejercicio.


PK - K% de datos por debajo de (K%) -
P25 ---» Son 25% de los datos de menor valor al que se encuentra en esta posicion.

Datos:

105,97,245,163,207,134,218,199,160,196,221,154,228,131,180,178,157,151,175,201,183,
153,174,154,190



* Se ordenan ascendentemente los datos


97,105,131,134,151,153,154,154,157,160,163,174,175,178,180,183,190,196,199,201,207,
218,221,228,245

n = 25
K = 25

Formula:

PK =



Obtencion de resultados:


P25 = = 6.25 = 7 = 154


P50 = = 12.5 = 13 = 175

P75 = = 18.75 = 19 = 199


* Cada valor obtenido se ubica en los datos ya ordenados decuerdo a su numero de posicion, para obtener el resultado.

Cauntiles

Cuantiles

Los cuantiles son medidas de posición que se determinan mediante un metodos que determina la ubicación de los valores que dividen un conjunto de observaciones en partes iguales.

Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos que comprenden el mismo número de valores. Cuando la distribución contiene un número alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella, se puede dividir la distribución en cuatro, en diez o en cien partes.

Los más usados son los cuartiles, cuando dividen la distribución en cuatro partes; los deciles, cuando dividen la distribución en diez partes y los centiles o percentiles, cuando dividen la distribución en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma una extensión de la mediana.

Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):

u

Q(u)

0.5

Mediana

0.25,0.75

Cuartiles

0.1,…0.99

Deciles

0.01,…0.99

Percentiles





Cuartiles

Son tres valores con las siguientes características:

Q1: Primer cuartil, que es el valor de la variable por debajo del cual queda 1/4 de los elementos

de la serie es tudiada.

Q3: Tercer cuartil, que es el valor de la variable por debajo del cual que dan los 3/4 de los

elementos que constituyen la serie.

Evidentemente el segundo cuartil coincide con la mediana. Como puede comprobarse, no tendría

ninguna utilidad definir el cuarto cuartil.



Para datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una

tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente:

k= 1,2,3

Donde:

Lk = Límite real inferior de la clase del cuartil k

n = Número de datos

Fk = Frecuencia acumulada de la clase que ant

ecede a la clase del cuartil k.

fk = Frecuencia de la clase del cuartil k

c = Longitud del intervalo de la clase del cuartil k

* Si se desea calcular cada cuartil individualmente, mediante

otra fórmula se tiene lo siguiente:

  • El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 2 5% de las o bservaciones y es superado por el 75% de las observaciones.

Fórmula de Q1, para series de Datos agrupados:

Donde:

L1 = limite inferior de la clase que lo contiene

P = valor que representa la posición de la medida

f1 = la frecuencia de la clase que contiene la medida soli cit ada.

Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.

Ic = intervalo de clase

  • El segundo cuartil Q2, (coincide, es idéntico o similar a la m ediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores.

Fórmula de Q2, para series de Datos agrupados:

Donde:

L1 = limite inferior de la clase que lo contiene

P = valor que representa la posición de la medida

f1 = la frecuencia de la clase que contiene la medida solicitada.

Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.

Ic = intervalo de clase

  • El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones.

Fórmula de Q3, para series de Datos agrupados:

Donde:

L1 = limite inferior de la clase que lo contiene

P = valor que representa la posición de la medida

f1 = la frecuencia de la clase que contiene la medida solicitada.

Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.

Ic = intervalo de clase.

Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil.


Para datos sin Agrupar

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:

- Para el primer cuartil:

Cuando n es par:



Cuando n es impar:



- Para el tercer cuartil

Cuando n es par:



Cuando n es impar:





Percentiles

Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc.

Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.

Para datos Agrupados

Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula:

k= 1,2,3,... 99

Donde:

Lk = Límite real inferior de la clase del decil k

n = Número de datos

Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.

fk = Frecuencia de la clase del decil k

c = Longitud del intervalo de la clase del decil k


Pra datos no Agrupados

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:

Para los percentiles, cuando n es par:


Siendo K el numero de percentil.

Cuando n es impar:



Siendo K el numero de percentil.

Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75.


Esta informacion fue sacada de: www.sectormatematica.cl/media/NM4/NM4_cuantiles.doc