Date post: | 14-Apr-2018 |
Category: |
Documents |
Upload: | jose-leopoldo-santana |
View: | 221 times |
Download: | 0 times |
7/30/2019 Unidad 3. Medidas de Tendencia Central y Dispersion
http://slidepdf.com/reader/full/unidad-3-medidas-de-tendencia-central-y-dispersion 1/7
Unidad 3. Medidas de tendencia central y dispersión
Para cualquier conjunto de datos estudiados es importante tener un
resumen de la información y sus características. Esta información indica
cómo se comporta la población de datos que tienes. Para resumir la
información se utilizan dos tipos de valores que, en vez de representar cadauno de los datos, representan conjuntos de datos. Estos dos tipos de
indicadores estadísticos son: las medidas de tendencia central, que
muestran hacia qué valores se agrupan o acumulan los datos; y las medidas
de dispersión, que de forma contraria a las anteriores, muestran cómo se
dispersan o separan los datos.
En esta unidad:
• Aplicarás el procedimiento para obtener las medidas de tendencia central y
dispersión en datos agrupados y no agrupados.
Utiliza las medidas de tendencia central y dispersión para describir un
conjunto de datos mediante la representación numérica y gráfica de la
información obtenida en una muestra o población.
3.1. Medidas de tendencia central
Las medidas de tendencia central
Las medidas de tendencia central son los valores que representan un conjunto de datos
de forma tal que te ayudan a saber dónde están acumulados los datos sin indicar cómose distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto
de datos. Las medidas de tendencia central más comunes son: la media aritmética
(conocida como media o promedio), la mediana y la moda.
La media aritmética o, simplemente, media, se denota por x la letra μ según se calcule
en una muestra o en la población, respectivamente. La media es resultado de dividir la
suma de todos los valores de los datos entre el número total de datos.
La manera como se organizan los datos: no agrupados y agrupados (por frecuencias o
intervalos),determina la expresión de la fórmula para calcular la media.
Fórmula para datos no agrupados
7/30/2019 Unidad 3. Medidas de Tendencia Central y Dispersion
http://slidepdf.com/reader/full/unidad-3-medidas-de-tendencia-central-y-dispersion 2/7
En estas fórmulas la diferencia radica en que, el total de la población se
representa con la letra N y el total de la muestra se representa con la letra
n.
Fórmula para datos agrupados en frecuencias
Los datos agrupados en frecuencias son aquellos que se organizan en una tabla de
frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable y,
en otra columna, la frecuencia o el número de veces que se repite cada valor en una
serie de datos.
Las fórmulas para calcular la media con los datos organizados de esta manera son:
Fórmula para datos agrupados en intervalos
7/30/2019 Unidad 3. Medidas de Tendencia Central y Dispersion
http://slidepdf.com/reader/full/unidad-3-medidas-de-tendencia-central-y-dispersion 3/7
Los datos agrupados en intervalos son los que se organizan dentro de un
rango establecido entre un límite inferior y un límite superior. Recuerda que
las tablas de intervalos muestran el número de datos que abarca cada
intervalo (frecuencia por intervalo). Las fórmulas para calcular la media con
los datos organizados de esta manera son:
Para realizar las actividades de esta unidad, utilizarás los problemas que resolviste en la
Actividad 2: Frecuencias de la Unidad 2. Lo recomendable es que trabajes con las tablas
que ya habías elaborado, si no tienes el archivo puedes descargarlo a continuación.
Da clic en el icono para descargar el documento Frecuencias.
Con los datos de este problema, tendrás que obtener las medidas de tendencia central y
dispersión que revisarás a lo largo de la unidad, por lo tanto, esta actividad está dividida
en seis momentos.
Es importante que la actividad la realices paso a paso, ya que si tienes dudas sobre el
uso de las fórmulas, puedes consultarlas a tiempo con tu Facilitador(a); además, tendrás
que entregar tu trabajo al final del tema.
3.1.2. Mediana
La segunda medida de tendencia central es la mediana, esta se define
como:
El valor que divide en dos partes iguales una serie de datos, es decir, la
cantidad de datos que quedan a la derecha de la mediana es igual a la
cantidad de datos que quedan a la izquierda. Se representa por Me.
7/30/2019 Unidad 3. Medidas de Tendencia Central y Dispersion
http://slidepdf.com/reader/full/unidad-3-medidas-de-tendencia-central-y-dispersion 4/7
Para calcular la mediana, debes hacer lo siguiente:
Mediana en datos agrupados por intervalos
Cuando quieres calcular la mediana en datos agrupados por intervalos,
tienes que buscar el intervalo donde la frecuencia acumulada llega hasta la
mitad de la suma de las frecuencias absolutas, es decir, es necesariolocalizar el intervalo donde se encuentre N/2, para ello utiliza la siguiente
fórmula:
Donde:
Li es el límite inferior del intervalo donde se encuentra la mediana.
es la división de las frecuencias absolutas entre 2.Fi-1 es la frecuencia acumulada anterior al intervalo de la mediana.
f i es la frecuencia absoluta del intervalo donde se encuentra la mediana.
ai es la amplitud del intervalo.
.
ara cuando la cantidad de valoreses impar
Para cuando la cantidad de valoreses par
Ordena los valores de menor a mayor y
busca el valor del centro.
Por ejemplo:
1. Supón que tienes los siguientes
valores:
2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9
2. Ordena:
0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9
3. El dato que divide a la mitad es:
4, por lo tanto Me: 4
Ordena los valores de menor a
mayor, busca y promedia los
valores del centro.
Por ejemplo:
1. Supón que tienes los siguientes
valores:
5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1 ,3, 2
2. Ordena:
1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9
3. Busca y promedia los datos del
centro:
4+5=9/2= 4.5, por lo tanto Me: 4.5
7/30/2019 Unidad 3. Medidas de Tendencia Central y Dispersion
http://slidepdf.com/reader/full/unidad-3-medidas-de-tendencia-central-y-dispersion 5/7
Actividad 2: Medidas de tendencia central. Mediana
1. Retoma el problema que utilizaste en la actividad anterior para obtener la media
aritmética.
2. Con los datos obtenidos, calcula la mediana, incluyendo fórmula y lasoperaciones que realices.
3. Recuerda que en el foro Medidas de tendencia central, puedes plantear tus
dudas sobre el tema.
4. La nomenclatura que debe tener tu archivo es la misma que se definió en la
actividad anterior, EB_U3_MTC_XXYZ. Sustituye las XX por las dos primeras
letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la
inicial de tu apellido materno. Recuerda que tu archivo no debe pesar más de 4 MB.
Nota: Todavía no debes enviar tu documento, consérvalo.
3.1.3. ModaLa tercera medida de tendencia central es la moda.
La moda es el valor que tiene mayor frecuencia absoluta, es decir, el valorque se repite más veces en una serie de datos. La moda se denota por Mo.
Cuando todos los valores de la distribución de datos tienen igual número defrecuencia, se dice que no hay moda.
Moda en datos agrupados por intervalosCuando la distribución de datos es por intervalos de clase, primero selocaliza el intervalo que tiene mayor frecuencia absoluta utilizando la
siguiente fórmula para calcular la moda:
Donde:
Li es el límite inferior del intervalo modal.f i es la frecuencia absoluta del intervalo modal.f i—1 es la frecuencia absoluta del intervalo anterior al intervalo modal.
f i-+1 es la frecuencia absoluta del intervalo siguiente al intervalo modal.
7/30/2019 Unidad 3. Medidas de Tendencia Central y Dispersion
http://slidepdf.com/reader/full/unidad-3-medidas-de-tendencia-central-y-dispersion 6/7
ai es la amplitud del intervalo.3.2. Medidas de dispersión
A diferencia de las medidas de tendencia central, que miden acumulaciones
en un solo punto, las medidas de dispersión miden el grado de separación oalejamiento que tiene una variable estadística con respecto a una medidade posición o tendencia central. Dicho grado de separación indica lorepresentativa que es la medida de posición con respecto al conjunto totalde datos. A mayor dispersión, menor representatividad de la medida deposición y viceversa.
3.2.1. RecorridoEl recorrido representa la diferencia que hay entre el primero y el últimovalor de la variable, también se le conoce como rango y se denota por Re.
La fórmula para calcularlo es:
donde:máx xi es el valor máximo de la variablemin xi es el valor mínimo de la variable
Por ejemplo:
Si tienes la siguiente distribución de datos: 69, 68, 52, 57, 69, 71, 78, 52,74, 74, 69, 52, 76, calcula el rango, sustituyendo los valores Re=78-52=26
3.2.2. VarianzaLa varianza mide la mayor o menor dispersión de los valores de la variablerespecto a la media aritmética. Siempre es mayor o igual que cero y menorque infinito. Se define como la media de los cuadrados de las diferencias delvalor de los datos menos la media aritmética de éstos.La fórmula de la varianza para datos no agrupados es:
Para calcularla en una población:
Para calcularla en una muestra:
Varianza para datos agrupados por intervalos
La fórmula para calcular la varianza en datos agrupados por intervalos es la siguiente:
Para calcularla en una población: F i es la frecuencia del intervalo.
Mc i es la marca de clase del intervalo.
Donde
es la suma de los
cuadrados de los valores
de X menos la media
N, n es el número total de
datos.
7/30/2019 Unidad 3. Medidas de Tendencia Central y Dispersion
http://slidepdf.com/reader/full/unidad-3-medidas-de-tendencia-central-y-dispersion 7/7
Para calcularla en una muestra
3.2.3. Desviación típica
La desviación típica o estándar muestra qué tan alejado está un dato del valor de la
media aritmética, es decir, la diferencia que hay entre un dato y la media aritmética.
Se denota como
S ó σ
según se calcule en una muestra o en toda la población,
respectivamente.Se define como la raíz cuadrada positiva de la varianza. Se expresamediante las siguientes fórmulas:
En datos no agrupados
Para una población Para una muestra
En datos agrupados por intervalos
es la marca de clase del
intervalo.
Para calcularla en una
muestra:
μ
X
es la media de la distribución de
datos.
N ,n
es el número total de datos de la
distribución.