1.1 Población
de muestra aleatoria
En estadística se denomina población al mundo ideal que se
quiere conocer o estudiar. Las poblaciones suelen ser muy extensas y es
imposible observar a cada componente, por ello se trabaja con muestras o
subconjuntos de esa población. Por eso podemos definir como muestra a una parte
o subconjunto de una población.
Una muestra aleatoria de tamaño n es un conjunto de n individuos
tomado de tal manera que cada subconjunto de tamaños n de la población tenga la misma probabilidad de ser elegidos como
muestra.
Una población en estadística es el conjunto de todas las observaciones en las que estamos
interesados, es el conjunto de todos los procesos susceptibles de aparecer en
un problema y que interesan a la persona que hace el estudio. Se llama tamaño
de la población al número de individuos que la componen, siendo cada posible
observación un individuo, así las poblaciones pueden ser finitas e infinitas.
Cuando es proceso de extracción es tal que garantiza a cada
uno de los elementos de la población la misma oportunidad de ser incluidos en
dicha muestra, se denomina el proceso de selección muestreo aleatorio.
El muestreo aleatorio se puede plantear como Sin reposición
y Con reposición.
1.2 Obtención
de datos estadísticos
La estadística estudia métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar conclusiones validad y
tomar decisiones razonables basadas en tal análisis.
Algunos van desde la elaboración de encuestas entrevistas,
censos. Si queremos realizar un estudio estadístico sobre la cantidad de
alumnos que reprueban el primer semestre del TEC y las causas del porque
reprueban. Primero que nada tenemos que buscar en los registros las
calificaciones de cada uno de los alumnos y así obtendríamos nuestra población
que sería todos los alumnos del primer semestre, después calificamos a cada uno
de los alumnos aprobados y reprobados, según su calificación.
Ya que dividimos los alumnos aprobados de los reprobados,
hacemos una encuesta y entrevista a los alumnos reprobados para que nos den los
motivos del porque de la reprobación, pero como la cantidad de alumnos en el
TEC es muy grande, lo que se hace en este caso es seleccionar dos o tres
alumnos de cada especialidad que haya reprobado para encuestarlos o
entrevistarlos.
Para finalizar las encuestas se analizan y se grafican las
calificaciones y los motivos de reprobación.
1.3 Medidas
de tendencia central
Son valores que tienden a situarse en el centro del conjunto
de datos ordenados según su magnitud.
Las medidas de centralización mas empleadas son la media
aritmética o media, la media, la moda, la media geométrica, la media armónica y
la media cuadrática. La aplicación de una u otra medida de centralización
depende de los resultados que interese extraer a partir de los datos.
La media aritmética o
media
La media aritmética presenta, entre otras, la suma
algebraica de las desviaciones de un conjunto de números respecto de su medida
(media) aritmética es cero.
Mediana
La mediana de una seria de datos ordenados en orden de
magnitud es el valor medio de el numero de datos es impar o bien la media
aritmética de los valores medios si el numero de los datos es par.
Moda
La moda de una serie de números es el valor que se presenta
con mayor frecuencia.
La moda puede no ser única e incluso puede no existir.
Media Geométrica
La media geométrica G de una serie de números X1, X2, X3……Xn es la raíz enésima
del producto de dichos números.
Media Armónica
La media armónica H de una serie de n números X1˙X2˙X3…Xn
Media Cuadrática
La media cuadrática de una serie de n números X1, X2, X3…Xn
1.4 Medidas
de dispersión
Las medidas
de dispersión nos informan sobre cuánto se alejan del centro los valores de la
distribución.
Indican por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la mediana media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será a la mediana media así se sabe si todas las cosas son parecidas
o varían mucho entre ellos.
Rango o recorrido
El rango es
la diferencia entre
el mayor y el menor de los datos de una distribución
estadística.
Desviación media
La desviación
respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética.
Di = x
– x
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se representa
por
Varianza
Desviación típica
La desviación
típica es la raíz
cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los
cuadrados de las puntuaciones de desviación. La desviación típica se representa por σ.
1.5 Tabla de
distribución de frecuencias
Las tablas de distribución de frecuencias se utilizan cuando
se recolectan datos, con ellas se pueden representar los datos de manera que es
más fácil analizarlos.
Se pueden elaborar tablas de distribución de frecuencias
para datos no agrupados y para datos agrupados. Estas últimas se utiliza cuando
tienen muchos datos.
Para elaborar tablas de distribuciones de frecuencia se deje
tener en cuenta que cuando hay muchos datos se agrupan en clases.
Clase es cada uno de los grupos en que se dividen los datos.
Para determinar cuántas clases crear, se puede utilizar la siguiente fórmula:
Numero de clases= 1+3.222 log n
Donde n es el número total de datos.
El intervalo de la clase o el ancho de la clase (tamaño de
la clase) es el espacio que hay entre el límite superior y límite inferior de
la clase, los cuales corresponden a los valores extremos de la clase.
La frecuencia absoluta es el número de veces que se repite
cada dato. Cuando se agrupan los datos
que tiene cada clase. Se simboliza con Fj.
La marca de clase es el punto medio de la clase. Se obtiene
dividiendo entre dos la suma de los valores extremos de cada clase.
El rango es la diferencia entre el valor mayor y el valor
menor en estudio de una distribución de datos.
La frecuencia absoluta acumulada es la frecuencia total hasta el limite superior de cada clase.
La frecuencia relativa de un dato da información sobre que
parte de la población o se la muestra en estudio corresponde a la característica
analizada. Se obtiene dividiendo la frecuencia absoluta entre el número total
de datos y se puede expresar como una fracción, como un decimal o como un
porcentaje.
La frecuencia acumulada relativa es la frecuencia relativa
total hata el límite superior de cada clase.
No hay comentarios:
Publicar un comentario