lunes, 4 de febrero de 2013

ESTADÍSTICA DESCRIPTIVA


1.1 Población de muestra aleatoria
En estadística se denomina población al mundo ideal que se quiere conocer o estudiar. Las poblaciones suelen ser muy extensas y es imposible observar a cada componente, por ello se trabaja con muestras o subconjuntos de esa población. Por eso podemos definir como muestra a una parte o subconjunto de una población.
Una muestra aleatoria de tamaño n es un conjunto de n individuos tomado de tal manera que cada subconjunto de tamaños n de la población tenga la misma probabilidad de ser elegidos como muestra.
Una población en estadística es el conjunto  de todas las observaciones en las que estamos interesados, es el conjunto de todos los procesos susceptibles de aparecer en un problema y que interesan a la persona que hace el estudio. Se llama tamaño de la población al número de individuos que la componen, siendo cada posible observación un individuo, así las poblaciones pueden ser finitas e infinitas.
Cuando es proceso de extracción es tal que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra, se denomina el proceso de selección muestreo aleatorio.
El muestreo aleatorio se puede plantear como Sin reposición y Con reposición.
1.2 Obtención de datos estadísticos
La estadística estudia métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones validad y tomar decisiones razonables basadas en tal análisis.
Algunos van desde la elaboración de encuestas entrevistas, censos. Si queremos realizar un estudio estadístico sobre la cantidad de alumnos que reprueban el primer semestre del TEC y las causas del porque reprueban. Primero que nada tenemos que buscar en los registros las calificaciones de cada uno de los alumnos y así obtendríamos nuestra población que sería todos los alumnos del primer semestre, después calificamos a cada uno de los alumnos aprobados y reprobados, según su calificación.
Ya que dividimos los alumnos aprobados de los reprobados, hacemos una encuesta y entrevista a los alumnos reprobados para que nos den los motivos del porque de la reprobación, pero como la cantidad de alumnos en el TEC es muy grande, lo que se hace en este caso es seleccionar dos o tres alumnos de cada especialidad que haya reprobado para encuestarlos o entrevistarlos.
Para finalizar las encuestas se analizan y se grafican las calificaciones y los motivos de reprobación.
1.3 Medidas de tendencia central
Son valores que tienden a situarse en el centro del conjunto de datos ordenados según su magnitud.
Las medidas de centralización mas empleadas son la media aritmética o media, la media, la moda, la media geométrica, la media armónica y la media cuadrática. La aplicación de una u otra medida de centralización depende de los resultados que interese extraer a partir de los datos.
La media aritmética o media
La media aritmética presenta, entre otras, la suma algebraica de las desviaciones de un conjunto de números respecto de su medida (media) aritmética es cero.
Mediana
La mediana de una seria de datos ordenados en orden de magnitud es el valor medio de el numero de datos es impar o bien la media aritmética de los valores medios si el numero de los datos es par.
Moda
La moda de una serie de números es el valor que se presenta con mayor frecuencia.
La moda puede no ser única e incluso puede no existir.
Media Geométrica
La media geométrica G de una serie de números X1, X2, X3……Xn es la raíz enésima del producto de dichos números.
Media Armónica
La media armónica H de una serie de n números X1˙X2˙X3…Xn
Media Cuadrática
La media cuadrática de una serie de n números X1, X2, X3…Xn
1.4 Medidas de dispersión
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.
Indican por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media así se sabe si todas las cosas son parecidas o varían mucho entre ellos.
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética.
Di = x – x
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se representa por 
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. La varianza se representa por .
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación típica se representa por σ.
1.5 Tabla de distribución de frecuencias
Las tablas de distribución de frecuencias se utilizan cuando se recolectan datos, con ellas se pueden representar los datos de manera que es más fácil analizarlos.
Se pueden elaborar tablas de distribución de frecuencias para datos no agrupados y para datos agrupados. Estas últimas se utiliza cuando tienen muchos datos.
Para elaborar tablas de distribuciones de frecuencia se deje tener en cuenta que cuando hay muchos datos se agrupan en clases.
Clase es cada uno de los grupos en que se dividen los datos. Para determinar cuántas clases crear, se puede utilizar la siguiente fórmula:
Numero de clases= 1+3.222 log n
Donde n es el número total de datos.
El intervalo de la clase o el ancho de la clase (tamaño de la clase) es el espacio que hay entre el límite superior y límite inferior de la clase, los cuales corresponden a los valores extremos de la clase.
La frecuencia absoluta es el número de veces que se repite cada dato. Cuando se agrupan  los datos que tiene cada clase. Se simboliza con Fj.
La marca de clase es el punto medio de la clase. Se obtiene dividiendo entre dos la suma de los valores extremos de cada clase.
El rango es la diferencia entre el valor mayor y el valor menor en estudio de una distribución de datos.
La frecuencia absoluta acumulada es la frecuencia total  hasta el limite superior de cada clase.
La frecuencia relativa de un dato da información sobre que parte de la población o se la muestra en estudio corresponde a la característica analizada. Se obtiene dividiendo la frecuencia absoluta entre el número total de datos y se puede expresar como una fracción, como un decimal o como un porcentaje.
La frecuencia acumulada relativa es la frecuencia relativa total hata el límite superior de cada clase.

No hay comentarios:

Publicar un comentario