martes, 6 de marzo de 2012

UNIDAD 1: ESTADISTICA Y PROBABILIDAD

Tema: Conceptos básicos de estadística.
 

1. Introducción: Permanentemente recibimos información referente al área enque trabajamos y es necesario hacer uso de ella, puesto que será útil para el
proyecto en que estamos trabajando.
La información es importante para la toma de decisiones en muchos
problemas. Para esto necesitamos un procesamiento adecuado de los datos,
para que nos arroje conclusiones certeras. En caso contrario, si no se aplica un
buen procesamiento, es posible que con base a los resultados tomemos una mala
decisión.
Información buena
Información suficiente           ⇒ buena decisión.
Procesamiento correcto
La estadística es un campo del conocimiento que permite al investigador
deducir y evaluar conclusiones acerca de una población a partir de información
proporcionada por una muestra.
Específicamente, la estadística trata de teoremas, herramientas, métodos y
técnicas que se pueden usar en:
a. Recolección, selección y clasificación de datos.
b. Interpretación y análisis de datos.
c. Deducción y evolución de conclusiones y de su confiabilidad, basada en
datos muéstrales.
Los métodos de la estadística fueron desarrollados para el análisis de datos
muestreados, así como para propósitos de inferencia sobre la población de la que
se selecciono la muestra.
La estadística como ciencia, cubre un extenso campo donde poder aplicarla.
Se agrupa en 2 grandes áreas: estadística descriptiva y estadística inferencial, que
desempeñan funciones distintivas, pero complementarias en el análisis
Es importante que todo profesional que utilice la estadística como
herramienta auxiliar de trabajo, posea un mínimo de conocimientos y habilidades
prácticas en aquellas técnicas que le facilitarán el buen desarrollo de esta
actividad.



 

1.1 Estadística descriptiva.
La estadística descriptiva comprende las técnicas que se emplean para
resumir y describir datos numéricos.
Son sencillas desde el punto de vista matemático y su análisis se limita a los
datos coleccionados sin inferir en un grupo mayor.
El estudio de los datos se realiza con representaciones gráficas, tablas,
medidas de posición y dispersión.
1.2 Estadística inferencial.
El problema crucial de la estadística inferencial es llegar a proposiciones
acerca de la población a partir de la observación efectuada en muestras bajo
condiciones de incertidumbre. Ésta comprende las técnicas que aplicadas en una
muestra sometida a observación, permiten la toman de decisiones sobre una
población o proceso estadístico. En otras palabras, es el proceso de hacer
predicciones acerca de un todo basado en la información de una muestra.
La inferencia se preocupa de la precisión de los estadígrafos descriptivos ya
que estos se vinculan inductivamente con el valor poblacional.
2. Definimos conceptos fundamentales: población, muestra y variable.
2.1 Población.
Es el conjunto de todos los elementos que presentan una característica
común determinada, observable y medible. Por ejemplo, si el elemento es una
persona, se puede estudiar las características edad, peso, nacionalidad, sexo, etc.
Los elementos que integran una población pueden corresponder a personas,
objetos o grupos (por ejemplo, familias, fábricas, emprersas, etc).
Las características de la población se resumen en valores llamados
parámetros.
2.2 Muestra.
La mayoría de los estudios estadísticos, se realizan no sobre la población,
sino sobre un subconjunto o una parte de ella, llamado muestra, partiendo del
supuesto de que este subconjunto presenta el mismo comportamiento y
características que la población. En general el tamaño de la muestra es mucho
menor al tamaño de la población.
Los valores o índices que se concluyen de una muestra se llaman estadígrafos y
estos mediante métodos inferenciales o probabilísticos, se aproximan a los
parámetros poblacionales.

2.3 Variable.
Se llama variable a una característica que se observa en una población o
muestra, y a la cual se desea estudiar.
La variable puede tomar diferentes valores dependiendo de cada individuo.
Una variable se puede clasificar de la siguiente manera.



 

3.3 Muestreo estratificado: los elementos de la población son primeramente
clasificados en grupos o estratos según una característica importante. Luego, de
cada estrato se extrae una muestra aleatoria simple.
3.4 Muestreo por conglomerado: los elementos de la población están
subdivididos en grupos y se extraen aleatoriamente algunos de estos grupos
completos

a) Variable cuantitativa: es aquella que toma valores numéricos. Dentro de ella, se
subdividen en:
Continua: son valores reales. Pueden tomar cualquier valor dentro
de un intervalo. Ej. Peso, estatura, sueldos.
Discreta: toma valores enteros. Ej. N° de hijos de una familia, n° de
alumnos de un curso.



b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se
subdividen en:
Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por
una marca, sexo, lugar de residencia.
Ordinal: son cualidades que representan un orden y jerarquía. Ej.
Nivel educacional, días de la semana, calidad de la atención, nivel
socioeconómico.



3.Obtención de los datos
Como se ha puesto de manifiesto, gran parte del trabajo de un estadístico
profesional se hace con muestras. Estas son necesarias porque las poblaciones
son casi siempre demasiado grandes para estudiarlas en su totalidad. Exigiría
demasiado tiempo y dinero estudiar la población entera, y tenemos que
seleccionar una muestra de la misma, calcular el estadístico de esa muestra y
utilizarlo para estimar el parámetro correspondiente de la población.
La obtención de la información se puede realizar por diversos medios.
Una forma es a través de una encuesta a un grupo de individuos, donde a cada
uno se le hacen las mismas preguntas.
Otra forma es a través de experimentos donde la respuesta a la variable es
el resultado del experimento. Puede también recolectarse los datos en forma
directa, es decir, la información se extrae de alguna base de datos seleccionando
una muestra de ellos.
En cualquiera de estos casos contamos con una selección de información
llamada muestra y que se procede a analizar.
Existen diferentes técnicas para realizar el muestreo y que dependerán cada
caso, cual usar. Algunas de ellas son:



3.1 Muestreo aleatorios simple: todos los elementos de la población tiene
igual posibilidad de ser escogido y se eligen al azar.

3.2 Muestreo sistemático: los elementos se seleccionan a un intervalo
uniforme en una lista ordenada. Una preocupación del muestreo sistemático es la
existencia de factores cíclicos en el listado que pudieran dar lugar a un error.

Ejercicios.
1. De las siguientes afirmaciones ¿cuál se asemeja más a los conceptos: un
parámetro, un dato, una inferencia a partir de datos, un estadígrafo?
- Según estudios, se producen más accidentes en el centro de Santiago, a 35
km/h que a 65 km/h.
- En una muestra de 250 empleados, se obtuvo un sueldo promedio de $150.000
- La tasa de nacimiento en el país aumentó en 5% con relación al mes precedente.
- Las edades son 85, 36, 57, 24
- Se sabe que el 55% de las personas en Chile son varones.
- Según datos de años anteriores se estima que la temperatura máxima de este
año aumentará en un 5%.
2. De los siguientes enunciados ¿cuál probablemente usa la estadística descriptiva y cuál, la estadística inferencial?
- Un médico general estudia la relación entre el consumo de cigarrillo y las
enfermedades del corazón.
- Un economista registra el crecimiento de la población en un área determinada.
- Se desea establecer el promedio de bateo de un equipo determinado.
- Un profesor de expresión oral emplea diferentes métodos con cada uno de sus 2 cursos. Al final del curso compara las calificaciones con el fin de establecer cual método es más efectivo.
3. Clasificar las siguientes variables en: continua, discreta, nominal, ordinal:
- n° de alumnos por carrera
- comuna en que viven los alumnos del curso de estadística
- color de ojos de un grupo de niños
- monto de pagos por concepto de aranceles en la universidad
- sumas posibles de los números obtenidos al lanzar dos dados
- clasificación de los pernos en un local según sus diámetros
- peso del contenido de un paquete de cereal
- monto de la venta de un artículo en $
- valor de venta de las acciones
- n° de acciones vendidas
- nivel de atención en el Banco
- nivel de educacional
- AFP a que pertenece un individuo
- edad
- clasificación de la edad en: niño, joven, adulto y adulto mayor
4. De cada una de las siguientes situaciones responda las preguntas que se
plantean:
- Un fabricante de medicamentos desea conocer la producción de personas
cuya hipertensión (presión alta) puede ser controlada con un nuevo producto
fabricado por la compañía. En un estudio a un grupo de 13.000 individuos
hipertensos, se encontró que el 80% de ellos controló su presión con el nuevo
medicamento.
- Según una encuesta realizada a 500 adultos mayores de la comuna de
Santiago, reveló que en promedio realizan 6 visitas anuales al consultorio. En
vista de los resultados el ministerio de salud deberá aumentar los recursos en
un 10%.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) Identifique el parámetro de interés
d) Identifique el estadígrafo y su valor
e) ¿Se conoce el valor del parámetro?



Tema: Tablas de frecuencia.
Veamos el caso de una variable discreta, pero antes se mencionaran las 

n = tamaño de la muestra
X
f
F
categoría i
h
obtiene dividiendo la frecuencia de la clase por el tamaño de la muestra.
H
Observamos algunos detalles importantes:
i) n es la suma de la columna f
tamaño de la muestra.
ii) En la columna de frecuencia absoluta acumulada se va sumando los
valores de la columna f
iii) La columna frecuencia relativa (h
categoría. Por ejemplo, en las categorías con 3 hijos a un 28.5% de
familias. Esta columna debe sumar 1.
iv) La H
valor debe ser 1. Ejemplo H
los más 3 hijos.


i = valor de la variable en el individuo ii = frecuencia absoluta: nº de veces que se repite la variable en la categoría ii = frecuencia absoluta acumulada. Indica el nº de individuos hasta lai = frecuencia relativa. Porcentaje de la categoría respecto del total, sei = frecuencia relativa acumulada. Porcentaje acumuladoi, es decir, siempre debe dar como resultado eli, por lo tanto el último valor debe ser igual a n.i) representa en % de familias en cadai acumula los valores de la frecuencia relativa, por lo tanto el último4: el 90.4% de las familias encuestadas tienen a
2.
en el comienzo. También sé vera en un ejemplo:
Salarios semanales de 40 personas en miles de pesos.

90 62 102 85 92 106 110 95 105 112
108 86 110 68 118 99 98 74 91 80
80 100 79 93 93 104 77 106 98 73
95 85 91 83 67 119 108 115 74 88

Efectuemos previamente los siguientes pasos.
i) Se busca el valor mínimo y el valor máximo X
ii) Se calcula el rango: 119 – 62 = 57.
Rango: en todo conjunto de valores estadísticos hay valores extremos: el
menor de todos y el mayor de todos; la diferencia entre estos valores
extremos se llama rango.
iii) La cantidad de intervalos no debe ser menor de 5 ni mayor de 18. Por lo
general tiene el mismo ancho. Una forma de calcular el nº de intervalos
para generar la tabla de frecuencias es mediante la siguiente formula:
k = 1 + 3.322 x log (40) = 6.322 usamos k
iv) Se calcula la amplitud de cada intervalo c = rango / k = 57 / 6 = 9.5
v) Se construye la tabla:

Tabla 2.


En el caso de analizar una variable continua, la tabla de frecuencia cambia sólomín = 62 Xmáx = 119610
El resto de las columnas se forman de la misma manera que la tabla 1.
n = tamaño de la muestra
X
f
F
categoría i
h
obtiene dividiendo la frecuencia de la clase por el tamaño de la muestra.
H
Y
inferior y superior del intervalo de clase. En todos los análisis estadísticos
su supone que el valor de la marca de una clase es el valor que
corresponde asignar a cada uno de los elementos ubicados en ese
intervalo.
C = amplitud del intervalo: la diferencia entre los limites reales de un intervalo.
Yi-
Yi+
i = valor de la variable en el individuo ii = frecuencia absoluta: nº de veces que se repite la variable en la categoría ii = frecuencia absoluta acumulada. Indica el nº de individuos hasta lai = frecuencia relativa. Porcentaje de la categoría respecto del total, sei = frecuencia relativa acumulada. Porcentaje acumuladoi = marca de clase: su valor es igual a la mitad de la suma de los limites1 = limite inferior del intervalo1 = limite superior del intervalo



Tema: Gráficos.


La entrega de información utilizando gráficos y dibujos es un método
funcional que no solo sirve para presentar datos sino también para expresar ideas
que se desean destacar.
Los gráficos son las representaciones visuales de los datos en donde se
evidencian fundamentalmente 3 características:
- forma
- acumulación o tendencia
- dispersión o variabilidad
Los gráficos no deben considerarse como sustitutos de un análisis
estadísticos, sino más bien como una ayuda visual del comportamiento de los
datos.
Existen diferentes tipos de gráficos:

- barras
- histogramas y polígonos
-
-
-
 pictogramas


 


 
También se utiliza si la variable en estudio es numérica discreta.
Ej: en el ejemplo del n° de hijos en 21 familias.



2.  Histogramas y polígonos de frecuencia:
Se construyen sobre el sistema de coordenadas cartesianas. Se utiliza
cuando la variable en estudio es continua o esta agrupada en una tabla de
frecuencia con intervalos en cada categoría.
En el eje X se identifica la variable en estudio y en el eje Y sé gráfica la
frecuencia absoluta o la frecuencia relativa. Consiste en una serie de rectángulos
en donde su altura depende del valor de cada frecuencia.
Cada categoría de la variable se representa por una barra. El ancho de cada
barra depende de la amplitud del intervalo.

El polígono se gráfica uniendo la punta superior de cada barra por segmento
de recta. Para que el polígono quede cerrado se considera un punto en la recta
horizontal, antes y después de las anotadas.


El polígono se dibuja midiendo los puntos medios de cada barra, que
corresponde a la marca de clase.

3. Histogramas y ojivas:  
También se gráfica la columna de frecuencia absoluta acumulada. El gráfico
siempre será en forma ascendente.
Se vera en un ejemplo usando la tabla 2.

La ojiva se dibuja midiendo segmentos de recta en la parte superior de cada barra,
y no se cierra.



4. Gráfico circular: 
Esta es otra forma de representar los datos, en especial cuando se trata de
cualidades. En un gráfico dibujado dentro de un círculo.
Es necesario en primer lugar calcular el porcentaje de cada categoría
respecto del total y luego repartir proporcionalmente estos porcentajes en los 360°
del círculo.
Ejemplo:
Para transformar la frecuencia relativa a grados sexagesimales se aplica el
siguiente método:











5.  Barras subliminales:
Es un gráfico de barras muy apropiado para comprobar subdivisiones en la
variable. Por ejemplo: % de estudiantes en diferentes carreras, separadas por
sexo. Cada barra es un 100%.



6. Pictogramas:
Un pictograma es la representación de datos estadísticos por medio de
símbolos que por su forma sugieren la naturaleza del dato.
Por ejemplo: producción de bicicletas (en miles.)


 
1. Barras:
Se construye sobre el sistema de ejes cartesianos. Es un procedimiento
gráfico para representar los datos nominales u ordinales. Para cada categoría se
traza una barra vertical en que la altura es la frecuencia absoluta de la categoría.
El ancho de la barra es arbitrario.
histogramas y ojivascircularesbarras subliminales

Cuando los datos estadísticos de que se dispone son numerosos, es difícil
realizar cálculos sobre ellos. Por esta razón se organizan en tablas de manera de
facilitar el trabajo.
Una tabla de frecuencia es la ordenación de la información obtenida de una
muestra, en el estudio de una sola variable.
Cuando se dispone de un gran número de datos, es útil distribuirlos en
categorías dentro de una tabla para facilitar el análisis. Se explicara con un
ejemplo:

1.
siguientes notaciones:
Ejemplo: en una encuesta de presupuesto familiar, se ha obtenido la siguiente
información respecto al n° de hijos en 2 familias.
Variable x = n° de hijos
Los datos son los siguientes:

3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3

Vemos que la variable x toma valores entre 0 y 4, es decir, existen en este
grupo 5 categorías o clases.
Contamos el número de familias en cada categoría y formamos la tabla.
Tabla 1.

No hay comentarios:

Publicar un comentario