Ejercicios resueltos

Ejercicio 1: obtener ficha técnica y listado de unidades a investigar.
Se desea obtener una muestra no superior al 5% del total para iniciar una investigación por muestreo del conjunto de clientes.
Para ello tiene usted una base de datos con la siguiente información:
Número total de empresas  400 
Variable de clasificación  Capital social 
Variable de interés  Compras en la empresa el año anterior 
Solución
Se introducen los datos en el programa mediante la opción "Datos". Posteriormente, dentro de la opción "Muestreo", se selecciona el método "Sistemático con intervalo constante" y por último se obtiene en el menú de "Listados", las unidades que van a pertenecer a la muestra y otras que se utilizaran como suplentes para el caso de ausencias y negativas. En la pantalla "Informe" tiene usted preparada su ficha técnica y las unidades que deben ser investigadas.
Resultados
Ficha Técnica de la Encuesta: Datos del diseño
Población marco utilizada : Empresas clientes de la firma
Variable de estudio : Compras en la firma el año anterior
Variable auxiliar : Capital social
Método de muestreo empleado : Sistemático Con Intervalo Constante
Tamaño de población = 400Tamaño de muestra = 20
Fracción de muestreo = 5% 
Media poblacional = 90.9825Desviación típica (n-1) = 1503.6463 
Desviación típica del estimador = 4.5755Error de muestreo CV% = 5.03%
Límites de confianza superior = 99.9504
Límites de confianza inferior = 82.0146 
Varianza para Msr = 71.4232Varianza para Mstr = 26.7522
Varianza para Msic = 20.9348
Ficha con las unidades a investigar al haber sido seleccionado el aleatorio de selección 9 y utilizar muestreo sistemático con intervalo constante:
Población marco utilizada : Empresas clientes de la firma
Variable de estudio : Compras en la firma el año anterior
Variable auxiliar : Capital social
Muestra (9)Unidades Muestra( 14)Reservas (1) Muestra( 5)Reservas (2) 
14 
29 34 25 
49 54 45 
69 74 65 
89 94 85 
109 114 105 
129 134 125 
149 154 145 
169 174 165 
189 194 185 
209 214 205 
229 234 225 
249 254 245 
269 274 265 
289 294 285 
309 314 305 
329 334 325 
349 354 345 
369 374 365 
389 394 385 
Los valores de la muestra(9) identifican las unidades, en este caso empresas que deben ser investigadas en la encuesta. Las otras dos columnas representan las identificaciones de aquellas unidades suplentes o reservas que deberán investigarse únicamente en el caso de que no sea posible investigar a la unidad seleccionada originalmente.
Parámetros:
Media poblacional = 90.9825
Desviación típica (n-1) = 1503.6463
Desviación típica del estimador = 4.5755
Tamaño de muestra = 20


Ejercicio 2: de los métodos considerados el de menor varianza.
Ahora se pide seleccionar de todos los métodos disponibles el de menor varianza.
Solución
En la opción "Configuración" seleccionamos todos los métodos. Después en "Cálculos" optamos por la opción " Varianza para selección de métodos" . En la ventana "Informes" tenemos la recomendación del sistema sobre el método a elegir.
Resultados
Métodos disponibles V(x) Eficacia(sr) Eficacia(str) 
Muestreo sin reposición (S.R.) 71.4232 100.0000 266.9810 
Muestreo estratificado con una unidad 26.7522 37.4559 100.0000 
Sistemático intervalo cte. (SIC) 20.9348 29.3110 78.2547 
Sistemático centrado (CLS) 7.4256 10.3967 27.7571 
Sistemático corrección de Yates (CY) 19.5264 27.3390 72.9900 
Sistemático equilibrado (BSS) 30.4178 42.5881 113.7023 
Sistemático modificado (MSS) 21.9673 30.7566 82.1142 
Prob. desiguales con reposición y ppt (CRPPT) 44.2157 61.9067 165.2791 
Prob. desiguales sin reposición y ppt (SRPPT) 24.5422 34.3617 91.7391 
Comentario
En el informe el programa recomienda utilizar el método que presenta la menor varianza. El método centrado no se recomienda por consideraciones de inestabilidad que deben estudiarse en los ejemplos más avanzados. Posteriormente se obtendría la ficha técnica tal y como se ha descrito en el primer ejemplo.


Ejercicio 3: distintos tamaños de muestra y varianzas.
Para el muestreo equilibrado se pide determinar varianza del estimador para diferentes tamaños de muestra y su comparación con el muestreo estratificado con una unidad y con el muestreo aleatorio sin reposición.
Solución
En la opción "Cálculos" seleccionar "Correlograma" , elegir en "Parámetros" tamaño de muestra inicial, final e intervalo entre ellos. Por ejemplo: 2, 200 y 4.
Resultados
Tamaño muestral V(x)_eql CV_eq% Var_st CV_st% Var_sr CV_sr% Corr.intra 
275.95 18.26% 454.76 23.44% 748.06 30.06% -0.6320 
158.33 13.83% 171.26 14.38% 372.15 21.20% -0.1926 
56.87 8.29% 71.52 9.30% 184.20 14.92% -0.0995 
10 48.03 7.62% 55.45 8.18% 146.61 13.31% -0.0755 
16 26.67 5.68% 33.76 6.39% 90.22 10.44% -0.0477 
20 30.42 6.06% 26.75 5.68% 71.42 9.29% -0.0313 
25 16.92 5.12% 21.08 5.05% 56.39 8.25% -0.0299 
40 8.08 3.12% 12.91 3.95% 33.83 6.39% -0.0201 
50 7.75 3.06% 9.86 3.45% 26.31 5.64% -0.0151 
80 2.32 1.67% 5.71 2.63% 15.04 4.26% -0.0111 
100 5.78 2.64% 4.35 2.29% 11.28 3.69% -0.0062 
200 0.54 0.81% 1.50 1.35% 3.76 2.13% -0.0047 
Comentario
En este método de muestreo equilibrado destaca una ganancia en precisión importante respecto de los otros métodos para el caso de tamaños de muestra pequeños. Se puede observar también en esta tabla una de las características del muestreo sistemático, es el caso de que al pasar de un tamaño de muestra a otro superior, debido a la composición interna de la población se pueden dar aumentos en la varianza del estimador.


Ejercicio 4: modelo de superpoblación gráfico.
Realizar, para la población natural analizada anteriormente, un ajuste matemático, mediante interpolación y ajustar el termino de error del modelo para que represente la población lo más fidedignamente posible.
Solución
Una vez seleccionada la base de datos original, se opta en "Datos" por " Generar estructura de población...". Se fija el grado del polinomio en 5 y, con el botón derecho del ratón, en el área gráfica, se ajusta por mínimos cuadrados. Posteriormente se da valores al termino de error, pulsando dos veces sobre el área del gráfico para ver el resultado.
Xi=1.8335E(+01)+1.0158E(+00)i+-7.1831E(-03)*i2+3.0846E(-05)i3+- +-7.0717E(-08)i4+7.0852E(-11)i5+-e
donde e es el termino de error que recoge la dispersión del fenómeno debida al azar y el efecto que se observa en la población de heterocedasticidad. Este término se distribuye con E(e)=0 y Var(e)=5(1+i*0.1)
Realización de una superpoblación.
Modelo de superpoblación
Comentario
La representación gráfica de una realización de este experimento se puede observar a continuación: los ejes y las definiciones se corresponden con una formalización matemática de la población en cada una de las 400 unidades ordenadas por tamaño.


Ejercicio 5: modelo de superpoblación. Varianza del estimador.
Generar la estructura de población un número elevado de veces y en cada uno de ellos calcular la varianza del estimador respecto del modelo.
Solución
En la opción "Cálculos " Seleccionar número de poblaciones" fijar en un número arbitrario superior a 40 y seleccionar cálculo de superpoblación "Varianza del estimador"
Esperanzas y varianzas respecto del modelo de la varianza del estimador
Metodos de muestreo
E*VpV*VpCVS.E*+(2*D*)
Sistemático intervalo cte. (SIC)17.5433.460.3329.11
Sistemático centrado (CLS)7.17100.91.427.26
Sistemático corrección de Yates (CY)12.9720.560.3522.04
Sistemático equilibrado (BSS)12.2519.110.3620.99
Sistemático modificado (MSS)11.6817.670.3620.09
Prob. desiguales con reposición y ppt (CRPPT)12.8413.860.2920.28
Prob. desiguales sin reposición y ppt (SRPPT)12.4314.010.319.92
Comentario
El principal resultado que observamos en esta tabla es el reducido valor esperado de los métodos centrados y, en contraste su elevada variabilidad. Esto quiere decir que si bien el error esperado, al analizar varias poblaciones generadas de forma aleatoria es pequeño, este varia mucho de unas poblaciones a otros. Por tanto la precisión respecto del modelo de los métodos centrados es pequeña en comparación con los otros métodos. La recomendación del sistema, para este caso, será, en el caso de no necesitar estimar el error con los datos de una sola muestra, utilizar el muestreo sistemático equilibrado, y, en caso contrario, el muestreo con probabilidades proporcionales al tamaño.