Se desea obtener una muestra no superior al 5% del total para iniciar una investigación por muestreo del conjunto de clientes.
Para ello tiene usted una base de datos con la siguiente información:
| Número total de empresas | 400 |
| Variable de clasificación | Capital social |
| Variable de interés | Compras en la empresa el año anterior |
Solución
Se introducen los datos en el programa mediante la opción "Datos". Posteriormente, dentro de la opción "Muestreo", se selecciona el método "Sistemático con intervalo constante" y por último se obtiene en el menú de "Listados", las unidades que van a pertenecer a la muestra y otras que se utilizaran como suplentes para el caso de ausencias y negativas. En la pantalla "Informe" tiene usted preparada su ficha técnica y las unidades que deben ser investigadas.
Resultados
Ficha Técnica de la Encuesta: Datos del diseñoPoblación marco utilizada : Empresas clientes de la firma
Variable de estudio : Compras en la firma el año anterior
Variable auxiliar : Capital social
Método de muestreo empleado : Sistemático Con Intervalo Constante
| Tamaño de población = 400Tamaño de muestra = 20 Fracción de muestreo = 5% | Media poblacional = 90.9825Desviación típica (n-1) = 1503.6463 |
| Desviación típica del estimador = 4.5755Error de muestreo CV% = 5.03% Límites de confianza superior = 99.9504 Límites de confianza inferior = 82.0146 | Varianza para Msr = 71.4232Varianza para Mstr = 26.7522 Varianza para Msic = 20.9348 |
Población marco utilizada : Empresas clientes de la firma
Variable de estudio : Compras en la firma el año anterior
Variable auxiliar : Capital social
| Muestra (9)Unidades | Muestra( 14)Reservas (1) | Muestra( 5)Reservas (2) |
| 9 | 14 | 5 |
| 29 | 34 | 25 |
| 49 | 54 | 45 |
| 69 | 74 | 65 |
| 89 | 94 | 85 |
| 109 | 114 | 105 |
| 129 | 134 | 125 |
| 149 | 154 | 145 |
| 169 | 174 | 165 |
| 189 | 194 | 185 |
| 209 | 214 | 205 |
| 229 | 234 | 225 |
| 249 | 254 | 245 |
| 269 | 274 | 265 |
| 289 | 294 | 285 |
| 309 | 314 | 305 |
| 329 | 334 | 325 |
| 349 | 354 | 345 |
| 369 | 374 | 365 |
| 389 | 394 | 385 |
Parámetros:
Media poblacional = 90.9825
Desviación típica (n-1) = 1503.6463
Desviación típica del estimador = 4.5755
Tamaño de muestra = 20
Ejercicio 2: de los métodos considerados el de menor varianza.
Ahora se pide seleccionar de todos los métodos disponibles el de menor varianza.
Solución
En la opción "Configuración" seleccionamos todos los métodos. Después en "Cálculos" optamos por la opción " Varianza para selección de métodos" . En la ventana "Informes" tenemos la recomendación del sistema sobre el método a elegir.
Resultados
| Métodos disponibles | V(x) | Eficacia(sr) | Eficacia(str) |
| Muestreo sin reposición (S.R.) | 71.4232 | 100.0000 | 266.9810 |
| Muestreo estratificado con una unidad | 26.7522 | 37.4559 | 100.0000 |
| Sistemático intervalo cte. (SIC) | 20.9348 | 29.3110 | 78.2547 |
| Sistemático centrado (CLS) | 7.4256 | 10.3967 | 27.7571 |
| Sistemático corrección de Yates (CY) | 19.5264 | 27.3390 | 72.9900 |
| Sistemático equilibrado (BSS) | 30.4178 | 42.5881 | 113.7023 |
| Sistemático modificado (MSS) | 21.9673 | 30.7566 | 82.1142 |
| Prob. desiguales con reposición y ppt (CRPPT) | 44.2157 | 61.9067 | 165.2791 |
| Prob. desiguales sin reposición y ppt (SRPPT) | 24.5422 | 34.3617 | 91.7391 |
Comentario
En el informe el programa recomienda utilizar el método que presenta la menor varianza. El método centrado no se recomienda por consideraciones de inestabilidad que deben estudiarse en los ejemplos más avanzados. Posteriormente se obtendría la ficha técnica tal y como se ha descrito en el primer ejemplo.Ejercicio 3: distintos tamaños de muestra y varianzas.
Para el muestreo equilibrado se pide determinar varianza del estimador para diferentes tamaños de muestra y su comparación con el muestreo estratificado con una unidad y con el muestreo aleatorio sin reposición.
Solución
En la opción "Cálculos" seleccionar "Correlograma" , elegir en "Parámetros" tamaño de muestra inicial, final e intervalo entre ellos. Por ejemplo: 2, 200 y 4.
Resultados
| Tamaño muestral | V(x)_eql | CV_eq% | Var_st | CV_st% | Var_sr | CV_sr% | Corr.intra |
| 2 | 275.95 | 18.26% | 454.76 | 23.44% | 748.06 | 30.06% | -0.6320 |
| 4 | 158.33 | 13.83% | 171.26 | 14.38% | 372.15 | 21.20% | -0.1926 |
| 8 | 56.87 | 8.29% | 71.52 | 9.30% | 184.20 | 14.92% | -0.0995 |
| 10 | 48.03 | 7.62% | 55.45 | 8.18% | 146.61 | 13.31% | -0.0755 |
| 16 | 26.67 | 5.68% | 33.76 | 6.39% | 90.22 | 10.44% | -0.0477 |
| 20 | 30.42 | 6.06% | 26.75 | 5.68% | 71.42 | 9.29% | -0.0313 |
| 25 | 16.92 | 5.12% | 21.08 | 5.05% | 56.39 | 8.25% | -0.0299 |
| 40 | 8.08 | 3.12% | 12.91 | 3.95% | 33.83 | 6.39% | -0.0201 |
| 50 | 7.75 | 3.06% | 9.86 | 3.45% | 26.31 | 5.64% | -0.0151 |
| 80 | 2.32 | 1.67% | 5.71 | 2.63% | 15.04 | 4.26% | -0.0111 |
| 100 | 5.78 | 2.64% | 4.35 | 2.29% | 11.28 | 3.69% | -0.0062 |
| 200 | 0.54 | 0.81% | 1.50 | 1.35% | 3.76 | 2.13% | -0.0047 |
Comentario
En este método de muestreo equilibrado destaca una ganancia en precisión importante respecto de los otros métodos para el caso de tamaños de muestra pequeños. Se puede observar también en esta tabla una de las características del muestreo sistemático, es el caso de que al pasar de un tamaño de muestra a otro superior, debido a la composición interna de la población se pueden dar aumentos en la varianza del estimador.Ejercicio 4: modelo de superpoblación gráfico.
Realizar, para la población natural analizada anteriormente, un ajuste matemático, mediante interpolación y ajustar el termino de error del modelo para que represente la población lo más fidedignamente posible.
Solución
Una vez seleccionada la base de datos original, se opta en "Datos" por " Generar estructura de población...". Se fija el grado del polinomio en 5 y, con el botón derecho del ratón, en el área gráfica, se ajusta por mínimos cuadrados. Posteriormente se da valores al termino de error, pulsando dos veces sobre el área del gráfico para ver el resultado.Xi=1.8335E(+01)+1.0158E(+00)i+-7.1831E(-03)*i2+3.0846E(-05)i3+- +-7.0717E(-08)i4+7.0852E(-11)i5+-e
donde e es el termino de error que recoge la dispersión del fenómeno debida al azar y el efecto que se observa en la población de heterocedasticidad. Este término se distribuye con E(e)=0 y Var(e)=5(1+i*0.1)
Realización de una superpoblación.
Comentario
La representación gráfica de una realización de este experimento se puede observar a continuación: los ejes y las definiciones se corresponden con una formalización matemática de la población en cada una de las 400 unidades ordenadas por tamaño.Ejercicio 5: modelo de superpoblación. Varianza del estimador.
Generar la estructura de población un número elevado de veces y en cada uno de ellos calcular la varianza del estimador respecto del modelo.
Solución
En la opción "Cálculos " Seleccionar número de poblaciones" fijar en un número arbitrario superior a 40 y seleccionar cálculo de superpoblación "Varianza del estimador"Esperanzas y varianzas respecto del modelo de la varianza del estimador
Metodos de muestreo
| E*Vp | V*Vp | CVS. | E*+(2*D*) |
| Sistemático intervalo cte. (SIC) | 17.54 | 33.46 | 0.33 | 29.11 |
| Sistemático centrado (CLS) | 7.17 | 100.9 | 1.4 | 27.26 |
| Sistemático corrección de Yates (CY) | 12.97 | 20.56 | 0.35 | 22.04 |
| Sistemático equilibrado (BSS) | 12.25 | 19.11 | 0.36 | 20.99 |
| Sistemático modificado (MSS) | 11.68 | 17.67 | 0.36 | 20.09 |
| Prob. desiguales con reposición y ppt (CRPPT) | 12.84 | 13.86 | 0.29 | 20.28 |
| Prob. desiguales sin reposición y ppt (SRPPT) | 12.43 | 14.01 | 0.3 | 19.92 |
Comentario
El principal resultado que observamos en esta tabla es el reducido valor esperado de los métodos centrados y, en contraste su elevada variabilidad. Esto quiere decir que si bien el error esperado, al analizar varias poblaciones generadas de forma aleatoria es pequeño, este varia mucho de unas poblaciones a otros. Por tanto la precisión respecto del modelo de los métodos centrados es pequeña en comparación con los otros métodos. La recomendación del sistema, para este caso, será, en el caso de no necesitar estimar el error con los datos de una sola muestra, utilizar el muestreo sistemático equilibrado, y, en caso contrario, el muestreo con probabilidades proporcionales al tamaño.