Escolar Documentos
Profissional Documentos
Cultura Documentos
PROBABILIDAD
Lucia Gonzalez Quiroz
Peso(mg)
Estadio 1 Mediana 0,38
Estadio 1 Q1 0,06 12
Estadio 1 Q3 0,90
Estadio 2 n 100,00 9
Estadio 2 Media 4,76 5
Estadio 2 D.E. 2,81
Estadio 2 Var(n-1) 7,89 2
Estadio 2 CV 59,01
-1
Estadio 2 Mín 0,35 Estadio 1 Estadio 2 Estadio 3
Estadio 2 Máx 14,67 Estadio Larval
Estadio 2 Mediana 4,11
Estadio 2 Q1 2,81
Estadio 2 Q3 6,09
Estadio 3 n 100,00
Estadio 3 Media 9,74 a) Realice una descripción de la distribución de
Estadio 3 D.E. 4,65 los pesos en cada uno de los estadios.
Estadio 3 Var(n-1) 21,64
Estadio 3 CV 47,78 b) Realice una comparación entre los diferentes
Estadio 3 Mín 2,63 estadios.
Estadio 3 Máx 23,73
Estadio 3 Mediana 9,31
Estadio 3 Q1 6,04
Estadio 3 Q3 11,30
1
Ejercicio 2: USE INFOSTAT El contenido de sales en el suelo tiene distribución normal con media
30,1 ppm y desviación estándar de 7 ppm. Se seleccionan 9 muestras de suelo de la zona sur de la
provincia de Córdoba. Calcular la probabilidad de que:
a) El contenido de sales del suelo sea superior a 22.5 ppm
b) El contenido promedio de sales del suelo sea superior a 22.5 ppm
c) El contenido promedio de sales del suelo esté entre 27.8 y 31.5 ppm
a)
Figura 1. Probabilidad de que las sales del suelo sean mayores a 22,5ppm.
b)
Figura 2. Distribución normal del contenido promedio de sales en el suelo mayores a 22,5
2
c)
Figura 3. Probabilidad de que el contenido promedio de sales este entre 27,8 y 31,5.
3
a)
N.º muestra LI LS
1 73,61 81,9
2 71,87 81,16
3 75,01 82,15
Tabla 1. Limites de intervalos calculados por muestra.
4
Figura 5. Intervalos de confianza para muestra 2.
5
Figura 7. Intervalo de confianzas de las 3 muestras.
Para las figuras 4, 5 y 6 se observan altos niveles de intervalos que muestras contener el parámetro
en cuestión, siendo 96%, 92% y 96 respectivamente.
A partir de los límites calculados en el punto a) y los gráficos observados en el punto b) se observa
que no solo el parámetro se encuentra dentro de los intervalos establecidos por los limites
inferior y superior (tabla 1), sino que también se determina que, por la comparación de los tres
gráficos y superposición de intervalos, pertenecen a la misma población.
6
a) El objetivo del estudio es, por el planteo de hipotesis y su comprobación, determinar el correcto
funcionamiento de la envasadora, determinando que las botellas tienen como volumen medio
970cm3 (media) y con variaciones no mayores a 20cm3(DE). Esto vendría a ser, la hipotesis
nula. Mientras que la hipotesis alternativa, al contrastar la nula, supone que estos datos son
distintos. Por lo que se demostraría de la siguiente manera:
b) El estadístico de contraste que debería utilizarse al ser conocida la media, además de contar con
la desviación estándar (√varianza), es la prueba T bilateral, ya que la idea es buscar una media
distinta y puede ser superior o inferior a 970.
0,05
𝑍𝑜𝑛𝑎 𝑑𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 = 2
d) Si, es información suficiente ya que con la fórmula del valor Z, según el resultado obtenido, y
conociendo los puntos críticos Z0,025 (-1,96 y 1,96) obtenidos de tablas que determinan el fin de
la zona de aceptación y el inicio de la zona de rechazo, se puede determinar si se considera la
hipotesis nula o la alternativa.
El valor z, determina la diferencia entre un estadístico observado y su parámetro establecido
como hipotético de población en unidades de la desviación estándar.
𝑥̅ −𝜇0
𝑧= 𝜎
√𝑛
977−970
𝑧= 20
√9
Ecuación 4.
7
𝒛 = ±𝟏, 𝟎𝟓
Ecuación 5. Valor z final.
977−970
𝑧= 20
√49
Ecuación 6.
𝒛 = ±𝟐, 𝟒𝟓
Ecuación 7.
Se observa una gran diferencia al tomar mas botellas como muestra, siendo mas representativo
y homogéneo. En este caso la hipotesis nula queda rechazada debido a que es superior al Z
Ejercicio 5: Desarrolle un breve resumen sobre REGRESION LINEAL y utilice los conceptos para
plantear una regresión entre las variables perímetro y peso de los ajos, Base de datos de prueba de
infostat: Ajoblanc
A partir del análisis de regresión lineal se obtiene un modelo funcional lineal que describa como
varia el promedio de la variable dependiente respecto a los cambios en la variable independiente o
regresora. Además, tiene como objetivo la estimación de parámetros de muestras aleatorias, validación
del modelo y contrastes de hipotesis sobre los mismos parámetros obtenidos. También el empleo del
modelo para obtener el valor esperado de la variable independiente según un valor determinado de la
A dependiente.
8
Figura 8. Gráfico de dispersión del peso del ajo blanco según respecto al perímetro.
9
Figura 9. Gráfico de dispersión del peso del ajo blanco respecto al perímetro.
10
Tabla 2. Análisis de regresión lineal
11
del ajo blanco es altamente probable, cuantizada en un 91%. Además, el p valor (<0,0001) indica una
óptima correlación entre ambas variables.
Observando el grafico de la figura 9, obtenido por el análisis de regresión lineal, se puede deducir una
relación de proporcionalidad entre ambas variables, ya que, a medida que aumenta el perímetro del
ajo, su peso también.
En el gráfico de residuos, aun así, se observan valores que se consideran anormales o distintos a la
distribución.
Por el método Q-Q plot como comprobación, se observa un escaso acercamiento a un comportamiento
normal de los residuos, sin embargo, no se garantiza que pueda confirmarte la exacta relación entre
perímetro y peso del ajo. Sin embargo, teniendo en cuenta los coeficientes de la tabla 2, se plantea el
modelo funcional:
𝑦 = −83,32 + 7,99𝑥 + 𝑐
Ecuación 8. Modelo funcional para estimación de peso a partir de un perímetro.
12
Bibliografía:
Di Rienzo, Casanoves, Gonzalez, Tablada, Diaz, Robledo, Balzarini. Estadisticas para la ciencias
agropecuarias, septima edicion.
Dr. Depool Rivero, Ramon; Ing. Monasterio, Dioscoro. Probabilidad y Estadistica. Aplicaciones a la
ingenieria.
Manual de Infostat.
13