Você está na página 1de 3

Cuidado con comprobar demasiadas hipótesis: cuanto más se torturen los datos, más probable

Regresión con dos variables: estimación por intervalos y pruebas de hipótesis

será que confiesen, pero la confesión obtenida bajo presión puede no ser admisible en el tribunal de la opinión científica
Requisitos estadísticos Probabilidad- La probabilidad es el cálculo matemático que evalúa las posibilidades que existen de que una
cosa suceda cuando interviene el azar.,
distribuciones de probabilidad- La distribución de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los
sucesos es el rango de valores de la variable aleatoria. También puede decirse que tiene una relación estrecha con las distribuciones
de frecuencia.
errores tipo I y tipo II,- Error de tipo I
Si usted rechaza la hipótesis nula cuando es verdadera, comete un error de tipo I. La probabilidad de cometer un error de tipo I es α,
que es el nivel de significancia que usted establece para su prueba de hipótesis.
Error de tipo IICuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La probabilidad de cometer un error
de tipo II es β, que depende de la potencia de la prueba.
nivel de significancia, El nivel de significación (o nivel de α) es un umbral que permite determinar si el resultado de un estudio se
puede considerar estadísticamente significativo después de realizar las pruebas estadísticas planificadas. El nivel de significación se
suele establecer en un 5% (o 0,05), aunque se pueden usar otros niveles en función del estudio
potencia de una prueba estadística La potencia de una prueba estadística o el poder estadístico es la probabilidad de que la hipótesis
nula sea rechazada cuando la hipótesis alternativa es verdadera (es decir, la probabilidad de no cometer un error del tipo II).
intervalos de confianza Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que
posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria, es poco probable que dos
muestras de una población en particular produzcan intervalos de confianza idénticos.
Estimación por intervalos: algunas ideas básicasconstituye una cifra estimada (puntual) del valor poblacional desconocido ß2.
¿Qué tan confiable es esta estimación? en estadística, la confiabilidad de un estimador puntual se mide por su error estándar. Por
tanto, en lugar de depender de un solo estimador puntual, se puede construir un intervalo alrededor del estimador puntual

Tal intervalo, si existe, se conoce como intervalo de confianza; a 1 se le denomina coefi – aciente de confianza; y(01) se conoce como
nivel de significancia a < a < Los extremos del intervalo de confianza se conocen como límites de confianza
Es muy importante conocer los siguientes aspectos de la estimación por intervalos:
1. La ecuación (5.2.1) no afi rma que la probabilidad de que β2 se encuentre entre los límites Dados sea 1 − α. Como se supone que
β2, aunque se desconoce, es un número fijo, se dice que está o no está dentro del intervalo. La ecuación (5.2.1) establece que, al
utilizar el método descrito en este capítulo, la probabilidad de construir un intervalo que contenga β2 es 1 − α.
2. El intervalo (5.2.1) es un intervalo aleatorio; es decir, variará de una muestra a la siguiente debido a que se basa en βˆ
2, el cual es aleatorio. (¿Por qué?)
3. Como el intervalo de confi anza es aleatorio, los enunciados probabilísticos que le corresponden deben entenderse en un sentido
de largo plazo, es decir, para muestreo repetid
4. el intervalo (5.2.1) es aleatorio siempre y cuando βˆ2 sea desconocido.pero, una vez que se tenga una muestra específica y se
obtenga un valor numérico específico de βˆ2, el intervalo (5.2.1) deja de ser aleatorio, y queda entonces fijo.
Intervalos de confi anza para los coefi cientes de regresión β1 y β2 Intervalo de confianza para β2
el supuesto de normalidad de ui, los estimadoresde MCO βˆ1 y βˆ2 son en sí mismos normalmente distribuidos con medias y
varianzas allí establecidas. Por consiguiente, por ejemplo, la variable
Por tanto,

parece que se puede utilizar la distribución normal para hacer afirmaciones probabilísticas sobre ß2,siempre que se s2. conozca la
verdadera varianza poblacional la amplitud del intervalo de confi anza es proporcional al error estándar del estimador. Es decir, entre
más grande sea el error estándar, más amplio será el intervalo de confianza.
Intervalo de confianza para β1 y β2 simultáneamente
Hay ocasiones en que se necesita construir un intervalo de confianza conjunto para β1 y β2 tal que, para un coeficiente de confianza
(1 − α) de, por ejemplo, 95%, tanto β1 como β2 caigan al mismo tiempo dentro de ese intervalo. Como este tema es complejo, el lector
quizá desee consultar referencias apropiadas.
Intervalo de confianza para σ2

χ21−α/2 y χ2 α/2 son dos valores de χ2 (los valores críticos χ2) obtenidos de la tabla ji cuadrada para n − 2 gl de manera que ellos
cortan 100(α/2)% de las áreas de las colas de la distribución χ2, como se muestra en la fi gura 5.1. Al sustituir χ2 de (5.4.1) en (5.4.2)
y reorganizar

Prueba de hipótesis: comentarios generales


El problema de las pruebas de hipótesis estadísticas puede plantearse sencillamente de la siguiente manera: ¿es compatible o no lo
es una observación o un hallazgo dados, según algunas hipótesis planteadas? La palabra “compatible” se utiliza aquí en el sentido de
que la observación es lo “bastante” cercana al valor hipotético, de forma que no se rechaza la hipótesis planteada.
En el lenguaje de estadística, la hipótesis planteada se conoce como hipótesis nula, y se denota con el símbolo H0. La hipótesis nula
suele probarse frente a una hipótesis alternativa (también conocida como hipótesis mantenida) denotada con H La teoría de pruebas
de hipótesis se refi ere al diseño de reglas o procedimientos que permitan decidir si se rechaza o no la hipótesis nula. Hay dos
métodos mutuamente complementarios para diseñar tales reglas: el intervalo de confi anza y la prueba de signifi cancia.
Pruebas de hipótesis: método del intervalo de confianza
Prueba bilateral o de dos colas
La hipótesis nula es una hipótesis simple, mientras que la hipótesis alternativa es compuesta; y, en la práctica, se conoce c omo
hipótesis bilateral. Con mucha frecuencia, dicha hipótesis alternativa bilateral refl eja el hecho de que no se tieneuna expectativa a
priori o teórica sólida sobre la dirección en la cual debe moverse la hipótesis alternativa respecto de la hipótesis nula.
Prueba unilateral o de una cola
Algunas veces se tiene una expectativa a priori o teórica sólida (o existen expectativas basadas en algún trabajo empírico previo) de
que la hipótesis alternativa es unilateral o unidireccional, en lugar de ser bilateral o de dos colas, como acabamos de analizar
Pruebas bilaterales o de dos colas Una prueba de dos colas se asocia a una hipótesis alternativa para la cual se desconoce el signo
de la potencial diferencia. Por ejemplo, supongamos que deseamos comparar las medias de dos muestras A y B. Antes de diseñar el
experimento y ejecutar la prueba, esperamos que si se resalta una diferencia entre las dos medias, realmente no saabemos si A
debería ser superior a B o a la inversa. Esto nos lleva a elegir una prueba de dos colas, asociada a la siguiente hipótesis
alternativa: Ha: media(A) ≠ media(B). Las pruebas de dos colas son con diferencia las más utilizadas.
Pruebas unilaterales o de una cola Una prueba de una cola normalmente está asociada a una hipótesis alternativa para la cual se
conoce el signo de la potencial diferencia antes de ejecutar el experimento y la prueba. En el ejemplo descrito más arriba, la hipótesis
alternativa referida a una prueba de una cola podría redactarse así: media(A) < media(B)o media(A) > media(B), dependiendo de la
dirección esperada de la diferencia.
Pruebas de hipótesis: enfoque de la prueba de signifi cancia
Prueba de significancia de los coeficientes de regresión:
la prueba tEn términos generales, una prueba de significancia es un procedimiento que utiliza los resultados muestrales para verificar
la verdad o falsedad de una hipótesis nula
La idea básica de las pruebas de signifi cancia es la de un estadístico de prueba (un estimador) y su distribución muestral según la
hipótesis nula. La decisión de aceptar o rechazar H0 se toma con base en el valor del estadístico de prueba obtenido con los datos
disponibles.
En el lenguaje de las pruebas de signifi cancia, se dice que un estadístico es estadísticamente signifi cativo si el valor del estadístico
de prueba cae en la región crítica. En este caso, se rechaza la hipótesis nula. De la misma manera, se dice que una prueba no es
estadísticamente signifi cativa si el valor del estadístico de prueba cae en la región de aceptación

Prueba de signifi cancia de σ2: la prueba χ2

Prueba de hipótesis: algunos aspectos prácticos


Signifi cado de “aceptar” o “rechazar” una hipótesis
Si, con base en una prueba de signifi cancia, por ejemplo, la prueba t, decidimos “aceptar” la hipótesis nula, todo lo que se afi rma es
que, con base en la evidencia dada por la muestra, no existe razón para rechazarla; no se sostiene que la hipótesis nula sea
verdadera con absoluta certeza. Al aceptar” una hipótesis nula siempre se debe tener presente que puede existir otra hipótesis nula
igualmente compatible con los datos. Es preferible, por tanto, decir que se puede aceptar la hipótesis nula en lugar de decir que la
aceptamos así la conclusión de una prueba estadística es la de “no rechazar” en lugar de “aceptar”.
Hipótesis nula “cero” y regla práctica “2t”
hipótesis nula de “cero” es un mecanismo para establecer si Y tiene relación con X, la variable explicativa tales pruebas formales se
abrevian con la regla de signifi cancia “2t”, que puede expresarse así:
Regla de decisión Construya un intervalo de confi anza para β2 a 100(1 − α)%. Si el β2 en H0 se encuentra dentro
de este intervalo de confi anza, no rechace H0, pero si está fuera del intervalo, rechace H0.
Regla práctica“2t”
Si el número de grados de libertad es 20 o más, y si α, el nivel de signifi cancia, se fi ja en 0.05, se rechaza la hipótesis nula β2 _ 0 si
el valor de t [ _ β ˆ 2/ee (β ˆ 2)] calculado a partir de (5.3.2)
es superior a 2 en valor absoluto.
Formación de las hipótesis nula y alternativa
¿cómo se formulan estas hipótesis? No existen reglas específicas. Muy a menudo, el fenómeno en estudio sugerirá la forma de las
hipótesis nula y alternativa. la hipótesis
alternativa natural a la hipótesis nula, β2 _ 0, sería β2 > 0. Es decir, no se considerarán valores
de β2 menores de cero. Así, las expectativas teóricas o el trabajo empírico previo o ambos pueden ser la base para formular hipótesis.
Selección del nivel de signifi cancia α
debe tenerse claro que rechazar o no una hipótesis nula depende de α, el nivel de signifi cancia o probabilidad de cometer un error
tipo I, o sea, la probabilidad de rechazar la hipótesis cuando es verdadera., el problema relacionado con la selección del valor
apropiado de se evita a al emplear lo que se conoce como valor p del estadístico de prueba, que analizamos a continuación.
Nivel exacto de signifi cancia: Valor p
Esta probabilidad se denomina valor p (es decir, valor de probabilidad), también conocido como nivel observado o exacto de
signifi cancia, o probabilidad exacta de cometer un error tipo I. Más técnicamente, el valor p se defi ne como nivel de signifi
cancia más bajo al cual puede rechazarse una hipótesis nula.
Signifi cancia estadística y signifi cancia práctica
Cuando se especifi ca una hipótesis nula, digamos βj _ 1, lo que se busca es que βj esté cercano a 1, tan cerca que para todos los
propósitos prácticos pueda tratarse como si fuera 1. Pero que 1.1 sea “prácticamente lo mismo que” 1.0 es un asunto de economía, no
de estadística. El asunto no se resuelve con una prueba de hipótesis, porque el estadístico de prueba [t _ ](bj − 1)/σˆbj mide el coefi
ciente estimado en unidades de errores estándar, las cuales no tienen signifi cado para medir el parámetro económico βj − 1. Puede
ser una buena idea reservar el término “signifi cancia” para el concepto estadístico, y adoptar la palabra “sustancial” para el económico
Elección entre los enfoques de intervalos de confi anzay pruebas de signifi cancia en las pruebas de hipótesis
estos autores prefieren el enfoque de intervalos de confi anza al de pruebas de signifi cancia.
Análisis de regresión y análisis de varianza
El estudio de estos componentes de SCT se conoce como análisis de varianza (ANOVA) desde el punto de vista de la regresión.
Aplicación del análisis de regresión: problema de predicción
De qué sirve esta regresión histórica? Para “predecir” o “pronosticar” el salario promedio futuro Y correspondiente a algún nivel dado
de escolaridad X. Ahora, hay dos clases de predicciones: 1) la predicción del valor de la media condicional de Y correspondiente a un
valor escogido X, por ejemplo, X0, que es el punto sobre la línea de regresión poblacional misma (véase la fi gura 2.2), y 2) la
predicción de un valor individual Y correspondiente a X0. Estas dos predicciones se llaman predicción media y predicción
individual.
Predicción media
suponga que X0 _ 20 y deseamos predecir E(Y|X0 _ 20). Ahora, puede demostrarse que la regresión histórica (3.6.2) proporciona la
estimación puntual de esta predicción media de la siguiente forma:
Yˆ0 _ ˆ β1 + ˆ β2X0 −0.0144 + 0.7240(20)_ 14.4656 (5.10.1)
donde Yˆ0 _ estimador de E(Y|X0). Puede comprobarse que este predictor puntual es el mejor
estimador lineal e insesgado (MELI).Como Yˆ0 es un estimador, es probable que éste sea diferente de su verdadero valor. La
diferencia entre los dos valores dará alguna idea del error de predicción o pronóstico. Para evaluar este error es necesario encontrar la
distribución muestral de Yˆ0.
Predicción individual
Si nuestro interés está en predecir un valor individual Y, Yo correspondiente a un valor dado X, digamos, Xo, entonces, como se
muestra en el apendice, el mejor estimador lineal insesgado de Yo está dado también por (5.10.1) pero su varianza es la siguiente

se demuestra que Y0 también sigue una distribución normal con media y varianza dadas
por (5.10.1) y (5.10.6), respectivamente. Al sustituir σ ˆ 2 por la desconocida σ2, se colige que

Informe de resultados del análisis de regresión


las cifras del primer conjunto de paréntesis son los errores estándar estimados de los coeficientes de regresión; las cifras del segundo
conjunto son los valores t estimados calculados de (5.3.2) según la hipótesis nula de que el verdadero valor poblacional de cada coefi
ciente de regresión individual es cero (es decir, 10.3428 0.72400.0700 ); y las cifras del tercer grupo son los valores p estimados.
Evaluación de los resultados del análisis de regresión
cabe cuestionar la bondad del modelo ajustado. ¿Qué tan “bueno” es el modelo ajustado? Necesitamos ciertos criterios para
responder esta pregunta.
Primero, ¿están los signos de los coefi cientes estimados de acuerdo con las expectativas teóricas o previas? A priori, β2 Sólo hay un
supuesto que se puede verifi car, a saber, el de normalidad del término de perturbación, ui. Recuerde que las pruebas t y F requieren
que el término de error siga una distribución normal.
Pruebas de normalidad
sólo consideraremos tres: 1) histograma de residuos, 2) gráfi ca de probabilidad normal (GPN) y 3) prueba Jarque-Bera.
Histograma de residuos
Es un simple dispositivo gráfico para saber algo sobre la forma de la función de densidad poblacional (FDP) de una variable aleatoria.
En el eje horizontal se dividen los valores de la variable de interés en intervalos convenientes, y sobre cada intervalo de clase se
construyen rectángulos cuya altura sea igual al número de observaciones para ese intervalo de clase.
Este diagrama muestra que los residuos no tienen distribución normal perfecta Siempre es aconsejable trazar el histograma de los
residuos de cualquier regresión como método aproximado y rápido para probar el supuesto de normalidad.
Gráfi ca de probabilidad normal
La mas sencilla para estudiar es es la gráfica de probabilidad normal (GPN), la cual utiliza el papel de probabilidad normal,
especialmente diseñado para gráficas. Sobre el eje horizontal, o eje X, se grafican los valores de la variable de interés, y sobre el eje
vertical, o eje Y, el valor esperado de esta variable si estuviera normalmente distribuida. Por tanto, si la variable fuese de la población
normal, la GPN sería más o menos una línea recta.
Prueba de normalidad de Jarque-Bera (JB)
La prueba de normalidad JB es una prueba asintótica, o de muestras grandes. También se basa en los residuos de MCO. Esta prueba
calcula primero la asimetría y la curtosis de los residuos de MCO, con el siguiente estadístico de prueba:

Otras pruebas del ajuste del modelo


Recuerde que el MCRLN tiene muchos supuestos adicionales al de la normalidad del término de error. A medida que se examina la
teoría econométrica,se considerara diversas pruebas de la bondad del modelo pero ahora es importante recorsar que la elaboración
de modelos de regresión se basa en diversos supuestos simplificadores que talvez no sean válidos en todos los casos.

Você também pode gostar