Você está na página 1de 13

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – JULIA XIMENES

BIOESTATÍFICA – P2

- MODELOS PROBABILÍSTICOS: Um modelo probabilístico é uma descrição matemática de um fenômeno aleatório que
consiste em duas partes: um espaço amostral S e uma maneira de se atribuir probabilidades a eventos.

- DISTRIBUIÇÃO DE POISSON: As distribuições binomiais não são o único tipo de distribuição discreta para contagens
de números inteiros. As distribuições de Poisson são ainda outra classe de distribuições discretas e têm aplicações
importantes nas ciências da vida. Elas descrevem a contagem de eventos que ocorrem aleatoriamente através do
espaço ou do tempo.

Doação de plasma sanguíneo: Sangue tipo AB é raro nos Estados Unidos (4% da população geral) e é útil para
transfusões de plasma, porque esse plasma pode ser aceito por indivíduos com todos os tipos de sangue. O plasma é
a parte líquida do sangue, uma vez removidas todas as células. Você conta o número X de doadores AB que
comparecem a um posto da Cruz Vermelha por dia. Essa contagem tem a distribuição de Poisson com parâmetro μ, o
número médio de doadores AB por dia.

Uma distribuição de Poisson descreve a contagem X de ocorrências de um evento definido em intervalos


fixos, finitos, de tempo ou espaço, quando:

1. as ocorrências são todas independentes (isto é, a ocorrência de um evento não muda a probabilidade de
que outro possa ocorrer) e
2. a probabilidade de uma ocorrência é a mesma em todos os intervalos possíveis. Sua aplicação está
relacionada a patologias raras (valor de p baixo).

Polidactilia: Em um determinado hospital, um em cada 500 bebês nasce com polidactilia, e os casos são
aleatórios e independentes. Essa é uma anomalia congênita comum, na qual um bebê nasce com um ou mais
dedos extras, nas mãos ou nos pés. Seja X a contagem de bebês que nascem com a anomalia em um mês
naquele hospital.

Vacinação Em Campo: Coqueluche (pertussis) é uma infecção bacteriana altamente contagiosa, uma das
principais causas de mortes infantis antes do desenvolvimento das vacinas. Cerca de 80% das crianças não
vacinadas e expostas à coqueluche desenvolverão a infecção, contra apenas 5% das vacinadas. Seja X os
números de crianças vacinadas infectadas.

λ → número médio de
ocorrências por intervalo

Exemplo: Suponha que uma em cada mil pessoas que utilizam determinado anestesico sofra uma reaçao negativa
(choque). Num total de 500 cirurgias em que se empregou esse anestesico, a probabilidade de que 1 pessoa sofra a
reaçao pode ser calculada
Monitoramento de surtos de caxumba: A caxumba é uma infecção viral geralmente suave e mesmo
assintomática, em cerca de 20% de indivíduos infectados. No entanto, podem surgir complicações de
consequências duradouras, como meningite/encefalite, esterilidade, aborto espontâneo ou surdez. A
vacinação obrigatória de crianças tem prevenido bastante a caxumba epidêmica nos Estados Unidos, com
média de apenas 265 casos por ano, desde 1996.

Apenas em Iowa, o número médio mensal de casos relatados é de cerca de 0,1 no mesmo período. Supondo
que os casos de caxumba sejam aleatórios e independentes, o número X de casos mensais em Iowa tem a
distribuição de Poisson, aproximadamente, com λ = 0,1. A probabilidade de que, em dado mês, não haja
mais que um caso de caxumba é:

Esperaríamos não mais que um caso de caxumba por


mês com probabilidade 99,53%. Isto é, vermos dois ou
mais casos em um mês seria considerado um evento
muito improvável (probabilidade 1 menos 0,9953) se
os casos forem aleatórios e independentes.

Monitoramento de surtos de caxumba De acordo com o Centro de Controle e Prevenção de Doenças (CDC),
antes da aprovação da vacina contra caxumba, em 1967, quase todos nos Estados Unidos tinham a doença,
com cerca de 200.000 novos casos relatados a cada ano. A vacina contra a caxumba tem eficácia relatada
de 95%. Isto é, alguns indivíduos não serão protegidos pela vacina, pois não têm a capacidade genética de
produzir anticorpos contra essa classe de vírus.

Casos de caxumba, como todos os casos de doenças raras, devem ser reportados ao CDC e são publicados
no Morbidity and Mortality Weekly Report (Relatório Semanal de Incidência e Mortalidade). Em janeiro de
2006, Iowa relatou quatro casos de caxumba. Qual é a probabilidade de haver quatro ou mais casos de
caxumba sob o modelo usado no exemplo?

Como as distribuições de Poisson descrevem eventos


aleatórios independentes, pode ser também
interessante descobrir que variável aleatória se afasta
substancialmente desse modelo.

Por exemplo, supondo que casos de caxumba sejam aleatórios e independentes, quase nunca esperaríamos quatro ou
mais casos em Iowa em dado mês. A contagem alta não usual aponta para um substancial afastamento do modelo de
Poisson – por exemplo, devido a um surto de contágio ou um surto epidêmico. Em um modelo de contágio, o fato de
se saber que uma pessoa está infectada aumenta a chance de que outra também esteja. Assim, eventos de contágio
não são independentes.

Febre tifoide O CDC recebe, em média, relatórios de 7,7 casos de febre tifoide por semana, de todos os Estados Unidos,
embora, na maioria dos casos, a doença seja adquirida em viagens internacionais. A febre tifoide é uma doença
potencialmente fatal, causada pela bactéria Salmonella typhi e transmitida pela ingestão de comida ou bebidas
contaminadas. (a) Qual distribuição melhor representaria a distribuição das contagens semanais de febre tifoide?
CARACTERIZAÇÃO DA POISSON

Se uma variável aleatória de


Poisson representar o número
de contagens em algum
intervalo, então a média da
variável aleatória terá de ser
igual ao número esperado de
eventos no mesmo
comprimento de intervalo.
Devido ao fato de a média e a variância de uma distribuição de Poisson serem iguais, quando o número médio de
ocorrências for grande, a variância também o será. Assim, distribuições de Poisson são tipicamente usadas para a
descrição de fenômenos aleatórios raros.

O caso das redes de farmácias O ramo de varejo farmacêutico realizou na última década consideráveis
progressos de gestão, destacando-se a formação de redes, a utilização de aprimorados sistemas
computadorizados de gestão de estoques em tempo real e a racionalização das operações de seu depósito
Central.

Os produtos eticos de baixo giro: Os produtos éticos de baixo giro comprometem os esforços de
contenção do estoque. São cerca de 2.000 especialidades medicamentosas pouco receitadas. Seu preço
é elevado. Por motivos sociais, algumas redes consideram ser sua obrigação manter uma ou duas
unidades de cada um desses medicamentos em todas as suas lojas. A venda de um produto de baixo giro
pode ser considerada, estatisticamente, como um evento raro; sua demanda obedece à distribuição de
Poisson.

O desvio-padrão é grande em relação


à média, o que resulta numa dispersão
considerável e, em consequência,
numa cobertura elevada. Na
distribuição de Poisson, o desvio
padrão é igual à raiz quadrada da
demanda média. Se este for inferior a
1, o desvio padrão torna-se
proporcionalmente considerável,
como se vê na coluna (4), e a cobertura
do estoque, aproximadamente igual
ao valor da coluna (5), avoluma-se.

- DISTRIBUIÇÃO NORMAL: A maioria dos fenômenos da natureza apresenta variações dentro de um intervalo definido.
Se coletássemos os dados quanto ao peso de mil indivíduos, encontraríamos diversos valores, dos quais haveria
pequena quantidade de baixos e altos, e grande quantidade em torno dos valores centrais.

A Distribuição de Probabilidade Normal, ou Distribuição Gaussiana


(curva de Gauss), se caracteriza por reunir um grande número de
valores em torno da media, que diminuem gradualmente de
frequência a medida que se afastam dela. De todas as distribuições
de probabilidade continuas, nenhuma e mais largamente usada que
a Distribuição Normal.
CURVA NORMAL: Uma distribuição de probabilidade Normal e
descrita por uma curva de densidade Normal. Essas curvas de
densidade são simétricas, tem um único pico e forma de sino.

A curva de densidade exata para uma distribuição Normal


particular e descrita por sua média μ e seu desvio-padrão σ. A
média está localizada no centro da curva simétrica e coincide com
a mediana. O desvio-padrão e a distância do centro ate os pontos
de mudança de curvatura em cada lado.

Alterando-se μ e mantendo s inalterado, a


curva Normal desloca-se ao longo do eixo
horizontal, sem modificar sua dispersão. O
desvio padrão s controla a dispersão de uma
curva Normal. A curva com maior desvio-
padrão e mais dispersa:

DISTRIBUIÇÃO NORMAL:

Propriedades

A distribuição normal possui as seguintes propriedades:

• f(x) e simétrica em relação a μ;

• f(x) diminui quando x se move para mais longe de μ;

• o valor máximo de f(x) se da em x = μ.

Regra 68–95–99,7

Na distribuicao Normal com media μ e desvio-padrao σ:

● ~ 68% das observacoes estao a menos de σ da media μ.

● ~ 95% das observacoes estao a menos de 2σ da media μ.

● ~ 99,7% das observacoes estao a menos de 3σ da media μ.

Usaremos a notação X ~ N(μ, σ2) para indicar que X tem


distribuição normal com parâmetros μ e σ2. Demonstra-
se que os parâmetros μ e σ2 denotam a média e a
variância da distribuição normal, respectivamente

Caracterização da Distribuição Normal:


- DISTRIBUICAO NORMAL PADRAO: Devido à complexidade da função de probabilidade, fazemos uso da Tabela
Normal-Padrão, construída através da transformação na variável X.

Padronizando uma Variável Aleatória Normal:

A criação de uma nova variável aleatória por


essa transformação e referida como uma
padronização. A variável aleatória Z representa
a distancia de X a partir de sua media em
termos dos desvios-padrao. Essa e a etapa
chave para calcular a probabilidade para uma
variavel aleatoria normal arbitraria.

Pressão sistólica em jovens saudáveis. Suponha que a pressao arterial sistolica em pessoas jovens
de boa saude tenha distribuicao N (120; 100) mmHg. Qual e a probabilidade de se encontrar uma
pessoa com pressão sistolica acima de 135 mmHg?

- Padronizando para Calcular uma Probabilidade:

A Tabela de Distribuição Cumulativa Normal


Padrão pode ser usada para encontrar as
probabilidades associadas com uma variável
aleatória normal arbitraria usando primeiro uma
transformação simples. A Tabela de Distribuição
Cumulativa Normal Padrão apresenta
probabilidades cumulativas para uma variável
aleatória normal padrão.
-Função de Distribuição Acumulada:

- TABELA DA NORMAL PADRÃO:

Considere que Z seja uma variável aleatória normal padrão. A Tabela de Distribuição Cumulativa Normal Padrão fornece
probabilidades na forma F(z) = P (Z <= z).

-USO DA TABELA DE DISTRIBUIÇÃO CUMULATIVA NORMAL PADRÃO: Exemplo: Para encontrar P(Z <= 1,5)

- Leia a coluna z para baixo ate encontrar o valor 1,5. O topo das colunas se refere as casas centesimais do valor de z
em P(Z <= z).

-A probabilidade de 0,93319 e lida na coluna adjacente, marcada como 0,00.


Pressão sistólica em jovens saudáveis.

Assim, da Tabela, P(X > 135) = P(Z > 1,5) = 1 – P(Z <= 1,5) = 1 – 0,93319 = 0,06681

Isto e, 6,68% das pessoas jovens e sadias tem pressao sistolica acima de 135 mmHg.

Seu colesterol é muito alto?

Colesterol alto no sangue aumenta o risco de doencas do coracao e enfartos. Quanto mais alto seu colesterol, maior o
risco, mas não ha um ponto de corte exato entre um nivel saudavel e umpatologico. Historicamente, niveis do colesterol
total acima de 240 mg/dL tem sido considerados um serio fator de risco.

Em uma mudanca na direcao de prevencao e deteccao prematura, foi criado um novo rotulo de “colesterol elevado” de
200 a 240 mg/dL para a identificacao de individuos que podem estar em algum risco de doenca cardiovascular. Um estudo
estima que o resultado foi mais de 40 milhoes de novos candidatos a tratamento farmacologico.

Colesterol em homens de meia-idade. Os niveis de colesterol no sangue de homens com idades entre 55 e 64 anos sao
aproximadamente Normais, com media de 222 mg/dL e desvio-padrao de 37 mg/dL.

(a) Qual percentual desses homens tem colesterol alto (niveis acima de 240 mg/dL)?

(b) Qual percentual tem colesterol elevado (entre 200 e 240 mg/dL)?

Hemoglobina. A distribuicao de hemoglobina em g/dl de sangue e ~ N(14; 1) em mulheres e ~ N(16; 1) em homens.

(a) Qual percentual de mulheres tem mais hemoglobina que hemoglobina media dos homens?

(b) Qual percentual de homens tem menos hemoglobina que a hemoglobina media das mulheres?

(c) Qual percentual de homens tem mais hemoglobina que a hemoglobina media das mulheres?
GRAFICO DOS QUANTIS NORMAIS: A distribuicao Normal fornece boas descricoes de algumas distribuicoes de dados
reais, como testes de QI ou alturas individuais. As distribuicoes de algumas outras variaveis comuns são assimetricas e,
portanto, claramente nao Normais. Os exemplos incluem os tempos de sobrevivencia de pacientes de cancer depois do
tratamento, a quantidade de certa toxina no sangue humano em uma amostra aleatoria.

A maneira mais util de avaliar a Normalidade e por meio de outro grafico, o grafico de quantis Normais.

Uso dos Gráficos dos Quantis Normais

Se os pontos em um grafico de quantis Normais estao


proximos de uma reta, o grafico indica que os dados sao
Normais. Desvios sistematicos em relacao a uma reta
indicam distribuicao nao Normal. Valores atipicos
aparecem como pontos distantes do padrao geral do
grafico.

EXEMPLO: TEMPOS DE SOBREVIVÊNCIA

Claramente, os pontos no grafico nao seguem um padrao linear.

Se voce traçar uma reta atraves dos pontos mais a esquerda, que correspondem
as menores observacoes, vera que as observacoes maiores ficarao acima dessa
reta.

Uso dos Gráficos dos Quantis Normais: Em uma distribuição assimétrica a direita, as observações com maiores valores
se situam distintamente acima de uma reta traçada através do corpo principal de pontos. Analogamente, a assimetria a
esquerda e evidente quando as menores observações ficam abaixo da reta.

Estabelecimento da
anorexia nervosa. A Figura
mostra o gráfico de quantis
Normais para os dados
sobre o estabelecimento da
anorexia nervosa em 691
meninas adolescentes.
Examine o grafico de
quantis normais em relacao
a desvios da Normalidade.
Explique suas conclusoes e
compare esse gráfico com o histograma dos mesmos dados.

INFERÊNCIA ESTATÍSTICA

Como uma amostra diferente poderia conduzir a


conclusões diferentes, não temos certeza de que elas
sejam corretas. A inferência estatística usa a linguagem
da probabilidade para expressar o grau de confiabilidade
de nossas conclusões.
INTERVALO DE CONFIANÇA: Toda medida laboratorial é analisada confrontando-se seu valor com uma faixa padrão. Isto
é tão comum que, na própria apresentação do resultado, muitos laboratórios já indicam os limites inferiores e superiores
para o valor da medida que devem servir de base ao raciocínio clínico.

Um intervalo de confiança usa dados amostrais para estimar um parâmetro desconhecido da população, através de um
intervalo de valores provaveis para a estimativa, com uma indicação do grau de precisão da estimativa e do grau d
confiança de que o resultado esteja correto.

Estudo de Caso Abordagem estatística na validação retrospectiva do processo de fabricação de mistura polivitamínica. Os
resultados permitiram concluir que o processo de fabricação do produto constituído por mistura polivitamínica pode ser
considerado validado.

Qual a altura das crianças atualmente? O intervalo de confiança de 95% de confiança para a altura média de meninos
americanos de 8 anos, com base na amostra NHANES, é 132,5 ± 1,4.

A estimativa (média amostral = 132,5, no nosso exemplo) é o centro do intervalo e é a nossa conjectura sobre o valor do
parâmetro desconhecido, com base nos dados amostrais.

A margem de erro (no nosso exemplo, ±1,4) mostra o grau de precisão que acreditamos que nossa conjectura tenha, com
base na variabilidade da estimativa.

Esse é um intervalo de confiança de 95%, porque ele capta o parâmetro


desconhecido (μ nesse caso) com 95% de probabilidade. Isto é, estamos 95%
confiantes de que o parâmetro desconhecido seja um valor dentro do intervalo
de confiança.

Interpretação de um Intervalo de Confiança: O nível de confiança é a taxa de


sucesso do método que produz o intervalo. Dizer que temos 95% de confiança de que o parâmetro desconhecido μ esteja
entre 131,1 e 133,9 é uma maneira abreviada de dizer que “obtivemos esses números por um método que fornece
resultados corretos em 95% das vezes”.

INTERVALO DE CONFIANÇA

Alho e colesterol ruim. Em um experimento relativo


ao efeito do alho sobre os níveis de colesterol no
sangue, 49 adultos voluntários foram selecionados
aleatoriamente e pediu-se a eles que consumissem
um dente de alho cru seis dias da semana, durante
seis meses. O estudo relata que, depois de seis
meses do experimento, o intervalo de confiança de
95% para a mudança média no LDL (lipoproteína de
baixa densidade ou colesterol “ruim”) foi –5,5 a 6,4
mg/dL.

(a) Qual é o parâmetro captado por esse intervalo de confiança? O que significa dizer que temos “95% de confiança”
nesse intervalo?

(b) Intervalos de confiança, em geral, são expressos na forma seguinte: “estimativa ± margem de erro”. Qual é o valor
numérico da estimativa do parâmetro aqui? Qual é a margem de erro?
- INTERVALO DE CONFIANÇA PARA A MÉDIA

-Para estimarmos a média populacional


desconhecida μ, usamos a média da amostra
aleatória.

- Em amostras repetidas, a média tem


distribuição Normal com média μ e desvio-
padrão

- números como z*, que delimitam áreas


específicas, são chamados valores críticos da
distribuição Normal-padrão.

-z* é a abscissa da Distribuição Normal para um determinado grau de confiança. Escolhendo grau de confiança de 95%
para a estimativa, o valor de z* resulta aproximadamente igual a 1,96 (Distribuição Normal).

- Valores de z* para os níveis mais comuns:

Produção farmacêutica. Um fabricante de produtos farmacêuticos analisa cada lote de um produto para verificar a
concentração do princípio ativo. A análise química não é perfeitamente precisa. Na verdade, medições repetidas seguem
uma distribuição Normal, com média μ igual à verdadeira concentração e desvio-padrão igual a 0,0068 grama por litro
(g/L). Três análises de um lote fornecem concentrações de 0,8403; 0,8363 e 0,8447 g/L.

Para estimar a verdadeira concentração, dê um intervalo de confiança de 95% para μ.

Fabricação de comprimidos de aspirina. Uma companhia farmacêutica fabrica comprimidos de aspirina vendidos com
o rótulo “princípio ativo: aspirina 325 mg”. Nenhuma produção, mesmo automatizada, é sempre perfeita, e
comprimidos individuais variam um pouco no conteúdo real de aspirina. Uma pequena quantidade de variação é
aceitável, desde que, na média, a produção toda tenha média μ = 325 mg. A dosagem apropriada de prescrição de
medicamento é importante, e os desvios da distribuição da dose esperada em qualquer direção (muita ou pouca aspirina
por comprimido) devem ser identificados e, então, naturalmente, corrigidos. Suponha que saibamos que o conteúdo de
aspirina em comprimidos siga uma distribuição Normal, com desvio-padrão igual a 5 mg.

Se o processo de fabricação estiver bem calibrado, o conteúdo médio de aspirinaserá μ = 325 mg. Para estimar a
verdadeira dosagem, dê um intervalo de confiança de 95% para μ.
Avandia e colesterol. O fabricante de remédios GlaxoSmithKline analisou o impacto potencial de seu remédio oral
para o diabetes Avandia (rosiglitazone maleate) sobre os níveis de lipídeos no sangue de adultos diabéticos, que
podem se beneficiar do Avandia. O nível da linha de base média do LDL (colesterol “ruim”) para uma amostra de 964
desses pacientes foi igual a 125,6 miligramas por decilitro (mg/dL). Sabe-se que a distribuição dos níveis de colesterol
LDL na população adulta é próxima de uma Normal, com desvio-padrão igual a 30 mg/dL.

Dê um intervalo de confiança de 90% para a linha de base média μ do nível de LDL entre adultos diabéticos que podem
se beneficiar da ingestão de Avandia.

Tempo de reação. Uma pesquisa analisou o tempo de reação a um novo medicamento. O tempo médio de reação
para uma amostra de 36 pacientes que receberam este medicamento foi de 4,7 minutos. Sabe-se que a distribuição
do tempo de reação ao medicamento é próxima de uma Normal, com desvio-padrão igual a 2,1 minutos.

Obtenha um intervalo de 99% de confiança para o tempo médio de reação.

_______________________________________________________________________________________________

TESTE DE HIPOTESES:

TESTE DE ASSOCIACAO ENTRE VARIAVEIS:

Terapia hormonal e tromboembolismo. A terapia de reposicao de estrogeno oral (TRE) ativa a coagulacao sanguinea
e aumenta o risco de tromboembolismo venoso (um coagulo viajante, algumas vezes fatal) em mulheres em pos-
menopausa. Um estudo retrospectivo de controle de caso comparou uma amostra aleatoria de 155 mulheres em pos-
menopausa com um primeiro tromboembolismo documentado, e uma amostra aleatoria de controle de 381 mulheres
em pos-menopausa sem nenhum historico de tromboembolismo. Desejamos saber se há uma diferenca significante
entre as duas distribuicoes de históricos de TRE.

H0: Não existe relação entre as variáveis

H1: Existe relação entre as variáveis


Terapia hormonal e tromboembolismo.

H0: não há nenhuma relação entre o estado de tromboembolismo e histórico de TRE (variáveis não associadas)

H1: há alguma relação entre estado de tromboembolismo e histórico de TRE (variáveis associadas)

Para testar H0, comparamos as contagens observadas na tabela com as contagens esperadas, as que esperariamos
se H0 fosse verdadeira. Se as contagens observadas estiverem muito distantes das esperadas, ha evidencia contraria
a H0.

Contagens Esperadas

A contagem esperada em qualquer célula de uma tabela de dupla entrada, quando H0 e verdadeira, é:

O TESTE QUI-QUADRADO: A estatística de teste que nos diz se as diferenças observadas entre as mulheres nos grupos
de casos e de controles são estatisticamente significantes compara as contagens observadas e esperadas. A estatística
de teste que realiza a comparação e a estatística qui-quadrado.

ESTATISTICA QUI-QUADRADO: A estatística qui-quadrado e uma medida da distância entre as contagens observadas
e as esperadas em uma tabela de dupla entrada.

A soma se estende a todas as


celulas na tabela. Cada termo
na soma e chamado um
componente da X2.

- Terapia hormonal e tromboembolismo. Devemos primeiro calcular os oito componentes da qui-quadrado


separadamente. Eis como calcular a primeira: 71 mulheres no grupo de casos com diagnostico relatado de
tromboembolismo relataram nunca ter usado TRE. A contagem esperada para essa celula e 80,68. Assim, o
componente da qui-quadrado para essa celula é

- Para obtermos a estatística qui-quadrado para esse teste, devemos somar todos os oito componentes, de modo que
X2 é:
-P-VALOR:

A maioria dos programas computacionais reporta os resultados dos problemas de testes de hipoteses em termos de
p-valor. Na apresentacao de resultados e conclusoes, e pratica padrao reportar o p-valor observado, juntamente com
a decisao que e feita em relacao a hipotese nula.

E costume chamar a estatística de teste (e os


dados) significativa quando a hipótese nula
H0 e rejeitada; por conseguinte, podemos
pensar a respeito do p-valor como o menor
nível a em que os dados são significativos.

Em outras palavras, o p-valor e o nivel de significancia observado

REGRA DE DECISAO

O p-valor e comparado ao nivel de significancia predeterminado, para decidir se a hipotese nula deve ser rejeitada.

p-valor < nivel de significancia → Rejeitamos H0

H0: Nao existe relacao entre as variaveis (variaveis nao associadas)

H1: Existe relacao entre as variaveis (associacao entre as variaveis)

Terapia hormonal e tromboembolismo

Dados: p-valor próximo de zero, cerca de 0,00009.

nível de significância α = 5% = 0,05 p-valor < nivel de significância → Rejeitamos H0

H0: nao ha nenhuma relacao entre o estado de tromboembolismo e historico de TRE (variaveis nao associadas)

H1: ha alguma relacao entre estado de tromboembolismo e historico de TRE (variaveis associadas)

Interpretação pratica: Ha evidencia bastante forte de que as distribuições de história de TRE são diferentes em
mulheres com e sem um primeiro episódio de tromboembolismo.

Tratamento de ulcera. Congelamento gastrico foi um tratamento recomendado para ulceras pepticas. O uso desse
tratamento foi interrompido depois que experimentos mostraram que nao tinha nenhum efeito. Um experimento
comparativo aleatorizado encontrou que 28 entre 82 pacientes de congelamento gástrico melhoraram, enquanto 30
de 78 pacientes no grupo placebo melhoraram. Podemos testar a hipotese de “nenhuma diferenca” entre os dois
grupos usando a estatistica qui-quadrado.

Dado: p-valor do teste = 0,5703; nivel de significancia α = 10%

(a) Estabeleca as hipoteses.


(b) Explique, em palavras, o que a hipotese nula para o teste quiquadrado diz sobre o resultado do tratamento.
(c) O que voce conclui sobre a eficacia do congelamento gástrico como tratamento de ulceras pepticas?