Testes Probabilidadetestes de Probabilidade

PROBABILIDADES
CONJUNTAS
TESTES DE PROBABILIDADE
Autor(a): Dra. Mariza Akiko Utida
Revisor: Fábio Santiago
Tempo de leitura do conteúdo estimado em 1 hora e 16 minutos.

Introdução
Caro(a) estudante,
A construção do seu conhecimento em probabilidade chega na última etapa. Você, estudante,

irá estudar nesta unidade alguns testes de probabilidade que o ajudarão a entender e a aplicar
esses testes em distribuições de variáveis. O primeiro o teste é de independência, com foco
na teoria da decisão estatística, para entender e aplicar hipóteses. O segundo é representado
por tabelas de contingência para fazer análises e aplicar testes específicos em alguns
problemas, avaliando o comportamento de variáveis. Por fim, há os testes não paramétricos
para aplicar testes de hipóteses.
Este material visa prepará-lo para aplicar testes de hipóteses para determinar o tipo de
distribuição associada e se há homogeneidade. Também vai ajudá-lo a entender e a aplicar
teste de coeficiente de variação entre duas variáveis X e Y.
Como você deve ter percebido, compreender probabilidade exige dedicação para que consiga
desenvolver capacidade de análise. Continue se esforçando, porque é um assunto essencial
para a sua formação.
Bons estudos!
Testes de Probabilidade
No modelo probabilístico, o resultado da saída de um experimento (relacionado à observação
de um fenômeno) tem uma probabilidade de ser calculado em pontos ou intervalos das
variáveis do processo. A escolha adequada para comparar os resultados exige:
que se leve em consideração o tanto o nível de significância como o poder do teste.

O nível de significância de um teste é a probabilidade de rejeitar a hipótese de que
as médias são iguais, quando esta hipótese é, na realidade, verdadeira. Já o poder
do teste é a probabilidade de rejeitar a hipótese de que as médias são iguais
quando esta hipótese é, na realidade, falsa (OLIVEIRA, 2008, p. 11).
Veja, no elemento a seguir, a função do modelo probabilístico na aplicação para tomadas de

decisão.
“Muito frequentemente, a região de rejeição é definida em

termos de uma estatística, denominada estatística do
teste. Estatística do teste é uma estatística que possibilita
o teste de uma hipótese estatística. Usualmente,
estatísticas possibilitam o mesmo processo de decisão
numa dimensão menor, devido à redução dos dados
providenciada pela estatística. Desse modo, a região de
rejeição pode ser estabelecida de modo equivalente em
termos da estatística do teste.”
Fonte: Sampaio e Leoni (2015, p. 2).
Fonte: ndul / 123RF.
Muitos problemas exigem uma decisão entre aceitar ou rejeitar uma afirmativa sobre algum
parâmetro . A afirmativa é, em geral, denominada hipótese , e os procedimentos de tomada de
decisão em relação à hipótese são chamados de teste de hipótese . Os testes de
probabilidade são metodologias estatísticas que auxiliam verificar se os dados amostrais
buscam evidência que embasem ou não uma hipótese estatística formulada.
Uma hipótese estatística é uma afirmativa sobra a distribuição de probabilidade de uma

variável aleatória . Hipóteses estatísticas envolvem, em geral, um ou mais parâmetros dessa
distribuição.
Neste estudo, será abordado, primeiramente, alguns dos conceitos básicos e a terminologia
utilizada no teste de hipótese; em um segundo momento, será estudado os procedimentos de
decisão dos problemas de teste de hipóteses encontrados, com base em uma amostra de
uma única população.
Para que você possa compreender melhor como isso funciona, veja o exemplo:
Um fabricante vem produzindo pinos para serem utilizados sob determinadas

condições de trabalho. Verificou-se que a duração da vida (em horas) desses pinos
é normalmente distribuída, N (100, 9). Um novo projeto de fabricação foi iniciado
com o objetivo de aumentar a duração da vida desses pinos, ou seja, a expectativa
é que a duração da vida X (correspondente aos pinos fabricados pelo novo
processo) terá distribuição
N (μ, 9) , onde μ > 100, μ é a expectancia finita (E (X ) = μ) . ¯
Deste modo, o fabricante e o comprador potencial desses pinos estão interessados

em testar as seguintes hipóteses: H0 : μ = 100 contra H1 : μ > 100 ,
onde H0 é denominada a hipótese da nulidade (ou hipótese básica) e H1 a
hipótese alternativa (MEYER, 1984, p. 371).
As hipóteses sempre são afirmativas sobre a população ou distribuição em estudo, não

afirmativas sobre a amostra . O valor do parâmetro populacional especificado na hipótese
nula é usualmente determinado de três maneiras. Veja cada uma delas e em que consistem
no elemento a seguir.
1) A primeira resulta de experiência passada ou de conhecimento do processo,

ou mesmo de experimentação previa. O objetivo do teste de hipótese, então, é
determinar se a situação experimental mudou.
2) Na segunda, o teste de hipótese pode ser determinado por alguma teoria ou
modelo relativo ao processo em estudo. Aqui, o objetivo do teste de hipótese é
verificar a teoria ou modelo.
3) A terceira situação surge quando o valor do parâmetro populacional resulta de
considerações externas, tais como planejamento ou especificações de
engenharia ou de obrigações contratuais. Nessa situação, o objetivo usual do
teste de hipótese é o teste de conformidade.
Fonte: Hines et al . (2006, p. 238).
Para testar uma hipótese, devemos extrair uma amostra aleatória , calcular uma estatística de
teste apropriada a partir dos dados amostrais e, então, usar a informação contida na
estatística de teste para tomar a decisão .
Teste de Independência
Nesta seção, você irá estudar o teste de independência, o qual é definido para verificar se uma
variável aleatória não interfere na ocorrência de outra variável aleatória, ou seja, duas variáveis
são independentes se a hipótese corresponde à independência entre as variáveis aleatórias.
A importância de quantificar o grau de associação entre duas variáveis, usando a

estatística, porém, essa quantificação só tem sentido se as variáveis não forem
independentes . Nos testes apresentados neste estudo supõe a existência de duas
variáveis aleatórias X e Y , e os valores de amostras delas são classificados
segundo categorias , obtendo-se uma tabela de dupla entrada , apresenta -se o
teste de hipótese que X e Y são independentes (BUSSAB; MORETTIN, 2018, p. 401).
Introdução
O teste de independência tem como objetivo analisar se as duas variáveis medidas nas
mesmas unidades são independentes ou correlacionadas. Veja no elemento a seguir como
são representadas as hipóteses.
1. H0 : Há independência entre as duas variáveis.

2. H1 : Há dependência entre as variáveis.
Segundo Magalhães e Lima (2005, p. 289), o cálculo estatístico para determinar a região
crítica é análogo ao utilizado na distribuição qui-quadrado , ou seja, após definir as hipóteses
de teste, primeiramente, constrói-se a tabela de valores esperados calculados sob a hipótese
de independência H0 . Os elementos da tabela e (i, j) são determinados por:
T otal da linha i × T otal da coluna j

ei, j =
T otal geral
Depois disso, é medida a diferença entre os valores esperados e observados, os quais são
calculados através da equação:
r s 2
(observadoi, j − ei, j)
2
Q = ∑ ∑
ei, j
i=1 j=1
A região crítica para Q

2
se comporta de acordo com o nível de significância do teste,
, em que é calculado através da tabela do qui-quadrado,
2
P (Q ≥ qc | H0 verdadeiro) qc
do valor de α com o grau de liberdade :

gl = (numero de linhas − 1) × (numero de colunas − 1) .
Quando não temos informações sobre os resultados obtidos dos dados do problema, ou seja,
sobre a ocorrência conjunta das variáveis aleatórias , o procedimento usual é coletar uma
amostra anotando a frequência conjunta da ocorrência dos dados, pode-se, assim, utilizar um
teste de independência .
Veja outro exemplo para poder visualizar melhor sua aplicação: a tabela a seguir contém os
resultados obtidos por estudantes do ensino médio, em um exame com questões nas
disciplinas de física e matemática. Deseja-se testar se existe dependência entre as notas
dessas duas disciplinas que, para efeito de apresentação na tabela e analise de
comportamento , foram classificadas nas categorias alta, média e baixa.
Observe a tabela a seguir.
Matemática
Alta Média Baixa Total
Física
Alta 56 71 12 139
Média 4 163 38 248
Baixa 14 42 85 141
Total 117 276 135 528
Tabela 4.1 - Notas das disciplinas física e matemática de 528 alunos do ensino médio
Fonte: Magalhães e Lima (2005, p. 290).
#PraCegoVer : a tabela apresenta as notas de 528 alunos do ensino médio. Na primeira

coluna, há as notas da disciplina de física, classificadas em alta, média e baixa, além do
total de cada nota. Na primeira linha da tabela, tem-se as notas da disciplina de
matemática, classificadas também em alta, média e baixa, com o total de cada nota da
disciplina de física. Na segunda linha, tem-se as notas altas da disciplina de física (total:
139), seguida das notas alta (56), média (71) e baixa (12) da disciplina de matemática.
Na terceira linha, tem-se as notas médias da disciplina de física (total: 248), seguida das
notas alta (47), média (163) e baixa (38) da disciplina de matemática. Na quarta linha,
tem-se as notas baixas da disciplina de física (total: 141), seguida das notas alta (14),
média (42) e baixa (85) da disciplina de matemática. E por fim, na última linha, o total das
notas da disciplina de matemática alta (117), média (276) e baixa (135), com o total de
alunos de 528.
Verifique se as notas das duas disciplinas de física e matemática são independentes,

considerando α = 0, 01 .
Solução: os testes de hipótese.
H0 : As notas de física e matemática são independentes.

H1 : As notas de física e matemática não são independentes.
Temos que o grau de liberdade é determinado por:

gl = (numero de linhas − 1) × (numero de colunas − 1) = (3 − 1) × (3 − 1) = 4
Deve-se construir a tabela de valores esperados, em que, para cada elemento da tabela,
utiliza-se a equação:
T otal da linha i × T otal da coluna j

ei, j =
T otal geral
Primeira linha da tabela. Para o elemento e1, 1
T otal da linha 1 × T otal da coluna 1 139 × 117 5421

e1, 1 = = = = 30, 80
T otal geral 528 176
Para o elemento e1, 2

e1, 2 = = = = 72, 66
T otal geral 528 44

e1, 3 = = = = 35, 54
Segunda linha da tabela. Para o elemento e2, 1

e2, 1 = = = = 54, 95
T otal geral 528 22

e2, 2 = = = = 129, 64
T otal geral 528 11

e2, 3 = = = = 63, 41
T otal geral 528 22
Terceira linha da tabela. Para o elemento e3, 1

e3, 1 = = = = 31, 25
l d l h l d l
e3, 2 = = = = 73, 70
T otal geral 528 44

e3, 3 = = = = 36, 05
Logo, observe a tabela a seguir.
Matemática
Alta Média Baixa
Física
Alta 30,80 72,66 35,54
Média 54,95 129,64 63,41
Baixa 31,25 73,70 36,05
Tabela 4.2 - Tabela completa dos valores esperados de 528 alunos do ensino médio
#PraCegoVer : a tabela apresenta o valor esperado das notas de 528 alunos do ensino
médio. Na primeira linha da tabela, tem-se os valores esperados das notas da disciplina
de matemática classificadas também em alta, média e baixa. Na segunda linha, tem-se
os valores esperados das notas altas da disciplina de física, seguida da alta (30,80),
média (72,66) e baixa (35,54) para a disciplina de matemática. Na terceira linha, tem-se
os valores esperados das notas médias da disciplina de física, seguida das notas alta
(54,95), média (129,64) e baixa (63,41) da disciplina de matemática. Na quarta e última
linha, tem-se os valores esperados das notas baixas da disciplina de física, seguida das
notas alta (31,25), média (73,70) e baixa (36,05) da disciplina de matemática.
Para medir a diferença entre os valores esperados e valores observados, temos:
r s 2
(observadoi, j − ei, j)
2
Q = ∑ ∑
ei, j
i=1 j=1
2 2 2
(observado1, 1 − e1, 1) (observado1, 2 − e1, 2) (observado3, 3 − e3, 3)
= + + …
e1, 1 e1, 2 e3,3
2 2 2
(56 − 30, 80) (71 − 72, 66) (85 − 36, 05)
= + + … + = 145, 78
30, 80 72, 66 36, 05
Para determinar a região crítica , dado que α = 0, 01 e o grau de liberdade calculado é 4,

utilizamos a distribuição qui-quadrado . Com o auxílio da tabela, temos: qc = 13, 28 .
Como Q , concluímos pela rejeição da hipótese nula , ou seja, as

2
≥ qc ⇒ 145, 78 ≥ 13, 28
notas de física e matemática não são independentes .
No box a seguir, clique no link indicado para conhecer mais sobre o desenvolvimento de
probabilidade.
SAIBA MAIS
A utilização da tabela da distribuição qui-quadrado em pesquisa visa verificar se as distribuições de

duas ou mais amostras não relacionadas diferem significativamente em relação à determinada
variável. O teste qui-quadrado compara duas proporções quando os dados assumirem qualquer
distribuição. Também testa o grau de associação entre as variáveis. Para visualizar a tabela, acesse
o link a seguir.
Para saber mais sobre o desenvolvimento da probabilidade, acesse o link :

https://www.ime.unicamp.br/~cnaber/Tabela%20da%20Qui-quadrado.pdf
Teoria de Decisão Estatística

Neste tópico, você aprenderá sobre a teoria da decisão com a probabilidade , os conceitos e
as aplicações a serem tomadas no processo de decisão, a incerteza, a matriz de decisão e os
critérios adotados.
A análise de decisão trata-se de uma teoria prescritiva ou normativa , com o objetivo de

ajudar a tomar decisões baseada nas suas preferencias básicas , quando enfrentam
situações de decisão simples, permite também aplicar uma metodologia mais desenvolvida,
ajudando na análise de decisão de problemas mais complexos .
A análise de decisão é responsável por representar um conjunto de métodos e conceitos para
apoiar o decisor a fazer a melhor escolha, baseando-se em uma decisão racional e
consistente, mesmo em condições de aleatoriedade e incerteza .
No box a seguir, você pode se aprofundar um pouco mais sobre a teoria da decisão.
SAIBA MAIS
“Agente, responsável pela decisão a ser tomada e ser racional, capaz de explicitar suas preferências
em relação aos possíveis resultados de suas decisões. O decisor pode ser uma pessoa ou um
grupo de pessoas que tem autoridade e responsabilidade pela escolha da alternativa a ser seguida.
Um decisor é capaz de revelar apenas a alternativa que mais se aproxima de sua realidade, pois
está sujeito à racionalidade humana e à imperfeição das decisões.”
Para saber mais sobre o desenvolvimento da probabilidade, acesse o link :

http://repositorio.unicamp.br/jspui/bitstream/REPOSIP/307582/1/Moreira_AndreadePaulaMachado_M.pd
Fonte: Moreira (2015, p. 11).
Para isso, segundo Bekman e Costa Neto (2009, p. 1-2):
as resoluções de problemas dependem muito da tomada de decisão difíceis de

serem tomadas, para que um problema possa ser formulado tornando necessário
uma descrição completa do problema que deseja ser resolvido, deve-se tomar os
seguintes critérios:
• A relação de todas as opções possíveis do problema a ser trabalhado, seja com
referência aos possíveis cursos de ação, ou seja, a respeito da coleta de dados ou
aquisição de novas informações.
• A lista de todos os eventos que podem ocorrer como resultado das possíveis
decisões.
• A cronologia em que as informações chegam ao conhecimento do decisor é em
que as decisões devem ser tomadas.
• A quantificação das preferências do decisor em relação as consequências que
podem resultar dos possíveis cursos de ação.
• Um julgamento probabilístico a respeito da ocorrência dos possíveis eventos.
Foram apresentadas as especificações da estrutura do problema, junto com as
probabilidades das variáveis e a racionalidade. Deve-se levar sempre em consideração que as
tomadas de decisões devem ser consistentes com informações lógicas e coerentes durante
todo o processo. Agora que você já adquiriu alguns conceitos e aplicações sobre
probabilidades, que tal colocar esse conhecimento em prática? Vamos lá?!
praticar
Vamos Praticar
Um curso de artes de uma faculdade deseja fazer uma pesquisa para saber se a preferência
por certo tipo de filme se altera de acordo com o estado civil da pessoa. Sendo assim,
selecionaram uma amostra com 400 pessoas, dentre elas solteiras, casadas, divorciadas e
viúvas. Os resultados estão na tabela a seguir.
Filme
Tamanho da
Estado Policial Comédia Romance
amostra
Civil
Solteiras 45 25 30 100
Casadas 36 61 43 140
Divorciadas 39 36 35 110
Viúvas 14 19 17 50
Total 134 141 125 400
Tabela - Pesquisa dos tipos de filmes e o estado civil de 400 pessoas

#PraCegoVer : a tabela apresenta a pesquisa dos tipos de filmes e o estado

civil de 400 pessoas. Na primeira coluna, há o estado civil das pessoas
pesquisadas classificadas em solteiras, casadas, divorciadas e viúvas, além do
total de cada estado civil. Na primeira linha da tabela, tem-se os gêneros de
filmes classificados em policial, comédia e romance, com o total de amostra de
cada estado civil. Na segunda linha, tem-se o estado civil das pessoas solteiras,
no total de 100 no final, seguida do gênero de filme policial (45), comédia (25) e
romance (30). Na terceira linha, estado civil das pessoas casadas, no total de
140 no final, seguida do gênero de filme policial (36), comédia (61) e romance
(43). Na quarta linha, tem-se estado civil das pessoas divorciadas, no total de
110 no final, seguida do gênero de filme policial (39), comédia (36) e romance
(35). Na quinta linha, tem-se estado civil das pessoas viúvas, no total de 50,
seguida do gênero de filme policial (14), comédia (19) e romance (17). E por fim,
na última linha, o total dos gêneros de filmes pesquisados, sendo policial (134),
comédia (141), romance (125), e o total de pessoas pesquisadas: 400.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatística . São

Paulo: Editora da Universidade de São Paulo, 2005.
Verifique se o tipo de filme tem relação com o estado civil, ou seja, se as variáveis
são independentes, considerando α = 0, 05.
Solução: os testes de hipótese.

H0 : A preferência por certo tipo de filme é igual para qualquer estado civil.
H1 : A preferência por certo tipo de filme muda de acordo com o estado civil.
Considerando também que o grau de liberdade é determinado por:

gl = (numero de linhas − 1) × (numero de colunas − 1) = (3 − 1) × (4 − 1) = 6
Tabelas de
Contingência
As tabelas de contingência correlacionam múltiplas variáveis aleatórias, sendo utilizadas para

associar duas ou mais variáveis independentes. Da mesma forma, uma tabela de frequência
corresponde a um conjunto de dados classificados ao mesmo tempo em várias
características.
A análise de tabela de contingência é um método multivariável que compara as estruturas de

várias tabelas de contingências, com a mesma linha e colunas diferentes (ou o contrário),
construídas em diferentes amostras ou populações , ou seja, é uma tabela na qual as
frequências estão distribuídas em duas variáveis, linhas e colunas, incluindo dados
categóricos arranjados em uma tabela.
Introdução
Os procedimentos para aplicar os testes de probabilidades, mesmo utilizando as tabelas de
contingência para melhor representação, são muitas vezes difíceis de obter, porém uma
estatística de teste aproximada é válida para n grande.
Na história da matemática, segundo Memória (2004, p. 28), tem-se que:

inicialmente Pearson (em 1896) propôs a formula do momento-produto para
coeficiente de correlação e seus estudos mais tarde foram base de inúmeros
estudos por Pearson e seus colaboradores entre eles destacou-se George Udny
Yule de 1893 a 1912 que em analogia com o coeficiente de correlação, Yule
introduziu o coeficiente de associação para o grau de associação em tabelas de
contingência 2x2, que levou a longa controvérsia quando foi sugerido considerar se
a tabela 2x2 como dupla dicotomia de uma superfície normal bidimensional.
Além disso, Yule é conhecido por seu livro “An Introduction to the Theory of Statistics”,
publicado em 1911.
Neste tópico, você irá estudar a importância dos testes, ao utilizar as tabelas de contingência
, para investigar as proporções nas diferentes categorias em todas as populações do
problema. As tabelas de contingência mais simples são tabelas com dois fatores , que
contam as respostas por duas variáveis.
A importância de se utilizar a tabela de contingência é facilitar a absorção do conhecimento

dos dados por parte do leitor, auxiliando, também, a representação gráfica do problema
trabalhado.
Análise e Aplicação
Nos testes para tabelas de contingência, muitas vezes, os n elementos de uma amostra de
uma população podem ser classificados de acordo com dois critérios diferentes. É de
interesse, então, saber se os dois métodos de classificação são estatisticamente
independentes; por exemplo, podemos considerar a população de graduandos em engenharia
e podemos querer determinar se o salário inicial é independente, ou não, das disciplinas
acadêmicas. Suponha que o primeiro método de classificação tenha r níveis e que o segundo
tenha c níveis. Denotaremos por Oij a frequência observada para o nível i do primeiro método
de classificação e para o nível j do segundo método de classificação.

Coluna
1 2 ... c
Linha
1 O 11 O 12 ... O 1c
2 O 21 O 22 .... O 2c
⋮ ⋮ ⋮ ⋮
r O r1 O r2 ... O rc
Tabela 4.3 - Tabela de contingência r x c

Fonte: Adaptada de Hines et al . (2006, p. 275).
#PraCegoVer : a tabela de contingência generalizada apresenta na primeira linha as

colunas de 1 a c elementos. Na segunda linha, tem-se a primeira linha da variável
múltipla, com os elementos O11 (primeira linha e primeira coluna), O12 (primeira linha e
segunda coluna) e O1c (primeira linha e c colunas). Na terceira linha, tem-se a segunda
linha da variável múltipla com os elementos O21 (segunda linha e primeira coluna), O22
(segunda linha e segunda coluna) e O2c (segunda linha e c colunas). Na quarta e última
linha, tem-se a r linha da variável múltipla, com os elementos Or1 (r linha e primeira
coluna), Or2 (r linha e segunda coluna) e Orc (r linha e c colunas).
O uso da tabela de contingência de dois critérios para se testar a independência entre duas
variáveis de classificação em uma amostra de uma única população de interesse é apenas
uma aplicação dos métodos de tabelas de contingência .
Para testar a hipótese de que os métodos de classificação das linhas e das colunas
são independentes. Se rejeitarmos essa hipótese, concluiremos que há alguma
interação entre os dois critérios de classificação. Os procedimentos exatos são
difíceis de ser obtidos, mas uma estatística de teste aproximada é válida para n
grande. Suponha que as Oij sejam variáveis aleatórias multinominais e que pij
seja a probabilidade de que um elemento selecionado aleatoriamente caia na ij-
ésima célula, dado que as duas classificações são independentes (HINES et al.,
2006, p. 275).
Portanto, sejam as variáveis aleatórias independentes, os estimadores de máximo possíveis

de ui e vj são:
c r
1 1
î =
u ∑ O ij ; ^j =
v ∑ O ij
n n
j=1 i=1
Os valores esperados são definidos pela equação: Eij = n . u

î . v
^j
Para n grande, temos o teste de estatística:
r c 2
(O ij − Eij )
2
x = ∑ ∑
0
Eij
i=1 j=1
Outra situação comum ocorre quando há́ r populações de interesse, e cada população é
dividida nas mesmas c categorias. Extrai-se, então, uma amostra da i-ésima população e
introduzem-se as contagens nas colunas apropriadas da i-ésima linha. Nessa situação,
desejamos investigar se as proporções nas c categorias são as mesmas para todas as
populações. A hipótese nula nesse problema afirma que as populações são homogêneas em
relação às categorias.
Por exemplo, quando há apenas duas categorias, tais como sucesso e falha, defeituosos e
não defeituosos, e assim por diante, então, o teste de homogeneidade é, na realidade, um
teste da igualdade de r parâmetros binomiais. Os cálculos das frequências esperadas, a
determinação dos graus de liberdade e o cálculo da estatística qui-quadrado para o teste de
homogeneidade são idênticos ao teste para independência .
Para que você entenda melhor, vamos a um exemplo, veja a situação no box a seguir.
Fonte: Elaborada pela autora.
#PraCegoVer : o infográfico apresenta o seguinte texto: “Em uma pesquisa, com o total de 200
alunos, sobre o curso de Ciências Sociais e o curso de Ciências Humanas, verificou-se que, dos dois
cursos juntos, 115 alunos são do sexo masculino e 85 do feminino. Na faculdade, sabe-se que o
curso de Ciências Humanas possui 90 alunos e de Ciências Sociais 110 alunos. Para determinar a
tabela de contingência, escolhe-se um aluno aleatoriamente. Observe a tabela a seguir:”. Logo
abaixo do texto, encontra-se a tabela, que apresenta os dados da pesquisa elaborada com 200
alunos. Na primeira coluna, tem-se os gêneros masculino e feminino. Na primeira linha, tem-se as
opções de cursos pesquisados, Ciências Sociais, Ciências Humanas, e o total. Na segunda linha,
tem-se os dados do sexo masculino para os cursos de Ciências Sociais (60) e Ciências Humanas
(55), com o total de 115. Na terceira linha, tem-se os dados do sexo feminino para os cursos de
Ciências Sociais (50) e Ciências Humanas (35), com o total de 85. Na última linha, tem-se os totais
de alunos dos cursos de Ciências Sociais (110) e Ciências Humanas (90) e o total de alunos
pesquisados 200.
Como os valores de n não são grandes, utilizamos, para esse exemplo, os estimadores de
máximo possíveis. Agora, deve-se construir uma tabela de probabilidade, para, assim, calcular
pelo valor total de alunos. Devendo, dessa forma, determinar a tabela de probabilidade de
contingência.
Na primeira linha numérica da tabela, temos que a probabilidade do sexo masculino, do curso
de Ciências Sociais e Ciências Humanas, é, respectivamente:
O 11
Ciências Sociais: P (M ∩ CS) =
n
=
60
200
= 0, 30
O 12
Ciências Humanas: P (M ∩ CH) =
n
=
55
200
= 0, 275
O 13
Total de alunos do sexo masculino: n
=
115
200
= 0.575
De modo análogo aos alunos do sexo masculino, deve-se determinar para o sexo feminino.
Logo, a tabela de probabilidade com todos os dados calculados é apresentada a seguir.
Observe a tabela de probabilidade conjunta a seguir.
Opção
Total
Ciências Sociais Ciências Humanas
Masculino 0,30 0,275 0.575
Feminino 0,25 0,175 0.425
Total 0,55 0,45 1
Tabela 4.4 - Tabela de contingência de probabilidade dos Cursos de Ciências Sociais e Ciências
Humanas
#PraCegoVer : a tabela de probabilidade conjunta apresenta a probabilidade dos dados

da pesquisa elaborada com 200 alunos. Na primeira coluna da tabela, tem-se os gêneros
do sexo masculino e feminino do estudo. Na primeira linha, tem-se as opções de cursos
pesquisados de Ciências Sociais, Ciências Humanas e o total. Na segunda linha, tem-se a
probabilidade dos dados do sexo masculino para os cursos de Ciências Sociais (0,30) e
Ciências Humanas (0,275), com probabilidade total de 0,575. Na terceira linha, tem-se a
probabilidade dos dados do sexo feminino para os cursos de Ciências Sociais (0,25) e
Ciências Humanas (0,175), como probabilidade total de 0.425. Na última linha, tem-se a
probabilidade dos totais de alunos dos cursos de Ciências Sociais (0,55) e Ciências
Humanas (0,45), além do total de alunos pesquisados: 1.
No levantamento da entrevista apresentada na tabela de contingência anterior, com os dados

observados por múltiplas variáveis aleatórias, cada linha e cada coluna corresponde a um
dado do problema dessas variáveis aleatórias.
As tabelas de contingência apresentam quantos dados se atrelam em cada categoria,

enquanto cada coluna indica em qual curso da pesquisa o aluno faz parte, cursos de Ciências
Sociais (110) e Ciências Humanas (90), as linhas da tabela indicam se o sexo é masculino ou
feminino. Por fim, apresenta-se a tabela de probabilidade conjunta, contendo a probabilidade
dos dados da pesquisa elaborada com 200 alunos.
Para encontrar a tabela dos valores esperados, temos que levar em consideração a definição:
c r
1 1
î =
u ∑ O ij ; ^j =
v ∑ O ij
n n
j=1 i=1
Logo, como na tabela anterior foi calculado, temos ^ 1 = 0, 575 u

u ,
^ 2 = 0, 425 v ,
^1 = 0, 55 e
^2 = 0, 45
v . Assim, o valor esperado a ser calculado pela equação é: Eij = n . u
î . v
^j .
Para primeira linha, temos os elementos:
E11 = n . u
^1 . v
^1 = 200 × 0, 575 × 0, 55 = 63, 25
E12 = n . u
^1 . v
^2 = 200 × 0, 575 × 0, 45 = 51, 75
Analogamente, isso também acontece para a segunda linha. A tabela de contingência com os
valores esperados é apresentada abaixo.
Opção
Total
Ciências Sociais Ciências Humanas
Masculino 63,25 51,75 115
Feminino 46,75 38,25 85
Total 110 90 200
Tabela 4.5 - Tabela de contingência dos valores esperados

#PraCegoVer : a tabela de contingência com os valores esperados apresenta os dados

da pesquisa elaborada com 200 alunos. Na primeira coluna da tabela, tem-se os valores
totais dos gêneros do sexo masculino e feminino do estudo. Na primeira linha, tem-se as
opções de cursos pesquisados de Ciências Sociais, Ciências Humanas e o total. Na
segunda linha, tem-se o valor esperado dos dados do sexo masculino para os cursos de
Ciências Sociais (63,25) e Ciências Humanas (51,75), com valor total de 115. Na terceira
linha, tem-se o valor esperado dos dados do sexo feminino para os cursos de Ciências
Sociais (46,75) e Ciências Humanas (38,25), com valor total de 85. Na última linha, tem-
se os valores dos totais de alunos dos cursos de Ciências Sociais (110) e Ciências
Humanas (90), além do total de alunos pesquisados: 200.
A partir do resultado da tabela de contingência do valor esperado, aplica-se os parâmetros de

interesse, as hipóteses e o teste de estática escolhido, como o teste de independência. O uso
da tabela de contingência para testar a independência entre duas variáveis de uma amostra
de uma população é necessário para uma melhor representação geométrica do problema.
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
“Uma companhia tem de escolher entre três planos de saúde. O gerente deseja saber se a
preferência para os planos é independente da classificação do trabalho e quer utilizar α =
0,05. As opiniões de uma amostra aleatória de 500 empregados são apresentadas na tabela
a seguir” (MONTGOMERY; RUNGER, 2018, p. 175).
Plano de Saúde
Classificação do
1 2 3 Totais
Trabalho
Trabalhadores
160 140 40 340
Assalariados
Trabalhadores
40 60 60 160
Horistas
Totais 200 200 100 500
Tabela - Tabela de contingência dos valores observados do plano de saúdeFonte:

Montgomery e Runger (2018, p. 175).
#PraCegoVer : a tabela de contingência, com os valores observados, dados do

problema de plano de saúde, apresenta, na primeira linha, os tipos de planos de
saúde. Na segunda linha, há a classificação do trabalho, os números de 1 a 3
dos tipos de planos de saúde e o total. Na terceira linha, apresenta os dados
dos trabalhadores assalariados, com os tipos dos planos de saúde, tipo 1
apresenta 160, tipo 2 apresenta 140, tipo 3 apresenta 40, no total de 340
trabalhadores. Na quarta linha, tem-se os dados dos trabalhadores horistas, o
plano tipo 1 apresenta 40, tipo 2 apresenta 60, tipo 3 apresenta 60, no total de
160 trabalhadores. Por fim, a quinta linha apresenta os totais de plano tipo 1
com 200, tipo 2 com 200, tipo 3 com 100, no total de empregados de 500.
MONTGOMERY. D. C.; RUNGER. G. C. Estatística Aplicada e Probabilidade para

Engenheiros . 6. ed. Rio de Janeiro: LTC, 2018. p. 175.
Encontre as frequências dos valores esperados dos seis elementos da tabela Eij .
Plano de Saúde
Classificação do
1 2 3 Totais
Trabalho
Trabalhadores
E11 E12 E13 340
Assalariados
Trabalhadores
E21 E22 E23 160
Horistas
Totais 200 200 100 500
Tabela - Tabela de contingência dos valores esperados

#PraCegoVer : a tabela de contingência dos valores esperados dados pelo

problema de plano de saúde apresenta, na primeira linha, os tipos de planos de
saúde. Na segunda linha, há a classificação do trabalho, os números de 1 a 3
dos tipos de planos de saúde e o total. Na terceira linha, apresenta os dados
dos trabalhadores assalariados, com os tipos dos planos de saúde, tipo 1
apresenta E11 (lê-se: e um um), o valor esperado do tipo 1 de plano de saúde e
trabalhador assalariado; tipo 2 apresenta E12 (lê-se: e um dois), o valor
esperado do tipo 2 de plano de saúde e trabalhador assalariado; tipo 3
apresenta E13 (lê-se: e um três), o valor esperado do tipo 3 de plano de saúde
e trabalhador assalariado; no total de 340 trabalhadores. Na quarta linha, tem-
se os dados dos trabalhadores horistas, o plano tipo 1 apresenta E21 (lê-se: e
dois um), o valor esperado do tipo 1 de plano de saúde e trabalhador horista;
tipo 2 apresenta E22 (lê-se: e dois dois), o valor esperado do tipo 2 de plano de
saúde e trabalhador horista; tipo 3 apresenta E23 (lê-se: e dois um), o valor
esperado do tipo 3 de plano de saúde e trabalhador horista; no total de 160
trabalhadores. Por fim, a quinta linha apresenta os totais de plano: tipo 1 com
200, tipo 2 com 200, tipo 3 com 100; com o total de 500 empregados.
a) E 11 = 231 ; E12 = 64 ; E13 = 68 ; E21 = 136 ; E22 = 51 e E23 = 32 .

b) E 11 = 136 ; E12 = 136 ; E13 = 68 ; E21 = 64 ; E22 = 64 e E23 = 32 .
c) E 11 = 80 ; E12 = 62 ; E13 = 68 ; E21 = 136 ; E22 = 51 e E23 = 32.
d) E 11 = 80 ; E12 = 64 ; E13 = 68 ; E21 = 136 ; E22 = 80 e E23 = 32.
e) E 11 = 136 ; E12 = 136 ; E13 = 80; E21 = 64 ; E22 = 68 e E23 = 32.

Testes não
Paramétricos
Os testes não paramétricos podem ser usados como atalhos para testes mais complicados.
Esses testes são especialmente valiosos com dados não numéricos , como quando os
consumidores avaliam cereais ou outros produtos em ordem de preferência.
“Os testes não paramétricos têm como base o teste de hipóteses, porém não conservam uma
organização normal. Em geral, possuem resultados estatísticos provenientes de suas
ordenações, o que torna mais fáceis de entender” (HINES et al ., 2006, p. 440).
Introdução
Neste tópico, você irá estudar o método chamado não paramétrico, o qual é válido para
amostras de distribuições populacionais contínuas , independentemente de sua forma, e se
baseia em estatísticas de ordem . Serão apresentados também os testes dos sinais ,
utilizados sobre a mediana de uma distribuição contínua. E, por fim, um exemplo para melhor
entender a aplicação de testes não paramétricos.
Análise e Aplicação
A analise do teste não paramétrico tem, muitas vezes, como um de seus principais méritos o
fato de que não assume que os dados sob analise foram extraídos de uma população. A
técnica não paramétrica pode ser utilizada com dados não exatos, sem nenhum sentido
numérico. Uma outra vantagem para a aplicação do teste não paramétrico é a simplicidade de
se passar para um algoritmo, pois um algoritmo exige uma linguagem numerica binaria, o que
permite de uma maneira simples a aplicação do teste não parametrico.
“Algumas tecnicas não parametricas são testes de ordenação, de maneira que a identificação
sugerem outro aspecto em que testes não paramétrico diferem de testes paramétricos”
(SIEGEL, CASTELLAN JR, 2006, p. 25).
Segundo Siegel e Castellan Jr (2006), no elemento seguir, você vai poder entender a diferença
entre os tipos de teste.
1. conteúdo do item 1: Eu mi bibendum neque egestas congue quisque egestas

diam in.
diam in.
diam in.
Um teste não paramétrico simples , no caso de tais amostras pareadas, é fornecido pelo teste
do sinal, levando em conta o sinal da diferença. O teste dos sinais é utilizado para verificar, a
partir de um evento, a influência antes e depois de uma determinada variável contínua ou
discreta.
O teste dos sinais é utilizado para testar hipóteses considerando a mediana de

uma distribuição contínua . A mediana μ̄ de uma distribuição é um elemento da
variável aleatória X tal que exista uma probabilidade de um valor observado de X
seja menor ou igual à mediana e a probabilidade. E o valor observado de X ser
maior ou igual à mediana, isto é, P (X ≤ μ ~
) = P (X ≥ μ) = 0, 5 (HINES et
~
al., 2006, p. 441).
As vantagens dos testes estatísticos não paramétricos é que os dados não necessitam ser
quantitativos , porém podem ser categóricos (tal como sim ou não, defeituoso ou não
defeituoso) ou dados ordenados. Outra vantagem é que procedimentos não paramétricos são
geralmente muito rápidos e fáceis de serem feitos, e os dados normalmente são
heterogêneos .
REFLITA
Segundo Pontes (2005), a estatística não paramétrica pode

ser utilizada no ensino médio, como ferramenta durante o
aprendizado de tomada de decisões em testes de hipóteses
simples, utilizando, por exemplo, o Teste dos Sinais. O uso de
elementos da análise combinatória é claro, permitindo a
aplicação dos conceitos aprendidos em situações cotidianas.
Além disso, o aprendizado de técnicas de decisão pode levar
a uma reflexão a respeito de ações que são ou podem ser
desenvolvidas baseadas na estatística e suas possíveis
consequências.
Fonte: Pontes (2005).
Você vai poder entender isso melhor em uma aplicação no exemplo a seguir.
A Empresa PQR afirma que o tempo de vida útil de um tipo de bateria que ela
manufatura está acima de 250 horas. O advogado de um consumidor, desejando
determinar se a afirmação é justificada, mensura os tempos de vida útil de 24
baterias da empresa; o resultado é apresentado na tabela abaixo. Supondo que a
amostra é aleatória, determine se a afirmação da empresa é justificada no nível de
significância de 0,05 e se o escore z for maior do que 1,645 (SPIEGEL, 1977, p. 353).
Considere H0 a hipótese de que as baterias da empresa têm um tempo de vida útil de 250
horas, também considere H1 a hipótese de que elas têm um tempo de vida útil maior do que
250 horas. Para testar H0 contra H1 , utilize o teste do sinal.

271 230 198 275 282 225 284 219
253 216 262 288 236 291 253 224
264 295 211 252 294 243 272 268
Tabela 4.6 - Tabela da vida útil em horas de um tipo de bateria

Fonte: Spiegel (1977, p. 353).
#PraCegoVer : a tabela mostra, em horas, o tempo que 24 baterias têm de carga,

somente com os dados em números distribuídos em três linhas e oito colunas. Os
valores da primeira linha são: 271, 230, 198, 275, 282, 225, 284 e 219, distribuídas em oito
baterias. Na segunda linha, os valores do tempo da vida útil das baterias são: 253, 216,
262, 288, 236, 291, 253 e 224. Por fim, na última linha, temos as oito últimas baterias,
com o tempo de 264, 295, 211, 252, 294 243, 272 e 268 horas.
Solução: Considerando os testes de hipóteses como:
H0 a hipótese de que as baterias da empresa têm um tempo de vida útil de 250 horas.
H1 a hipótese de que elas têm um tempo de vida útil maior do que 250 horas.
Para testar H0 contra H1 , podemos usar o teste do sinal. Para fazer isso, subtraímos 250 de
cada entrada na tabela com os dados observados e registramos os sinais das diferenças,
como mostra a tabela abaixo.
271-250 230-250 198-250 275-250 282-250 225-250 284-250 219-250
= + 21 = - 20 = - 52 = + 25 = + 32 = - 25 = + 34 = - 31
253-250 216-250 262-250 288-250 236-250 291-250 253-250 224-250

=+3 = - 34 = +12 = + 38 = - 14 = + 41 =+3 = - 26
264-250 295-250 211-250 252-250 294-250 243-250 272-250 268-250

=+4 = + 45 = - 39 =+2 = + 44 =-7 = + 22 = + 18
Tabela 4.7 - Cálculo do sinal da vida útil em horas de um tipo de bateria

#PraCegoVer : a tabela mostra, em horas, o tempo que 24 baterias têm de carga,

somente com os cálculos do teste do sinal dos dados em números distribuídos em três
linhas e oito colunas. Os valores da primeira linha são: 271-250=+21; 230-250= - 20; 198-
250 = - 52; 275-250= + 25; 282-250= + 32; 225-250= - 25; 284-250= + 34; e 219-250= - 31;
distribuídos em oito baterias. Na segunda linha, os valores do tempo da vida útil das
baterias são: 253-250=+3; 216-250= - 34; 262-250= +12; 288-250= + 38; 236-250= - 14;
291-250= + 41; 253-250= + 3; e 224-250= - 26. Por fim, na última linha, temos as oito
últimas baterias com o tempo de 264-250=+4; 295-250= + 45; 211-250= - 39; 252-250= +
2; 294-250= + 44; 243-250= - 7; 272-250= + 22; e 268-250= + 18 horas.
Logo, verificou-se que existem 15 sinais de mais e nove sinais de menos no teste do sinal, a
um nível de significância de 0,05. Utilizando a equação de correção para a continuidade,
temos que:
X − E (X) X − np (15 − 0, 5) − (24) (0, 5)

z = = = = 1, 02
−−−− −−− −−−− −−−−− −−−− −−− −−−− −
√V ar (X) √n p (1 − p) √(24) (0, 5) (0, 5)
Para concluir o teste não paramétrico, depende do parâmetro que queremos comparar,
podendo utilizar um nível de significância de 0,05. Se compararmos com um teste em que os
desvios têm uma direção de região crítica à direita ou à esquerda, iriamos rejeitar H0 se o
escore z fosse maior do que 1,645. Portanto a afirmação da empresa não pode ser justificada
no nível de 0,05. Para que você possa compreender melhor a definição da distribuição normal,
temos a seguinte definição abaixo.
A distribuição normal, também conhecida como distribuição gaussiana, é uma

curva simétrica em torno do seu ponto médio. A distribuição normal tem como
equação:
X − E (X)
z = −−−− −−−
√V ar (X)
Onde E (X) é a esperança em relação a variável X .

V ar (X) é a variância em relação a variável X .
A curva de distribuição normal representa o comportamento de diversos processos

nas empresas e muitos fenômenos comuns, como por exemplo, altura ou peso de
uma população, a pressão sanguínea de um grupo de pessoas, o tempo que um
grupo de estudantes gasta para realizar uma prova (MAGALHÃES; LIMA, 2005, p.
234).
Neste tópico, você estudou os testes não paramétricos para o caso de uma amostra. O teste
descrito é apropriado para os dados de experimentos apresentados. Testes não paramétricos
podem ser usados como atalhos para testes mais complicados. Eles são especialmente
valiosos com dados não numéricos.
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
No teste não paramétrico, temos o seguinte caso: parte sempre de uma função de
densidade f(x|θ), ou uma função de probabilidade para a variável aleatória X , que
dependa do parâmetro teta constante. E o teste de hipótese é basicamente uma regra
acerca de um parâmetro populacional.
Hipótese nula: H0 : θ ∈ Θ0
Hipótese alternativa: H 1 : θ ∈ Θ1
Uma regra que testa duas hipóteses e faz afirmações do parâmetro teta e seu respectivo
espaço paramétrico: Θ ∪ Θ = Θ
0 1
Logo, os testes de hipótese devem atender algumas condições. Normalmente, os testes

mais eficazes são os que têm suposições mais rígidas ou mais abrangentes. Se as
suposições são validas, os testes baseados sobre elas são os mais prováveis, dentre todos
os testes, em rejeitar o H quando a hipótese nula é falsa.
0
Portanto, para melhor decisão, os dados da pesquisa devem ser apropriados ao teste. No
caso do teste:
a independência das observações (seleção) de qualquer elemento não influencia a

seleção do outro;
as observações precisam ser extraídas da distribuição normal;
para analises de dois grupos, é necessária a mesma variância, ou a razão entre as
variâncias conhecidas.
Fonte: Autora, 2021.
Considerando as características necessárias para a realização de um teste, assinale a

alternativa correta.
a) As observações devem ser dependentes, são valores (fenômenos ou fatos) a

serem descobertos ou explicados, em virtude de serem influenciados.
b) As observações advêm de populações distribuídas não normal, pois o teste é não
paramétrico.
c) As variáveis devem ser mensuradas no mínimo em escala intervalar.
d) As populações devem ter variâncias diferentes, pois as médias populacionais são
diferentes.
e) O tamanho amostral dever ser pequeno.
Material
Complementar
WEB
Teste qui-quadrado de associação

(independência)
Ano: 2020
Comentário: esse vídeo apresenta o teste de associação com a

estatística qui-quadrado. A Khan Academy oferece exercícios, vídeos e
um painel de aprendizado personalizado para ajudar estudantes a
aprenderem no seu próprio ritmo, dentro e fora da sala de aula. Há
conteúdos de matemática, ciências e programação, do jardim da
infância ao ensino superior, com tecnologia de ponta. A Khan Academy
é uma organização sem fins lucrativos com o objetivo de mudar a
educação para melhor, proporcionando uma educação de classe
mundial livre para qualquer pessoa, em qualquer lugar.
Para conhecer mais sobre o assunto do teste qui-quadrado, acesse o

trailer disponível em:
ACESSAR
LIVRO
Noções de Probabilidade e Estatística

Editora: Editora da Universidade de São Paulo
Autor: Marcos Magalhães e Antônio Lima
ISBN: 978-85-314-0677-5
Comentário: para os alunos que possuem dificuldade em probabilidade,

esta obra é uma introdução à probabilidade e estatística, tendo sido
elaborada para alunos de todas as áreas, procurando introduzir
conceitos em teóricos e também com a linguagem computacional.
Conclusão
Durante este estudo, o objetivo foi apresentar para você a realização de testes de probabilidade,
sendo fundamentais para saber se os dados amostrais embasam uma hipótese. Para isso, foram
considerados três tópicos para a abordagem do assunto.
No teste de independência, buscou-se considerar o nível de significância de um teste para saber se

há rejeição de uma hipótese. Para isso, é usual coletar uma amostra, anotando a frequência
conjunta da ocorrência dos dados. Um dos subtópicos é a análise de decisão que contribui para
apoiar a fazer a melhor escolha mesmo com elementos de aleatoriedade.
O segundo tópico se refere às tabelas de contingência que correlacionam múltiplas variáveis

aleatórias para associar duas ou mais independentes. Trata-se de um método multivariável que
compara as estruturas de tabelas de contingências.
Por fim, os testes não paramétricos não precisam que a distribuição da população seja feita com
parâmetros, porém podem ser utilizados em diferentes situações com métodos mais fáceis de
compreender.
Esperamos que tenha se sentido instigado a aperfeiçoar o seu conhecimento nessa área que é tão
essencial para a sua formação.
Referências
BEKMAN, O. R.; COSTA NETO, P. L. O. C. Análise
Estatística de Decisão . 2. ed. São Paulo: Blucher, 2009.
BUSSAB, W.O.; MORETTIN, P. A. Estatística Básica . 9.

ed. São Paulo: Saraiva, 2018.
GNERI, M. Tabela da distribuição qui-quadrado. IMECC/Unicamp , [2021]. Disponível em:

https://www.ime.unicamp.br/~cnaber/Material_ME414C_2S_2016.htm . Acesso em: 14 jul. 2021.
HINES, W. W. et al . Probabilidade e Estatística na Engenharia . Rio de Janeiro: LTC, 2006.

MAGALHÃES, M. N.; LIMA A. C. P. Noções de Probabilidade e Estatística . São Paulo: Editora da
Universidade de São Paulo, 2005. (Biblioteca Ânima).
MEMÓRIA, J. M. P. Breve História da Estatística . Brasília, DF: Embrapa Informação Tecnológica,

2004.
MEYER, P. L. Probabilidade : aplicações à Estatística. Rio de Janeiro: LTC, 1984. (Biblioteca Ânima).
MONTGOMERY. D. C.; RUNGER. G. C. Estatística Aplicada e Probabilidade para Engenheiros . 6. ed.

Rio de Janeiro: LTC, 2018.
MOREIRA, A. P. M. Aplicações da Teoria de Decisão e Probabilidade Subjetiva em Sala de Aula do

Ensino Médio . 2015. Dissertação (Mestrado Profissional em Matemática) – Instituto de
Matemática, Estatística e Computação Científica, Universidade Estadual de Campinas, Campinas,
2015. Disponível em:
http://repositorio.unicamp.br/jspui/bitstream/REPOSIP/307582/1/Moreira_AndreadePaulaMachado_M.pd
. Acesso em: 12 jul. 2021.
OLIVEIRA, A. F. G. Testes Estatísticos para Comparação de Médias. Revista Eletrônica Nutritime , v.

5, n. 6, p. 777-778, nov./dez., 2008.
PONTES, A. C. F. O Aprendizado da Estatística no Ensino Médio: A Estatística Não-Paramétrica

como Ferramenta – O Teste dos Sinais. In : Encontro Regional de Professores de Matemática, 17.,
2005, Campinas, Anais eletrônicos [...]. Campinas, 2005. Disponível em:
https://www.ime.unicamp.br/erpm2005/anais/c27.pdf . Acesso em: 5 jul. 2021.
SAMPAIO, N. A. S.; LEONI, R. C. Utilização dos Testes de Hipóteses para a Média na Tomada de
Decisão. AEDB , 2015. Disponível em: https://www.aedb.br/wp-content/uploads/2015/05/545.pdf .
Acesso em: 22 jun. 2021.
SIEGEL, S.; CASTELLAN JR. N. J. Estatística não paramétrica para ciências do comportamento .
São Paulo: Bookman, 2006.
SPIEGEL, M. R. Probabilidade e Estatística . São Paulo: McGraw Hill, 1977.
TESTE qui-quadrado de associação (independência). [ S. l.: s. n. ], 2020. 1 vídeo (11m48s). Publicado

pelo canal Khan Academy Brasil. Disponível em: https://www.youtube.com/watch?v=fHYMce8E7OY
. Acesso em: 12 jul. 2021.

Testes Probabilidadetestes de Probabilidade

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Testes Probabilidadetestes de Probabilidade

Enviado por

Direitos autorais:

Formatos disponíveis

PROBABILIDADES

Revisor: Fábio Santiago

Tempo de leitura do conteúdo estimado em 1 hora e 16 minutos.

A construção do seu conhecimento em probabilidade chega na última etapa. Você, estudante,

que se leve em consideração o tanto o nível de significância como o poder do teste.

Veja, no elemento a seguir, a função do modelo probabilístico na aplicação para tomadas de

“Muito frequentemente, a região de rejeição é definida em

Fonte: Sampaio e Leoni (2015, p. 2).

Fonte: ndul / 123RF.

Uma hipótese estatística é uma afirmativa sobra a distribuição de probabilidade de uma

Um fabricante vem produzindo pinos para serem utilizados sob determinadas

Deste modo, o fabricante e o comprador potencial desses pinos estão interessados

As hipóteses sempre são afirmativas sobre a população ou distribuição em estudo, não

1) A primeira resulta de experiência passada ou de conhecimento do processo,

A importância de quantificar o grau de associação entre duas variáveis, usando a

1. H0 : Há independência entre as duas variáveis.

T otal da linha i × T otal da coluna j

A região crítica para Q

do valor de α com o grau de liberdade :

Observe a tabela a seguir.

Média 4 163 38 248

Total 117 276 135 528

#PraCegoVer : a tabela apresenta as notas de 528 alunos do ensino médio. Na primeira

Verifique se as notas das duas disciplinas de física e matemática são independentes,

Solução: os testes de hipótese.

H0 : As notas de física e matemática são independentes.

Temos que o grau de liberdade é determinado por:

T otal da linha i × T otal da coluna j

Primeira linha da tabela. Para o elemento e1, 1

T otal da linha 1 × T otal da coluna 1 139 × 117 5421

Para o elemento e1, 2

T otal da linha 1 × T otal da coluna 2 139 × 276 3197

Para o elemento e1, 3

T otal da linha 1 × T otal da coluna 3 139 × 135 6255

Segunda linha da tabela. Para o elemento e2, 1

T otal da linha 2 × T otal da coluna 1 248 × 117 1209

Para o elemento e2, 2

T otal da linha 2 × T otal da coluna 2 248 × 276 1426

Para o elemento e2, 3

T otal da linha 2 × T otal da coluna 3 248 × 135 1295

Terceira linha da tabela. Para o elemento e3, 1

T otal da linha 3 × T otal da coluna 1 141 × 117 5499

Para o elemento e3, 2

Para o elemento e3, 3

T otal da linha 3 × T otal da coluna 3 141 × 135 6345

Logo, observe a tabela a seguir.

Alta 30,80 72,66 35,54

Média 54,95 129,64 63,41

Baixa 31,25 73,70 36,05

Para medir a diferença entre os valores esperados e valores observados, temos:

Para determinar a região crítica , dado que α = 0, 01 e o grau de liberdade calculado é 4,

Como Q , concluímos pela rejeição da hipótese nula , ou seja, as

notas de física e matemática não são independentes .

A utilização da tabela da distribuição qui-quadrado em pesquisa visa verificar se as distribuições de

Para saber mais sobre o desenvolvimento da probabilidade, acesse o link :

Teoria de Decisão Estatística

A análise de decisão trata-se de uma teoria prescritiva ou normativa , com o objetivo de

Para saber mais sobre o desenvolvimento da probabilidade, acesse o link :

Fonte: Moreira (2015, p. 11).

Para isso, segundo Bekman e Costa Neto (2009, p. 1-2):

as resoluções de problemas dependem muito da tomada de decisão difíceis de

Total 134 141 125 400

Tabela - Pesquisa dos tipos de filmes e o estado civil de 400 pessoas