Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
www.esab.edu.br
Probabilidade e
Estatística
Diretor Geral
Nildo Ferreira
Diretora Acadêmica
Beatriz Christo Gobbi
Coordenadora do Núcleo de Educação a Distância
Beatriz Christo Gobbi
Coordenadora do Curso de Administração EAD
Rosemary Riguetti
Coordenador do Curso de Pedagogia EAD
Claudio David Cari
Coordenador do Curso de Sistemas de Informação EAD
David Gomes Barboza
Copyright © Todos os direitos desta obra são da Escola Superior Aberta do Brasil.
www.esab.edu.br
Av. Santa Leopoldina, nº 840
Coqueiral de Itaparica - Vila Velha, ES
CEP 29102-040
Apresentação
Caro estudante,
Esperamos que esteja animado para fazer este percurso. Convidamos você a iniciar os
estudos.
Bom estudo!
Objetivo
Conhecer os conceitos e cálculos estáticos, para compreender e aplicar esses
conhecimentos nas mais diversas áreas de atuação profissional ou acadêmica.
Habilidades e competências
• Compreender o conceito de estatística.
• Conhecer as medidas descritivas.
• Conhecer as distribuições de probabilidade.
• Apresentar os dados estatísticos em tabelas e gráficos.
• Descrever os dados estatísticos por meio de medidas de tendência central e dispersão.
• Calcular a probabilidade de determinados eventos ocorrerem.
Ementa
Conceitos preliminares. Noções de amostragem. Apresentação de dados.
Medidas de tendência central e de dispersão. Probabilidade, variáveis aleatórias.
Distribuição de probabilidades. Amostragem e estimativa de parâmetros.
Sumário
1. Conceitos preliminares.....................................................................................................7
2. Planejamento de uma pesquisa estatística....................................................................11
3. Noções de amostragem..................................................................................................16
4. Outros tipos de amostragem aleatória...........................................................................22
5. Apresentação dos dados: tabelas e gráficos...................................................................27
6. Tipos de gráficos estatísticos .........................................................................................33
7. Tabelas e gráficos...........................................................................................................40
8. Exercícios resolvidos.......................................................................................................47
9. Distribuição de frequência.............................................................................................53
10. Intervalo de classe e ponto médio..................................................................................59
11. Medidas de tendência central........................................................................................65
12. Moda, média e mediana para dados agrupados.............................................................71
13. Média geométrica e média harmônica...........................................................................80
14. Medida de dispersão......................................................................................................86
15. Variância e desvio-padrão para dados agrupados..........................................................93
16. Exercícios resolvidos.......................................................................................................99
17. Separatrizes e gráfico boxplot......................................................................................107
18. Medidas de assimetria e curtose..................................................................................113
19. Variável bidimensional.................................................................................................119
20. Diagrama de dispersão e coeficiente de correlação......................................................125
21. Regressão linear simples..............................................................................................133
22. Probabilidade: conceito e axiomas...............................................................................140
23. Probabilidade condicional e teorema de Bayes............................................................149
24. Teorema do produto.....................................................................................................155
25. Exercícios resolvidos.....................................................................................................161
26. Variável aleatória discreta............................................................................................166
27. Distribuição de Bernoulli..............................................................................................173
28. Distribuição binomial...................................................................................................178
29. Distribuição de Poisson................................................................................................186
30. Variáveis aleatórias contínuas......................................................................................191
31. Distribuição normal.....................................................................................................198
32. Exercícios resolvidos ....................................................................................................204
33. Aproximação normal à binomial..................................................................................211
34. Amostragem e inferência estatísticas...........................................................................217
35. Distribuições amostrais................................................................................................222
36. Estimação: conceitos e propriedades............................................................................232
37. Estimadores de mínimos quadrados e máxima verossimilhança..................................239
38. Exercícios resolvidos.....................................................................................................245
39. Intervalos de confiança................................................................................................250
40. Teste de hipóteses: introdução.....................................................................................257
41. Etapas para realizar um teste de hipótese....................................................................263
42. Testes bilaterais e unilaterais.......................................................................................269
43. Teste de hipótese para média e teste para proporção...................................................277
44. Exercícios resolvidos.....................................................................................................286
45. Teste t-Student.............................................................................................................294
46. Teste Qui-Quadrado.....................................................................................................302
47. Exercícios resolvidos.....................................................................................................311
48. Exercícios resolvidos.....................................................................................................321
Glossário.............................................................................................................................330
Referências.........................................................................................................................336
1 Conceitos preliminares
Objetivo
Introduzir os conceitos de estatística, amostra e população e
apresentar as etapas de uma pesquisa estatística e a classificação das
variáveis.
Uma situação trivial, por exemplo, é quando vamos sair de casa para o
trabalho ou para a faculdade. Sabemos que normalmente levamos em
média 20 minutos (por exemplo) para realizar o trajeto. Como fazemos
essa dedução? Conforme nossas experiências em realizar esse percurso,
reparamos que chegamos ao trabalho em aproximadamente de 20
minutos após termos saído de casa. Dependendo do trânsito, levamos
mais ou menos tempo. Mas, com a informação do tempo médio,
conseguimos tomar a decisão a respeito do horário em que devemos
acordar para nos arrumar e, assim, não chegar todos os dias atrasados ou
antecipados em nosso destino.
www.esab.edu.br 7
Segundo Magalhães e Lima (2005, p. 1), a estatística é “(...) como um
conjunto de técnicas que permite, de forma sistemática, organizar,
descrever, analisar e interpretar dados oriundos de estudos ou
experimentos, realizados em qualquer área de conhecimento”.
www.esab.edu.br 8
• Amostra: é um subconjunto ou uma parte da população. Por
exemplo: para verificar o grau de instrução dos moradores de
determinado bairro, a amostra consistirá em pesquisar apenas alguns
moradores desse bairro, e não a população total que ali residente.
Veja na figura a seguir essa relação entre os dois conceitos:
Amostra
População
www.esab.edu.br 9
Solução
Saiba mais
Veja como a estatística é utilizada para responder
questões como: quantos somos? Quem vai vencer
a eleição para prefeito na capital do meu estado?
Quantas escolas municipais há no Brasil? Clique
aqui.
www.esab.edu.br 10
Planejamento de uma pesquisa
2 estatística
Objetivo
Conhecer a etapa de planejamento de uma pesquisa estatística.
www.esab.edu.br 11
Objetivo geral: conhecer o perfil dos estudantes de graduação dos cursos
de Administração e Sistemas de Informação de uma IES.
Objetivos específicos:
www.esab.edu.br 12
Outro fator-chave para a coleta de dados é a escolha das variáveis
de interesse da pesquisa. As variáveis são as características que
podem ser observadas (ou medidas) em cada elemento da população
(MAGALHÃES; LIMA, 2005).
NÍVEL DE MENSURAÇÃO
www.esab.edu.br 13
Com as variáveis em mãos, deve-se pensar em como serão coletados os
dados: por meio de entrevista, questionário ou outros. Vamos apresentar
aqui como elaborar um questionário, ferramenta usualmente utilizada
para coletar dados.
www.esab.edu.br 14
Nesse questionário foram apresentadas algumas perguntas para coletar
os dados. Observe que temos várias formas de categorizar a resposta
às perguntas. Nas perguntas 2, 3 e 4 deixamos espaços livres para que
os entrevistados respondam. Já nas demais perguntas, acrescentamos
algumas opções de respostas. Note que na pergunta 6 solicitamos que o
entrevistado dê uma nota de 1 a 5, o que nos leva ao conhecimento da
escala de Likert, na qual as respostas para cada item variam segundo o
grau de intensidade.
Estudo complementar
Compreenda melhor a intervenção de escalas,
como a escala de Likert, para a construção de um
questionário. Para tanto, faça a leitura do artigo
“A escala Likert – coisas que todo o pesquisador
deveria saber”. Disponível aqui.
Dica
Para auxiliar no processo de construção de um
questionário, alguns procedimentos devem
ser levados em consideração. Para tanto, leia
os trechos das páginas 16, 17 e 18 do material
disponível aqui.
www.esab.edu.br 15
3 Noções de amostragem
Objetivo
Apresentar a diferença entre amostragem aleatória e não aleatória
e amostragem simples, tamanho de uma amostra e cálculo do erro
amostral.
Caro aluno, você está lembrando que, como vimos na unidade 1, uma
amostra é uma parte da população? Então, para determinar uma amostra
significativa de dada população, existem técnicas que chamamos de
técnicas de amostragem. Elas são o processo de seleção de uma amostra,
que possibilita o estudo das características desconhecidas da população.
As principais técnicas de amostragem são subdividas em amostragem
aleatória e não aleatória.
TÉCNICAS DE AMOSTRAGEM
Mas quais os motivos que nos levam a optar por uma amostragem, ao
invés de uma população?
www.esab.edu.br 16
Os motivos encontrados na literatura sobre estatística são basicamente:
a economia, pois com o número reduzido de elementos (ou pessoas)
a serem pesquisados aumenta a viabilidade financeira de se aplicar a
pesquisa; o tempo, pois é um fator decisivo em muitas pesquisas que
necessitam obter os resultados rapidamente, como as pesquisas eleitorais;
a operacionalidade, pois com um número reduzido de indivíduos a
serem pesquisados é mais fácil efetuar as operações necessárias para
levantar os dados da pesquisa; e a confiabilidade, pois a verificação e o
acompanhamento dos dados é mais simples.
www.esab.edu.br 17
Vejamos um exemplo:
www.esab.edu.br 18
2 Cristiano 32 Masculino
5 Sofia 29 Feminino
10 Ingrid 37 Feminino
11 Laura 30 Feminino
15 Felipe 27 Masculino
Para ficar mais claro, pense o seguinte: você já deve ter observado que em
pesquisas eleitorais é divulgado que certo candidato tem, por exemplo,
31% das intenções de voto, com uma margem de erro de 2% para mais
ou para menos. Essa margem de erro de 2% refere-se ao erro amostral,
isto é, o quanto a pesquisa tolera errar. Assim, a preferência do eleitorado
por certo candidato fica em um intervalo de 29% a 33% (ou seja, 31%–
2% = 29% ou 31% + 2% = 33%)
www.esab.edu.br 19
Em que:
Em que:
Resolução:
• E0 = 5% = 0,05
• N = 1000
• n0 = ?
2º passo – calcular n0:
1
n0 =
( E0 )²
1
n0 =
(0,05)²
n0 = 400
www.esab.edu.br 20
Como a população N = 1000 não é muito grande, então vamos efetuar o
cálculo de correção:
N ⋅ n0
n=
N + n0
1000 ⋅ 400
n=
1000 + 400
n = 285,7
Fórum
Caro estudante, dirija-se ao Ambiente Virtual de
Aprendizagem da Instituição e participe do nosso
Fórum de discussão. Lá você poderá interagir com
seus colegas e com seu tutor de forma a ampliar,
por meio da interação, a construção do seu
conhecimento. Vamos lá?
www.esab.edu.br 21
Outros tipos de amostragem
4 aleatória
Objetivo
Apresentar outros tipos de amostragem aleatória.
www.esab.edu.br 22
Tabela 1– Exemplo de amostragem estratificada proporcional.
Amostra
Sexo População 10% da população
(arredondada)
(10 ⋅ 51)
Masculino 51 = 5,1 5
100
(10 ⋅ 29)
Feminino 29 = 2,9 3
100
(10 ⋅ 80)
Total 80 =8 8
100
A Tabela 1 nos indica que 10% dos 51 alunos do sexo masculino equivale
a uma amostra de 5 alunos, ou seja, devem ser extraídos 5 alunos do sexo
masculino para compor o desenvolvimento da pesquisa. Com relação ao
sexo feminino, 10% do total de 29 alunas equivale a uma amostra de 3
alunas para compor a pesquisa. Assim, o total de alunos (sexo feminino e
masculino) que irá fazer parte da amostragem é 8.
www.esab.edu.br 23
Exemplo
N 1000
=
a = = 5.
n 200
x = 3,
x + a = 3 + 5 = 8,
x + 2 a = 3 + 2 ⋅ 5 = 13,
...,
x + 199a = 3 + 199 ⋅ 5 = 998
www.esab.edu.br 24
Veja a aplicação dessa técnica no seguinte exemplo:
1ª etapa: seleção
aleatória por
conglomerados.
1ª etapa: seleção
aleatória de
elementos.
Amostra
Figura 4 – Representação de uma amostragem por conglomerados.
Fonte: Elaborada pela autora (2013).
Exemplo
www.esab.edu.br 25
Selecionam-se três quarteirões por sorteio, obtendo-se como resultado os
quarteirões Q2, Q4 e Q5.
www.esab.edu.br 26
Apresentação dos dados: tabelas e
5 gráficos
Objetivo
Representar e interpretar um conjunto de dados em tabela e gráficos.
Uma tabela possui linhas e colunas nas quais inserimos os dados coletados
de forma organizada. A figura a seguir apresenta um exemplo de tabela.
www.esab.edu.br 27
Perfil dos estudantes do curso de
Administração e Sistemas de Cabeçalho da tabela:
Informação de uma IES apresentar o título
com infrmações
Aluno Pergunta 1 Pergunta 2 relevantes da pesquisa.
(sexo) (idade)
1 F 19
2 M 20 Variáveis:
3 F 20 características
4 F 21
observadas.
5 M 22 Corpo da tabela:
6 M 21 contém os dados.
7 M 21
Rodapé da tabela:
Fonte: Elaborado pela autora
contém a fonte.
Figura 6 – Apresentação dos dados em tabela.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 28
Tabela 2 – Exemplo de dados brutos e rol.
Dados brutos da Rol da variável
variável “Idade” “Idade”
19 19
20 20
20 20
21 21
22 21
21 21
21 21
21 22
Além disso, vale ressaltar que nenhuma célula da tabela deve ficar em
branco, elas devem sempre conter um número ou sinal. Para isso, existem
alguns símbolos estabelecidos por convenção internacional. Vejamos
alguns exemplos:
www.esab.edu.br 29
5.1 Séries estatísticas
Uma série estatística é um conjunto de dados ordenados, apresentados
em uma tabela ou gráfico, em função de características como tempo,
espaço ou espécie.
www.esab.edu.br 30
Exemplo:
A tabela anterior retrata uma série espacial (ou geográfica), pois apresenta
os dados de nascimento no Brasil, no ano de 2002, pelas regiões
geográficas brasileiras. Por fim, temos a série por espécie ou categoria,
que corresponde à qualidade ou aos atributos de determinado objeto
pesquisado. Veja o exemplo que segue:
www.esab.edu.br 31
Vimos até o momento a representação dos dados organizados em uma
tabela, mas também podemos apresentar os dados em um gráfico. Veja o
exemplo que segue:
194.363 190.117
Norte
374.404 Nordeste
706.688 Sudeste
Sul
Centro-Oeste
1.118.971
Figura 7 – Gráfico de nascidos vivos e registrados no ano de 2002.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 32
6 Tipos de gráficos estatísticos
Objetivo
Apresentar, reconhecer e interpretar os tipos de gráficos estatísticos.
www.esab.edu.br 33
Por exemplo, a variável “gênero” de um indivíduo é uma variável
qualitativa nominal que possui duas categorias (classes): feminino e
masculino. Assim, podemos representá-las através do gráfico de setores.
147,06º
Feminino
41% Masculino
59%
www.esab.edu.br 34
6.2 Gráficos de barras horizontais ou verticais
O gráfico de barras horizontais ou verticais é indicado, normalmente,
para representar variáveis qualitativas ordinais. Esse tipo de gráfico
é recomendado quando as variáveis possuem muitas categorias e para
indicar a relação de ordem entre uma categoria e outra. Assim, barras
horizontais devem ser desenhadas observando-se a sua ordem de
grandeza (preferencialmente crescente). Por exemplo:
4
Bom
52
Regular
Ruim
35
0
20 40 60
Figura 9 – Gráfico de barras horizontais que representa o grau de satisfação no atendimento ao cliente.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 35
60
52
50
40
35 Bom
30 Regular
20 Ruim
10
4
0
Figura 10 – Gráfico de barras verticais que representa o grau de satisfação no atendimento ao cliente.
Fonte: Elaborada pela autora (2013).
Encosta do Morro
Médio
Parque da Figueira Fundamental
Nenhum
Monte Verde
0 5 10 15 20 25
Figura 11 – Gráfico de barras múltiplas para o grau de escolaridade dos moradores dos bairros Encosta do
Morro, Parque da Figueira e Monte Verde.
Fonte: Barbetta (2011, p. 70).
www.esab.edu.br 36
Assim, com base no gráfico anterior, podemos verificar que no Bairro
Monte Verde temos uma quantidade mais elevada de moradores com
Ensino Médio. Além disso, entre os três bairros, Monte Verde é o que se
destaca com maior nível de escolaridade perante os demais bairros.
www.esab.edu.br 37
6.5 Histograma
O histograma é utilizado para representar variáveis quantitativas. São
retângulos justapostos, feitos sobre as classes da variável em estudo.
Esse tipo de gráfico será muito utilizado em nossos estudos daqui para
frente, pois em situações práticas é comum trabalharmos com variáveis
quantitativas. O histograma é o mais indicado para representar esse tipo
de variável, pois há uma continuidade nos valores, análoga ao conceito
de reta real visto na unidade 35 da disciplina de Matemática. Exemplo:
representar as idades de uma turma de alunos.
12
10
8
Frequência 6
4
2
0
18-23 23-28 28-33 33-38 38-43
Idade
Figura 13 – Histograma da variável idade.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 38
Resumo
Olá, estudante!
www.esab.edu.br 39
7 Tabelas e gráficos
Objetivo
Desenvolver tabelas e gráficos estatísticos em planilhas eletrônicas.
Uma pesquisa realizada com 300 pessoas, tinha como pergunta principal:
“Qual a funcionalidade que você mais utiliza em seu celular?” Das 300
pessoas, 170 responderam que faziam mais uso da telefonia, 80 que
enviavam mais torpedos, 45 responderam que utilizavam mais o serviço
de internet e 5 assinalaram a opção “outros”
www.esab.edu.br 40
Figura 14 – Exemplo de construção de tabela no Microsoft Excel 2010.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 41
Figura 15 – Iniciando construção de gráfico.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 42
Observe na Figura 16 que, ao passar o mouse pelas opções de gráfico de
pizza, aparece uma caixa de diálogo explicando para qual série de dados
aquele tipo de gráfico de pizza é mais indicado. Selecionando aquela
primeira opção (em 2D), temos o gráfico de pizza para o exemplo dado.
O gráfico é gerado automaticamente com base nas informações da tabela
que criamos anteriormente.
www.esab.edu.br 43
Agora vamos exemplificar para você como construir um gráfico
histograma simples. Conforme visto na unidade 5, o histograma é
um gráfico apropriado para representar variáveis quantitativas. Ele é
composto de barras horizontais justapostas (isto é, juntas, grudadas).
Observe a construção desse gráfico na Figura 18 que segue:
www.esab.edu.br 44
Selecionando os dados da tabela sobre peso e as respectivas frequências,
vamos em direção à aba “Inserir” e dentro da opção “gráficos” escolhemos
a primeira opção, “gráfico de colunas”, e então temos o respectivo
gráfico. Porém, repare que o gráfico apresenta as colunas verticais
separadas umas das outras. Nesse caso, precisamos juntá-las. Para isso
dê um clique em cima das barras verticais, pressione o botão direito do
mouse e logo aparecerá uma caixa de diálogo com opções de formatação
das barras. Veja a figura a seguir:
www.esab.edu.br 45
Repare que na opção “Formatar Série de Dados...”, da cascata que se
forma ao clicarmos com o botão direto do mouse, abre-se uma janela
com “Opções de Série”. Nesse ambiente há duas opções: “Sobreposições
de Séries” e “Largura do Espaçamento”. É essa última opção que você
reduzirá a 0%; dessa forma, as barras ficarão justapostas no histograma,
conforme a Figura 20.
Figura 20 – Histograma.
Fonte: Elaborada pela autora (2013).
Estudo complementar
Vimos nesta unidade dois exemplos simples de
construção de gráficos no Excel 2010 da Microsoft.
Agora aprenda com mais detalhes a elaboração
de gráficos no Microsoft Excel 2010 assistindo aos
vídeos “Montando nossa primeira tabela”, clicando
aqui, e “Gráficos”, disponível aqui.
www.esab.edu.br 46
8 Exercícios resolvidos
Objetivo
Apresentar exercícios resolvidos sobre tabelas e gráficos estatísticos.
Exercício 1
(UFG - 2004) Uma pesquisa mostrou que a uma semana das inscrições
para os principais vestibulares, muitos candidatos ainda estavam
indecisos em relação ao curso pretendido, como mostra a tabela a seguir:
www.esab.edu.br 47
De acordo com os dados, o número de candidatos que decidirão pelo
curso por meio do teste vocacional representa, entre os indecisos:
a. 1,3%
b. 9,85%
c. 10,15%
d. 11,9%
e. 13,2%
Resolução
www.esab.edu.br 48
Exercício 2
6
Gols marcados
5 Gols sofridos
Número de gols
0
28/1 04/2 11/2 18/2 25/2 04/3 11/3 18/3 25/3 01/4
Data da Partida
Figura 21 – Gráfico de linhas para os gols marcados e sofridos por uma equipe de futebol.
Fonte: Adaptada de Iezzi, Hazzan e Degenszajn (2004).
a. 15
b. 17
c. 18
d. 20
e. 24
Resolução
www.esab.edu.br 49
• No dia 28/1 o time venceu com 2 gols (2 x 0). Logo, recebeu 3
pontos.
• No dia 4/2 o time perdeu com 3 com gols de diferença (4 x 1).
Logo, recebeu 0 ponto.
• No dia 11/2 o time empatou com 3 gols (3 x 3). Logo, recebeu 1
ponto.
• No dia 18/2 o time perdeu com 5 gols de diferença (5 x 0). Logo,
recebeu 0 ponto.
• No dia 25/2 o time venceu com 1 gol de diferença (2 x 1). Logo,
recebeu 3 pontos.
• No dia 4/3 o time venceu com 2 gols de diferença (3 x 1). Logo,
recebeu 3 pontos.
• No dia 11/3 o time empatou com 2 gols (2 x 2). Logo, recebeu 1
ponto.
• No dia 18/3 o time venceu com 1 gol de diferença (1 x 0). Logo,
recebeu 3 pontos.
• No dia 25/3 o time empatou com 0 gol (0 x 0). Logo, recebeu 1
ponto.
• No dia 1/4 o time venceu com 3 gols de diferença (3 x 0). Logo,
recebeu 3 pontos.
Portanto, o time acumulou nas 10 partidas:
3 + 0 + 1 + 0 + 3 + 3 + 1 + 3 + 1 + 3 = 18 pontos
Portanto, a resposta correta é a letra “c”.
www.esab.edu.br 50
Exercício 3
Número de
29
clientes
15
7 6
3 2
Resolução
www.esab.edu.br 51
Apresentamos até aqui alguns exercícios resolvidos com o objetivo de
aprimorar a sua aprendizagem e ativar seu raciocínio lógico com relação
à interpretação de dados e às informações dispostas em tabelas e gráficos
estatísticos. Agora aproveite o embalo e siga com seus estudos!
Tarefa dissertativa
Caro estudante, convidamos você a acessar o
Ambiente Virtual de Aprendizagem e realizar a
tarefa dissertativa.
www.esab.edu.br 52
9 Distribuição de frequência
Objetivo
Determinar as distribuições de frequência – frequência absoluta,
relativa e acumulada.
www.esab.edu.br 53
Observando a Tabela 7, não é possível de imediato dizer se a população
pesquisada gosta mais de cachorro ou de gato. Por isso entramos com a
ideia de distribuição de frequência, que consiste em construir uma nova
tabela com a informação resumida, isto é, quantificando a ocorrência
(frequência) das pessoas que afirmaram gostar mais de cachorros, assim
como das pessoas que afirmaram gostar mais de gatos.
www.esab.edu.br 54
Vejamos outro exemplo:
fi
fri =
n
Para você compreender melhor esse conceito, vamos tomar o exemplo da
Tabela 9, abrindo uma coluna ao lado da coluna (fi ):
Gênero ( xi ) ( fi ) ( fri )
17
Feminino 17 = 0,57
30
13
Masculino 13 = 0, 43
30
Total 30 1
www.esab.edu.br 55
Agora, temos os dados absolutos com relação ao total de pessoas
pesquisadas, que nominamos de frequência relativa. A fri será sempre um
valor compreendido entre 0 e 1, portanto, na linha do total, a soma da fri
tem de resultar 1 (um). Esse valor numérico (1) corresponde à população
total, que em frequência absoluta é 30. Logo, o total da fi = 30 está
relacionado ao total da fri = 1.
13
Masculino 13 = 0, 43 43%
30
Total 30 1 100%
Então, podemos afirmar que 57% dos pesquisados são do sexo feminino.
www.esab.edu.br 56
Exemplo
Nº de filhos ( xi ) ( fi )
0 3
1 2
2 3
3 2
4 1
Total 11
www.esab.edu.br 57
De posse da frequência acumulada, podemos constatar que 8 pessoas
possuem dois, um ou nenhum filho.
Atividade
Chegou a hora de você testar seus conhecimentos
em relação às unidades 1 a 9. Para isso, dirija-se
ao Ambiente Virtual de Aprendizagem (AVA) e
responda às questões. Além de revisar o conteúdo,
você estará se preparando para a prova. Bom
trabalho!
www.esab.edu.br 58
10 Intervalo de classe e ponto médio
Objetivo
Representar um conjunto de dados por intervalos de classe e
determinar o ponto médio.
21 25 26 26 27 28 28 28 29 29 29 30 30 31 32
32 33 33 34 34 35 36 37 37 38 39 40 40 41 45
Dessas 30 idades, 19 delas são diferentes: 21; 25; 26; 27; 28; 29; 30; 31;
32; 33; 34; 35; 36; 37; 38; 39; 40; 41; e 45 anos. Embora essa redução
de 30 para 19 idades seja significativa, o número de classes (19) ainda é
bastante grande. Aconselha-se, quando o número de resultados distintos
é superior a 8, agrupar os dados por intervalos de classes.
www.esab.edu.br 59
Tabela 14 – Intervalo de classe para a variável “idade”.
www.esab.edu.br 60
• Critério da raiz: para definir a quantidade de intervalos de classe
(i) segundo esse critério, devemos extrair a raiz quadrada dos n
elementos da amostra. Matematicamente:
i= n
O valor de i é sempre arredondado para o inteiro mais próximo.
• i é o número de classes;
• n = número de elementos;
• log é o logaritmo na base 10.
O valor de i é sempre arredondado para o inteiro mais próximo.
=
Critério da raiz: i =
30 5, 48 5
Critério de Sturges: i =
1 + (3,3 ⋅ log n ) =
1 + (3,3 ⋅ log 30) =
5,87 6
www.esab.edu.br 61
valor mínimo: o menor valor numérico da amostra (conjunto de dados);
AA
h=
k
Portanto:
AA
h=
k
31
=
h = 6,2 6
5
Para organizar os intervalos das classes, é preciso lembrar que cada
intervalo é composto de dois extremos, que chamaremos de limites: o
inferior – li (à esquerda) e o superior – ls (à direita).
www.esab.edu.br 62
Em cada classe ls = li + h. Assim, cada classe tem seu próprio limite
inferior e superior, isto é, cada valor da variável só pertence a um único
intervalo. O primeiro intervalo tem início com o valor mínimo, no caso
em estudo, 21 anos. Sabendo que h = 6, então:
l s= li + h
ls = 21 + 6 = 27 primeiro intervalo de classe
ls = 27 + 6 = 33 segundo intervalo de classe
ls = 33 + 6 = 39 terceiro intervalo de classe
ls = 39 + 6 = 45 quarto intervalo de classe
l s = 45 + 6 = 51 quinto intervalo de classe
fi
Idades ( xi ) ( fi ) ( faci ) fri = fri (%)
n
4
21 |- 27 4 4 = 0,13 13
30
12
27 |- 33 12 12 + 4 =16 = 0, 40 40
30
9
33 |- 39 9 9 + 16 = 25 = 0,30 30
30
4
39 |- 45 4 4 + 25 = 29 = 0,13 13
30
1
45 |- 51 1 1 + 29 = 30 = 0,03 3
30
Total 30 – 1 100
www.esab.edu.br 63
Vimos na Tabela 15 a distribuição de frequência das idades dos 30
funcionários de certa empresa. Outra medida que podemos acrescentar à
tabela de distribuição de frequência quando os dados estão por intervalo
de classe é o chamado ponto médio.
fi
Idades ( xi ) ( pmi ) ( fi ) ( faci ) fri = ( fi ) (%)
n
21 + 27 4
21 |- 27 = 24 4 4 = 0,13 13
2 30
27 + 33 12
27 |- 33 = 30 12 12 + 4 =16 = 0, 40 40
2 30
33 + 39 9
33 |- 39 = 36 9 9 + 16 = 25 = 0,30 30
2 30
39 + 45 4
39 |- 45 = 42 4 4 + 25 = 29 = 0,13 13
2 30
45 + 51 1
45 |- 51 = 48 1 1 + 29 = 30 = 0,03 3
2 30
Total - 30 - 1 100
www.esab.edu.br 64
11 Medidas de tendência central
Objetivo
Compreender e desenvolver os cálculos de moda, mediana e média.
Média aritmética
Provavelmente você já ouviu falar em média aritmética, ou apenas média.
Por exemplo: a média de gastos mensais com supermercado, a média
de notas de uma determinada disciplina, a estatura média da população
brasileira etc. A média é uma importante medida para representar um
conjunto de dados, pois com base na observação dos dados podemos
estimar um único valor que os represente. Mas como efetuamos o cálculo
da média? Acompanhe o exemplo a seguir.
7,0 – 7,5 – 9,0 – 10,0 – 5,0 – 8,5 – 2,0 – 4,0 – 8,0 – 7,0
Qual foi a média aritmética da turma na primeira prova?
www.esab.edu.br 65
Vamos chamar de x1, x2, x3, ..., xn = 10 as notas da prova, sendo n = 10
a quantidade de alunos que realizaram a prova. A média aritmética das
notas da prova será a soma das notas, x1 + x2 + x3 + ... + x10, dividida por
n. Isto é:
7,0 + 7,5 + 9,0 + 10,0 + 5,0 + 8,5 + 2,0 + 4,0 + 8,0 + 7,0 68
µ
= = = 6,8
10 10
x1 + x 2 + x3 + ... + x10 ∑x i
=µ = i =1
ou
n n
n
x1 + x 2 + x3 + ... + x10 ∑x i
=x = i =1
n n
Moda
O entendimento da moda (Mo) em estatística é semelhante ao que
utilizamos no cotidiano para designar que tal roupa, por exemplo, está na
moda, ou seja, uma determinada roupa está na moda quando a maioria
da população a utiliza. Portanto, em estatística a moda é o valor que
ocorre mais vezes em um conjunto de dados. Assim, tomando o exemplo
das notas novamente:
7,0 – 7,5 – 9,0 – 10,0 – 5,0 – 8,5 – 2,0 – 4,0 – 8,0 – 7,0
A moda será:
Mo = 7,0
Afinal, a nota 7,0 aparece duas vezes e as demais uma única vez. Assim,
chamamos a nota 7,0 de valor modal, ou unimodal.
www.esab.edu.br 66
Se acrescentarmos mais uma nota, por exemplo, a nota 8,0, temos duas
notas distintas que ocorrem com a mesma frequência.
7,0 – 7,5 – 9,0 – 10,0 – 5,0 – 8,5 – 2,0 – 4,0 – 8,0 – 7,0 – 8,0
Assim, Mo = 7,0 e Mo = 8,0, que chamaremos de valor bimodal.
Mediana
A mediana (Md) é uma medida de tendência central que indica
exatamente o valor central de uma amostra de dados – esse valor divide o
conjunto de dados em duas partes iguais.
Dados brutos: 7,0 – 7,5 – 9,0 – 10,0 – 5,0 – 8,5 – 2,0 – 4,0 – 8,0 – 7,0
Rol: 2,0 – 4,0 – 5,0 – 7,0 – 7,0 – 7,5 – 8,0 – 8,5 – 9,0 – 10,0
www.esab.edu.br 67
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Rol:
2, 0 – 4, 0 – 5, 0 – 7, 0 – 7, 0 – 7,5 – 8, 0 – 8,5 – 9, 0 – 10, 0
x n + x n
+1
2 2
Md =
2
www.esab.edu.br 68
Quando n é impar: agora, se acrescentarmos mais uma nota ao rol,
teremos n = 11 notas, isto é, uma quantidade ímpar de elementos. Então:
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
Rol:
2, 0 – 4, 0 – 5, 0 – 7, 0 – 7, 0 – 7,5 − 8, 0 – 8, 0 – 8,5 – 9, 0 – 10, 0
=
Md x=
n +1
x=
11+1 x6
2 2
50% 50%
www.esab.edu.br 69
Em distribuições assimétricas, a média tende a deslocar-se para o lado da
cauda mais longa da curva.
50%
50%
Mediana Média
Figura 24 – Representação da média, moda e mediana para uma distribuição assimétrica.
Fonte: Elaborada pela autora (2013).
É importante destacar que normalmente usamos apenas uma das medidas para
representar a distribuição.
www.esab.edu.br 70
Moda, média e mediana para
12 dados agrupados
Objetivo
Determinar moda, média e mediana para dados agrupados.
Nº de filhos ( xi ) Frequência ( fi )
0 3
1 2
2 3
3 2
4 1
Total 11
www.esab.edu.br 71
A tabela nos informa que três funcionários não têm filhos (0 filho), que
dois funcionários têm apenas um filho, e assim por diante. Logo, para
iniciar o cálculo da média temos que obter o produto do número de
filhos pela sua frequência. Podemos fazer isso abrindo uma nova coluna
na tabela para facilitar a realização do cálculo.
Nº de filhos ( xi ) ( fi ) xi × fi
0 3 0×3=0
1 2 1×2=2
2 3 2×3=6
3 2 3×2=6
4 1 4×1=4
Total 11 ∑x × f
i i =
18
µ
=
∑ x × f=
i i 18
= 1,6
n 11
Fazendo o arredondamento da média para o inteiro mais próximo (pois o
número de filhos é uma variável discreta, já que não podemos ter meio),
temos m = 2 filhos. Portanto, os funcionários de determinada empresa
têm em média dois filhos.
www.esab.edu.br 72
Veja outro exemplo:
Um aluno tirou nota 9,0 nos EF e nota 7,0 na AB. Qual será a média
desse aluno no bimestre?
Total n = 3 + 7 = 10 - ∑ P× N =
76
µ
=
∑ P × N= 76
= 7,6
∑P 10
www.esab.edu.br 73
Média aritmética para dados em intervalos de classe
A média aritmética para distribuição de dados em intervalos de classe
é semelhante ao cálculo da média aritmética de dados agrupados sem
intervalos de classe. A diferença é que, ao invés de considerar os valores
da variável x, toma-se como parâmetro o ponto médio dos intervalos de
classe da variável x. Observe o exemplo.
Idade ( xi ) ( pmi ) ( fi )
18 |- 23 20,5 2
23 |- 28 25,5 11
28 |- 33 30,5 5
33 |- 38 35,5 2
38 |-43 40,5 2
Total - 22
Total - 22 ∑ pm × f =626.
i i
www.esab.edu.br 74
De posse do produto pmi × fi em cada linha, temos que a soma desses
resultados ( ∑ pm × f ) é igual a 626. A média será então a soma de
i i
µ
=
∑ pm ×=
f i i 626
= 28,5
n 22
Nº de livros ( xi ) ( fi )
0 8
1 10
2 3
5 1
Total 22
www.esab.edu.br 75
Mediana para dados agrupados
Quando os dados estiverem agrupados, a mediana dos valores x1, x2, x3,
..., xn será determinada pela sua posição em relação à frequência absoluta
acumulada (faci). Lembrando que para encontrar a posição da mediana
devemos utilizar as fórmulas vistas na unidade 10, ou seja:
x n x n
2
2
, quando é par
Md
x , quando n é ímpar
x n + x n
+1
2 2
Md =
2
x 22 + x 22
+1
2 2
Md =
2
x(11) + x(12 )
Md =
2
Encontrando a frequência absoluta acumulada (faci):
Nº de livros ( xi ) ( fi ) ( faci )
0 8 8 Da 1ª à 8ª posição
1 10 18 Da 9ª à 18ª posição
2 3 21 Da 19ª à 21ª posição
5 1 22 22ª posição
Total 22 -
www.esab.edu.br 76
Assim, as posições x11 e x12 possuem os respectivos valores: x11 = 1 e x12 = 1.
Substituindo em:
x(11) + x(12 ) 1 + 1 2
Md= = = = 1.
2 2 2
Nº de defeitos ( xi ) Peças ( fi )
0 32
1 15
2 3
3 1
Total 51
Md = x n +1
2
www.esab.edu.br 77
Tabela 26 – Mediana para n ímpar.
Estudo complementar
Para aprender a resolver problemas estatísticos
que envolvam o cálculo da moda e da mediana
para um conjunto de dados organizados em
intervalo de classe, leia o material disponível aqui.
www.esab.edu.br 78
Resumo
www.esab.edu.br 79
Média geométrica e média
13 harmônica
Objetivo
Calcular a média geométrica e a média harmônica.
Matematicamente:
Mg= n x1 ⋅ x 2 ⋅ ... ⋅ xn
Vamos a um exemplo?
www.esab.edu.br 80
Seja o conjunto de dados cujos elementos são: 1 – 2 – 4 – 8 – 16; ou seja,
temos n = 5 elementos. Assim, a média geométrica desses dados é a raiz
quíntica (raiz de índice igual a 5) do produto dos cinco elementos. Veja:
Mg = 5
1 ⋅ 2 ⋅ 4 ⋅ 8 ⋅ 16
Mg = 5 1024
Mg = 4
Dica
Sabemos que nem sempre utilizar uma
calculadora científica é tarefa fácil, não é mesmo?
Então, para ajuda-lo com essa tarefa,
recomendamos este site. Nele, você irá encontrar
algumas dicas de encontrar vários tipos de
resultado.
www.esab.edu.br 81
Para recordar, em matemática financeira, os fatores de crescimento
relacionados às taxas de crescimento iguais a i (em nosso exemplo, i =
1% e i = 2%) são obtidos fazendo-se 1 + i. Sendo assim, os fatores de
crescimento do nosso exemplo são respectivamente:
1, 01 ⋅ 1, 02 =
1, 01499
x1 + x 2 + ... + xn
µ=
n
x1 + x 2 + ... + x
= =
n x1 + x 2 + ... + x
www.esab.edu.br 82
E o inverso dos elementos x1, x2, ..., xn é:
1 1 1
x1−1 , x 2 −1 ,..., xn −1 = , ,..., .
x1 x 2 xn
www.esab.edu.br 83
Observe a problemática a seguir:
www.esab.edu.br 84
adequada em problemas cujas grandezas são inversamente proporcionais.
Agora que já vimos as principais medidas de centrabilidade, vamos
conhecer na unidade seguinte as medidas de dispersão. Até lá!
Saiba mais
Outra aplicação da média geométrica é em
problemas financeiros que apresentam variações
percentuais sucessivas. Veja um exemplo
disponível aqui.
www.esab.edu.br 85
14 Medida de dispersão
Objetivo
Compreender e desenvolver o cálculo das medidas de dispersão:
desvio médio, desvio quadrático, variância, desvio-padrão e
coeficiente de variação.
www.esab.edu.br 86
Como podemos avaliar se a média calculada, de fato, é representativa
com relação à distribuição dos dados? A resposta a essa pergunta nos leva
ao conhecimento da medida de dispersão.
Desvio Médio = DM = xi ‒ m
Desvio Quadrático = DQ = DM2 = ( xi ‒ µ)2
www.esab.edu.br 87
Em que:
15 15 – 21 = – 6 ( – 6)2 = 36
19 19 – 21 = – 2 ( – 2)2 = 4
19 19 – 21 = – 2 ( – 2)2 = 4
21
22 22 – 21 = 1 ( 1)2 = 1
25 25 – 21 = 4 ( 4)2 = 16
26 26 – 21 = 5 ( 5)2 = 25
Você observou que o desvio médio pode ter como resultado valores
negativos. Todavia, para determinar o cálculo da variância e do desvio-
padrão que veremos a seguir, é necessário que os dados sejam não
negativos. Para isso, transformamos esses dados em valores positivos
elevando-os ao quadrado.
www.esab.edu.br 88
Antes de conhecermos os cálculos da variância e do desvio-padrão, vamos
determinar o desvio médio e quadrático para o número de funcionários
da cidade B.
∑(x i − µ )²
= s=
Variância ² i =1
n
n
∑(x i − µ )²
Desvio-padrão= s= i =1
www.esab.edu.br 89
Em que:
∑(x
i =1
i − µ )²
Cidade A 36 + 4 + 4 + 1 + 16 + 25 + = 86
Cidade B 1+1+0+1+1=4
www.esab.edu.br 90
Tabela 31 – Variância e desvio-padrão – cidades A e B.
Variância Desvio-padrão
n n
∑(x i − µ )² ∑(x i − µ )²
s² = i =1
s= i =1
n n
86
Cidade A s=
² = 14,33 =s =
14, 33 3, 786
6
4
Cidade B s=
² = 0,8 s
= =
0,8 0,894
5
www.esab.edu.br 91
14.3 Coeficiente de variação
O coeficiente de variação é uma medida de dispersão relativa, pois
permite comparar a dispersão de diferentes distribuições (com diferentes
médias e desvios-padrão). Normalmente, essa medida é calculada em
percentual (MAGALHÃES; LIMA, 2005).
s s
cv= ou cv(%)= × 100
µ µ
Em que:
3, 786
cv = = 0,180 ou cv(%)= 0,180 × 100= 18%
21
Vimos, nesta unidade, as medidas de dispersão para um conjunto de
dados brutos. Na unidade a seguir veremos como calcular as medidas de
variância e desvio-padrão para dados agrupados. Vamos em frente!
www.esab.edu.br 92
Variância e desvio-padrão para
15 dados agrupados
Objetivo
Determinar a variância e o desvio-padrão para dados agrupados.
Nota ( xi ) Frequência ( fi )
2 1
4 3
5 3
6 5
7 5
8 4
Total 21
www.esab.edu.br 93
n
∑ f (x i i − µ )²
= s=
Variância ² i =1
n
n
∑ f (x i i − µ )²
Desvio-padrão= s= i =1
n
Em que:
∑x f i i
=µ = i =1
n
(2 × 1) + (4 × 3) + (5 × 3) + (6 × 5) + (7 × 5) + (8 × 4)
=
21
126
= = 6
21
Com essa informação podemos dar sequência no cálculo da variância e
do desvio-padrão, obtendo o valor do desvio médio (DM), seguido pelo
cálculo do desvio quadrático (DQ). Observe a Tabela 33:
www.esab.edu.br 94
Tabela 33 – Variância e desvio-padrão para dados agrupados – exemplo das notas.
n
(1 × 16) + (3 × 4) + (3 × 1) + (5 × 0) + (5 × 1) + (4 × 4)
=
21
52
= = 2, 48
21
E o desvio-padrão:
n
∑ f (x i i − µ )²
s²
= i =1
= =
2, 48 1,57
n
Portanto, as notas estão dispersas em aproximadamente 1,57 pontos.
www.esab.edu.br 95
Tabela 34 – Variância e desvio-padrão para dados agrupados – exemplo das notas.
∑ f ( pm − µ )²
i i
= s=
Variância ² i =1
n
n
∑ f ( pm − µ )²
i i
Desvio-padrão= s= i =1
n
Assim, para o exemplo anterior, vamos primeiramente determinar a
média das notas. Lembre-se que para determinar a média aritmética para
dados agrupados com intervalo de classe devemos multiplicar cada valor
do ponto médio pela sua respectiva frequência. Desse modo, tomando os
valores da Tabela 34 do exemplo anterior:
n
∑ pm f i i
=µ= i =1
n
(21 × 5) + (27 × 10) + (33 × 4) + (39 × 12) + (45 × 7) + (51 × 2)
=
40
1392
= = 34,8
40
www.esab.edu.br 96
Com essa informação podemos dar sequência no cálculo da variância e
do desvio-padrão, obtendo o valor do Desvio Médio (DM), seguido pelo
cálculo do Desvio Quadrático (DQ). Observe a Tabela 35:
∑ f ( pm − µ )²
i i
s² = i =1
n
(5 × 190, 44) + (10 × 60,84) + (4 × 3,24) + (12 × 17,64) +
s² =
40
+(7 × 104,04) + (2 × 262, 44)
40
3038, 4
=s² = 75,96
40
www.esab.edu.br 97
E o desvio-padrão:
∑ f ( pm
i − µ )²
i
=s² i =1
= =
75,96 8, 72
n
www.esab.edu.br 98
16 Exercícios resolvidos
Objetivo
Apresentar exercícios resolvidos de medidas de tendência central e
medidas de dispersão.
Exercício 1
Altura (cm): 160 – 158 – 160 – 173 – 164 – 171 – 180 – 163 – 164 – 165
Determine:
a. a moda;
b. a mediana;
c. a média aritmética;
d. o desvio médio e quadrático;
e. a variância e o desvio-padrão.
www.esab.edu.br 99
Resolução:
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
158 160 160 163 164 164 165 171 173 180
Portanto:
x(5) + x( 6 ) 164 + 164
=Md = = 164 cm
2 2
www.esab.edu.br 100
c. Ainda conforme o aprendizado da unidade 11, a média aritmética é
determinada pela soma de todos os elementos do conjunto de dados
dividida pela quantidade n de elementos. Logo:
n
∑x i
=µ =
i =1
n
158 + 160 + 160 + 163 + 164 + 164 + 165 + 171 + 173 + 180
µ=
10
1658
=µ = 165,8 cm
10
d. Com base na unidade 14, o desvio médio é a diferença entre cada
valor do conjunto de dados por sua média aritmética, e o desvio
quadrático é o valor de cada desvio médio elevado ao quadrado.
Assim, temos:
Tabela 36 – Desvio médio e desvio quadrático das alturas (cm).
www.esab.edu.br 101
e. Na unidade 14 aprendemos também a calcular a variância e o
desvio-padrão para um conjunto de dados brutos.
A variância é o somatório dos desvios quadráticos (calculados na Tabela
37) dividido pela quantidade de elementos n do conjunto de dados:
n
∑(x i − µ )²
423, 6
s²
= i =1
= = 42,36 cm
n 10
∑(x i− µ )²
=s i =1
= =
42,36 6,51 cm
n
Exercício 2
www.esab.edu.br 102
A partir dos dados da Tabela 37, determine:
a. a moda;
b. a mediana;
c. a média aritmética;
d. a variância e o desvio-padrão.
Resolução:
x n + x n x 54 + x 54
2 2
+1
2 2
+1 x( 27 ) + x( 28)
=Md = =
n 2 2
www.esab.edu.br 103
Tabela 38 – Frequência absoluta acumulada da dedicação semanal a atividade física.
∑x f i i
=µ =
i =1
n
(0 × 20) + (1 × 2) + (2 × 3) + (3 × 8) + (4 × 5) + (5 × 15) + (6 × 1)
=
54
133
= = 2,5
54
www.esab.edu.br 104
Portanto, a média é de 2,5 dias de dedicação semanal a atividade física.
∑ f (x i i − µ )²
= s=
Variância ² i =1
e
n
n
∑ f (x i i − µ )²
Desvio-padrão= s= i =1
www.esab.edu.br 105
Logo, a variância será:
∑ f (x i i − µ )²
s² = i =1
n
(20 × 6,25) + (2 × 2,25) + (3 × 0,25) + (8 × 0,25) +
s² =
54
+(5 × 2,25) + (15 × 6,25) + (1 × 12,25)
54
249,5
s²
= = 4,62
54
E o desvio-padrão:
n
∑ f (x i i − µ )²
s²
= i =1
= =
4, 62 2,15
n
www.esab.edu.br 106
17 Separatrizes e gráfico boxplot
Objetivo
Apresentar, determinar e representar as medidas de separatrizes e o
gráfico boxplot.
2 3 4 4 5 5 5 7 8 9 10
www.esab.edu.br 107
Chamamos de extremo inferior (Ei ) o menor valor dos dados em
análise. Chamamos de primeiro quartil (Q1) o valor que delimita os
25% valores abaixo. O segundo quartil (Q2) é a própria mediana (Md)
que separa os 50% valores abaixo dos 50% valores acima. Chamamos de
terceiro quartil (Q3) o valor que separa os 25% valores acima. Por fim,
chamamos de extremo superior (Es ) o maior valor dos dados em análise.
25% 25%
25% 25%
i ⋅ (n + 1)
Posição= P=
i
4
www.esab.edu.br 108
Em que:
Observe o exemplo:
Suponha que desejamos conhecer a idade limite que separa os 75% mais
jovens dos 25% mais velhos de n = 14 funcionários de determinada
empresa. A Tabela 40 apresenta o rol da idade dos funcionários.
21 26 27 28 28 29 30 30 32 32 33 34 37 39
Assim, determinar a idade limite que separa os 75% mais jovens dos
25% mais velhos significa que se procura o 3º quartil. Pois cada quartil
delimita 25% dos dados (25% + 25% + 25% + 25% = 100% dos
dados). Então, sendo i = 3:
3 ⋅ (14 + 1)
=P3 = 11, 25
4
Assim, para encontrarmos Q3 precisamos efetuar a média entre os valores
que estão uma posição antes de 11,25, ou seja, 11, e uma posição depois de
11,25, que é a posição 12. Os elementos que estão nas posições 11 e 12 são
x11 = 33 e x12 = 34. A média desses elementos será o terceiro quartil:
33 + 34
=Q3 = 33,5
2
www.esab.edu.br 109
Portanto, a idade que separa os 75% mais jovens dos 25% mais velhos é
a idade de 33,5 anos.
Estudo complementar
Agora que você já aprendeu sobre a medida
separatriz, denominada quartis, conheça também
outras separatrizes, como os decis e centis (também
conhecido como percentis), disponíveis aqui.
dq = Q3 ‒ Q1
www.esab.edu.br 110
A mediana, medida de tendência central, é representada por um traço no
interior da caixa, e segmentos de reta são colocados da caixa até os valores
máximo e mínimo, que não sejam observações discrepantes.
Es *
Q3
dq
Md
Q1
Ei
www.esab.edu.br 111
De acordo com Magalhães e Lima (2005), o boxplot correspondente é
apresentado na Figura 28:
70
60
50
Laranjas
40
30
20
Tarefa dissertativa
Caro estudante, convidamos você a acessar o
Ambiente Virtual de Aprendizagem e realizar a
tarefa dissertativa.
www.esab.edu.br 112
18 Medidas de assimetria e curtose
Objetivo
Apresentar e determinar as medidas de assimetria e curtose.
Distribuição
simétrica
µ = Md = Mo
Figura 29 – Distribuição simétrica ou curva simétrica.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 113
Quando a média, a mediana e a moda recaem em pontos diferentes
da distribuição, isto é, apresentam valores diferentes, sendo que o
deslocamento desses pontos pode ser para a direita ou para a esquerda,
chamamos de distribuição (ou curva) assimétrica positiva ou distribuição
(ou curva) assimétrica negativa, respectivamente. Observe a Figura 30:
Figura 30 – Representação gráfica das curvas assimétrica positiva (a) e assimétrica negativa (b).
Fonte: Elaborada pela autora (2013).
m > Md > Mo
Na assimetria negativa, a média, a mediana e a moda têm a relação de
ordem a seguir:
m < Md < Mo
Podemos concluir então que, em distribuições assimétricas, média, moda
e mediana terão valores diferentes, em que a média será maior que a
mediana, e esta maior que a moda, quando a assimetria for positiva; e a
média será menor que a mediana, e esta menor que a moda, quando a
assimetria for negativa.
www.esab.edu.br 114
18.1 Curtose
A curtose indica até que ponto a curva de frequências de uma
distribuição se apresenta mais afilada ou mais achatada do que uma
curva padrão (BUSSAB; MORETTIN, 2002). De acordo com o grau de
curtose, podemos ter três tipos de curvas de frequência.
Mesocúrtica
Platicúrtica
www.esab.edu.br 115
Leptocúrtica
(Q3 − Q1 )
k= 2
C 90 − C10
Assim, é determinado que:
www.esab.edu.br 116
Exemplo:
0 0 1 4 4 5 6 6 6 8 9 10
Sendo k = 0,265, que é maior que 0,263, isso significa que a curva ou
distribuição é platicúrtica.
Atividade
Chegou a hora de você testar seus conhecimentos
em relação às unidades 10 a 18. Para isso, dirija-
se ao Ambiente Virtual de Aprendizagem (AVA) e
responda às questões. Além de revisar o conteúdo,
você estará se preparando para a prova. Bom
trabalho!
www.esab.edu.br 117
Resumo
www.esab.edu.br 118
19 Variável bidimensional
Objetivo
Compreender e determinar as frequências absoluta e relativa de uma
variável bidimensional.
www.esab.edu.br 119
Tabela 41 – Esquema de como fazer a contagem para uma distribuição conjunta.
Dados
Carreira
Estudantes Sexo Criação da tabela de contingência
escolhida
1 Economia Masculino Carreira Sexo
escolhida Feminino Masculino
2 Administração Feminino
3 Administração Masculino Economia II
5 Administração Feminino
... ... ...
200 Administração Feminino
Tabela 42 – Frequências absolutas para distribuição conjunta da relação entre o sexo e a carreira escolhida dos
estudantes.
Carreira Sexo
Total
escolhida Feminino Masculino
Economia 35 85 120
Administração 25 55 80
Total 60 140 200
Note que os totais nas linhas constituem o total de estudantes pelo sexo
(masculino ou feminino) e os totais das colunas constituem o total dos
estudantes pela carreira escolhida (economia ou administração).
www.esab.edu.br 120
Neste momento, vamos determinar a frequência relativa (em percentual)
pelo total geral, aplicando uma regra de três simples. Por exemplo:
tomando os 35 estudantes do sexo feminino cuja carreira escolhida foi
economia, esse valor em percentual é:
Tabela 43 – Frequência relativa (em percentual) para distribuição conjunta da relação entre o sexo e a carreira
escolhida.
Sexo
Carreira escolhida Total
Feminino Masculino
Economia 35 (17,5%) 85 (42,5%) 120 (60%)
Administração 25 (12,5%) 55 (27,5%) 80 (40%)
Total 60 (30%) 140 (70%) 200 (100%)
www.esab.edu.br 121
Fazendo a mesma conta para cada item da Tabela 44, temos:
Tabela 44 – Frequência relativa (percentual) para distribuição conjunta da relação entre o sexo e a carreira
escolhida.
Sexo
Carreira escolhida Total
Feminino Masculino
Economia 35 (29%) 85 (71%) 120 (100%)
Administração 25 (31%) 55 (69%) 80 (100%)
Total 60 (30%) 140 (70%) 200 (100%)
Exercício resolvido
Solução:
www.esab.edu.br 122
130 (total geral) − − − − − − 100 (%) 24 × 100
=⇒x = 18%
24 (empregados) − − − − − x (%) 130
Fazendo essa operação para cada valor da Tabela 45, originamos a Tabela 46.
Tabela 46 – Frequência relativa (em percentual) para as variáveis sexo (feminino e masculino) e fumantes.
Fumantes
Sexo
Sim Não Total
24 × 100 18 × 100 42 × 100
Feminino = 18% = 14% = 32%
130 130 130
49 × 100
Total = 38% 130 (100%)
130
www.esab.edu.br 123
Fórum
Caro estudante, dirija-se ao Ambiente Virtual de
Aprendizagem da Instituição e participe do nosso
Fórum de discussão. Lá você poderá interagir com
seus colegas e com seu tutor de forma a ampliar,
por meio da interação, a construção do seu
conhecimento. Vamos lá?
www.esab.edu.br 124
Diagrama de dispersão e
20 coeficiente de correlação
Objetivo
Apresentar e determinar o diagrama de dispersão e o coeficiente de
correlação.
www.esab.edu.br 125
Na Figura 34, o gráfico de dispersão para as variáveis quantitativas X e Y
é representado em um eixo cartesiano no qual os dados das variáveis X e
Y são apresentados por pontos P (x, y).
y
1.100,00
1.050,00
1.000,00
950,00
900,00
850,00
800,00
0 1 2 3 4 5 x
Figura 34 – Gráfico de dispersão das variáveis: tempo de serviço (X) e salário (Y).
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 126
Os dados da Tabela 48 podem ser apresentados em um gráfico, conforme
a Figura 35.
y
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8
x
Figura 35 – Apresentação dos dados e diagrama de dispersão para as variáveis número de operário (X) e dias (Y).
Fonte: Elaborada pela autora (2013).
Observando a Figura 35, podemos concluir que parece haver uma relação
de dependência entre as variáveis, pois à medida que aumenta o número
de funcionários, diminui o número de dias. Assim, dizemos que temos
uma associação linear inversa (ou negativa).
www.esab.edu.br 127
Tabela 49 – Resultado no teste (X) em relação ao tempo (Y).
Indivíduo Resultado no teste (X) Tempo (Y)
A 45 343
B 52 368
C 61 355
D 70 334
E 74 337
F 76 381
G 80 345
H 90 375
y
380
370
360
350
340
330
0 10 20 30 40 50 60 70 80 90 x
Figura 36 – Apresentação dos dados e diagrama de dispersão para as variáveis resultado no teste (X) e tempo (Y).
Fonte: Adaptada de Bussab e Morettin (2002).
Através da Figura 36, podemos concluir que não parece haver nenhum
tipo de dependência entre as duas variáveis, uma vez que “(...) conhecer
o resultado no teste não ajuda a prever o tempo gasto para aprender a
operar a máquina” (BUSSAB; MORETTIN, 2002, p. 62).
www.esab.edu.br 128
20.2 Coeficiente de correlação linear
O coeficiente de correlação linear r é uma medida que permite verificar o
quão uma variável está associada a (ou depende da) outra.
r=
∑ (z x ⋅ zy )
n
Em que:
desvio médio x − µ
=• z x = , é um valor padronizado da variável X.
desvio-padrão s
desvio médio y − µ
=• z y = , é um valor padronizado da variável Y.
desvio-padrão s
• n é número de elementos do conjunto de dados.
Tomando o exemplo e os dados vistos anteriormente na Figura 35, temos
que:
n = quantidade de elementos = 4.
7 +5+ 4+2
µy =
4
µ y = 4,5.
www.esab.edu.br 129
Para calcular o desvio-padrão das variáveis X e Y, precisamos encontrar os
valores de Desvio Médio (DM) e Desvio Quadrático (DM):
∑(x i − µ x )²
6,25 + 0,25 + 0,25 + 6,25 13
s x=
² i =1
= = = 3,25
n 4 4
∑(x i − µ x )²
sx
= i =1
= =
3,25 1,80
n
∑( y i − µ y )²
6,25 + 0,25 + 0,25 + 6,25 13
s y=
² i =1
= = = 3,25
n 4 4
∑( y i − µ y )²
sy
= i =1
= =
3,25 1,80
n
www.esab.edu.br 130
De posse dessas informações, abrimos algumas colunas na Tabela 51 para
facilitar o cálculo dos desvios médios e dos valores padronizados.
Nº de
Dias x − µx y − µy
operários ( x – μx ) ( y – μy ) 2 zx = zy = zx . zy
(X)
(Y) sx sy
3 7 –2,5 2,5 –1,39 1,39 –1,92
5 5 –0,5 0,5 –0,28 0,28 –0,08
6 4 0,5 –0,5 0,28 –0,28 –0,08
8 2 2,5 –2,5 1,39 –1,39 –1,92
r=
∑ (z x ⋅ zy )
=
( −1,92) + ( −0,08) + ( −0,08) + ( −1,92) −4
= = −1
n 4 4
Mas, qual o significado do resultado r = – 1?
www.esab.edu.br 131
Para melhor compreender a análise dos resultados de r, veja o esquema
apresentado na Figura 37.
Sentido Intensidade
+1 Forte
Positiva Moderada
Fraca
Valor de r 0 Ausência
Fraca
Negativa Moderada
–1 Forte
www.esab.edu.br 132
21 Regressão linear simples
Objetivo
Compreender e determinar a medida de regressão linear simples.
Por exemplo:
www.esab.edu.br 133
Para melhor compreender, considere o exemplo a seguir.
y
65
60
55
Altura (cm)
50
45
40
155 160 165 170 175 180 x
Peso (kg)
Figura 38 – Diagrama de dispersão de alturas e pesos.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 134
Como podemos observar na Figura 38, o peso (kg) das funcionárias tem
relação com sua altura (cm), ou seja, o peso aumenta proporcionalmente
em relação à altura. Observe no diagrama de dispersão que há uma
representação de uma reta que passa entre os pontos (x, y). Essa reta é
chamada de reta de regressão e tem por finalidade criar um modelo
aproximado à realidade dos dados, que explica, de forma geral, a relação
entre as variáveis X e Y.
n ⋅ ∑ ( X ⋅ Y ) − ( ∑ X ) ⋅ ( ∑Y )
a=
n ⋅ ∑ X 2 − (∑ X )
2
b=
∑Y − a ⋅ ∑ X
n
Em que:
www.esab.edu.br 135
Tabela 53 – Cálculos para regressão linear simples.
∑ X = 2156 ∑Y = 730 ∑X 2
= 358194 ∑ X ⋅Y =
121394
n ⋅ ∑ ( X ⋅ Y ) − ( ∑ X ) ⋅ ( ∑Y )
=a =
n ⋅ ∑ X 2 − (∑ X )
2
b=
∑Y − a ⋅ ∑ X =
(730) − (0,518) ⋅ (2156)
= −29, 754
n 13
Sendo assim, temos a reta de regressão:
www.esab.edu.br 136
y = ax + b
y = 0,518x – 29,754.
Com a equação de regressão em mãos, podemos predizer o peso de um
indivíduo y ’ com altura, por exemplo, x = 178 cm. Vejamos:
• X: número de clientes;
• Y: vendas (em 104 reais).
O gráfico de dispersão referente aos 17 pares de dados (x, y) é
apresentado na Figura 39:
www.esab.edu.br 137
14
12
10
8
Vendas 6
4
2
0
350 550 750 950 1150
Clientes
y = 0,000777x + 8,381
Interessado em prever as vendas para uma loja com 800 clientes, qual o
valor de y ’?
www.esab.edu.br 138
Solução:
y = 0,000777x + 8,381 ⇒
y ’ = 0,000777 . (800) + 8,381
y ’ = 9,00
Portanto, para um número de 800 clientes, a loja apresentará um total de
vendas de 9,00 × 104 reais = 90.000 (noventa mil reais).
Saiba mais
Você sabia que o cálculo de correlação, que você
aprendeu na unidade 20, e o cálculo de regressão
linear, que você aprendeu nesta unidade, são
possíveis de calcular, de forma mais imediata, por
meio de calculadoras científicas? Para aprender
como efetuar esses cálculos na calculadora
científica, assista ao vídeo disponível aqui.
www.esab.edu.br 139
22 Probabilidade: conceito e axiomas
Objetivo
Apresentar o conceito e os axiomas de probabilidade e determinar a
probabilidade de alguns eventos.
www.esab.edu.br 140
Então, a probabilidade de sair o número 4 é de uma entre seis
1
possibilidades. Representamos matematicamente por .
6
Com base nesse exemplo, podemos generalizar alguns conceitos
importantes no estudo das probabilidades.
Exemplo
Lançamento de um dado.
Alguns eventos de Ω:
www.esab.edu.br 141
O símbolo # significa cardinalidade, isto é, o número (quantidade) de
elementos do conjunto evento ou/e do conjunto espaço amostral.
#A 3
P( A) =
== =
0,50 ⇒ P ( A ) =
50%
#Ω 6
Ou seja, 50% de chance de tirarmos um número par no lançamento de
um dado.
Solução
www.esab.edu.br 142
Agora, vamos resolver os eventos designados pelos itens a e b da questão:
# A 14
P( A) = = = 0,82 ⇒ P ( A ) =82%
# Ω 17
#B 3
P (B ) = = = 0,18 ⇒ P ( A ) =
18%
# Ω 17
Ou seja, 18% de chances de ser sorteado um funcionário da diretoria.
www.esab.edu.br 143
Primeiro axioma: a probabilidade de ocorrência de um evento é sempre
um número real compreendido entre 0 e 1. Ou seja:
0 ≤ P (Ei) ≤ 1
Segundo axioma: a probabilidade de ocorrência do espaço amostral
é igual a 1, pois pelo menos um dos resultados do espaço amostral
ocorrerá. Por isso, o espaço amostral é chamado de evento certo e
representado por:
P (Ω) = 1
Terceiro axioma: a probabilidade de ocorrência do conjunto vazio é
nula (igual a zero), uma vez que não há resultados no conjunto vazio, e
representamos por:
P (∅) = 0
Quarto axioma: a soma das probabilidades de todos os eventos que
compõem o espaço amostral é igual a 1. Ou seja:
∑ P ( E=)
i P ( E1 ) + P ( E 2 ) + ... + P ( E=
n) 1
www.esab.edu.br 144
União
Exemplo
A ∪ B = {1, 2, 3, 6, 9, 10}
Note que o elemento 3 é comum a ambos os eventos; no entanto, não é
necessário representá-lo duas vezes no conjunto união A ∪ B.
Intersecção
Exemplo
A ∩ B = {7, 8}
www.esab.edu.br 145
Complementar de um evento
Exemplo
AC = {4, 5, 6, 8}
Observe que:
Ac
A B A B A
Ω Ω Ω
www.esab.edu.br 146
Continue seus estudos. Na sequência, veremos a regra da adição de
probabilidades.
P (A ∪ B) = P (A) + P (B) ‒ P (A ∩ B)
Para ilustrar essa regra, considere o exemplo a seguir.
Solução:
www.esab.edu.br 147
Dessa forma, a probabilidade de P (A ∪ B) é a soma da probabilidade
do evento A com o evento B. Todavia, existem 30 alunos que estão
matriculados em ambas as disciplinas, ou seja, se somarmos P (A) com
P (B) contabilizaremos nessa soma duas vezes os 30 alunos. Portanto,
devemos retirar da soma P (A) + P (B) a intersecção (A ∩ B). Logo:
P ( A ∪ B )= P ( A ) + P ( B ) − P ( A ∩ B )=
100 80 30 150 3
= + − = =
200 200 200 200 4
Já no item b da questão, a probabilidade de P (B ∪ C) é a soma da
probabilidade do evento B com o evento C. Como nessas duas disciplinas
não há alunos simultaneamente matriculados, basta somarmos P (B) com
P (C). Logo:
80 50 130 13
P ( B ∪ C ) = P ( B ) + P (C ) = + = =
200 200 200 20
www.esab.edu.br 148
Probabilidade condicional e
23 teorema de Bayes
Objetivo
Apresentar o conceito de probabilidade condicional e o teorema de
Bayes e determinar a probabilidade condicional de alguns eventos.
www.esab.edu.br 149
5
P (homem | recuperação) =
12
12
E P( A) = , pois dos 40 estudantes, 12 estão em recuperação.
40
Temos que:
5
P ( A ∩ B ) 40 5 40 5
P (B | =
A) = = ⋅ =
P( A) 12 40 12 12
40
www.esab.edu.br 150
Para sua reflexão
Se invertermos a relação hipótese e tese do exemplo
anterior, isto é, se a hipótese for o conjunto B
(“meninos”) e a tese o conjunto A (“estudantes em
recuperação”), a probabilidade condicional P (A | B)
será a mesma que a obtida P (B | A)?
A resposta a essa reflexão forma parte de sua
aprendizagem e é individual, não precisando ser
comunicada ou enviada aos tutores.
Solução
P (A ∩ B) = 10%
A probabilidade de ocorrer o evento B individualmente é:
P (B) = 30%
O clima é o espaço amostral Ω. Dessa forma, Ω = 100%.
www.esab.edu.br 151
Assim, a probabilidade condicional de esse dia ser chuvoso, dado que é,
sabidamente, um dia nublado é:
10
P ( A ∩ B ) 100 10 100 10 1
P( A =
| B) = = ⋅ = = = 0,33= 33%
P (B ) 30 100 30 30 3
100
Portanto, e dado que o dia está nublado, há 33% de chances de chover.
Teorema de Bayes
Segundo Bussab e Morettin (2002), o teorema de Bayes expressa
uma probabilidade condicional em termos de outras probabilidades
condicionais, do mesmo espaço amostral.
A B5
B2
B6 Ω
Figura 41 – Partição do espaço amostral.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 152
Perceba que A = (A ∩ B1) ∪ (A ∩ B2) ∪ (A ∩ B3) ∪ (A ∩ B4) ∪ (A ∩
B5) ∪ (A ∩ B6).
MB
D
MA
Ω
2000 2
P (=
MA ) = .
3000 3
A probabilidade de uma peça qualquer ser da máquina B é:
1000 1
P (=
MB ) = .
3000 3
A quantidade de peças defeituosas da máquina A e da máquina B é:
www.esab.edu.br 153
Sabendo que 1% das peças da máquina A e 3% da máquina B são
defeituosas, temos:
P(M A ∩ D ) 20 1
P (D | =
MA ) = = .
P(M A ) 2000 100
P(MB ∩ D ) 30 3
=
P (D | M B) = = .
P(MB ) 1000 100
P ( M B ) ⋅ P (D | M B )
P(MB | D ) =
P ( M B ) ⋅ P (D | M B ) + P ( M A ) ⋅ P (D | M A )
1 3 3 3
⋅
3 100 300 3 300
P(MB | D ) = = = 300 = ⋅ ⇒
1 3 2 1 3 2 5 300 5
⋅ + ⋅ +
3 100 3 100 300 300 300
3
P(MB | D ) =
5
www.esab.edu.br 154
24 Teorema do produto
Objetivo
Apresentar o teorema do produto.
P( A ∩ B )
=
P( A | B ) ⇒ P ( A ∩=
B ) P ( A | B ) ⋅ P (B ) (3)
P (B )
www.esab.edu.br 155
Vamos ver um exemplo.
Uma urna contém ao todo 10 bolas, das quais 4 são amarelas (A) e 6 são
verdes (V). Se ocorrer um sorteio de duas bolas, uma de cada vez e sem
reposição, isto é, sorteamos a primeira bola, verificamos sua cor e não a
devolvemos à urna; sorteamos novamente uma bola e verificamos sua cor.
Quais as probabilidades em relação aos pares de bolas sorteadas?
4 6 4
A V ⋅ =
10 9 15
6 4 4
V A ⋅ =
10 9 15
6 5 1
V V ⋅ =
10 9 3
P (A ∩ A) = P (A | A) ⋅ P (A)
Ou seja, sabendo que no primeiro sorteio a probabilidade de sair uma
bola amarela é 4 (pois, inicialmente há 4 bolas amarelas na urna), para
4 2
um total de 10 bolas, então P ( A=
) = .
10 5
www.esab.edu.br 156
Já para o 2º sorteio, a probabilidade da segunda bola está condicionada
à primeira retirada, pois não houve reposição da 1ª bola à urna. Dessa
forma, temos não mais 4 bolas amarelas na urna, e sim 3 bolas amarelas,
para um total não mais de 10 bolas na urna, mas de 9 bolas. Portanto,
3 1
a probabilidade condicional é P ( A | A=
) = . Logo, substituindo os
9 3
valores na fórmula:
P ( A ∩=
A) P( A | A) ⋅ P( A)
4 3 2 1
P( A ∩ A) = ⋅ = ⋅
10 9 5 3
2
P( A ∩ A) =
15
Exatamente o valor que havíamos encontrado na Tabela 55.
Eventos independentes
Dizemos que dois ou mais eventos são independentes quando a ocorrência
de um deles não influencia a probabilidade de ocorrência de outros.
P (A ∩ B) = P (A) ⋅ P (B)
Essa justificativa é dada, pois se A e B são eventos independentes, então:
P (B | A) = P (B) e P (A | B) = P (A)
Pela igualdade (3):
P (A ∩ B) = P (A | B) ⋅ P (B)
www.esab.edu.br 157
Substituindo P (B | A) por P (B), conforme enunciado dado
anteriormente, então:
P (A ∩ B) = P (A) ⋅ P (B)
Tomando as informações do exemplo anterior em que temos uma urna
com 10 bolas, das quais 4 bolas são amarelas (A) e 6 bolas são verdes
(V), se ocorrer um sorteio de duas bolas, uma de cada vez, mas agora
com reposição – isto é, sorteamos a primeira bola, verificamos sua cor e
a devolvemos à urna –, as probabilidades com relação aos pares de bolas
sorteadas podem ser observados na Tabela 56:
4 6 6
A V ⋅ =
10 10 25
6 4 6
V A ⋅ =
10 10 25
6 6 9
V V ⋅ =
10 10 25
P (A ∩ A) = P (A) ⋅ P (A)
www.esab.edu.br 158
Ou seja, sabendo que no primeiro sorteio a probabilidade de sair uma
bola amarela é 4 (pois há 4 bolas amarelas na urna), para um total de 10
4 2
bolas, então P ( A=
) = . No segundo sorteio, haverá novamente
10 5
a mesma chance de ocorrer uma bola amarela, pois houve reposição da
primeira bola amarela à urna.
P ( A ∩ A )= P ( A ) ⋅ P ( A )
4 4 2 2
P( A ∩ A) = ⋅ = ⋅
10 10 5 5
4
P( A ∩ A) =
25
www.esab.edu.br 159
Resumo
www.esab.edu.br 160
25 Exercícios resolvidos
Objetivo
Apresentar exercícios resolvidos de probabilidade, probabilidade
condicional e teorema do produto.
Exercício 1
www.esab.edu.br 161
Resolução
#A 4 1
P ( A=
) = = = 0, 25 ou 25%
# Ω 16 4
Concluindo, os alunos têm 25% de chances de acertar a segunda questão
da prova.
Exercício 2
www.esab.edu.br 162
Resolução
#R 4 1
P ( R=
) = = = 0,08 ou 8%
# Ω 52 13
Exercício 3
Mulheres 5 9 11 25
Total 38 28 34 100
Resolução
M ∩Z
P(Z / M ) =
M
www.esab.edu.br 163
Sabendo que o espaço amostral #Ω = 100. pessoas, então:
11
#( M ∩ Z ) = , isto é, 11 mulheres que são do partido Z.
100
25
#M = , isto é, 25 mulheres para um total de 100 pessoas.
100
Substituindo esses valores na fórmula de probabilidade condicional:
11
11 100 11
P(Z / =M ) 100= ⋅ = = 0, 44
25 100 25 25
100
Portanto, a probabilidade de que seja sorteada uma pessoa do partido Z,
sabendo que esta é uma mulher, é de 0,44 ou 44%.
Exercício 4
Resolução
www.esab.edu.br 164
P ( H ∩ M )= P ( H ) ⋅ P ( M ) ⇒
1 1
P (H ∩ M ) = ⋅ ⇒
3 2
1
P (H ∩ M ) = ⇒
6
P (H ∩ M ) = 0,1666 ou 16,66%
Portanto, as chances de ambos viverem mais de dez anos é de 16,66%.
www.esab.edu.br 165
26 Variável aleatória discreta
Objetivo
Compreender o conceito de variável aleatória e determinar a
distribuição de probabilidade e o valor esperado de uma variável
aleatória discreta.
www.esab.edu.br 166
26.1 Definição de variável aleatória discreta
Dizemos que uma variável é aleatória quando os resultados numéricos
dessa variável são determinados pelo acaso, isto é, por fatores de chance de
certo valor ocorrer (BUSSAB; MORETTIN, 2002). Essa variável aleatória
será discreta quando assumir apenas valores inteiros (..., ‒ 1, 0, 2, ...).
Saiba mais
Caro estudante, para um pouco mais sobre variável
aleatória e alguns exemplos, você pode clicar aqui.
Sendo X uma variável aleatória e x1, x2, ..., xn seus resultados possíveis
então a função discreta de probabilidade P : x → p (x) possui a seguinte
notação (MAGALHÃES; LIMA, 2005):
www.esab.edu.br 167
Para você compreender melhor esse conceito e fixar sua aprendizagem,
veja os exemplos a seguir.
Exemplo
Imagine que um grande lote de peças possui 70% dos itens com algum
tipo de defeito. Construa a distribuição de probabilidades para a
variável aleatória número de itens com defeito dentre 2 itens sorteados
aleatoriamente.
Solução
70%
+ 30%
= 100%
com defeito sem defeito total de itens
www.esab.edu.br 168
Observe que, na situação em que apenas um dos dois itens apresenta
defeito, temos duas possibilidades de ocorrência: sair item bom e item
com defeito ou sair item com defeito e item bom, isso significa que as
probabilidades serão somadas, isto é, 0,21 + 0,21 = 0,42. A Tabela 59 e a
Figura 43 resumem essas observações.
0,42 0,49
0,09
0 1 2
Figura 43 − Distribuição de probabilidade da variável aleatória: número de itens com defeito de um
determinado lote.
Fonte: Elaborada pela autora (2013).
F (x) = P (X ≤ x)
www.esab.edu.br 169
Assim, retomando o exemplo desta unidade sobre as peças defeituosas
de uma produção, teremos a distribuição acumulada de probabilidade
indicada na Tabela 60.
Dessa forma, podemos concluir que 0,51 (ou 51%) dos itens possuem 0
ou 1 defeito. Vejamos, na sequência, o valor esperado.
www.esab.edu.br 170
Para calcularmos o valor esperado e o desvio-padrão de uma dada
distribuição de probabilidades:
n
µx
= ∑(x
i =1
i ⋅ pi )
n
s
= ∑ p ⋅ (x
i =1
i i − µ x )2
www.esab.edu.br 171
O valor esperado e o desvio-padrão dessa distribuição de probabilidades
estão representados na Tabela 63. Vejamos:
Cálculo para
obtenção do Cálculos para o valor do desvio-padrão
x P ( x) valor esperado
xi – pi xi – μx ( xi – μx )2 pi ( xi – μx )2
O desvio-padrão é:
n
s
= ∑ p ⋅ (x
i =1
i i − µx =
)2 = 0, 66
0, 43
Tarefa dissertativa
Caro estudante, convidamos você a acessar o
Ambiente Virtual de Aprendizagem e realizar a
tarefa dissertativa.
www.esab.edu.br 172
27 Distribuição de Bernoulli
Objetivo
Conhecer e determinar a distribuição de Bernoulli.
www.esab.edu.br 173
Em outras palavras, a distribuição de Bernoulli apresenta apenas dois
resultados possíveis: sim (o que desejamos que ocorra) ou não, com
probabilidade de sucesso (de ocorrer um sim) que indicaremos por p.
P (sucesso) = P (1) = p
Em que p é um número compreendido entre 0 e 1. Em decorrência
disso, a probabilidade de fracasso é:
P (fracasso) = P (0) = 1 – p
Ressaltamos que essa justificativa é pautada na definição de probabilidade
e no conjunto complementar de uma probabilidade, vistos na unidade
22. Para que você consiga visualizar melhor esse conhecimento, vamos
ver um exemplo?
Exemplo
Em uma empresa de grande porte sabe-se que 65% dos sócios foram
favoráveis a determinado projeto e 35% foram contra. A probabilidade
de, ao acaso, fazer contato com um dos sócios que foram favoráveis ao
projeto, pode ser escrita através do modelo probabilístico de Bernoulli.
www.esab.edu.br 174
Assim, vamos representar os 65% favoráveis (sucesso) pelo número 1 e os
35% contra (fracasso) por 0. Logo:
0,65
0,35
0 1
Figura 44 − Distribuição de Bernoulli.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 175
Valor esperado e desvio-padrão de uma distribuição
de Bernoulli
O objetivo de encontramos o valor esperado e o desvio-padrão de uma
distribuição de Bernoulli é o mesmo que vimos na unidade anterior para
distribuição de probabilidade discreta: encontrar um único valor médio
que represente a distribuição e a medida de dispersão, respectivamente.
mx = p
Já o desvio-padrão é calculado pela seguinte fórmula:
s= p ⋅ (1 − p ) = p − p2
1 0,65 (p)
www.esab.edu.br 176
Aplicando as respectivas fórmulas, temos que o valor esperado e o desvio-
padrão dessa distribuição são:
Valor esperado:
mx = p = 0,65
Desvio-padrão é:
s= p ⋅ (1 − p ) = 0, 65 ⋅ 0,35 = 0, 23
Estudo complementar
Caro estudante, você pode estudar sobre as
contribuições de Jacob Bernoulli e diversos
outros aspectos da história da Estatística no texto
disponível aqui.
Atividade
Chegou a hora de você testar seus conhecimentos
em relação às unidades 19 a 27. Para isso, dirija-
se ao Ambiente Virtual de Aprendizagem (AVA) e
responda às questões. Além de revisar o conteúdo,
você estará se preparando para a prova. Bom
trabalho!
www.esab.edu.br 177
28 Distribuição binomial
Objetivo
Conhecer e determinar a distribuição binomial.
SS
...S e FF
...
F
x n−x
p ⋅ p ⋅ ... ⋅ p ⋅ (1 − p ) ⋅ (1 − p ) ⋅ ... ⋅ (1 − p ) = p x ⋅ (1 − p )n − x
x vezes de n − x vezes
sucesso
www.esab.edu.br 178
Além dessas duas possibilidades particulares temos ainda a combinação
(possibilidades) de sequências que apresentam sucesso e fracasso
concomitantemente, por exemplo:
n n!
x =
x !(n − x )!
Portanto, temos que a probabilidade determinada por meio do modelo
de distribuição binomial é:
n
P ( x )= ⋅ p x ⋅ (1 − p )n − x ⇒
x
n!
=
P(x ) ⋅ p x ⋅ (1 − p )n − x
x !(n − x )!
Veja agora alguns pressupostos importantes do modelo de distribuição
binomial:
www.esab.edu.br 179
Com base nesses pressupostos, você reparou que mencionamos apenas
dois parâmetros? Os parâmetros n e p. Para identificarmos uma
distribuição binomial, basta sabermos esses dois parâmetros, lembrando
que o valor de x na fórmula é o valor que desejamos obter de sucesso em
cada um dos n experimentos.
Exemplo
Considere que um grande lote de peças possui 60% das peças com algum
tipo de defeito. Com base nessa informação, construa a distribuição de
probabilidades para a variável aleatória número de itens com defeito
dentre 3 sorteados aleatoriamente.
Solução
www.esab.edu.br 180
O exemplo apresentado pode ser representado por uma distribuição
binomial em que os parâmetros n (número de experimentos) e p
(probabilidade) são:
• n = 3 sorteios.
• p = 60% ⇒ 0,6 (peça com defeito, ou seja, sucesso, pois se deseja o
número de peças com defeito).
Assim, se quisermos saber a probabilidade da distribuição binomial P(x)
para x = 0, isto é, zero peça com defeito (fracasso), então:
n!
=
P(x ) ⋅ p x ⋅ (1 − p )n − x ⇒
x !(n − x )!
3!
⇒=P (0) ⋅ 0, 60 ⋅ (1 − 0, 6)3−0 ⇒
0!(3 − 0)!
3!
⇒ P (0) = ⋅ 1 ⋅ (0, 4)3 ⇒ P (0) = 1 ⋅ 1 ⋅ 0,064 ⇒
1 ⋅ 3!
⇒ P (0) = 0,064
Para x = 1 peça com defeito, a probabilidade da distribuição binomial será:
n!
=
P(x ) ⋅ p x ⋅ (1 − p )n − x ⇒
x !(n − x )!
3!
⇒=P (1) ⋅ 0,61 ⋅ (1 − 0,6)3−1 ⇒
1!(3 − 1)!
(3 ⋅ 2 ⋅1)
⇒ P (1) = ⋅ 0,6 ⋅ (0, 4)2 ⇒ P (1) = 3 ⋅ 0,6 ⋅ 0,16 ⇒
1 ⋅ (2 ⋅1)
⇒ P (1) = 0,288
www.esab.edu.br 181
Por fim, para x = 3 peças com defeito, a probabilidade da distribuição
binomial será:
n!
=
P(x ) ⋅ p x ⋅ (1 − p )n − x ⇒
x !(n − x )!
3!
⇒= P (3) ⋅ 0, 63 ⋅ (1 − 0, 6)3−3 ⇒
3!(3 − 3)!
(3 ⋅ 2 ⋅ 1)
=
P (3) ⋅ 0, 216 ⋅ (0, 4)0 ⇒
(3 ⋅ 2 ⋅ 1) ⋅ 1
⇒ P (3) = 1 ⋅ 0, 216 ⋅ 1 ⇒ P (1) = 0, 216
Portanto, as probabilidades determinadas são:
www.esab.edu.br 182
Vamos às respostas? Respondendo à primeira pergunta, temos que a
probabilidade de no máximo uma peça ser defeituosa significa que
queremos as situações em que nenhuma peça, dos 3 sorteios, seja
defeituosa ou que somente uma peça dos 3 sorteios seja defeituosa, isto é,
queremos as somas das probabilidade binomiais de P(0) e P(1). Portanto:
Dica
Você reparou que no cálculo da primeira
probabilidade binomial P(0) bastaria calcular
o último membro da fórmula da binomial,
isto é, bastaria calcular (1 – p)n ? Já na última
probabilidade, em nosso exemplo P(3), bastaria
calcular o segundo membro da fórmula binomial,
ou seja, p x. Volte à resolução desses casos e
observe o desenvolvimento desses cálculos!
www.esab.edu.br 183
Valor esperado e desvio-padrão
O cálculo do valor esperado e do desvio-padrão é análogo ao da
distribuição de Bernoulli que nós vimos na unidade 27. Como
a distribuição binomial é n ensaios de Bernoulli, então devemos
acrescentar esse parâmetro ao cálculo do valor esperado e do desvio-
padrão. Logo:
Valor esperado:
mx = n . p
Desvio-padrão:
s= n ⋅ p ⋅ (1 − p )
Valor esperado:
Desvio-padrão:
s= n ⋅ p ⋅ (1 − p ) = 3 ⋅ 0, 6 ⋅ (1 − 0, 6) =
= 3 ⋅ 0, 6 ⋅ 0, 4 = 0, 72 =
= 0,85 peças
www.esab.edu.br 184
Nesta unidade você aprendeu a calcular as probabilidades binomiais
de um dado experimento aleatório, correto? Determinamos essas
probabilidades a partir de uma fórmula matemática. Na próxima
unidade, conheceremos outro modelo de distribuição de probabilidade
para variáveis discretas: a distribuição de Poisson.
Saiba mais
As probabilidades para algumas binomiais podem
ser encontradas em tabelas nos livros de estatística
ou, atualmente, podem ser geradas através de
softwares e disponibilizadas em documentos
eletrônicos. Veja aqui o vídeo que mostra como
utilizar a distribuição binomial no Excel
www.esab.edu.br 185
29 Distribuição de Poisson
Objetivo
Conhecer e determinar a distribuição de Poisson.
e − np ⋅ (n ⋅ p )x
P(x ) =
x!
www.esab.edu.br 186
Para saber mais sobre o número e, chamado de número de Euler, procure
o ícone Saiba Mais ao final desta unidade.
e −l ⋅ l x
P(x ) =
x!
Em que l = n . p é o número médio de ocorrências em um intervalo de
tempo ou espaço considerado. Em outras palavras, l é o valor esperado.
Além disso, na distribuição de Poisson o valor esperado e o desvio-padrão
são os mesmos, ou seja:
mx = s = l = n . p
Observe alguns exemplos para elucidar esse conhecimento.
Exemplo 1
Resolução
www.esab.edu.br 187
A probabilidade p do experimento refere-se às 240 ligações por hora.
Como 1 hora tem 60 minutos, então vamos escrever o parâmetro p em
função das ligações por minuto. Desse modo:
240
=p = 4.
60
De posse dos parâmetros n = 1 e p = 4, temos l = n . p = 1 . 4 = 4. A
probabilidade de Poisson P(0) será:
e −l ⋅ l x
=
P(x ) ⇒
x!
e −4 ⋅ 40
P (0) =
0!
0,018315 ⋅ 1
P (0) =
1
P (0) 0,02
Portanto, a probabilidade de nenhuma chamada ocorrer em 1 minuto é
aproximadamente 2% (ou 0,02) de chance.
www.esab.edu.br 188
A probabilidade de duas chamadas ocorrerem em 2 minutos é
aproximadamente 6% (ou 0,06).
Exemplo 2
Resolução
e −1 ⋅ 10 0,3679 ⋅ 1
P (0)= ⇒ P (0)= ⇒ P (0)= 0,3679
0! 1
e −1 ⋅ 11 0,3679 ⋅ 1
P (1)= ⇒ P (1)= ⇒ P (1)= 0,3679
1! 1
e −1 ⋅ 12 0,3679 ⋅ 1
P (2)= ⇒ P (2)= ⇒ P (2)= 0,1839
2! 2
Logo:
www.esab.edu.br 189
Estudo complementar
Descubra sobre as contribuições de Leonhard Euler
para o desenvolvimento e o surgimento do número e
no texto “Refletindo sobre o ensino e aprendizagem
do número de Euler”, disponível aqui.
www.esab.edu.br 190
30 Variáveis aleatórias contínuas
Objetivo
Determinar o valor esperado de uma variável aleatória contínua.
www.esab.edu.br 191
1 2
0,5 0,5
1 2
Figura 46 − Distribuição de probabilidade, tabela e histograma.
Fonte: Elaborada pela autora (2013).
8 1 1516 1 2
4 1 14 3
7 2 13 4
6 3 12 5
3 2 11 6
5 4 10 9 8 7
www.esab.edu.br 192
As distribuições de probabilidades, ilustradas em histogramas, são
respectivamente:
0,125
0,125
0,125
0,125
0,125
0,125
0,125
0,125
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,25
0,25
0,25
0,25
1 2 3 4 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
y = f (x )
y Área = 1
(ou 100%)
α β
β −α
Figura 49 − Histograma da variável aleatória contínua.
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 193
Para identificar uma distribuição contínua, existe a função densidade
de probabilidade, que é uma equação do tipo y = f (x). A função
densidade de probabilidade está relacionada com a probabilidade de a
variável aleatória contínua assumir algum resultado possível em um dado
intervalo sob a função densidade. Como vimos na Figura 49, a área sob
a função densidade é igual a 1, então
1
A = (b − a ) ⋅ y ⇒ 1 = (b − a ) ⋅ y ⇒ y = .
b −a
Exemplo
12
9 3
www.esab.edu.br 194
Solução
www.esab.edu.br 195
Portanto, a probabilidade de o ponteiro parar entre um ângulo de 30º e
60º é P(30º < x < 60º) = 0,0833.
b−a
P (a < x < b ) =
b −a
www.esab.edu.br 196
Resumo
www.esab.edu.br 197
31 Distribuição normal
Objetivo
Apresentar, compreender e determinar a distribuição normal.
1 2 2
f ( x, µ,s 2 ) = e −( x − µ ) /2s
s 2p
www.esab.edu.br 198
Em que:
• p = 3,14159...
• e = 2,71828...
Para o cálculo da probabilidade de ocorrência de variáveis normalmente
distribuídas não usaremos a fórmula apresentada anteriormente, mas sim
a Tabela de Probabilidades da Distribuição Normal Padrão, que veremos
mais adiante na unidade 32.
−∞ +∞
www.esab.edu.br 199
• os valores da variável aleatória x mais próximos da média
populacional (m) ocorrem com maior frequência;
• a probabilidade de um valor específico é igual a zero na distribuição
normal;
• a curva da distribuição normal aproxima-se mais do eixo X à medida
que se afasta da média populacional (m) em ambos os lados. Isso
significa que ela se prolonga indefinidamente em quaisquer das
direções, a partir da média populacional (m), mas nunca chega a
tocar o eixo X. Teoricamente os valores possíveis vão de ‒ ∞ a + ∞;
• a área total sob a curva da distribuição normal é igual a 1 ou 100%.
Essa área representa a probabilidade de ocorrência do espaço
amostral (Ω) do experimento que se está analisando. Lembre-se
de que o espaço amostral (Ω) é o conjunto de todos os resultados
possíveis de um experimento aleatório;
• a distribuição normal de probabilidade fica completamente
especificada se conhecemos sua média populacional (m) e seu desvio-
padrão (s), pois existe uma única distribuição normal para cada
combinação de média populacional (m) e desvio-padrão (s);
• a área sob a curva entre dois pontos (intervalo) é a probabilidade de
uma variável normalmente distribuída tomar um valor entre esses
pontos. Os intervalos mais conhecidos são:
• 68,26% dos valores de uma variável aleatória normal estão dentro
de um desvio-padrão positivo ou negativo, com relação à sua
média;
• 95,44% dos valores de uma variável aleatória normal estão dentro
de dois desvios-padrões positivos ou negativos, com relação à sua
média;
• 99,73% dos valores de uma variável aleatória normal estão dentro
de três desvios-padrões positivos ou negativos, com relação à sua
média (LEVIN, 2004).
www.esab.edu.br 200
Na Figura 53, você pode visualizar as áreas correspondentes a esses
desvios-padrões.
68,25%
95,45%
99,73%
x − 3s x − 2 s x − s x x + s x + 2 s x + 3s
Figura 53 – Áreas e desvios-padrões.
Fonte: Adaptada de Bisquerra, Martínez e Sarriera (2004).
www.esab.edu.br 201
A Distribuição z é também conhecida como distribuição normal
padrão, tem média zero (m = 0), e desvio-padrão igual à unidade (s =
1). Qualquer distribuição normal com média populacional (m) e desvio-
padrão (s) conhecidos pode ser transformada (relativizada) e expressa
em termos de z para efeitos de cálculos das suas probabilidades. Para essa
transformação, exprimimos a diferença entre a média populacional e
outro valor da distribuição normal original, e expressamos esse valor em
números de desvios-padrões a contar da média populacional (m). Esse
processo é traduzido matematicamente pela equação a seguir:
x−µ
z=
s
Em que:
www.esab.edu.br 202
A Figura 54 mostra a relação entre o eixo da variável aleatória x e o eixo
da variável padronizada (eixo z). Verifique que para o valor da média
populacional o valor de z é igual a zero.
σ
x
( µ − 2σ ) ( µ − σ ) µ ( µ + σ ) ( µ + 2σ )
z
−2 −1 0 1 2
Figura 54 – Distribuição z.
Fonte: Elaborada pela autora (2013).
Fórum
Caro estudante, dirija-se ao Ambiente Virtual de
Aprendizagem da Instituição e participe do nosso
Fórum de discussão. Lá você poderá interagir com
seus colegas e com seu tutor de forma a ampliar,
por meio da interação, a construção do seu
conhecimento. Vamos lá?
www.esab.edu.br 203
32 Exercícios resolvidos
Objetivo
Apresentar exercícios resolvidos de distribuição normal.
www.esab.edu.br 204
Tabela 71 – Distribuição Normal Padrão.
www.esab.edu.br 205
Fonte: Bussab e Morettin (2002, p. 497).
Exercício 1
www.esab.edu.br 206
obtenha a probabilidade de o número de horas gastas em academia ser
inferior ou igual a 2,5 horas semanais.
Solução
www.esab.edu.br 207
Φ( z )
z
0 zc
A B
z z
0 1,73 −1,73 0 1,73
z
0, 47 1,73
Figura 56 – Cálculo de probabilidades.
Fonte: Bussab e Morettin (2002, p. 178).
www.esab.edu.br 208
Vamos aprender a usar a Tabela 71 utilizando como referência os valores
de z da Figura 56, extraída de Bussab e Morettin (2002).
Passo 1
Passo 2
Passo 3
www.esab.edu.br 209
p (0, 47 ≤ z ≤ 1, 73)= p (0 ≤ z ≤ 1, 73) − p (0 ≤ z ≤ 0, 47)=
= 0, 4582 − 0,1808 = 0, 2774
A probabilidade para z variando entre os valores 0,47 e 1,73 é igual a
0,2774.
Passo 4
www.esab.edu.br 210
33 Aproximação normal à binomial
Objetivo
Determinar a medida de aproximação do modelo de distribuição
normal para o modelo de distribuição binomial.
www.esab.edu.br 211
Lembre-se de que na unidade 28 você estudou a distribuição binomial
e que esse tipo de modelo probabilístico é usado em situações em que
observamos a presença (ou a ausência) de alguma característica (variável)
da população estudada. Normalmente, o interesse está no número
absoluto ou na percentagem de elementos da população que possuem a
característica em estudo.
Exemplo 1
Solução
www.esab.edu.br 212
c. np ≥ 5. Substituindo os valores da fórmula pelos valores do exemplo,
temos: 50 × 0,4 = 20,0 → satisfaz, pois é maior do que 5.
d. n(1 ‒ p) ≥ 5. Substituindo os valores da fórmula pelos valores do
exemplo, temos: 50 (1 ‒ 0,4) = 50 × 0,6 = 30,0 → satisfaz, pois
é maior do que 5.
Como todas as condições foram satisfeitas, podemos usar as fórmulas
=µ np=
es np (1 − p ) para calcular a média e o desvio-padrão:
µ = n ⋅ p = 50 ⋅ 0, 4 = 20
s= np(1 − p )= 50 × 0, 4 × (1 − 0, 4)=
= 20 × 0, 6 = 12 = 3, 46
x − µ 25 − 20
=z = = 1, 45
s 3, 46
www.esab.edu.br 213
Exemplo 2
µ = n ⋅ p = 45 ⋅ 0,55 = 24,75
www.esab.edu.br 214
Logo, a média populacional (m) é igual a 24,75 e o desvio-padrão (s) é 3,34.
x − µ 30,0 − 24, 75 5, 25
=z = = = 1,57
s 3,34 3,34
www.esab.edu.br 215
Tabela 72 – Distribuição Normal Padrão.
www.esab.edu.br 216
Amostragem e inferência
34 estatísticas
Objetivo
Apresentar os conceitos de amostragem e inferência estatísticas.
www.esab.edu.br 217
Para exemplificarmos esses conceitos, selecionamos um texto. Leia-o com
atenção!
www.esab.edu.br 218
Como você pode perceber, é muito difícil obtermos dados de algum
atributo de uma determinada população. Portanto, buscamos esses
dados sempre partindo de uma amostra selecionada por meio de algum
dos métodos vistos nas unidades 3 e 4: amostragem aleatória simples,
amostragem estratificada proporcional, amostragem sistemática e
amostragem por conglomerados.
www.esab.edu.br 219
Para que possamos regular a máquina, necessitamos saber como ela está
se comportando na realidade. Para descobrir, retiraremos uma amostra de
pacotes de café (de tamanho n), usando algum método de amostragem
(por exemplo, amostragem aleatória sistemática). Vamos pesar todos os
pacotes participantes da amostra para ver se a média está variando para
baixo (diminuindo) ou para cima (aumentando).
www.esab.edu.br 220
Para sua reflexão
Reflita sobre as seguintes questões: Porque
é necessário se ter uma amostra aleatória no
momento em que se deseja fazer uma pesquisa
científica? Porque os participantes da amostra
podem mudar, quando se retira duas ou mais
amostras de uma mesma população?
A resposta a essa reflexão faz parte de seu
processo de aprendizagem, que é individual,
assim não precisa ser comunicada ou enviada aos
tutores. Busque no material teórico apresentado
nessa unidade e a unidade 3 as respostas às
questões acima.
www.esab.edu.br 221
35 Distribuições amostrais
Objetivo
Determinar as distribuições amostrais da média e da proporção.
www.esab.edu.br 222
É por causa da variabilidade amostral que a estimação de um parâmetro
populacional com base na estatística amostral não é exata e que sempre
existirá um erro nesse processo de estimação, chamado de erro amostral
(E0 ). Estudaremos o que é estimação na Unidade 36, mas antes
precisamos entender o que é uma distribuição amostral.
www.esab.edu.br 223
Exemplo
Passo 1
n 4
∑X
i ∑X i
1 + 2 + 3 + 4 10
=x =
=i 1 =i 1
= == 2,5
n n 4 4
Passo 2
1 1
∑ − ( ∑ xi ) =
2
s
= xi2 .(30 − 25)
=
n 4
1 5
= =
.(5) = 1, =
25 1,1180
4 4
www.esab.edu.br 224
Passo 3
n 16
i ∑X ∑X i
µ
= = =
=i 1 =i 1
x
n 16
1 + 1,5 + 2 + 2,5 + 1,5 + 2 + 2,5 + 3 + 2 + 2,5 + 3 + 3,5 + 2,5 + 3 + 3,5 + 4
=
16
40
= = 2,5
16
www.esab.edu.br 225
Em que µ x = média da distribuição amostral das médias da amostra.
Veja que a média da Distribuição Amostral das Médias é igual à
média populacional, conforme a primeira propriedade apresentada
anteriormente.
Passo 4
Veja que:
∑x i
2
=
1 + 2, 25 + 4 + 6, 25 + 2, 25 + 4 + 6, 25 + 9 +
+ 4 + 6, 25 + 9 + 12, 25 + 6, 25 + 9 + 12, 25 + 16 =
110
www.esab.edu.br 226
1 ( ∑ )
2
x 1 402
∑ xi − n =
i
s= 2
110 − =
16 16
x
n
1 1600
= 110 −
16 16
1 10
sx = [110 − 100] = = 0, 625 = 0, 7905
16 16
s
Poderíamos ter aplicado a fórmula s x = .
n
s 1,1180 1,1180
s
= x = = = 0, 7905
n 2 1, 4142
Note que chegamos ao mesmo resultado e confirmamos a segunda
propriedade da Distribuição Amostral das Médias.
Dica
Verifique que como só temos duas respostas
possíveis (comprar ou não comprar), estamos
trabalhando com uma distribuição binomial,
estudada na unidade 28.
www.esab.edu.br 227
Quando temos a proporção como estatística da amostra, dizemos que
temos uma distribuição amostral da proporção. Assim, a distribuição
amostral da proporção é a distribuição de probabilidade de todos os
valores possíveis da proporção da amostra (p).
k
p=
n
Em que k é o número total de sucessos e n o tamanho da amostra.
=
E ( p) ∑
=
p
p
k
Na qual:
www.esab.edu.br 228
b. O desvio-padrão das proporções das amostras (sp ) é obtido pela
(p )(1 − p ) ( p )(1 − p )
=
fórmula: sp = e a variância por
n n
p (1 − p )
p(1 − p )
=s2 =
n n
Em que: n é o tamanho da amostra e p a proporção populacional
(parâmetro)
Exemplo
Solução
www.esab.edu.br 229
Tabela 75 – Memória de cálculo da Distribuição Amostral.
NÚMERO DE PROPORÇÃO DE SUCESSO
AMOSTRA
SUCESSO (k) (p)
S1,N2 1 0,50
S1,N3 1 0,50
S1,S4 2 1,00
N2,N3 0 0,00
N2,S4 1 0,50
N3,S4 1 0,50
_ ∑ p = 3,00
∑k = 6 _
Na qual:
=
E ( p) ∑=
p 3,00
=
k 6 0,50
(p )(1 − p )
sp =
n
www.esab.edu.br 230
Na qual p = 0,5 e n = 2, devido à seguinte afirmação presente no
enunciado: “Considere todas as amostras possíveis de tamanho igual a 2”.
Tarefa dissertativa
Caro estudante, convidamos você a acessar o
Ambiente Virtual de Aprendizagem e realizar a
tarefa dissertativa.
www.esab.edu.br 231
Estimação: conceitos e
36 propriedades
Objetivo
Introduzir os conceitos e propriedades de estimação estatística.
www.esab.edu.br 232
Estimativa: é o valor encontrado com a aplicação do estimador. As
estimativas obtidas podem ser pontuais ou intervalares.
www.esab.edu.br 233
a. Não tendenciosidade.
É razoável exigir que um bom estimador tenha sua distribuição de valores
de algum modo centrado no verdadeiro valor q do parâmetro a ser
estimado E (θˆ) = θ em que θˆ é o estimador de q.
b. Variância mínima.
Entre os estimadores não tendenciosos de q, escolhe-se aquele que tenha
menor variância. Uma medida de variabilidade da distribuição de um
estimador de q é dada por seu desvio-padrão, também chamado, no caso,
erro-padrão de θˆ.
k
p=
n
Em que:
• p = proporção;
• k = número de casos de sucesso;
• n = tamanho da amostra.
Vejamos um exemplo para que você compreenda melhor essa definição.
Exemplo 1
www.esab.edu.br 234
Para chegar à proporção solicitada basta dividir a quantidade de pessoas
favoráveis pelo total de pessoas entrevistadas, ou seja,
k 240
p= = = 0, 60 ou 60%.
n 400
Para fazer a estimativa de uma proporção, você deve calcular o erro-
padrão de P, que é determinado pela fórmula:
=
Sp p(1 − p ) / n
Em que:
• Sp : erro-padrão de P;
• p: proporção do atributo;
• n: tamanho da amostra.
Solução
p ± z .S p
www.esab.edu.br 235
O valor de z é retirado da Tabela da Distribuição Normal de acordo
com o nível de confiança desejado. Veremos na unidade 39 como
encontraremos o Intervalo de Confiança para uma proporção.
x ± z ⋅ Sx
x ± t ⋅ Sx
www.esab.edu.br 236
Exemplo 2
S 2,0
=
Sx = = 0,2
n 100
Atividade
Chegou a hora de você testar seus conhecimentos
em relação às unidades 28 a 36. Para isso, dirija-
se ao Ambiente Virtual de Aprendizagem (AVA) e
responda às questões. Além de revisar o conteúdo,
você estará se preparando para a prova. Bom
trabalho!
www.esab.edu.br 237
Resumo
www.esab.edu.br 238
Estimadores de mínimos
37 quadrados e máxima
verossimilhança
Objetivo
Determinar os estimadores pelos métodos de mínimos quadrados e
máxima verossimilhança.
Exemplo
www.esab.edu.br 239
Comparando os valores de X com os valores de Y, verificamos que os
valores de Y são aproximadamente 3 vezes maiores do que os valores de
X. Assim, podemos concluir que o parâmetro θˆ é igual a 3.
X Y 3X Y – 3X (Y – 3X)2
1,2 3,9 3,6 0,3 0,09
1,5 4,7 4,5 0,2 0,04
1,7 5,6 5,1 0,5 0,25
2,0 5,8 6,0 -0,2 0,04
2,6 7,0 7,8 -0,8 0,64
TOTAL 0 1,06
www.esab.edu.br 240
5
∑XY i i
θˆ MQ = i =1
5
∑X i =1
i
2
Usamos sobre o símbolo dos somatórios o valor 5 por ser o tamanho das
amostras observadas pelo engenheiro. Vamos agora substituir os valores
da pesquisa do engenheiro na equação e ver a que resultados chegamos?
∑XY i i
(4, 68 + 7,05 + 9,52 + 11, 60 + 18, 20)
θˆMQ
= =
i =1
5
(1, 44 + 2, 25 + 2,89 + 4,00 + 6, 76)
∑ X i2
i =1
∑XY i i
51,05
θˆMQ
= = = 2,94
i =1
5
17,34
∑ X i2
i =1
www.esab.edu.br 241
Verifique que o valor encontrado está muito próximo de 3, como
havíamos suposto no início do problema.
Exemplo 1
www.esab.edu.br 242
Por meio de outro exemplo presente na obra de Bussab e Morettin
(2002), vamos entender melhor os estimadores de máxima
verossimilhança.
Exemplo 2
L '( p ) = 2 p ⋅ (1 − p ) − p 2 = 0
L '( p ) = 2 p − 2 p 2 − p 2 = 0
L '( p ) =2 p − 3 p 2 =0
L '( p ) = p ⋅ (2 − 3 p ) = 0
www.esab.edu.br 243
a. para p = 0
L’ (p) = p (2 ‒ 3p) = 0
L’ (p) = 0 (2 ‒ 3x0) = 0 (2 ‒ 0) = 0
b. para p = 2/3
L '( p ) = p(2 − 3 p ) = 0
2 2 2 6 2 2
L '( p ) = 2 − 3 ⋅ = 2 − = ⋅ (2 − 2) = ⋅ (0) = 0
3 3 3 3 3 3
www.esab.edu.br 244
38 Exercícios resolvidos
Objetivo
Apresentar exercícios resolvidos de amostragem e estimação.
Exercício 1
Solução
www.esab.edu.br 245
Na sequência, sortear a primeira ficha de forma que esteja dentro
do intervalo de seleção. Supondo que sorteamos o valor 3, então os
próximos números de fichas que participarão da amostra serão:
x = 3,
x + a = 3 + 5 = 8,
x + 2 a = 3 + 2 ⋅ 5 = 13,
...,
x + 999a = 3 + 999 ⋅ 5 = 4998
Exercício 2
www.esab.edu.br 246
Solução
Exercício 3
Solução
www.esab.edu.br 247
Para calcular o tamanho mínimo de amostra (n0), vamos aplicar as
fórmulas apresentadas na unidade 3, usando a teoria de amostragem
apresentada por Magalhães e Lima (2005). Segue:
1 1
=
n0 = = 400
( E0 )² (0,05)²
Exercício 4
Solução:
www.esab.edu.br 248
Tabela 80 – Determinação da quantidade de participantes por departamento
Amostra
Departamento População 15% da população
(arredondada)
(15 × 55)
Administrativo 55 = 8, 25 8
100
(15 × 145)
Produção 145 = 21, 75 22
100
(15 × 25)
Logística 25 = 3, 75 4
100
Total 225 34
www.esab.edu.br 249
39 Intervalos de confiança
Objetivo
Determinar os intervalos de confiança.
www.esab.edu.br 250
0
Intervalo de confiança
De uma média: X ± Zσ σ X
De uma proporção: PD ± Z σ σ p
Temos também que admitir que essas variáveis possam ser aproximadas
da distribuição normal. Portanto, as condições apresentadas na unidade
33 devem ser satisfeitas.
www.esab.edu.br 251
p (1 − p )
P (1 − P ) / n ou s p =
Sp =
n
Na qual:
Exemplo
Solução
P x=
= n
240 = 0, 60
400
www.esab.edu.br 252
Como desconhecemos a proporção da população (p), substituiremos os
valores do enunciado do exemplo na fórmula de cálculo do erro-padrão
da P. Segue:
S=
p P (1 − P ) / n= 0, 6 × (1 − 0, 6) / 400
=
= =
0, 0006 0, 0245
www.esab.edu.br 253
Intervalos de confiança para média (m) – amostras
grandes
Quando a amostra é grande (n ≥ 30), podemos adotar que a variável em
análise possui um comportamento de distribuição normal. Dessa forma,
podemos usar na construção desse tipo de intervalo a fórmula do erro-
padrão para a média amostral, já apresentada na unidade 36 e a seguir:
S s
=Sx = ou s x
n n
Na qual:
Na qual:
• x : média amostral;
• Z: valor padronizado;
• m: média populacional;
• Sx: erro-padrão da média amostral.
Vamos novamente mostrar como pode ser resolvido um problema com
esse teor por meio de um exemplo.
www.esab.edu.br 254
Exemplo
S 7200 7200
=
Sx = = = 720
n 100 10
x ± z ×=
Sx 35.500 ± 1,96 × =720 35.500 ± 1.411, 20
ou
34.088,80 ≤ µ ≤ 36.911, 20
www.esab.edu.br 255
Estudo complementar
Vimos nesta unidade o conceito e exemplos de
intervalos de confiança para a proporção e para
média quando se possui uma amostra grande.
Agora aprenda um pouco mais sobre esse assunto
assistindo o vídeo ‘Intervalo de Confiança’,
disponível aqui.
www.esab.edu.br 256
40 Teste de hipóteses: introdução
Objetivo
Introduzir os conceitos básicos sobre testes de hipóteses.
www.esab.edu.br 257
Exemplo 1
Exemplo 2
Exemplo 3
Para poder ser usada em testes estatísticos, essa forma de escrever uma
hipótese deve ser transformada em uma expressão matemática. Nessas
expressões, você deve usar a notação dos parâmetros − média, proporção
e variância. Assim, as hipóteses anteriores devem ser reescritas da seguinte
forma:
Exemplo 1
H0 : pA ≥ pB
www.esab.edu.br 258
H1 : a proporção de vendas da Filial A é menor do que a proporção de
vendas da Filial B.
H1 : pA < pB
Exemplo 2
H0 : m = 55
H1 : o peso médio das mulheres brasileiras é diferente de 55 kg.
H1 : m ≠ 55
Exemplo 3
H0 : s ≤ 20
H1 : a variação da dosagem de um remédio para dor de cabeça é maior do
que 0,20 microgramas.
H1 : s > 20
Essas são as três possibilidades de sinais usados nos conjuntos de
hipóteses nula e alternativa. Verifique que na hipótese nula sempre há o
sinal de igualdade.
www.esab.edu.br 259
• Probabilidade de significância (p): é um valor obtido em função
da distribuição de probabilidades do resultado alcançado com a
amostra: “[...] é a probabilidade de a estatística do teste acusar um
resultado tão ou mais distante do esperado por H0 como resultado
da amostra observada” (BARBETTA, 2008, p. 184).
• Nível de significância (a): é o valor da probabilidade tolerável do
pesquisador incorrer em um Erro Tipo I. (BUSSAB; MORETTIN,
2002). Também é chamado de nível de confiança (LEVIN, 2004,
p. 154).
• Erro Tipo I (a): consiste em rejeitar a hipótese nula, sendo ela
verdadeira.
• Erro Tipo II (b): consiste em aceitar a hipótese nula, sendo ela falsa.
O Nível de significância (a) é utilizado na decisão do teste de hipótese
de acordo com a seguinte regra, chamada de Regra de decisão: se a
Probabilidade de significância (p) é maior que o Nível de significância
(a), deve-se aceitar a hipótese nula; se a Probabilidade de significância
(p) é menor ou igual ao Nível de significância (a), deve-se rejeitar a
hipótese nula.
Exemplo
www.esab.edu.br 260
de significância (p) igual a 0,002 (0,2%) usando a tabela da distribuição
que está sendo utilizada pelo teste em aplicação. Nesse caso, aplicando a
Regra de Decisão apresentada previamente, podemos rejeitar a Hipótese
Nula (H0) em favor da Hipótese Alternativa (H1), pois o valor da
probabilidade de se cometer um Erro Tipo I, encontrado com os dados
da amostra, foi muito menor (0,002) do que o pesquisador decidiu como
tolerável/aceitável (0,05) de cometer esse tipo de erro.
Decisão do Teste
Situação de H0
Aceita H0 Rejeita H0
Verdadeira Decisão correta Erro Tipo I
Falsa Erro Tipo II Decisão correta
z = −1,96 0 z = +1,96
Valores críticos
Figura 58 – Representação da Zona de aceitação, Zona de rejeição e Valores críticos.
Fonte: Adaptada de Levin (2004).
www.esab.edu.br 261
Como você pode verificar, estamos usando a Curva de Gauss (curva
da distribuição normal), pois admitimos que as variáveis que usamos
nos testes de hipótese possuem uma distribuição normal. Verifique que
a região que corresponde a 95% da área interna da Curva de Gauss, e
que está afastada 1,96 desvio-padrão da média, é chamada de zona de
aceitação da hipótese nula. As áreas que estão fora dos 95% da área
interna da Curva de Gauss – ou seja, que correspondem a 2,5% da área
interna da Curva de Gauss (uma área do lado direito e outra do lado
esquerdo da curva) – são chamadas de zona de rejeição da hipótese nula.
A zona de rejeição também é chamada de região crítica.
www.esab.edu.br 262
Etapas para realizar um teste de
41 hipótese
Objetivo
Apresentar as etapas para realizar um teste de hipótese.
www.esab.edu.br 263
Dica
Se ficar em dúvida sobre os significados do
conceito de estimador, retorne à unidade 36, e
sobre os conceitos de nível de significância, Erro
Tipo I, valores críticos, zona de aceitação e zona de
rejeição, retorne à unidade 40.
x−µ
z=
s
A quinta etapa consiste em identificar os valores críticos, a zona de
aceitação e zona de rejeição (ou região crítica). Encontrar o valor da
Probabilidade de Significância (p) é a sexta etapa do teste de hipótese.
Por exemplo, se estivermos trabalhando com uma variável que admitimos
possuir uma distribuição normal, esse valor será retirado da Tabela de
Distribuição Normal Padrão (Tabela 71 vista na unidade 32).
www.esab.edu.br 264
Na sétima etapa, devemos comparar o valor encontrado da probabilidade
de significância com o nível de significância para tomar a decisão do teste
(regra de decisão), que poderá ser “aceitar a hipótese nula” ou “rejeitar a
hipótese nula”. Essa hipótese será rejeitada caso a estatística do teste estiver
dentro da região crítica. E, de forma análoga, a hipótese será aceita caso a
estatística do teste não esteja dentro da Região Crítica.
Exemplo
www.esab.edu.br 265
Solução
H0 : m = 50
H1 : m ≠ 50
s 4
s
= x = = 0,8
n 25
www.esab.edu.br 266
Na qual:
• s = 4 kg
• n = 25 parafusos
4
sx
= = 0,8
25
• x = 48 kg
• m = 50 kg
• s x = 0,8
48 − 50 2
z= =
− =
−2,5
0,8 0,8
Agora, na quinta etapa, identificamos que o valor crítico, que limita
as zonas de aceitação e de rejeição, é z ± 2,5. A zona de aceitação está
representada pela área limitada por z = – 2,5 e z = + 2,5, ou seja, a
área entre esses dois valores de z. A zona de rejeição ou região crítica
está representada pelas seguintes áreas: inferior a z = – 2,5 e superior a
z = + 2,5.
www.esab.edu.br 267
significância (p), o qual será comparado ao valor do nível de significância
(a) na sétima etapa de aplicação do teste de hipótese, que consiste em
aplicar a regra de decisão (que já foi apresentada na unidade 40).
Para ter outra visão desse assunto, você pode estudar o Capítulo 12
de Bussab e Morettin (2002) referente aos Testes de Hipóteses. Na
próxima unidade, você estudará a diferença entre os testes de hipótese
considerados unilaterais e os testes bilaterais.
www.esab.edu.br 268
42 Testes bilaterais e unilaterais
Objetivo
Conhecer e aplicar os testes bilaterais e unilaterais.
www.esab.edu.br 269
Na Figura 59 a seguir, você pode verificar pelos gráficos da Curva de
Gauss as áreas que correspondem às regiões críticas ou zonas de rejeição
do teste de hipótese.
Região
Direita Esquerda Ambos os lados
Crítica
Prova Unilateral Unilateral Bilateral
Representação
gráfica
H0 H1 H1 H0 H1 H0 H1
H1 : m ≠ 50
H1 : pA < pB
www.esab.edu.br 270
Esse é o teste unilateral à esquerda, pois somente a cauda esquerda da
Curva de Gauss está participando do teste de hipótese.
Ou:
H0 : s ≤ 20
H1 : s > 20
www.esab.edu.br 271
controle, isto é, se m = 500 g ou não. Se uma dessas amostras apresentasse
uma média x = 492 g, você pararia ou não a produção para regular a
máquina (BUSSAB; MORETTIN, 2002, p. 332)?
H0 : m = 500 g
H1 : m ≠ 500 g
Logo, temos um teste bilateral, uma vez que utilizamos nas hipóteses os
sinais = e ≠, significando que estamos trabalhando com as duas caudas da
Curva de Gauss. Veja a representação na Figura 60.
www.esab.edu.br 272
Exemplo de enunciado de teste unilateral à esquerda
Uma estação de televisão afirma que 60% dos televisores estavam ligados
no seu programa especial na última segunda-feira. Uma rede competidora
deseja contestar essa informação e decide usar uma amostra de 200
famílias para o teste. Qual deve ser o procedimento adotado para avaliar a
veracidade da afirmação da estação (BUSSAB; MORETTIN, 2002)?
H0 : p ≥ 0,60
H1 : p < 0,60
α = 5%
0,544 p̂
Figura 61− Representação da área do teste unilateral à esquerda.
Fonte: Bussab e Morettin (2002, p. 336).
www.esab.edu.br 273
Dica
Observe que usamos a percentagem transformada
em número decimal (60% = 0,60) nas hipóteses.
Isso acontece porque ao escrevermos as hipóteses
de forma matemática, não podemos utilizá-las na
forma de percentagem.
H0 : m ≤ 300 min
www.esab.edu.br 274
RA
RC
www.esab.edu.br 275
Resumo
www.esab.edu.br 276
Teste de hipótese para média e
43 teste para proporção
Objetivo
Conhecer e aplicar o teste de hipótese para média com variância
conhecida e teste para proporção.
Exemplo
www.esab.edu.br 277
Como vimos na unidade 41, para realizar um teste de hipótese, em
primeiro lugar, devemos identificar a afirmação que será testada (H0)
no enunciado do problema e, logo em seguida, identificar a hipótese
alternativa (H1). Assim, no nosso exemplo teremos:
• H0: O peso médio dos pacotes de café enchidos pela máquina é igual
a 500 g.
• H1: O peso médio dos pacotes de café enchidos pela máquina é
diferente de 500 g.
Na segunda etapa da aplicação do teste de hipótese, você deverá
escrever a hipótese nula (H0) e a hipótese alternativa (H1) em termos
matemáticos. Elas serão:
• H0: m = 500 g
• H1: m ≠ 500 g
Continuando a aplicação do teste de hipótese, na terceira etapa, você
deverá escolher o nível de significância (a) do teste. Vamos adotar o valor
de a = 1%, conforme Bussab e Morettin (2002).
www.esab.edu.br 278
Com o valor do desvio-padrão da distribuição amostral, vamos usar
agora a fórmula:
x−µ 492 − 500
z = = = − 1, 60
sx 5
Zona de aceitação
z = −2,58 0 z = +2,58
Valores críticos
www.esab.edu.br 279
Tabela 81 – Distribuição Normal Padrão.
www.esab.edu.br 280
Lembre-se de que, como estamos trabalhando com um teste bilateral,
devemos subtrair do valor 0,5000 o valor de p encontrado na tabela. Na
Tabela 81, encontramos o valor 0,4950 que subtraindo de 0,500 resulta
0,005 (o valor desejado de a). Agora, identificaremos o valor de z que
corresponde a p = 0,4950 da seguinte forma: do local onde está o valor
0,4950, na mesma linha identificamos a casa inteira e a primeira casa
decimal de z e na mesma coluna identificamos a segunda casa decimal de
z. O valor de z composto é igual a 2,58. Esse valor é o valor crítico.
www.esab.edu.br 281
43.2 Teste de hipótese para proporção
De forma semelhante, vamos estudar a aplicação desse tipo de teste
usando um exemplo apresentado na unidade 42.
Exemplo
• H0: p ≥ 0,60
• H1: p < 0,60
Continuando a aplicação do teste de hipótese, na terceira etapa, você
deverá escolher o nível de significância (a) do teste. Vamos adotar o valor
de a = 5%, conforme Bussab e Morettin (2002).
www.esab.edu.br 282
Na quarta etapa identificamos o valor da estatística do teste. Como
estamos trabalhando com o estimador proporção p, vamos calcular a
estatística do teste usando a fórmula:
pˆ − p
z=
p.q
n
Em que:
• p̂ = proporção amostral;
• p = proporção populacional;
• q = 1 – p;
• n = tamanho da amostra.
O valor de p̂ é calculado com a fórmula p̂ = número de sucessos/n.
pˆ − p (104 / 200) − 0, 60
=z = =
p.q 0, 60.(1 − 0, 60)
n 200
0,52 − 0, 60 −0,08
= = = −2,31
0, 60.(0, 40) 0, 24
200 200
www.esab.edu.br 283
Zona de rejeição Zona de aceitação
α = 5%
z = −1,65 z
Valor crítico
www.esab.edu.br 284
Nesta unidade você estudou dois tipos de testes de hipótese, o teste para
média com variância conhecida e o teste de hipótese para proporção.
Também verificou que o primeiro teste de hipótese estudado é um
caso específico – variância conhecida, que é mais difícil de ocorrer na
realidade de nossas pesquisas, pois normalmente desconhecemos a
variância. No segundo tipo de teste de hipótese para proporção, lembre-
se de que, antes de usá-lo, você deve possuir as proporções amostral e
populacional. Na unidade seguinte, vamos resolver alguns exercícios
relacionados com esses dois tipos de testes estudados.
www.esab.edu.br 285
44 Exercícios resolvidos
Objetivo
Apresentar exercícios resolvidos de testes de hipótese para a média
com variância conhecida e testes para proporção.
Exercício 1
Solução
www.esab.edu.br 286
Em primeiro lugar, devemos identificar a hipótese nula (H0) e a hipótese
alternativa (H1). Assim, no nosso exemplo, teremos:
• H0: m = 60
• H1: m ≠ 60
Continuando a aplicação do teste de hipótese, identificamos, no
enunciado do problema, o valor de a = 5%.
x−µ
z=
s
www.esab.edu.br 287
Porém, não é dado no enunciado do problema o valor do desvio-padrão
(nem o amostral nem o populacional). Assim, antes de usar a fórmula
anterior, devemos encontrar o valor do desvio-padrão. Verifique
que no enunciado há a seguinte afirmação: “variância sempre igual a
400 horas2/ homem”, que expressa matematicamente é s2 = 400 h2.
Levando em consideração essa informação, assumimos que, para todo
o valor de m, a média x de 9 indústrias terá a distribuição N (m, 400/
9), de modo que o desvio-padrão (ou erro-padrão) de x é s x = 6, 7.
Substituímos na fórmula:
x−µ 50 − 60
z= = = −1, 49
s 6, 7
Zona de aceitação
z = −1,96 0 z = +1,96
Valores críticos
www.esab.edu.br 288
Tabela 82 – Distribuição Normal Padrão.
www.esab.edu.br 289
Procure, na parte central da Tabela 82, o valor de probabilidade que
subtraído de 0,5000 resulta em um valor o mais próximo possível de
0,025 (valor de a). Lembre-se que, como estamos trabalhando com
um teste bilateral, devemos subtrair do valor 0,5000 do valor de p
identificado na tabela. Encontramos, na Tabela 82, o valor 0,4750, que
subtraído de 0,5000 resulta no valor 0,025 (exatamente o valor de a).
www.esab.edu.br 290
Agora, use o que você aprendeu sobre o conteúdo apresentado na unidade
43, referente ao teste para proporção, para resolver o problema a seguir.
Exercício 2
Solução
• H0: p ≥ 0,20
• H1: p < 0,20
O nível de significância (a) do teste é a = 10%, conforme mencionado
no enunciado do exercício.
www.esab.edu.br 291
Em que:
• p̂ = proporção amostral;
• p = proporção populacional;
• q = 1 – p;
• n = tamanho da amostra.
Substituindo os valores do enunciado na fórmula anterior, obtemos o
seguinte valor de z:
pˆ − p 0, 27 − 0, 20
=z = =
p.q 0, 20.(1 − 0, 20)
n 50
0,07 0,07
= = 1, 25
0,16 0,0032
50
Na sequência, vamos identificar, no gráfico, o Valor Crítico, a Zona de
Aceitação e a Zona de Rejeição (ou Região Crítica). Você pode verificar
esses valores na Figura 66.
Zona de aceitação
Zona de rejeição
RC
Valor crítico
www.esab.edu.br 292
Para encontrar o Valor Crítico, usaremos a Tabela de Distribuição
Normal Padrão (Tabela 82). Vamos procurar, na parte central da Tabela,
o valor de probabilidade que subtraído de 0,500 resulta em um valor
mais próximo possível de 0,10 (valor de a). Assim, encontramos o valor
de p = 0,4015, que subtraído de 0,5000 resulta 0,0985, e arredondado
para 2 casas decimais é 0,10. Do local em que está o valor 0,4015,
identificamos a casa inteira e a primeira casa decimal de z (na mesma
linha) e a segunda casa decimal de z (na mesma coluna), compondo o
valor de z igual a 1,29.
www.esab.edu.br 293
45 Teste t-Student
Objetivo
Aplicar o teste t-Student.
www.esab.edu.br 294
Temos mudança na quarta etapa – identificação da estatística do teste.
Quando a amostra for pequena (n < 30), usaremos a Distribuição
t-Student no lugar da Distribuição Normal para encontrar a estatística
do teste de hipótese, que é o valor de t-Student, obtido usando a seguinte
expressão (BUSSAB; MORETTIN, 2002, p. 348):
x −µ x −µ
=t =
Sx S/ n
Em que:
• x : média amostral;
• m: média populacional;
• Sx: erro-padrão da média amostral;
• S: desvio-padrão da amostra;
• n: tamanho da amostra.
Outra mudança ocorre na sexta etapa de aplicação do teste que consiste
na identificação do valor da Probabilidade de Significância (p). Porém,
nesse tipo de teste de hipótese, buscaremos o valor de t-Student para
usá-lo na comparação com nível de significância (a) adotado, ao invés
de buscar o valor da Probabilidade de Significância (p) como nos demais
testes já apresentados na unidade 43.
www.esab.edu.br 295
Tabela 83 – Distribuição t-Student.
www.esab.edu.br 296
Com o valor encontrado de grau de liberdade (gl), vamos usar a Tabela
83 na qual você buscará identificar a linha do grau de liberdade calculado
e a coluna do nível de significância (a) adotado. Na intersecção da
linha com a coluna identificada anteriormente, você encontrará o valor
t-Student.
www.esab.edu.br 297
O teste permite que, para cada amostra, tenhamos um conjunto de
dados coletados e que cada amostra tenha um tamanho (n) diferente ou
igual. Mas, para aplicar essa versão do teste t-Student, devemos conhecer
os valores da média amostral ( x ), do desvio-padrão amostral (S) e o
tamanho da amostra (n) de cada grupo em estudo, ou seja, das duas
amostras em estudo.
Dica
Relembre como se calcula a média amostral
apresentada na unidade 11 – medidas de
tendência central – e como encontrar o desvio-
padrão da amostra visto na unidade 14 – medida
de dispersão.
x1 x2
(n1 − 1)S12 + (n2 − 1)S22 1 1
n1 + n2 − n1 n2
Em que:
• x1 : média da amostra 1;
• x 2 : média da amostra 2;
• n1: tamanho da amostra 1;
• n2: tamanho da amostra 2;
• S1: desvio-padrão da amostra 1;
• S2: desvio-padrão da amostra 2.
www.esab.edu.br 298
Na identificação do grau de liberdade (gl), que ocorre na sexta etapa da
aplicação do teste de hipótese, usaremos a seguinte fórmula encontrada
em Bisquerra, Martínez e Sarriera (2004, p. 92):
gl = n1 + n2 ‒ 2.
Considerando:
( ∑ d )2
−∑d 2
d =
x1 − x 2 e Sd = n .
n −1
www.esab.edu.br 299
Sendo:
• t: valor de t-Student;
• d : média das diferenças entre cada par de amostras;
• x1 : média amostra 1;
• x 2 : média amostra 2;
• d: diferença entre as médias;
• Sd: desvio-padrão das diferenças entre cada par de amostras;
• n: tamanho das amostras.
Para identificar o grau de liberdade, será utilizada a fórmula: gl = n – 1
(BISQUERRA; MARTÍNEZ; SARRIERA, 2004, p. 96). Em que: gl:
grau de liberdade; n: tamanho da amostra.
www.esab.edu.br 300
Estudo complementar
Vimos nesta unidade os principais conceitos e
como aplicar o ‘Teste de Hipóteses t-Student’
usando a Tabela da distribuição t-Student. Veja
como usar o Excel para aplicar um Teste de
Hipóteses t-Student ’ no vídeo intitulado ‘Como
fazer um teste “T” no Excel’, clicando aqui.
www.esab.edu.br 301
46 Teste Qui-Quadrado
Objetivo
Aplicar o teste Qui-Quadrado
www.esab.edu.br 302
c. fórmula do grau de liberdade (gl);
d. tabela da distribuição Qui-Quadrado.
Usaremos, para encontrar o valor crítico, a Tabela da Distribuição Qui-
Quadrado (MORETTIN, 2010, p. 348). Veja a Tabela 84.
www.esab.edu.br 303
No topo da Tabela 84, consta uma representação do formato da curva
Qui-Quadrado, observe que essa distribuição não é simétrica em relação
à média dos dados, como a distribuição normal. Na Tabela 84, a coluna
do grau de liberdade (gl) está identificada pelo seguinte símbolo – φ/ a.
(o − e )2
χ =∑
2
Em que:
• χ2: Qui-Quadrado;
• o: frequência observada;
• e: frequência esperada (BISQUERRA; MARTÍNEZ; SARRIERA
2004, p. 102).
Precisamos do grau de liberdade para usar a Tabela 84 da Distribuição
Qui-Quadrado. O grau de liberdade é obtido com a fórmula: gl = (l – 1)
(c – 1).
www.esab.edu.br 304
Com o valor do nível de significância (a) e com o valor do grau
de liberdade (gl), vamos retirar da Tabela 84 (de Distribuição Qui-
Quadrado ) o valor crítico de χ2, que limitará a zona de rejeição da
hipótese nula.
Exemplo
www.esab.edu.br 305
Solução:
www.esab.edu.br 306
Dica
Veja que em cada célula colocamos uma letra
como forma de identificá-la, isso é feito com a
finalidade de não misturar os valores na hora do
cálculo.
www.esab.edu.br 307
Vamos agora calcular a estatística χ2 para essa situação usando a fórmula
a seguir:
(o − e )2 (o − e )2 (o − e )2 (o − e )2 (o − e )2
χ 2
=∑ = + + +
e e e e e
(100 − 125) (900 − 875) (150 − 125) (850 − 875)2
2 2 2
χ2 = + + +
125 875 125 875
( −25) (25) (25) ( −25)
2 2 2 2
χ2 = + + +
125 875 125 875
625 625 625 625
χ2 = + + +
125 875 125 875
χ2 = 5 + 0, 71 + 5 + 0, 71 = 11, 42
Assim, o valor de χ é 11,42.
2
gl = (l − 1) ⋅ (c − 1) = (2 − 1) ⋅ (2 − 1) = 1
www.esab.edu.br 308
Tabela 87 – Distribuição χ 2 de Qui-Quadrado
gl
α
Fonte: Morettin (2010, p. 347).
www.esab.edu.br 309
a decisão será apresentada da seguinte forma: existe evidência suficiente
para garantir a rejeição de que o uso do hospital independe do sexo do
paciente.
www.esab.edu.br 310
47 Exercícios resolvidos
Objetivo
Apresentar exercícios resolvidos sobre testes de hipótese utilizando os
testes t-Student e Qui-Quadrado.
Exercício 1
“Um fabricante afirma que seus cigarros contêm não mais que 30 mg de
nicotina. Uma amostra de 25 cigarros fornece uma média de 31,5 mg e
um desvio-padrão de 3 mg. No nível de 5%, os dados refutam ou não a
afirmação do fabricante?” (BUSSAB; MORETTIN, 2002, p. 349).
Solução
• H0: m1 ≤ 30 mg
• H1: m1 > 30mg
www.esab.edu.br 311
Para identificar o valor da estatística do teste, vamos substituir os valores
=x 31,5, = µ 30, = S 3= e n 25 na fórmula a seguir:
x − µ x − µ 31,5 − 30 1,5
t= = = =
− =
2,5
Sx S/ n 3 / 25 0, 6
Vamos identificar o grau de liberdade (gl) para que se possa usar a Tabela
83 de Distribuição t-Student usando a seguinte fórmula: gl = n – 1 = 25 –
1 = 24.
www.esab.edu.br 312
Na intersecção da linha com a coluna identificada, você encontrará o
valor t-Student desejado nessa etapa, que é igual a 2,064.
Exercício 2
Solução
• H0 : A média das notas dos meninos é igual a média das notas das
meninas.
• H1: A média das notas dos meninos é diferente da média das notas
das meninas.
Agora, escrevemos as hipóteses em termos matemáticos. Elas serão:
• H0: m1 = m2
• H1: m1 ≠ m2
www.esab.edu.br 313
Para aplicar a fórmula da estatística t, antes devemos calcular a média
e o desvio-padrão de cada uma das amostras. Usando as fórmulas
apresentadas na unidade 11 (média) e na unidade 14 (desvio-padrão),
chegamos aos seguintes resultados:
= =
x1 5,83; x 2 6,= =
63; S1 1, 47 e S2 2,16.
5,83 − 6, 63
t=
( 6 − 1) .1, 47 2 + (6 − 1).2,16 2 1 1
+
6+6−2 6 6
−0,80
t=
10,8045 + 23,3280 2
.
10 6
−0,80 −0,80
=t =
34,1325 2 1,13775
.
10 6
−0,80
t= = −0, 7500091 =
−0, 75
1,0666536
www.esab.edu.br 314
A seguir, vejamos um exercício relacionado ao teste t-Student para
comparação entre duas médias com amostras com dados relacionados,
assunto que estudamos na unidade 45.
Exercício 3
Solução
• H0: m1 = m2
• H1: m1 ≠ m2
Para aplicar a fórmula da estatística t, antes devemos calcular a média da
diferença (d ) e o desvio-padrão da diferença (Sd), vamos usar a Tabela 88
para organizar o nosso raciocínio:
www.esab.edu.br 315
Tabela 89 – Organização dos dados.
X 6 7 5 8 5 4 ∑ = 35
Y 6 7 8 9 5 3 ∑ = 38
d 0 0 -3 -1 0 1 ∑= −3
d2 0 0 9 1 0 1 ∑ = 11
Fonte: Adaptada de Bisquerra, Martínez e Sarriera (2004).
=
x1
∑ X=
35
= 5,83
n 6
x=
∑Y= 38
= 6,33
2
n 6
d =x1 − x 2 =
5,83 − 6,33 =
− 0,5
(∑ d )
2
( −3)2
∑d n
11 − 2
6
−
11 − 1,5
=Sd = = = 1,9
n −1 6 −1 5
d −0,5 −0,5
t= = = = −0,89
Sd / n 1,378 / 6 0,56
O valor crítico de t é obtido, na Tabela 88, com gl = n – 1 = 6 – 1 = 5 e
a/ 2 = 5% (igual a 10%/2, porque o teste é bicaudal). Assim, t crítico é
igual a 2,571.
www.esab.edu.br 316
Exercício 4
Solução
Veja que, para usar a fórmula anterior, necessitamos dos totais das linhas
e das colunas da Tabela 89. Então, vamos adaptá-la, acrescentando os
totais necessários. Observe a Tabela 90 que mostra o resultado.
www.esab.edu.br 317
Tabela 91 – Distribuição dos dados coletados.
(o − e )2 (o − e )2 (o − e )2 (o − e )2 (o − e )2
χ2 = ∑ = + + +
e e e e e
6, 25 6, 25 6, 25 6, 25
χ2 = + + +
7,5 12,5 7,5 12,5
www.esab.edu.br 318
Agora, vamos identificar o grau de liberdade usando a fórmula:
gl = (l − 1).(c − 1) = (2 − 1).(2 − 1) = 1
www.esab.edu.br 319
Na Tabela 91, a coluna do grau de liberdade está identificada pelo seguinte
símbolo - φ/ a. Como o valor calculado da estatística é menor (χ2 = 2,66)
do que o valor encontrado na Tabela (χ2 = 3,841), a decisão será de aceitar
a H0. Por isso, a decisão será apresentada da seguinte forma: não existe
evidência suficiente para garantir a rejeição de que a orientação política
independe do uso de métodos na educação de crianças.
Tarefa dissertativa
Caro estudante, convidamos você a acessar o
Ambiente Virtual de Aprendizagem e realizar a
tarefa dissertativa.
www.esab.edu.br 320
48 Exercícios resolvidos
Objetivo
Apresentar exercícios resolvidos sobre testes de hipótese das
unidades 42 a 46 .
Exercício 1
www.esab.edu.br 321
Solução
• H0: A duração média das viagens é igual ou menor que 300 minutos.
• H1: A duração média das viagens é maior do que 300 minutos.
Escritas em termos matemáticos ficam:
x −µ
t=
Sx
Sendo:
• x = 314
• m = 300
=
• Sx S=
/ n 30 / 10
x − µ 314 − 300 14
=
• t = = = 0,147
S/ n 30 / 10 9, 49
www.esab.edu.br 322
Com o valor encontrado de grau de liberdade (gl), vamos usar a Tabela de
Distribuição t-Student para identificar a linha do grau de liberdade calculado
e a coluna do nível de significância (a) adotado. Veja a Tabela 92:
www.esab.edu.br 323
Na intersecção da linha com a coluna identificada anteriormente, você
encontrará o valor crítico de t-Student. que é igual a 2,262.
Exercício 2
Solução
www.esab.edu.br 324
Vamos resolver o problema iniciando pela construção das hipóteses:
• H0: m1 = m2
• H1: m1 ≠ m2
Esse exercício também é um teste de hipótese bilateral, já que
trabalharemos com o sinal de diferente na hipótese alternativa. Para
aplicar a fórmula da estatística t, antes devemos calcular a média
e o desvio-padrão de cada uma das amostras. Usando as fórmulas
apresentadas na unidade 11 (média) e na unidade 14 (desvio-padrão)
chegamos aos seguintes resultados:
= =
x1 1,33; =
x 2 4,5; S1 0, 48=
e S2 0,76.
x1 − x 2
t=
(n1 − 1) ⋅ S12 + (n2 − 1) ⋅ S22 1 1
⋅ +
n1 + n2 − 2 n1 n2
1,33 − 4,50
t=
(6 − 1) ⋅ 0, 482 + (6 − 1) ⋅ 0, 76 2 1 1
⋅ +
6+6−2 6 6
−3,17 −3,17
=t =
1,152 + 2,888 2 4,04 2
⋅ ⋅
10 6 10 6
−3,17 −3,17
t= = = −8, 64
0, 404.0,333 0,3668
www.esab.edu.br 325
O valor crítico de t é obtido na Tabela 92 com o grau de liberdade
e o nível de significância. Assim, t crítico é igual a 2,228, para
gl = n1 + n2 − 2 = 10 e a / 2 = 5% (igual a 10%/2, porque o teste é
bicaudal).
Exercício 3
www.esab.edu.br 326
Solução
• H0: mA = mB
• H1: mA ≠ mB
Como na hipótese alternativa estamos usando o sinal de diferente,
estamos trabalhando com um teste de hipótese bilateral.
A 80 72 65 78 85 ∑ = 380
B 75 70 60 72 78 ∑ = 355
d 5 2 5 6 7 ∑ = 25
d2 25 4 25 36 49 ∑ = 139
Fonte: Elaborada pela autora (2013).
www.esab.edu.br 327
d = x1 − x 2 = 76 − 71 = 5
(25)2 ( ∑ d )2
∑d − n 139 − 2
5 139 − 125
=Sd = = = 3,5
n −1 5 −1 4
d 5
=t = = 3,19
Sd / n 3,5 / 5
Atividade
Chegou a hora de você testar seus conhecimentos
em relação às unidades 37 a 48. Para isso, dirija-
se ao Ambiente Virtual de Aprendizagem (AVA) e
responda às questões. Além de revisar o conteúdo,
você estará se preparando para a prova. Bom
trabalho!
www.esab.edu.br 328
Resumo
www.esab.edu.br 329
Glossário
Acaso
Significa a ocorrência de algum fato determinado de forma aleatória. O
aleatório (isto é, o acaso) é, grosso modo, causado por diversos fatores
pelos quais perdemos o controle da ocorrência de uma situação ou fato.
É a inexistência de um padrão. R
Aleatoriamente
Significa a ocorrência de algum fato determinado de forma aleatória, isto
é, pelo acaso. O aleatório é, grosso modo, causado por diversos fatores
pelos quais perdemos o controle da ocorrência de uma situação ou fato.
É a inexistência de um padrão. R
Análoga
Diz-se de algo que é semelhante, similar, parecido com outra coisa. R
Área tabelada
É a área que foi usada como base para encontrar o valor da probabilidade
de ocorrência. R
Arredondar
Efetuar o arredondamento de um número usando regras matemáticas.
R
Assimetria
É o contrário da simetria, ou seja, é quando um lado tem uma proporção
maior (ou menor) que o outro lado. R
www.esab.edu.br 330
Assimétrico
É o contrário de simétrico, ou seja, é quando um lado tem uma porção
maior (ou menor) que o outro. R
Axiomas
São verdades inquestionáveis, universalmente válidas, utilizadas como
princípios na construção de uma teoria ou usadas como base para uma
argumentação. R
Boxplot
É um gráfico apropriado para resumir o conjunto de observações de uma
variável quantitativa. R
Caudas
Na Curva de Gauss, são representadas pelas áreas à esquerda e à direita
da posição da média dessa curva. R
Censitária
Vem da palavra “censo”, que é o processo de levantamento de dados para
estudar a população inteira. R
Coloquial
Modo de escrita e fala utilizado na linguagem cotidiana, no nosso dia a
dia. R
Correlação
Dependência entre as funções de distribuição de duas ou mais variáveis
aleatórias, em que a ocorrência de um valor de uma das variáveis favorece
a ocorrência de um conjunto de valores das outras variáveis. R
www.esab.edu.br 331
Curva de Gauss
É o nome da curva da distribuição normal (curva em forma de sino). Foi
utilizada por Carl Gauss, em 1809, em análises de dados astronômicos.
R
Curva normal
Curva que apresenta uma área central em volta dos pontos de maior
frequência localizada no centro da curva, que representa a mídia dos
pontos. R
Dados
Um conjunto (ou mais) de valores numéricos (ou não). R
Dados brutos
Resultados numéricos não organizados obtidos da observação direta de
um fenômeno. R
Derivação
No cálculo, a derivada representa a taxa de variação de uma função. R
Diagrama de Venn
É um desenho ou esquema usado para representar relações entre
conjuntos. R
Escala de Likert
É uma escala em que as respostas para cada item variam segundo o grau
de intensidade: 1 – discordo totalmente, 2 – discordo parcialmente, 3 –
indiferente, 4 – concordo parcialmente e 5 – concordo totalmente. R
www.esab.edu.br 332
Estimador
É uma função matemática por meio da qual se obtém o valor de uma
estatística; é toda estatística amostral que tem um correspondente
parâmetro na população. R
Frequência
Número de vezes que um valor ou um subconjunto de valores do
domínio de uma variável aleatória aparece em uma experiência ou em
uma observação de caráter estatístico. R
Hipótese
É qualquer suposição passível de ser verificada (demonstrada). R
Incerteza
Pode ser compreendida como a falta de certeza ocasionada pela
variabilidade de certo fenômeno. R
Índice
O índice de um elemento representa a ordenação dele de modo a
distingui-lo dos demais elementos da variável em que se está trabalhando.
R
Inferir
Tirar uma conclusão. R
Integração
www.esab.edu.br 333
O processo de integração de uma função, em matemática, é o cálculo da
área delimitada pela curva em um intervalo dessa função. R
Intersecção
É o ponto de cruzamento entre uma linha e uma coluna da tabela de
Distribuição Normal Padrão. R
Justapostos
Significa que estão juntos. Assim, em um gráfico histograma, as barras
estão juntas (grudadas), justapostas. R
Mutuamente exclusivo
Em probabilidade, dizemos que dois eventos quaisquer são mutuamente
exclusivos quando não existem elementos comuns entre eles. Podemos
dizer também que esses eventos são disjuntos. R
Notação
É a forma de identificar ou de escrever um determinado símbolo
matemático. R
Parâmetro
É a medida que descreve certa característica dos elementos da população
de interesse. R
Progressão geométrica
Uma sequência de números reais é chamada de sequência geométrica, ou
Progressão Geométrica (PG), quando cada um de seus termos, a partir
do segundo, é igual ao produto do anterior por uma constante dada,
chamada razão da sequência geométrica. R
www.esab.edu.br 334
Refutar
O mesmo que rejeitar. R
Restritivo
Significa ficar dentro de certos limites. R
Simétrico
Dizemos que uma distribuição é simétrica quando um lado da
distribuição é o reflexo do outro lado. Se considerarmos em valor
percentual, dizemos que um lado tem o mesmo percentual que o outro,
ou seja, cada lado possui 50%. R
Tabela de contingência
Chamamos de tabela de contingência uma tabela que relaciona mais de
uma variável em estudo. Assim, quando relacionamos duas variáveis,
inserimos na primeira linha as categorias de uma variável e na primeira
coluna as categorias da outra variável. Os valores da tabela correspondem
às frequências absolutas de ambas as variáveis. R
Tese
É uma proposição conclusiva. R
Variabilidade
Possibilidade de mudar (de diversificar). R
www.esab.edu.br 335
Variações percentuais sucessivas
A razão entre uma grandeza (ou objeto) em um instante inicial 0 a t,
expressa em percentual, é chamada de variação percentual. Essa variação
percentual será sucessiva quando existir uma sequência sucessiva de
variações percentuais. R
www.esab.edu.br 336
Referências
LEVIN, J. Estatística para ciências humanas. São Paulo: Prentice Hall, 2004.
www.esab.edu.br 337