Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística PDF
Estatística PDF
Estatística PDF
ESTATÍSTICA
AUTORIA:
1
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Módulo de: Estatística
Autoria: Frederico Gomes Carvalhaes
Várias marcas registradas são citadas no conteúdo deste módulo. Mais do que simplesmente listar esses nomes
e informar quem possui seus direitos de exploração ou ainda imprimir logotipos, o autor declara estar utilizando
tais nomes apenas para fins editoriais acadêmicos.
Declara ainda, que sua utilização tem como objetivo, exclusivamente na aplicação didática, beneficiando e
divulgando a marca do detentor, sem a intenção de infringir as regras básicas de autenticidade de sua utilização
e direitos autorais.
E por fim, declara estar utilizando parte de alguns circuitos eletrônicos, os quais foram analisados em pesquisas
de laboratório e de literaturas já editadas, que se encontram expostas ao comércio livre editorial.
2
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
A presentação
Neste módulo você é convidado a aprofundar seus estudos na área da Estatística. Buscou-
se apresentar os principais conceitos e ferramentas estatísticas dentro de uma forma
acessível, objetiva e prática. Foram evitadas demonstrações para não tornar o conteúdo
desgastante e extenso, mas para os interessados em informações mais detalhadas uma
vasta bibliografia é sugerida ao final de nosso módulo. Este material é complementado por
baterias de exercícios disponíveis na plataforma, nas quais se procurou trabalhar com
situações práticas, aplicando a Estatística em casos reais para o perfeito entendimento de
sua importância. Mantenha em dia seus estudos e não deixe acumular dúvidas. Sempre que
preciso, entre em contato comigo. Estarei à disposição para auxiliá-lo na conclusão de mais
esta etapa acadêmica. Sucessos e bons estudos !
O bjetivo
3
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
E menta
S obre o Autor
4
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
S UMÁRIO
UNIDADE 1 ........................................................................................................... 8
Histórico da Estatística ....................................................................................... 8
UNIDADE 2 ......................................................................................................... 11
Métodos Estatísticos ........................................................................................ 11
UNIDADE 3 ......................................................................................................... 14
Fases do Método Estatístico ............................................................................ 14
UNIDADE 4 ......................................................................................................... 17
Variáveis Estatísticas ....................................................................................... 17
UNIDADE 5 ......................................................................................................... 20
Amostragem ..................................................................................................... 20
UNIDADE 6 ......................................................................................................... 25
Principais técnicas da Amostragem ................................................................. 25
UNIDADE 7 ......................................................................................................... 29
Séries Estatísticas ............................................................................................ 29
UNIDADE 8 ......................................................................................................... 32
Gráficos Estatísticos ........................................................................................ 32
UNIDADE 9 ......................................................................................................... 39
Distribuição de Frequência .............................................................................. 39
UNIDADE 10 ....................................................................................................... 43
Elementos de uma Distribuição de Frequência ............................................... 43
UNIDADE 11 ....................................................................................................... 47
Cálculo do número de classes (k) e intervalo de classes (hi) ......................... 47
UNIDADE 12 ....................................................................................................... 49
Medidas de Posição ......................................................................................... 49
UNIDADE 13 ....................................................................................................... 55
5
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Medidas Separatrizes ...................................................................................... 55
UNIDADE 14 ....................................................................................................... 57
Medidas Separatrizes ...................................................................................... 57
UNIDADE 15 ....................................................................................................... 60
Medidas Separatrizes ...................................................................................... 60
UNIDADE 16 ....................................................................................................... 61
Medidas de Dispersão ou Variabilidade .......................................................... 61
UNIDADE 17 ....................................................................................................... 64
Medidas de Dispersão ou Variabilidade .......................................................... 64
UNIDADE 18 ....................................................................................................... 66
O coeficiente de variação (CV) ........................................................................ 66
UNIDADE 19 ....................................................................................................... 67
Escore padronizado (zi) ................................................................................... 67
UNIDADE 20 ....................................................................................................... 69
Medidas de Assimetria ..................................................................................... 69
UNIDADE 21 ....................................................................................................... 74
Medidas de Curtose ......................................................................................... 74
UNIDADE 22 ....................................................................................................... 78
Noções de Probabilidades ............................................................................... 78
UNIDADE 23 ....................................................................................................... 81
Probabilidade ................................................................................................... 81
UNIDADE 24 ....................................................................................................... 84
Exercícios resolvidos envolvendo o cálculo de Probabilidades ...................... 84
UNIDADE 25 ....................................................................................................... 93
Distribuições de Probabilidade ........................................................................ 93
UNIDADE 26 ....................................................................................................... 98
Distribuição Binomial ........................................................................................ 98
UNIDADE 27 ..................................................................................................... 100
6
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Distribuição Normal ........................................................................................ 100
UNIDADE 28 ..................................................................................................... 106
Correlação ...................................................................................................... 106
UNIDADE 29 ..................................................................................................... 109
Correlação Linear ........................................................................................... 109
UNIDADE 30 ..................................................................................................... 114
Regressão Linear ........................................................................................... 114
GLOSSÁRIO ..................................................................................................... 119
7
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 1
Objetivo: Apresentar e discutir o Histórico da Estatística e sua origem
Histórico da Estatística
Embora a palavra “Estatística” ainda não existisse, há indícios de que desde 3000 A.C. já se
faziam censos na Babilônia, China e Egito.
Assim, a Estatística servia como ferramenta administrativa nas mãos do Estado. Na Idade
Média colhiam-se informações, geralmente com a finalidade tributária ou bélica.
Foi no século XVIII que os estudos de tais fatos foram adquirindo forma verdadeiramente
científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de
Estatística, determinando o seu objetivo e suas relações com as ciências.
8
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Friedrich Gauss (1777-1855), surge a ideia de “Distribuição Normal de Frequência”. Essa
ideia levou a uma teoria muito útil para fazer previsões.
A teoria da distribuição normal foi usada pelo astrônomo e matemático belga Adolphe
Quételet (1796-1874), no estudo estatístico de diversas características das populações
humanas: altura, peso, natalidade, mortalidade, renda mensal, etc.
A Estatística em diversas áreas vem avançando muito rapidamente e, com seus processos e
técnicas, tem contribuído para a organização dos negócios e para a evolução do mundo
moderno.
9
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
A profissão do Estatístico
Demografia
Bioestatística
Estatístico Matemático
Estatístico
Estatístico Matemático
10
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 2
Objetivo: Apresentar e discutir os principais Métodos Estatísticos existentes.
Métodos Estatísticos
O método científico
Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por
necessidades práticas, sem aplicação de um método.
O método experimental
11
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
O Método Estatístico
Como exemplo, podemos citar a determinação das causas que definem o preço de uma
mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade
da mercadoria e verificar se tal fato iria influenciar seu preço.
Porém, seria necessário que não houvesse alteração nos outros fatores.
Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos
consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos
preços das outras necessidades, etc. Mas isso tudo é impossível.
Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso,
denominado método estatístico.
A Estatística
Exprimindo por meio de números as observações que se fazem de elementos com, pelo
menos, uma característica comum (por exemplo: os alunos do sexo masculino de uma
comunidade), obtemos os chamados dados referentes a esses elementos.
12
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Podemos dizer, então, que:
A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta,
organização, descrição, análise e interpretação de dados, para a utilização dos
mesmos na tomada de decisões.
13
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 3
Objetivo: Apresentar e discutir as Fases do Método Estatístico.
1. Coleta de dados
A coleta direta dos dados pode ser classificada relativamente ao fator tempo em:
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas
e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam
influenciar sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou
má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os
elementos originais dos dados da coleta.
15
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
5. Análise dos resultados
16
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 4
Objetivo: Apresentar e discutir as Variáveis Estatísticas, População e Amostra.
Variáveis Estatísticas
Qualitativa => quando seus valores são expressos por atributos. Exemplo:
Salário
Idade
Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites
recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes
a um conjunto enumerável recebe o nome de variável discreta ou descontínua.
17
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Exemplos:
Outros exemplos:
População e Amostra
Ao conjunto finito ou infinito de elementos que possuem PELO MENOS UMA característica
comum denominamos população estatística ou universo estatístico.
Assim, os jogadores de futebol, por exemplo, constituem uma população, pois apresentam
pelo menos uma característica comum: são aqueles que jogam futebol.
18
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Assim, amostra é qualquer conjunto finito e não vazio de uma população, ou seja, uma
subcoleção.
Verificamos, então, que a Estatística Indutiva tem por objetivo tirar conclusões sobre as
populações, baseada em resultados verificados nas amostras retiradas destas populações.
Entretanto, para que as inferências estejam corretas, é necessário garantir que a amostra
seja representativa da população, isto é, a amostra deve possuir as mesmas características
básicas da população, no que diz respeito ao fenômeno que será pesquisado. Dessa forma,
é necessário que a amostra a ser usada seja obtida por processos adequados.
19
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 5
Objetivo: Apresentar e discutir Amostragem e as principais técnicas existentes.
Amostragem
É a técnica utilizada para recolher amostras, que garante, tanto quanto possível, o acaso na
escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o
que garante à amostra o caráter de representatividade. Isto é muito importante pois as
conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras
dessa população.
Exemplo:
Obter uma amostra representativa de 10% da população para a pesquisa de salários dos 90
funcionários de uma empresa.
20
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Procedimentos:
Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito
trabalhoso. A fim de facilitá-lo, foi elaborada uma tabela - TABELA DE NÚMEROS
ALEATÓRIOS, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso
nas linhas e colunas.
21
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Para obtermos os elementos da amostra usando a tabela, escolhemos ao acaso um
algarismo qualquer da mesma, a partir do qual iremos considerar números de dois, três ou
22
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os
elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),
verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou
descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita
antes de iniciado o processo.
O primeiro passo é definir o critério da leitura da tabela. Assim, consideremos, por exemplo,
a 6ª linha, tomando os números de dois algarismos (tantos algarismos quantos formam o
maior número da população), da esquerda para direita e de cima para baixo, e assim
sucessivamente. Obtivemos então:
62 18 54 66 06 68 95 66 09 14 97 61
62 18 54 66 06 68 95 66 09 14 97 61
Ou, reescrevendo:
62 18 54 66 06 68 09 14 61
06 09 14 18 54 61 62 66 68
Estas foram as pessoas escolhidas para o critério adotado. Com base na listagem dos
funcionários, deve- se buscar posteriormente as informações salariais de cada um. Anota-se,
23
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
assim, os salários das pessoas correspondentes aos números sorteados, obtendo-se uma
amostra de 10% dos salários dos 90 funcionários da empresa.
24
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 6
Objetivo: Apresentar e discutir as principais técnicas de Amostragem.
Exemplo:
25
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Logo, teremos:
Obtivemos então:
12 19 19 99 22 18 12 65 02 11 15 71 24 04
24 86 07 98 71 25 63
Da mesma forma, deveremos desprezar todos os numerais que não constam da população,
bem como aqueles que já tiverem sido selecionados. Também devemos parar a seleção para
um estrato quando já tiver sido preenchida sua quantidade de elementos necessários. Dessa
forma:
12 19 19 99 22 18 12 65 02 11 15 71 24 04
24 86 07 98 71 25 63
26
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Ou, separando por estratos:
Estas foram as pessoas escolhidas para o critério adotado em cada estrato. Com base na
listagem dos funcionários, deve-se buscar posteriormente as informações salariais de cada
um. Anota-se, assim, os salários das pessoas correspondentes aos números sorteados em
cada estrato, obtendo-se uma amostra proporcional estratificada de 10% dos salários dos 90
funcionários da empresa, separados por sexo. Também pode ser verificada a aleatoriedade
na determinação da amostra, o que garante sua representatividade.
3. Amostragem Sistemática
É uma seleção feita por algum critério preestabelecido, como, por exemplo, intervalos de
tempo para coleta, peças de uma linha de montagem, etc.
27
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Exemplos:
Linhas de produção
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.
Assim, no caso de uma linha de produção, podemos, por exemplo, a cada dez itens
produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso,
estaríamos fixando o tamanho da amostra em 10% da população.
Exemplo:
Suponha-se uma avenida contendo 900 prédios, dos quais desejamos obter uma amostra
formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento: como
900
18
50 , escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o
primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente
considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado
direito da rua, o 4º prédio, o 22º, o 40º, etc. , até voltarmos ao início da avenida, pelo lado
esquerdo.
28
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 7
Objetivo: Apresentar e discutir as principais Séries Estatísticas.
Séries Estatísticas
São aquelas onde os dados são observados conforme época de ocorrência. Descrevem os
valores da variável em determinado local, discriminados segundo intervalo de tempo variável.
Exemplo:
29
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
2. Séries Geográficas, Espaciais, Territoriais ou de Localização
Exemplo:
São aquelas onde os dados são observados em determinado tempo e local, discriminados
conforme especificações ou categorias.
Exemplo:
30
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
4. Séries Mistas ou Conjugadas
São aquelas onde os dados provenientes de duas ou mais séries são colocados em uma
única série.
Exemplo:
31
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 8
Objetivo: Apresentar e discutir os principais tipos de Gráficos Estatísticos.
Gráficos Estatísticos
Simplicidade => o gráfico não deve conter detalhes de importância secundária, assim
como de traços desnecessários que possam levar o leitor a uma análise demorada ou
errônea.
Clareza => o gráfico deve possibilitar uma correta interpretação dos valores
representativos do fenômeno em estudo.
32
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
1. Gráfico em linha ou em curva
É a representação gráfica de uma série estatística por meio de uma linha poligonal e constitui
uma aplicação do processo de representação das funções num sistema de coordenadas
cartesianas. É a melhor representação para uma série temporal, onde se deve observar a
ordem cronológica das informações. É usada para mostrar a variação entre os valores de
uma série.
Exemplo:
200.000
190.000
180.000
170.000
160.000
150.000
140.000
130.000
120.000
110.000
100.000
2001 2002 2003 2004 2005 2006 2007 2008
33
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
2. Gráfico em colunas ou em barras
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos
respectivos dados.
Exemplos:
a. Gráfico em Colunas
200.000
180.000
160.000
Mil Toneladas
140.000
120.000
100.000
80.000
60.000
40.000
20.000
0
1990 1991 1992 1993 1994 1995 1996 1997
34
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
b. Gráfico em Barras
Minas Gerais
Rio de Janeiro
Bahia
Ceará
Espírito Santo
Paraná
Pernambuco
Santa Catarina
Goiás
Observações:
1. Sempre que as informações escritas das legendas forem extensas, devemos dar
preferência ao gráfico em barras (séries geográficas ou específicas). Porém, mesmo
assim for escolhido o gráfico em colunas, as informações das legendas devem ser
dispostas de baixo para cima, jamais o contrário.
35
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
3. Para uma melhor apresentação e visualização de informações, a distância entre as
colunas (ou barras) não deverá ser menor que a metade nem maior que dois terços da
largura (ou da altura) dos retângulos.
Exemplo:
30.000
20.000
10.000
0
2000 2001 2002 2003 2004
36
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
4. Gráfico em setores ou circular (pizza)
É a representação gráfica de uma série estatística por meio de superfícies setoriais. É usado
para comparar os valores de uma série com a soma total.
O gráfico é construído com base em um círculo dividido em partes, onde cada ângulo central
é proporcional à frequência de cada variável.
Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total
da série corresponde à 360º.
Exemplo:
37
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Vacinação contra doença "X" - Brasil - 2006
8% 13%
18% Norte
Nordeste
Sudeste
23%
Sul
Centro-Oeste
38%
Observações:
38
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 9
Objetivo: Apresentar e discutir os conceitos relacionados à Distribuição de Frequência.
Distribuição de Frequência
Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 alunos, que
compõem uma amostra dos alunos de uma Faculdade brasileira, resultando a seguinte
tabela de valores, dados em centímetros (cm):
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
Partindo dos dados acima, é difícil averiguar em torno de que valor tende a se concentrar as
estaturas, qual a menor e qual é a maior estatura ou, ainda, quantos alunos se acham abaixo
ou acima de uma dada estatura.
Dessa forma, conhecidos os valores de uma variável, é difícil formarmos uma ideia exata do
comportamento do grupo como um todo, a partir dos dados não ordenados.
39
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Assim, obtemos o seguinte rol para os dados apresentados:
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Agora podemos obter com relativa facilidade qual é a menor estatura (150 cm) e qual é a
maior (173 cm). Podemos também determinar qual foi a amplitude de variação (173 - 150 =
23 cm) e, ainda, a ordem que um valor em particular da variável ocupa no conjunto.
Observamos também que há uma concentração das estaturas em algum valor entre 160 cm
e 165 cm e, mais ainda, existem poucos valores abaixo de 155 cm e acima de 170 cm.
Com base nas informações anteriores, podemos organizar o que chamamos de “Quadro de
Distribuição de Frequências”.
ESTATURAS DE 40 ALUNOS
40
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Assim, ao invés de dizermos que a estatura de 1 aluno é 154 cm; de 4 alunos é de 155 cm;
de 3 alunos é de 156 cm; e de 1 aluno é de 157 cm, diremos que 9 alunos têm estaturas
entre 154, inclusive, e 158 cm, exclusive. Estaremos desse modo, agrupando os valores da
variável em intervalos, chamados em Estatística de classes.
O que se pretende com a construção deste quadro é realçar o que há de essencial nos
dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição.
Recorde que a Estatística tem por finalidade específica analisar o conjunto de valores,
desinteressando-se por casos isolados.
A partir do quadro anterior, podemos elaborar um quadro mais completo, pelo qual será
possível extrair um maior volume de informações sobre a variável em estudo. Este quadro é
conhecido na Estatística como “Quadro de Distribuição de Frequências”, conforme abaixo:
41
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Com este quadro, podemos observar, por exemplo, que existem 27,5% dos alunos com
estaturas entre 158 e 162 cm. Verificamos também que existem 80% dos alunos com
estaturas até 166 cm e que existem 33 alunos com estaturas entre 154 e 170 cm. Cada um
dos “elementos” deste quadro será detalhado a seguir.
Como vimos, a Estatística possui grande importância para nossa formação. Dessa forma,
relacione a Estatística com sua profissão, destacando os principais pontos onde sua
aplicação é (ou poderia ser) relevante.
42
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 10
Objetivo: Apresentar e discutir os principais Elementos de uma Distribuição de Frequência.
1. Classes (i)
2. Limites de Classe
É obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi.
Assim:
hi = Li - i
43
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
4. Amplitude total da distribuição (AT)
É a diferença entre o limite superior da última classe (limite superior máximo) e o limite
inferior da primeira classe (limite inferior mínimo):
AT = Lmáx - mín
AA = xmáx - xmín
Como o próprio nome indica, é o ponto que divide o intervalo de classe em duas partes
iguais. Para obtermos o ponto médio de uma determinada classe, calculamos a soma dos
limites da classe e dividimos por 2, ou seja:
i Li
xi
2
O ponto médio de uma classe é o valor que a representa.
44
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Obviamente, a soma de todas as frequências é igual ao número total de observações n.
k
fi n
i 1
fi f
fri i
fi n
É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma
dada classe.
Fi = f1 + f2 + f3 + ... + fk
Fi F
Fri i
fi n
45
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Antes de dar continuidade aos seus estudos é fundamental que você acesse sua
SALA DE AULA e faça a Atividade 1 no “link” ATIVIDADES.
46
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 11
Objetivo: Apresentar e calcular o Número de Classes e Intervalo de Classes de uma
Distribuição.
log n
k 1
log 2
Quando o resultado não for exato, iremos sempre arredondá-lo para mais,
independentemente do valor decimal encontrado.
47
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Assim, temos:
AA
hi
k
Também iremos manter o critério de arredondamento para mais para facilitar nossos
cálculos, na medida do possível.
n = 40 alunos
log 40 1,602059991
k 1 1 5,321928093 7
log 2 0,301029996
Observe que foi feito um arredondamento matemático para mais, independente do valor
decimal encontrado.
AA = 173 - 150 = 23 cm
AA 23
hi 3,285714286 4
k 7
Observe que também foi feito um arredondamento matemático para mais, independente do
valor decimal encontrado.
Sempre que for solicitada a aplicação da Fórmula de Sturges, deverão ser considerados k e
hi calculados.
48
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 12
Objetivo: Apresentar e discutir as principais Medidas de Posição.
Medidas de Posição
As medidas de posição são dados que nos orientam quanto à posição da distribuição em
relação ao eixo horizontal (eixo das abscissas).
Dentre as medidas de posição mais importantes estão as medidas de tendência central, que
recebem tal nome pelo fato dos dados observados tenderem, em geral, a ser agrupar em
torno dos valores centrais.
Destacamos:
Média Aritmética;
Mediana;
Moda.
49
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
As outras medidas de posição são as separatrizes, que englobam:
A própria mediana;
Os quartis;
Os decis;
Os percentis.
1. Média Aritmética ( x )
xi
x
n
x i fi
x
fi
Sendo:
50
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
A média é utilizada quando desejamos obter a medida de posição que possui maior
estabilidade
2. Moda (Mo)
Por exemplo, o salário modal de uma empresa é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados desta empresa.
Nos dados não agrupados, podemos encontrar séries que não possuam valor modal (série
amodal). Em contra-partida, podem haver dois ou mais valores de concentração de uma
variável. Nestes casos, a série é chamada de bimodal, trimodal, tetramodal, etc .
Para dados agrupados, a moda é o ponto médio da classe modal, ou seja, da classe de
maior frequência.
3. A mediana ( Md )
É definida como o número que se encontra no centro de uma série de números, estando
estes dispostos segundo uma ordem.
É o valor situado de tal forma no conjunto de dados que o separa em dois subconjuntos de
mesmo número de elementos.
51
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Para dados não agrupados, se a série tiver número ímpar de elementos, a mediana é,
obviamente, o valor central da série, disposta em uma determinada sequência.
Se a série tiver um número par de elementos, a mediana será, por definição, qualquer dos
números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o
ponto médio dos valores centrais.
Para tanto, temos inicialmente que determinar a classe na qual se acha à mediana - classe
mediana. Tal classe será, evidentemente, àquela correspondente à frequência acumulada
fi
imediatamente superior a 2 .
Interpolação => Inserção de uma determinada quantidade de valores entre dois números
dados.
52
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Veja o exemplo:
Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos
determinar o valor que ocupa o 20 lugar, a partir do início da série, vemos que este deve
estar localizado na terceira classe (i = 3), supondo que as frequências destas classes
estejam uniformemente distribuídas.
4 4 28
20 13 7 2,54
11 11 11
53
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
1. Determinamos as frequências acumuladas;
fi
2. Calculamos 2 ;
fi *
2 F( ant ) h
*
Md
f*
Na qual:
54
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 13
Objetivo: Apresentar e discutir as Medidas Separatrizes – Quartis.
Medidas Separatrizes
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No
entanto, ela apresenta outra característica, tão importante quanto à primeira: ela separa a
série em dois grupos que apresentam o mesmo número de valores.
Assim, além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à mediana
relativamente à sua segunda característica, já que se baseiam em sua posição na série.
1. Os quartis
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há,
portanto, três quartis:
Valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e
as três quartas partes restantes (75%) são maiores.
55
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
O segundo quartil (Q2)
Valor situado de tal modo na série que as três quartas partes (75%) dos dados são menores
que ele e uma quarta parte (25%) é maior.
Quando os dados estão agrupados, para determinar os quartis usamos a mesma técnica do
fi
cálculo da mediana, bastando substituir, na fórmula da mediana, 2 por:
k fi
4
Assim, temos:
k fi *
4 F( ant ) h
*
Qk
f*
56
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 14
Objetivo: Apresentar e discutir as Medidas Separatrizes – Decis.
Medidas Separatrizes
2. Os decis
Denominamos decis os valores de uma série que a dividem em dez partes iguais. Há,
portanto, dez decis:
Valor situado de tal modo na série que 10% dos dados é menor que ele e 90% restantes são
maiores.
Valor situado de tal modo na série que 20% dos dados é menor que ele e 80% restantes são
maiores.
Valor situado de tal modo na série que 30% dos dados é menor que ele e 70% restantes são
maiores.
57
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
O quarto decil (D4)
Valor situado de tal modo na série que 40% dos dados é menor que ele e 60% restantes são
maiores.
Valor situado de tal modo na série que 50% dos dados é menor que ele e 50% restantes são
maiores. Evidentemente, coincide com a mediana (D5 = Q2 = Md ).
Valor situado de tal modo na série que 60% dos dados é menor que ele e 40% restantes são
maiores.
Valor situado de tal modo na série que 70% dos dados é menor que ele e 30% restantes são
maiores.
Valor situado de tal modo na série que 80% dos dados é menor que ele e 20% restantes são
maiores.
58
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
O nono decil (D9)
Valor situado de tal modo na série que 90% dos dados é menor que ele e 10% restantes são
maiores.
Valor situado de tal modo na série que 100% dos dados é menor que ele e 0% restantes são
maiores (ou seja, nenhum é maior).
fi
O cálculo de um decil segue a mesma técnica do cálculo da mediana, porém a fórmula 2
será substituída por:
k fi
10
Assim, temos:
k fi
F(ant ) h*
10
Dk *
f*
59
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 15
Objetivo: Apresentar e discutir as Medidas Separatrizes – Percentis.
Medidas Separatrizes
3. Os percentis
Denominamos percentis os noventa e nove valores que separam uma série em 100 partes
iguais.
k fi
100
Assim, temos:
k fi
F(ant ) h*
100
Pk *
f*
60
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 16
Objetivo: Apresentar e discutir as Medidas de Dispersão ou Variabilidade.
Vimos anteriormente que um conjunto de valores pode ser sintetizado por meio de
procedimentos matemáticos em poucos valores representativos: média aritmética, mediana
e moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento
do conjunto.
Vemos, então, que a média - ainda que considerada como um nº que tem a faculdade de
representar uma série de valores - não pode, por si mesma, destacar o grau de
homogeneidade ou heterogeneidade que existem entre os valores que compõem o conjunto.
61
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Calculando a média aritmética de cada um desses conjuntos, obtemos:
x i 350
x 70
n 5 ;
y i 350
y 70
n 5 ;
z i 350
z 70
n 5 ;
Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70.
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que
todos os valores são iguais à média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação
entre cada um de seus valores e a média representativa.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística
recorre às medidas de dispersão ou de variabilidade.
62
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Amplitude Total
AT = x(máx) – x(mín)
É a diferença entre o limite superior da última classe e o limite inferior da primeira classe.
AT = L(superior) – (inferior)
63
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 17
Objetivo: Apresentar e discutir as Medidas de Dispersão ou Variabilidade – Variância e
Desvio Padrão.
Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos,
que são, na sua maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em
consideração a totalidade dos valores da variável em estudo, o que faz delas índices de
variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados.
2 2
2 x i x x i x
s
fi n
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um nº em unidade
quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um
inconveniente.
64
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas,
denominada desvio padrão, definida como a raiz quadrada da variância e representada por s:
s s2
2
x i x
s
Desvio padrão: n (Para população)
Quando nosso interesse não se restringe à descrição dos dados, mas, partindo da amostra,
visamos tirar inferências válidas para a respectiva população, convém efetuar uma
modificação, que consiste em utilizarmos o divisor n - 1 no lugar de n.
Assim, teremos:
2
x i x
s
Desvio padrão: n 1 (Para amostra)
s
2
x i .fi n.x
2
n 1
65
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 18
Objetivo: Apresentar e discutir o Coeficiente de Variação.
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas
unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 300;
no entanto, se a média for igual a 30, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade de medida dos dados
limita o seu emprego quando desejamos comparar duas ou mais séries de valores,
relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes.
s
CV 100
x
Já vimos que o desvio padrão tem a mesma unidade de medida que os dados, de modo que
o coeficiente de variação é adimensional.
66
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 19
Objetivo: Apresentar e discutir o Escore Padronizado.
Por exemplo, em uma escala de 0 a 10, a nota 6 em uma prova em que a nota máxima foi
6 é muito mais do que a mesma nota 6 em uma prova em que a nota máxima foi 9. Uma
forma de captar essa diferença é considerar a nota do aluno como a sua posição relativa no
grupo, medida por:
xi x
zi
s
, onde zi é o que se chama “escore padronizado”
Dessa forma, estamos comparando a nota do aluno com a média do grupo, ou seja, estamos
considerando o afastamento da nota em relação à média, tomando esta como origem. Ao
dividirmos aquela diferença pelo desvio padrão s, estamos tomando o desvio padrão como
unidade ou padrão de medida. Daí o nome desvio padrão.
67
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Aplicação das Ferramentas no dia a dia
De acordo com o que você aprendeu, como poderíamos aplicar as ferramentas e métodos
estatísticos em seu dia a dia ? Quais rotinas ou processos poderiam ser melhorados? Como?
68
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 20
Objetivo: Apresentar, discutir e calcular as Medidas de Assimetria.
Medidas de Assimetria
Você já ouviu falar dessas medidas ? Sabe como calculá-las? Vamos estão estudá-las nesta
unidade.
As medidas podem ser simétricas ou assimétricas. Elas são simétricas quando os valores da
Média e Moda se coincidem. Quando a média é menor que a moda, a medida é assimétrica
à esquerda ou negativa. Quando a média é maior que a moda, a medida é assimétrica à
direita ou positiva. Naturalmente, quanto mais próxima de zero for a medida de assimetria,
mais simétrica será a distribuição.
Os conceitos de assimetria de uma curva de frequência estão ilustrados nos gráficos abaixo:
69
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Baseando-se nas relações entre a Média e a Moda, podemos determinar o tipo de
assimetria.
Se tivermos:
onde:
x = Média
Mo = Moda
70
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Exemplos:
3 x Md
As
s , em que:
x = Média
Md = Mediana
s = Desvio-padrão
71
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Após calcular os valores da média, mediana e desvio-padrão, basta aplicar na fórmula
anterior para se obter o Coeficiente de Assimetria de Pearson.
Assim, temos:
Exemplos:
3 x Md
As
s
3 10 10 3 0
As 0
4,8 4,8
72
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
2. Considere os valores: x = 14,5 , Md = 15,2 e s = 4,2. Calcule o coeficiente de
assimetria.
3 x Md
As
s
Como As = – 0,5 e 0,15 < |As| < 1, temos neste caso uma assimetria negativa moderada.
3 x Md
As
s
Como As = 1,4 e |As| ≥ 1, temos neste caso uma assimetria positiva forte.
Antes de dar continuidade aos seus estudos é fundamental que você acesse sua
SALA DE AULA e faça a Atividade 2 no “link” ATIVIDADES.
73
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 21
Objetivo: Apresentar, discutir e calcular as Medidas de Curtose.
Medidas de Curtose
Você já ouviu falar dessas medidas ? Sabe como calculá-las ? Vamos estão estudá-las nesta
unidade.
Quando a distribuição apresentar uma curva de frequência mais aberta que a normal (ou
mais achatada em sua parte superior), ela receberá o nome de Platicúrtica.
Se a distribuição em estudo apresentar uma curva de frequência mais fechada que a normal
(ou mais aguda em sua parte superior), ela receberá o nome de Leptocúrtica.
74
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Os tipos de curvas de frequência em termos de curtose estão mostrados abaixo:
Coeficiente de Curtose
Q 3 Q1
C
2 P90 P10
onde:
Q1 = 1º Quartil da Distribuição
Q3 = 3º Quartil da Distribuição
75
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Para o caso especial da Curva Normal, temos que C = 0,263.
Assim:
Exemplos:
Q1 = 21,84 cm ; Q3 = 45,32 cm
Solução:
Q 3 Q1
C
2 P90 P10
Como 0,3398 > 0,263 , temos uma distribuição Platicúrtica em relação à normal.
76
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
2. Uma distribuição salarial de uma empresa apresentou os seguintes valores:
Q1 = R$ 925,36 ; Q3 = R$ 2.043,75
Solução:
Q 3 Q1
C
2 P90 P10
Como 0,2405 < 0,263 , temos uma distribuição Leptocúrtica em relação à normal.
77
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 22
Objetivo: Apresentar e discutir os principais elementos relacionados às Probabilidades.
Noções de Probabilidades
Experimento Aleatório
que empate.
Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados
fenômenos aleatórios ou experimentos aleatórios.
Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob
condições semelhantes, apresentam resultados imprevisíveis.
78
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
É o processo de coleta de dados relativos a um fenômeno que acusa variabilidade em seus
resultados.
Espaço Amostral
S = {CARA , COROA}
S = {1, 2, 3, 4, 5, 6}
Do mesmo modo, como em dois lançamentos sucessivos de uma moeda podemos obter
cara nos dois lançamentos, ou cara no primeiro e coroa no segundo, ou coroa no primeiro e
cara no segundo, ou coroa nos dois lançamentos, o espaço amostral é:
2 S 2 é um ponto amostral de S
79
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Eventos
Exemplo:
Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser
definidos pelas sentenças:
80
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 23
Objetivo: Apresentar e calcular as Probabilidades.
Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os
elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto
equiprovável.
n( A )
P(A)
n (S)
Onde:
P(S) = 1
81
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
A probabilidade do evento impossível é igual a zero =>
P() = 0
0 P(E) 1
1
P(E)
n
n(A
Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra
(sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento
existe sempre a relação:
p q 1 q 1 p
Eventos Independentes
Dizemos que dois eventos são independentes quando a realização ou a não realização de
um dos eventos não afeta a probabilidade da realização do outro e vice-versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do
resultado obtido no outro.
82
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
p p1 p 2
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um
exclui a realização do(s) outro(s).
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são
mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
p p1 p 2
83
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 24
Objetivo: Exercícios resolvidos envolvendo o cálculo de Probabilidades.
Solução:
Evento A = {sair valete de espadas em um baralho de 52 cartas}
P(A) = Probabilidade de ocorrer o Evento A
n(A) = Quantidade de valetes de espadas existentes no baralho de 52 cartas
n(S) = Quantidade de elementos do Espaço Amostral S, ou seja, número de cartas do
baralho.
Logo, temos:
n( A ) 1
P( A ) 0,0192308 1,92%
n(S) 52
2. Qual a probabilidade de sair uma dama quando retiramos uma carta de um baralho de 52
cartas ?
Solução:
Evento A = {sair dama em um baralho de 52 cartas}
P(A) = Probabilidade de ocorrer o Evento A
n(A) = Quantidade de damas existentes no baralho de 52 cartas
84
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
n(S) = Quantidade de elementos do Espaço Amostral S, ou seja, número de cartas do
baralho.
Logo, temos:
n( A ) 4
P( A ) 0,0769231 7,69%
n(S) 52
Solução:
O evento “obter soma igual a 7” é formado pelos elementos (1, 6) , (6, 1) , (2, 5) , (5, 2) ,
(3, 4) , (4, 3). Como o número de elementos do Espaço Amostral S é 36 (pois existem ao
todo 6 x 6 = 36 possíveis combinações no lançamento de dois dados), temos que:
n( A ) 6
P( A ) = = ≈ 16,67%
n(S) 36
Solução:
85
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
P(A) = Probabilidade de ocorrer o Evento A
n(A) = Quantidade de peças defeituosas existentes no lote.
n(S) = Quantidade de total de peças do lote.
Logo, temos:
n( A ) 5
P( A ) = = = 0,277777778 ≈ 27,78 %
n(S) 18
5. Uma urna A contém: 5 bolas brancas, 3 pretas, 3 verdes; uma urna B contém: 4 bolas
brancas, 2 pretas, 2 verdes; uma urna C contém: 3 bolas brancas, 2 pretas, 4 verdes.
Uma bola é retirada de cada urna. Qual a probabilidade de as três bolas retiradas da
primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde ?
Solução:
Como são três acontecimentos simultâneos e independentes (uma urna não afeta
outra), temos que:
pTotal = p1 x p2 x p3
5 2 4 40 5
p Total = × × = = ≈ 5,05%
11 8 9 792 99
Solução:
p1 = { sair dama }
p2 = { sair 6 de copas }
Como são dois acontecimentos simultâneos e independentes (um baralho não afeta
outro), temos que:
pTotal = p1 x p2
4 1 4 1
p Total = × = = ≈ 0,15%
52 52 2704 676
Solução:
87
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Como são dois acontecimentos simultâneos e independentes (um baralho não afeta
outro), temos que:
pTotal = p1 x p2
1 1 1
p Total = × = ≈ 0,04%
52 51 2652
Observe que, após a retirada da primeira carta, restam 51 cartas no baralho, uma
vez que a carta retirada não foi reposta, conforme solicita o enunciado da questão.
Solução:
pTotal = p1 + p2 + p3
1 1 1 3
p Total = + + = = 50,00%
6 6 6 6
9. Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho ?
Solução:
Sair uma figura significa sair rei ou sair dama ou sair valete.
4 1
p1 = { sair rei } = =
52 13
88
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
4 1
p2 = { sair dama } = =
52 13
4 1
p3 = { sair valete } = =
52 13
Como os três eventos são mutuamente exclusivos (ou sai rei, ou sai dama ou sai
valete – uma opção exclui a outra), temos que:
pTotal = p1 + p2 + p3
1 1 1 3
p Total = + + = ≈ 23,08%
13 13 13 13
12 3
p Total = = ≈ 23,08%
52 13
10. Qual a probabilidade de sair uma carta de paus ou de copas quando retiramos uma carta
de um baralho ?
Solução:
13 1
p1 = { sair paus } = =
52 4
13 1
p2 = { sair copas } = =
52 4
Como os dois eventos são mutuamente exclusivos (ou sai paus ou sai copas – uma
opção exclui a outra), temos que:
89
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
pTotal = p1 + p2
1 1 2 1
p Total = + = = = 50,00%
4 4 4 2
11. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 9 ou
maior que 9.
Solução:
A probabilidade de temos soma 9 ou maior que 9 significa dizer que a soma deverá ser
9, 10, 11 ou 12. Dessa forma, temos que calcular a probabilidade de cada uma dessas
possibilidades. Assim, temos:
Soma igual a 9: Este evento é formado pelos elementos (3, 6) , (6, 3) , (4, 5) , (5, 4).
Soma igual a 10: Este evento é formado pelos elementos (4, 6) , (6, 4) , (5, 5).
Soma igual a 11: Este evento é formado pelos elementos (5, 6) , (6, 5).
Soma igual a 12: Este evento é formado pelo único elemento (6, 6).
90
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Como estes quatro eventos são mutuamente exclusivos (ou sai soma 9, ou soma 10,
ou soma 11 ou soma 12 – uma opção exclui a outra), temos que:
pTotal = p1 + p2 + p3 + p4
4 3 2 1 10 5
p Total = + + + = = ≈ 27,78 %
36 36 36 36 36 18
12. São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de tirarmos um 4 e um 7, não
necessariamente nesta ordem ?
Solução:
4 1
p1 = { sair quatro } = =
52 13
4 1
p2 = { sair sete } = =
52 13
1 1 1
p3 = p1 x p2 → p3 = × =
13 13 169
1 1 1
p4 = p1 x p2 → p4 = × =
13 13 169
Como estes dois eventos são mutuamente exclusivos (ou sai a sequência 4 – 7 , ou
sai a sequência 7 – 4 , pois uma opção exclui a outra), temos que:
91
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
pTotal = p3 + p4
1 1 2
p Total = + = ≈ 1,18 %
169 169 169
92
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 25
Objetivo: Apresentar e discutir as principais Distribuições de Probabilidades.
Distribuições de Probabilidade
1. Variável Aleatória
Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído um número.
Fica, então, definida uma função chamada VARIÁVEL ALEATÓRIA, indicada por uma letra
maiúscula, sendo seus valores indicados por letras minúsculas.
Ponto Amostral X
(Ca,Ca) 2
(Ca,Co) 1
(Co,Ca) 1
(Co,Co) 0
93
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
2. Distribuição de Probabilidade
0 22
1 5
2 2
3 1
TOTAL 30
22
p 0,73
Não ocorrer acidente é: 30
5
p 0,17
Ocorrer um acidente é: 30
2
p 0,07
Ocorrerem dois acidentes é: 30
1
p 0,03
Ocorrem três acidentes é: 30
94
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Podemos escrever:
0 0,73
1 0,17
2 0,07
3 0,03
1
Seja X uma variável aleatória que pode assumir os valores x1, x2, x3, ... , xn. A cada valor xi
correspondem pontos do espaço amostral. Associamos, então, a cada valor xi a
probabilidade pi de ocorrência de tais pontos no espaço amostral.
Assim, temos:
pi 1
Os valores x1, x2, x3, ... , xn e seus respectivos correspondentes p1, p2, p3, ... , pn definem
uma distribuição de probabilidade.
95
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Logo, para o caso do lançamento de duas moedas, teremos:
1 1 1
(Ca,Ca) 2 x
2 2 4
1 1 1
(Ca,Co) 1 x
2 2 4
1 1 1
(Co,Ca) 1 x
2 2 4
1 1 1
(Co,Co) 0 x
2 2 4
1
2
4
2
1
4
1
0
4
1
96
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
define uma função; os valores xi ( i = 1, 2, 3, ... , n) formam o domínio da função e os valores
pi ( i = 1, 2, 3, ... , n) formam o seu conjunto imagem.
f(x) = P (X = xi)
Assim, ao lançarmos um dado, a variável aleatória X, definida por “pontos de um dado”, pode
tomar os valores 1, 2, 3, 4, 5 e 6.
Como a cada um destes valores está associada uma e uma só probabilidade de realização e
X P(X)
1
1
6
1
2
6
1
3
6
1
4
6
1
5
6
1
6
6
1
97
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 26
Objetivo: Apresentar e discutir a Distribuição Binomial.
Distribuição Binomial
O experimento deve ser repetido, nas mesmas condições, um número finito de vezes
(n);
As provas repetidas devem ser independentes, isto é, o resultado de uma NÃO deve
afetar os resultados das sucessivas;
98
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Ao realizarmos a mesma prova n vezes sucessivas e independentes, a probabilidade de que
um evento se realize k vezes nas provas é dada pela função:
n
f ( X) P( X k ) pk qn k
k
Onde:
n n!
k
é o coeficiente binomial de n sobre k, igual a k!( n k )! .
n
O termo BINOMIAL possui origem no fato de que k pk . qn-k é o termo geral do
desenvolvimento do BINÔMIO DE NEWTON.
99
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 27
Objetivo: Apresentar e discutir a Distribuição Normal.
Distribuição Normal
Curva Normal
Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a
DISTRIBUIÇÃO NORMAL.
100
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Para uma perfeita compreensão da distribuição normal, analisaremos a figura e
observaremos as seguintes propriedades:
3. A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade de a variável aleatória X assumir qualquer valor real;
Escrevemos:
Quando temos uma variável aleatória com distribuição normal, nosso principal interesse é
obter a probabilidade de essa variável aleatória assumir um valor em um determinado
intervalo.
Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa
máquina. Vamos supor que essa variável tenha distribuição normal com os seguintes dados:
Média : x = 2 cm
101
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Vamos determinar a probabilidade de um parafuso ter diâmetro com valor entre 2 e 2,05 cm.
Essa probabilidade é indicada por: P(2 < X < 2,05) , correspondente à área hachurada na
figura abaixo:
xi x
z
s
Se X é uma variável aleatória com distribuição normal de média x e desvio padrão s, então a
variável z tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e
desvio padrão 1, onde z é o escore padronizado, calculado da seguinte forma:
xi x
z
s
102
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
103
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
A probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z é:
Temos, então, que se X é uma variável aleatória com distribuição normal de média x e
desvio padrão s, podemos escrever:
xi x
z
P ( x < X < x ) = P ( 0 < Z < z ), com s .
Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, devemos calcular o valor
de z que corresponde a x = 2,05 (x = 2 z = 0, pois x = 2). Temos, então:
x i x 2,05 2 0,05
z 1,25
s 0,04 0,04
Onde:
104
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro
entre a média x = 2 e o valor x = 2,05 é 0,3944.
Escrevemos, então:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%
105
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 28
Objetivo: Apresentar e discutir os conceitos principais relacionados à Correlação.
Correlação
Quando consideramos variáveis como peso e altura de um grupo de pessoas, uso do cigarro
e a incidência de câncer, vocabulário e compreensão da leitura, dominância e submissão,
procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e
qual o grau dessa relação. Para isso, é necessário o conhecimento de novas medidas.
Sendo esta relação de natureza quantitativa, o instrumento adequado para descobrir e medir
essa relação denomina-se CORRELAÇÃO.
Uma vez caracterizada esta relação, procuraremos descrevê-la através de uma função
matemática. A REGRESSÃO é o instrumento adequado para determinar os parâmetros
dessa função.
4
106
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Onde é o perímetro e é o lado do quadrado.
Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe
correlação entre elas.
Diagrama de Dispersão
Consideremos uma amostra aleatória formada por 10 dos 98 alunos de uma determinada
Faculdade A e pelas notas por eles obtidas nas disciplinas de Matemática e Estatística.
Nº do NOTAS
aluno Matemática (xi) Estatística (yi)
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
107
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Representando os pares ordenados (xi , yi) em um sistema coordenado cartesiano ortogonal,
obtemos uma nuvem de pontos que denominamos Diagrama de Dispersão. Este diagrama
nos fornece uma ideia grosseira, porém útil, da correlação existente entre as variáveis:
108
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 29
Objetivo: Apresentar e discutir Correlação Linear, calculando o Coeficiente de Correlação.
Correlação Linear
Podemos imaginar que, quanto mais fina for à elipse, mais ela se aproximará de uma reta.
Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, por
isso, denominada correlação linear.
É possível verificar que a cada correlação está associada como “imagem” uma relação
funcional. Por este motivo, as relações funcionais são chamadas relações perfeitas.
109
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Como a correlação em estudo tem como “imagem” uma reta ascendente, ela é chamada
correlação linear positiva.
Linear Positiva se os pontos do diagrama têm como “imagem” uma reta ascendente.
110
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Coeficiente de Correlação Linear
n x i y i x i y i
r
n x 2
i
2
x i n y i2 y i
2
Onde n é o número de observações.
Para que uma relação possa ser descrita por meio do Coeficiente de Correlação de Pearson
é imprescindível que ela se aproxime de uma função linear. Uma maneira prática de
verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se a elipse
apresenta saliências ou reentrâncias muito acentuadas, provavelmente trata-se de
correlação curvilínea.
0,6 ≤ | r | ≤ 1
111
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Se 0,3 ≤ | r | < 0,6 , há uma correlação relativamente fraca entre as variáveis.
Se 0 < | r | < 0,3 , a correlação é muito fraca e praticamente nada podemos concluir
sobre a relação entre as variáveis em estudo.
Nº do NOTAS
aluno Matemática (xi) Estatística (yi)
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Assim, teremos:
112
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Calculando r , temos:
n x i y i x i y i
r
n x 2
i
2
x i n y i2 y i
2
505
r 0,911242136 0,911
307125
O resultado indica uma correlação linear positiva forte, ou seja, aponta uma relação
altamente significativa entre as duas variáveis.
Em qual(is) processo(s) de seu dia a dia (ou de seu conhecimento) poderíamos implementar
os conceitos relacionados à Correlação e Regressão Linear ? Quais vantagens você imagina
que seriam obtidas ?
113
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
U NIDADE 30
Objetivo: Apresentar, discutir e calcular Regressão Linear e Equação da Reta.
Regressão Linear
Ajustamento da Reta
Sempre que desejamos estudar determinada variável em função de outra, fazemos uma
análise de regressão.
Ela tem por objetivo descrever, através de um modelo matemático, a relação entre duas
variáveis, partindo de n observações das mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável
dependente e a outra recebe o nome de variável independente.
Y = a.X + b
n x i y i x i y i
a b y ax
n x i2 x i 2
114
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Em que:
n é o número de observações;
xi
x
x é a média dos valores de xi => n
yi
y
y é a média dos valores de yi => n
Veja o exemplo:
xi 5 8 7 10 6 7 9 3 8 2
yi 6 9 8 10 5 7 8 4 6 2
Diagrama de Dispersão
10,0
8,0
Notas de Estatística (yi)
6,0
4,0
2,0
0,0
0,0 2,0 4,0 6,0 8,0 10,0
115
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Baseado nos dados do problema, vamos determinar a equação de reta de Regressão Linear
calculando os parâmetros a e b:
Ŷ = 0,8632.X + 0,8889
Observe o gráfico abaixo que mostra a reta ajustada ao diagrama de notas do exemplo:
10,0
Notas de Estatística (yi)
8,0
Ŷ = 0,8632.X + 0,8889
6,0
4,0
2,0
0,0
-2,0 0,0 2,0 4,0 6,0 8,0 10,0
116
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Interpolação e Extrapolação
Observando os dados do exercício anterior, podemos facilmente verificar que não temos a
nota 4,0 entre as notas de Matemática.
Ŷ = 0,8632 X + 0,8889
Ŷ = 4,34
Isso significa dizer que, com base nas notas apresentadas do grupo, por meio da equação da
reta de Regressão Linear, podemos estimar a nota de Estatística. Uma pessoa que por
ventura tirasse 4,0 em Matemática, dentro daquele grupo, essa nota estimada seria 4,34.
Como a nota 4,0 pertence ao intervalo de notas de Matemática do grupo (que vai de 2,0 a
10,0), dizemos que foi feita uma Interpolação.
E qual seria a nota estimada de Estatística de uma pessoa que tirasse 1,0 em Matemática?
De forma análoga, podemos também fazer uma estimativa para a nota de Estatística,
fazendo X = 1,0 na equação estimada Ŷ.
Ŷ = 0,8632 X + 0,8889
Ŷ = 1,75
117
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
Isso significa dizer que, com base nas notas apresentadas do grupo, estimamos a nota de
Estatística como 1,75 para uma pessoa que por ventura tirasse 1,0 em Matemática, dentro
daquele grupo.
Como a nota 1,0 não pertence ao intervalo de notas de Matemática do grupo (que vai de 2,0
a 10,0), dizemos que foi feita uma Extrapolação.
Antes iniciar a Avaliação On-line, é fundamental que você acesse sua SALA DE
AULA e faça a Atividade 3 no “link” ATIVIDADES.
118
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
G LOSSÁRIO
Caso haja dúvidas sobre algum termo ou sigla utilizada, consulte o link Glossário em sua
sala de aula, no site da ESAB.
119
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil
B IBLIOGRAFIA
BUSSAB, Wilton O, MORETTIN, Pedro A. Estatística Básica. 5a ed. São Paulo: Saraiva,
2003.
HOFFMAN, Rodolfo. Estatística para Economistas. São Paulo: Livraria Pioneira Editora,
1980.
LEVINE, David M., STEPHAN, David, KREHBIEL, Timothy C., BERENSON, Mark L.
Estatística - Teoria e Aplicações usando o Microsoft Excel em Português. Rio de
Janeiro: LTC, 2005.
NETO, Pedro Luiz de Oliveira Costa. Estatística. São Paulo: Edgard Blucher, 1977.
SOARES, José Francisco, FARIAS, Alfredo Alves de, CESAR, Cibele Comini. Introdução à
Estatística. Rio de Janeiro: Guanabara Koogan S.A, 1991.
120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil