Apostila Estatistica Aplicada A MTQ - Ifes VV - 2015

Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 1
1. COLETA E APRESENTAÇÃO DE DADOS ..............................................................................3

1.1. Introdução ............................................................................................................................3
1.2. Conceituação .......................................................................................................................3
1.3. Método estatístico ................................................................................................................3
1.4. Variáveis ..............................................................................................................................4
1.5. População e amostra ............................................................................................................5
1.6. Amostragem .........................................................................................................................6
1.7. Apresentação de resultados .................................................................................................7
2. MEDIDAS ...............................................................................................................................18
2.1. Algarismos significativos.....................................................................................................18
2.2. Regras para arredondamento .............................................................................................19
2.3. Notação científica (notação exponencial) ...........................................................................19
2.4. Ordem de grandeza............................................................................................................21
2.5. Operações com calculadoras científicas .............................................................................21
3. MEDIDAS DE POSIÇÃO ........................................................................................................21
3.1. Média aritmética .................................................................................................................22
3.2. Média geométrica simples ..................................................................................................24
3.3. Média harmônica simples ...................................................................................................25
3.4. Média quadrática ................................................................................................................25
3.5. Moda ..................................................................................................................................25
3.6. Mediana .............................................................................................................................26
4. MEDIDAS DE DISPERSÃO ...................................................................................................28
4.1. Amplitude total....................................................................................................................28
4.2. Variância populacional........................................................................................................28
4.3. Desvio padrão populacional ...............................................................................................28
4.4. Propriedades da média e do desvio padrão........................................................................29
4.5. Desvio padrão populacional (dados agrupados sem intervalos de classe) .........................29
4.6. Variância amostral e desvio padrão amostral .....................................................................30
4.7. Coeficiente de variação ......................................................................................................31
4.8. Escore padronizado ............................................................................................................31
4.9. Desvio padrão da média .....................................................................................................32
5. PROBABILIDADE ..................................................................................................................33
5.1. Conceitos básicos ..............................................................................................................33
5.2. Avaliação da probabilidade .................................................................................................33
5.3. Distribuição de probabilidade..............................................................................................34
6. DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE ...........................................................34
6.1. Distribuição Binomial ..........................................................................................................34
6.2. Distribuição de Poisson ......................................................................................................36
7. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE ..........................................................37
7.1. Distribuição Normal ............................................................................................................37
7.2. Aproximação da Distribuição Binomial pela Distribuição Normal ........................................41
7.3. Distribuição t de Student.....................................................................................................43
7.4. Distribuição F .....................................................................................................................47
8. CRITÉRIOS DE REJEIÇÃO DE RESULTADOS ....................................................................50
8.1. Teste Q ..............................................................................................................................50
8.2. Teste de Grubbs .................................................................................................................51
8.3. Teste Cochran ....................................................................................................................53
9. ANÁLISE DE VARIÂNCIA ......................................................................................................53
9.1. Análise de variância com número diferente de repetições ..................................................56
10. CORRELAÇÃO E REGRESSÃO ...........................................................................................57

10.1. Equações das principais curvas .........................................................................................58
10.2. Correlação ..........................................................................................................................59
10.3. Regressão linear simples ...................................................................................................60
11. REFERÊNCIAS BIBLIOGRÁFICAS .......................................................................................63
12. RESPOSTAS DOS EXERCÍCIOS PROPOSTOS ...................................................................64
ESTATÍSTICA DESCRITIVA
1. COLETA E APRESENTAÇÃO DE DADOS
1.1. Introdução
O Vocábulo Estatística é originado do latim Status (Estado). Foi empregado pela primeira vez por
Godofredo Achenwall, em meados do século XVIII.
A Estatística é historicamente relacionada às coisas do Estado, do Governo e da Administração.
Na mão dos estadistas, constituiu-se de verdadeira ferramenta administrativa. A própria Bíblia nos
leva a essa recuperação histórica: Maria e José viajaram de Nazaré para Belém, na época do
nascimento de Jesus Cristo, para que fossem recenseados. Naquele tempo, por imposição do
imperador César Augusto, toda a população do império romano deveria se alistar em suas cidades
de origem (a palavra “censo” deriva de censere, que em latim significa “taxar”).
1.2. Conceituação
A Estatística possui alguns conceitos antigos. Ela ainda é usada como simples contagem
aritmética; como sinônimo de dados publicados oficialmente ou como transformações matemáticas.
Assim, é comum ouvir alguém dizer: “Aqui estão as estatísticas sobre o jogo realizado ontem!”.
Eis alguns conceitos modernos para a Estatística:
“É a parte da matemática aplicada que se ocupa em obter conclusões a partir de dados
observados”.
“É a estimativa de um parâmetro a partir de uma amostra” (parâmetro é o elemento numérico
usado para caracterizar todo o conjunto).
1.3. Método estatístico

Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se
deseja. Podemos distinguir no método estatístico as seguintes fases:
1.3.1. Coleta de informações

Após cuidadoso planejamento e a devida determinação das características mensuráveis do
fenômeno que se quer pesquisar, damos início à coleta de informações (ou dados). A coleta pode ser
direta ou indireta.
A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos,
casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos
prontuários dos pacientes de um hospital ou, ainda, quando os dados são coletados pelo próprio
pesquisador através de inquéritos e questionários.
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do
conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo,
podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma
coleta direta.
1.3.2. Crítica dos dados

Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e
imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir
sensivelmente nos resultados. A crítica é externa quando visa às causas dos erros por parte do infor-
mante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa
observar os elementos originais dos dados da coleta.
1.3.3. Apuração dos dados

Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante
critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.
1.3.4. Exposição ou apresentação dos dados

Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser a
representados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que
está sendo objeto de tratamento estatístico.
1.3.5. Análise dos resultados

O objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações
fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores
(Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da
Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses
resultados conclusões e previsões.
1.4. Variáveis
A cada fenômeno corresponde um número de resultados possíveis. Exemplos:
Ex.1: para o fenômeno "sexo" são dois os resultados possíveis: sexo masculino e sexo feminino;
Ex.2: para o fenômeno "número de filhos" há um número de resultados possíveis expresso
através dos números naturais: 0, 1, 2, 3, ..., n;
Ex.3: para o fenômeno "estatura" temos uma situação diferente, pois os resultados podem tomar
um número infinito de valores numéricos dentro de um determinado intervalo.
Variável: é o conjunto de resultados possíveis de um fenômeno. Podem ser classificadas como
qualitativas ou quantitativas.
1.4.1. Variável qualitativa

Quando seus valores são expressos por atributos: sexo (masculino ou feminino); religião (católica,
protestante,...); escolaridade (fundamental, médio, superior), etc. Podem ser classificadas como
nominais ou ordinais.
Variáveis qualitativas ordinais

Quando apresentam alguma ordenação ou hierarquia. Exemplos:
Escolaridade: 1ºgrau, 2ºgrau, 3ºgrau;
Funcionários de uma escola: diretor, gerente, coordenador, professor, etc.
Variáveis qualitativas nominais

Quando não representam ordenação ou hierarquia. Exemplos:
Sexo (masculino; feminino);
Religião (católica, protestante, espírita...);
Município de origem: Campos dos Goytacazes, São Fidélis, São João da Barra, etc.
1.4.2. Variável quantitativa

Quando seus valores são expressos em números. Exemplo: os salários dos operários, a idade
dos alunos de uma escola, etc.
Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe
o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto
enumerável recebe o nome de variável discreta.
Assim, o número de clientes de um banco pode assumir qualquer um dos valores do conjunto N =
{ 1, 2, 3, ..., 188, ...}, mas nunca valores como 2,5 ou 3,78 ou 4,325. Logo, o número de clientes é
uma variável discreta. Já o saldo da conta desses clientes é uma variável contínua, pois pode
assumir um conjunto não enumerável de valores, como R$172,54 ou R$172,5402, etc. Outro
exemplo de variável contínua é o peso de atletas de uma determinada equipe: um atleta pode pesar
72 kg, como 72,5 kg ou ainda 72,520 kg. A medida depende da precisão do equipamento utilizado,
no caso, uma balança. De um modo geral, as medições dão origem a variáveis contínuas e as con-
tagens ou enumerações dão origem a variáveis discretas.
Designamos as variáveis por letras latinas, em geral, as últimas: X, Y, Z.
Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possíveis de um determinado fenômeno.
Usando a letra X para indicar a variável relativa ao fenômeno considerado, temos: X  {2, 3, 5, 8}.
1º. Exercício Proposto

Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas (discreta ou
contínua):
Universo: alunos de uma escola.

Variável 1: Cor dos cabelos. .........................................................................................
Variável 2: Série ...........................................................................................................
Variável 3: Estatura ......................................................................................................
Variável 4: Número de irmãos ......................................................................................
Universo: casais residentes em uma cidade.

Variável 1: Número de filhos ........................................................................................
Variável 2: Renda familiar ..............................................................................................
Variável 3: Classe social ..............................................................................................
Variável 4: Saldo bancário ...........................................................................................
1.5. População e amostra
1.5.1. População
População Estatística ou Universo Estatístico é o conjunto de entes portadores de pelo menos
uma característica comum. Os estudantes, por exemplo, constituem uma população, pois apre-
sentam pelo menos uma característica comum: são os que estudam.
Em qualquer estudo estatístico, as características dos elementos que constituem a população de-
vem estar perfeitamente definidas a priori. Isso se dá quando, considerado um elemento qualquer,
podemos afirmar, sem ambigüidade, se esse elemento pertence ou não à população. É necessário,
pois, existir um critério de constituição da população que seja válido para qualquer pessoa, no tempo
ou no espaço.
Por isso, quando pretendemos fazer uma pesquisa entre os alunos das escolas de 1° grau,
precisamos definir quais são os alunos que formam o universo: os que atualmente ocupam as
carteiras das escolas, ou devemos incluir também os que já passaram pela escola? É claro que a
solução do problema vai depender de cada caso em particular.
Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as
observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa
parte proveniente da população em estudo denominamos amostra.
1.5.2. Amostra
É um subconjunto finito de uma população.
Como vimos a Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com
base em resultados verificados em amostras retiradas dessa população.
Mas, para as inferências serem corretas, é necessário garantir que a amostra seja representativa
da população, isto é, a amostra deve possuir as mesmas características básicas da população, no
que diz respeito ao fenômeno que desejamos pesquisar. E preciso, pois, que a amostra ou as
amostras que vão ser usadas sejam obtidas por processos adequados. Há casos, como o de
pesquisas sociais, econômicas e de opinião, em que os problemas de amostragem são de extrema
complexidade. Mas existem também casos em que os problemas de amostragem são bem mais
fáceis. Como exemplo, podemos citar a retirada de amostras para controle de qualidade dos
produtos ou materiais de determinada indústria.

Nem sempre é possível coletar todos os dados da população para a análise desejada (censo).
Faz-se então uma amostragem representativa dessa população. Tanto a amostragem quanto o
censo apresentam vantagens e desvantagens em relação ao outro. Cite duas vantagens de cada tipo
de coleta de dados.
Vantagens do censo: ___________________________________________________________
_____________________________________________________________________________
Vantagens da amostragem: ______________________________________________________
_____________________________________________________________________________
1.6. Amostragem
A amostragem é uma técnica especial para recolher amostras que garante, tanto quanto possível,
o acaso na escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser
escolhido, o que garante à amostra o caráter de representatividade.
1.6.1. Amostragem casual ou aleatória simples

Este tipo de amostragem é equivalente a um sorteio lotérico. Pode ser feita numerando-se a
população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k
números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra.
Exemplo: Para obter uma amostra representativa para uma pesquisa sobre estatura de uma turma
de noventa alunos de uma escola, seguimos os seguintes passos:
1º passo: numeramos os alunos de 01 a 90.
2º passo: escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel,
colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel
e retiramos, um a um, nove números que formarão a amostra. Nesse caso, 10% da população.
Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso.
A fim de facilitá-lo, foi elaborada uma tabela (Tabela de Números Aleatórios), construída de modo
que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas.
Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da
mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme
nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),
verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou
descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita antes
de iniciado o processo.
1.6.2. Amostragem proporcional estratificada

Muitas vezes a população se divide em subpopulações (estratos). Como é provável que a variável
em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada
estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em
consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada,
que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao
número de elementos dos mesmos.
Exemplo: Suponhamos que no exemplo anterior, dentre os noventa alunos, 54 sejam meninos e
36 sejam meninas, vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10%
da população. Logo, temos:
a) Definição dos estratos:
Sexo População Amostra
M 54 5
F 36 4
Total 90 9
Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90,
meninas. A amostra é obtida usando-se uma Tabela de Números Aleatórios ou simplesmente por
sorteio dos números.
1.6.3. Amostragem sistemática

Quando os elementos da população já se acham ordenados, não há necessidade de construir o
sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua,
as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode
ser feita por um sistema imposto pelo pesquisador.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para
pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra
em 10% da população.
Exemplo: Suponhamos uma rua contendo novecentas casas, das quais desejamos ter uma
amostra formada de cinqüenta casas. Podemos, neste caso, usar o seguinte procedimento: como
900/50 = 18, escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o
primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente
considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da
rua, a 4a casa, a 22a , a 40a e assim sucessivamente, até voltarmos ao início da rua, pelo lado
esquerdo.
3º. Exercício proposto

Dentre os 3 tipos de amostragem estudados, qual seria o mais indicado para se obter uma
amostra de 10% dos fregueses que almoçam num restaurante self service? Justifique.
______________________________________________________________________________
______________________________________________________________________________
1.7. Apresentação de resultados

Um dos objetivos da Estatística é sintetizar os valores que uma determinada variável pode
assumir, de forma que tenhamos uma visão global da sua variabilidade. Isso se consegue,
inicialmente, apresentando os dados em tabelas e gráficos, que fornecem informações rápidas e
seguras aos tomadores de decisão.
1.7.1. Tabelas estatísticas

Uma tabela deve apresentar a seguinte estrutura: cabeçalho, corpo e rodapé.
Cabeçalho
Conjunto de informações localizado no topo da tabela que responde às perguntas: O que? (fato);
Onde? (local) e Quando? (tempo).
Corpo
Conjunto de linhas, colunas e subcolunas que contém informações sobre a variável em estudo. O
corpo da tabela é formado por uma coluna indicadora: parte da tabela que especifica o conteúdo
das linhas; por linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que
se inscrevem nos seus cruzamentos com as colunas; e por casas ou células: interseções entre
linhas e colunas que comportam somente um dado numérico.
Rodapé
Espaço abaixo do corpo da tabela reservado para observações pertinentes a tabela, bem como o
registro e identificação da fonte dos dados.
Os seguintes pontos devem ser observados na preparação das tabelas:
 Organizar as tabelas, de tal forma que o leitor possa entendê-las sem que seja necessário
recorrer ao texto para a sua compreensão;
 Delimitar a estrutura da tabela na parte superior e na parte inferior por traços paralelos;
 Recomenda-se não fechar por traços verticais os lados externos da tabela, tanto à direita
como à esquerda;
 Quando for necessário deitar a tabela numa página, fazendo a rotação no sentido anti-
horário.
Exemplo geral
Produção de café - Brasil - 1991-1995 cabeçalho
Anos Produção (1.000t)

1991 2.535
corpo 1992 2.666

1993 2.122
1994 3.750
1995 2.007
Fonte: IBGE
1.7.2. Séries
São tabelas estatísticas. Conforme critério de agrupamento, as tabelas são classificadas em série
cronológica, temporal, evolutiva ou histórica, série geográfica ou de localização e série específica.
Série cronológica
É uma série estatística em que os dados são representados segundo a época de ocorrência.
Exemplo dado acima.
Série geográfica ou de localização

Ë uma série estatística em que os dados são observados segundo a localidade de ocorrência.
Série específica
É uma série estatística em que os dados são agrupados segundo a modalidade de ocorrência.
Exemplo
Matrículas no Ensino de Terceiro Graus no Brasil em 1973 (ciclo básico)

Áreas de ensino Matrículas
Ciências biológicas 32.109
Ciências exatas e tecnológicas 65.949
Ciências agrárias 2.419
Ciências humanas 148.842
Letras 9.883
Artes 7.464
Duas ou mais áreas 16.323
Fonte: Serviço de Estatística da Educação e Cultura
1.7.3. Gráficos
O gráfico é uma forma de comunicação do fenômeno em termos visuais. Portanto, representa um
relato matemático-geométrico de um problema, o que facilita sobremaneira a compreensão do
fenômeno estudado. Os relatos científicos, os relatórios técnicos, os relatórios administrativos, os
estudos realizados por professores ou mesmo alunos fazem uso extensivo de gráficos.
Um gráfico, da mesma forma que a tabela, deve ser estruturado com: cabeçalho, corpo e rodapé.
Recomenda-se que o gráfico mantenha uma proporção entre altura e largura entre 3/4 a 2/3 e que
contenha essencialmente, as seguintes características:
Simplicidade: o gráfico deve ser destituído de detalhes de importância secundária, assim como
de traços desnecessários que possam levar a uma análise morosa ou com erros;
Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do
fenômeno em estudo;
Veracidade: o gráfico deve expressar a veracidade sobre o fenômeno em estudo.
Os principais tipos de gráficos são: diagramas, cartogramas e pictogramas. Os pictogramas são
representações pictóricas sobre o fenômeno representado. Os cartogramas apresentam os dados
em cartas geográficas. Nessa apostila apresentaremos somente os principais tipos de diagramas.
Diagramas
São gráficos geométricos de no máximo duas dimensões, e para a sua construção, em geral, faz-
se uso do sistema cartesiano. Nesse sistema, faz-se uso de duas retas perpendiculares; as retas são
os eixos coordenados e o ponto de interseção, a origem. O eixo horizontal é denominado eixo das
abscissas (ou eixo x) e o vertical, eixo das ordenadas (ou eixo dos Y). Exemplo:
Potencial de ionização dos primeiros vinte elementos da tabela periódica
Número Potencial de Número Potencial de
Elemento Elemento
atômico (Z) ionização (kJ/mol) atômico (Z) ionização (kJ/mol)
H 1 1312 Na 11 495,8
He 2 2371 Mg 12 737,6
Li 3 520 Al 13 577,4
Be 4 900 Si 14 786,4
B 5 800 P 15 1021
C 6 1086 S 16 999,6
N 7 1402 Cl 17 1255
O 8 1314 Ar 18 1520
F 9 1681 K 19 418,8
Ne 10 2080 Ca 20 589,5
Fonte: BRADY - Química Geral - volume 1
Diagramas triangulares
Usam-se os gráficos triangulares, quando se pretende representar três variáveis ao mesmo
tempo. Essas variáveis deverão estar relacionadas entre si, e suas intensidades podem ser
representadas em termos percentuais.
100%A
90
80
70
60
50
40
30
%m/m
20 A
10
0
Exemplo:
Diagrama ternário de uma liga hipotética formada pelos elementos A, B e C.
100%
C
%A
%C
100%
A 0 20 40 60 80 100 %
% de B B
Determine a composição da liga no ponto marcado no diagrama. Localize no diagrama a liga com
40% de B, 30% de A e 30% de C.

No diagrama ternário a seguir, têm-se as composições em massa de nitrogênio (N2 ), metano
(CH4) e oxigênio (O2) numa mistura gasosa a uma dada temperatura. As composições do triângulo
de linhas em negrito indicam que a mistura é explosiva. Com base no diagrama apresentado,
responda às seguintes questões.
a) A mistura de 30% de N2, 50% de O2 e 20% de CH4 em massa, num reator, é explosiva?
Justifique sua resposta.
b) A partir de que percentagem em massa de N2, a condição do item anterior será modificada,
caso seja mantida a percentagem de CH4 na mistura? Justifique sua resposta.
100%
CH4
% O2
% CH4
Misturas
explosivas
100%
O2
0 20 40 60 80 100 %
% de N2 N2
Montagem de gráficos
Não existe fórmula pronta para a montagem de um bom gráfico. Existem alguns aspectos que
devem ser observados para não comprometer a qualidade dos dados coletados e algumas dicas que
quando seguidas levam a produção de um bom gráfico, além, é claro de um bom senso crítico.
1o - A escolha do papel deve ser feita de forma que permita a leitura no gráfico do mesmo número
de algarismos significativos que aparecem nos dados;
2o - Para melhor organização do gráfico deve-se deixar uma margem de no mínimo 1cm de cada
lado e na margem inferior e de 3 a 5 cm na margem superior para indicar o que será representado no
gráfico;
3o - Sempre que for possível, utilize todo o papel a fim de não de não comprometer a precisão dos
dados.
Escalas
Aqui reside a maior dificuldade de construção de gráficos. Quando se vence esta etapa, o restante
fica fácil. Algumas dicas:
1o - Determine o comprimento útil do eixo em unidades do papel (mm ou cm) - L, conforme o
caso;
2o - Determine a amplitude da grandeza a ser representada sobre o eixo (G);
3o - Calcule a razão (escala) E  G

L
o
4 - Procure fazer com que cada unidade de divisão do papel corresponda a um intervalo igual a
1, 2 ou 5 unidades da grandeza representada ou, então 1.10n , 2.10n ou 5.10n , onde n é um número
inteiro. Algumas vezes é tolerável fazer corresponder a cada unidade do papel 4.10n ou 8.10n.
Exemplo
Supondo que se disponha de um papel milimetrado com espaço útil de 150mm, construir uma
escala para representar num eixo os seguintes valores de massa: 5,50; 10,7; 22,4; 45,6; 95,3g.

Numa prática de determinação de densidade no laboratório, foram obtidas experimentalmente as
seguintes massas para corpos de provas em forma de cubos um metal dado pelo professor.
Amostra Aresta do cubo (cm) Volume (cm3) Massa (g)
1 1,00 2,86
2 2,00 22,72
3 3,00 74,52
4 4,00 176,67
5 5,00 345,43
Com base no que foi discutido até agora, determine numa folha de papel milimetrado, a porção útil
do papel e proponha um escala para cada grandeza acima (massa versus volume). Plote os pontos e
responda as seguintes perguntas:
Existe proporcionalidade entre volume e massa?
Existe a possibilidade de descrever a relação entre o volume e a massa por uma relação linear?
Caso exista, ajuste uma reta que represente tal relação.
Determine o coeficiente de inclinação da reta. Interprete esse resultado.
Gráfico em colunas ou em barras

É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou
horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos
respectivos dados.
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos
respectivos dados.
Estas condições asseguram a proporcionalidade entre as áreas dos retângulos e os dados
estatísticos.
Exemplos de gráficos em colunas:
Histogramas
São representações gráficas da distribuição de freqüência em forma de gráficos em colunas
justapostas.
Considere a distribuição de freqüências abaixo, resultante da apuração das alturas de uma turma
de alunos.
i Altura ( cm ) xj fi f ir f i% fiAC
1 154 159 156,5 3 3/50 6 3
2 159 164 161,5 6 6/50 12 9
3 164 169 166,5 9 9/50 18 18
4 169 174 171,5 14 14/50 28 32
5 174 179 176,5 11 11/50 22 43
6 179 184 181,5 4 4/50 8 47
7 184 189 186,5 3 3/50 6 50
 TOTAL - 50 1 100 -
Histograma da distribuição
de freqüência para a variável
altura dos alunos.

Construa esse mesmo histograma no Excel.
Gráfico de Barras de uma distribuição ocupacional.

Seja o quadro de distribuição de freqüências abaixo, referente a uma pesquisa que tem por
objetivo categorizar a ocupação (profissão) de 180 pessoas entrevistadas.
Ocupação (Profissão) Freqüências (fi)

Artesanato 52
Trabalho não qualificado 65
Gerencial 29
Serviços burocráticos 34
Total 180
70
60
Frequência
50
40
30
20
10
0
Artesanato Trabalho não Gerencial Serviços
qualificado burocráticos
Profissão
Como se vê, esta é outra forma de se apresentar o gráfico de colunas. Aqui não se trata de
contagem, mas ao se categorizar os dados em 4 classes de ocupação que não são mensurados
continuamente, o que se faz é revestir esses dados de um nível categórico ou nominal e, portanto,
destacar a natureza discreta dos mesmos. A utilização de retângulos neste exemplo (não é
obrigatória) objetiva apenas destacar as classes de profissão, que são efetivamente classes
(categorias) e não pontos. Entretanto, observar que os retângulos não estão unidos; caso contrário,
existe um hiato entre as bases representativas das classes, de modo a ressaltar o caráter discreto
dos dados.
Exemplo de gráfico em barras
Produção de cebola - Brasil -1982
Estados Quantidades (t)
São Paulo 255.620
R. G. do Sul 168.555
S. Catarina 113.602
Pernambuco 54.091
Minas Gerais 46.903
Paraná 21.903
Fonte: IBGE
Polígonos de freqüências
Um polígono de freqüência é um gráfico em linha, sendo as freqüências marcadas sobre
perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe, ou
quando for o caso, pelos valores constantes no eixo horizontal.
Exemplo:
Polígono de
freqüência
154 159 164 169 174 179 184 189

Construa esse mesmo polígono de freqüência no Excel.
As distribuições de freqüências assumem uma variedade de formatos. As classificações mais
importantes são: distribuições simétricas e distribuições assimétricas.
As distribuições simétricas são aquelas caracterizadas por apresentar o valor máximo no ponto
central e os pontos eqüidistante desse ponto terem a mesma freqüência - distribuição normal ou
distribuição gaussiana (distribuição de Gauss).
A figura abaixo mostra uma curva simétrica.
Exemplo
Os erros indeterminados seguem uma distribuição normal
Na prática, as observações obtidas de medições reais são mais ou menos assimétricas em

relação à freqüência máxima.
Curva assimétrica negativa Curva assimétrica positiva
Portanto, as variações nas formas das distribuições (entender como curvas de freqüência) podem
ser caracterizar em termos de simetria ou, conforme haja um acúmulo de dados extremos na cauda
esquerda ou na cauda direita da curva, em termos de assimetria negativa ou positiva.
1.7.4. Ogivas
São gráficos que apresentam a distribuição de freqüência acumulada abaixo de qualquer
limite superior de classe, locado (plotado) em relação a esse limite.
Exemplo: Distribuição das alturas de uma turma de alunos.
Gráficos setoriais
O gráfico setorial é um dos mais simples recursos gráficos, pois consiste em um círculo cujos
setores ou partes do mesmo círculo totalizam 100%. Eles são especialmente úteis quando se deseja
ressaltar a participação do dado no total.
O total é representado pelo círculo que fica dividido em tantos setores quantas forem às partes. As
áreas dos setores circulares são respectivamente proporcionais aos dados da série.
Obtêm-se as áreas proporcionais a cada setor por regra de três simples e direta, lembrando que o
total corresponde a 360o.
Exemplo:
A turma de Licenciatura do TEFEC apresenta a seguinte distribuição de freqüência com relação a
opção de especialização:
Opção de especialização Freqüência (fi) %

Biologia 16 32
Física 15 30
Indeciso 3 6
Química 16 32
Total 50 100
O correspondente gráfico setorial está representado na figura a seguir:

Construa um gráfico setorial do meio de transporte usado pelos estudantes da turma de
licenciatura do TEFEC/2008.
Meio de transporte (fi) (fi%) Angulo (0)

A pé 4
Bicicleta 3
Carro 8
Moto 6
Ônibus 29
Total
2. MEDIDAS
Conforme visto, medir uma variável constitui o primeiro passo no exame de um determinado
fenômeno. Medir é o ato de expressar numericamente a intensidade de uma determinada grandeza,
em termos de uma unidade. Uma unidade de medida se constitui numa quantidade precisamente
definida da grandeza que se quer medir.
Exemplo:
Grandeza: largura de uma sala;
Unidade: metro
Medida da largura da sala: 3m = 3xm = 3x1m (três vezes a unidade metro).
2.1. Algarismos significativos

Considere a medida de volume feita nas seguintes buretas:
Veja que na leitura do volume gasto na 1a bureta, há uma incerteza em estimar valor
(interpolação) do número de décimos de mL, enquanto que na 2a bureta, a incerteza está em estimar
o valor do número de centésimos de mL gastos (bureta mais precisa).
Os algarismos necessários para expressar o resultado de uma medida com a mesma precisão do
instrumento usado são chamados algarismos significativos. Portanto, faz-se necessário aprender a
representar uma medida com a precisão do instrumento usado.
A determinação dos algarismos significativos em um número pode ser feita mediante o emprego
das seguintes regras:
1o) Todos os algarismos não nulos em um número, são significativos.
2o) Todos os zeros entre dois algarismos significativos não nulos, são significativos .
Exemplo:
100,122 120,012 110,101 11,0011
todos com 6 algarismos significativos
3o) Todos os zeros tanto à direita da vírgula decimal, como à direita de um dígito não nulo, são
significativos.
Exemplos:
12,00 0,1200 1,200 120,0
o
4 ) Todos os zeros à esquerda de um algarismo não nulo, mas à direita de uma vírgula decimal
não são significativos, se não houver algarismos não nulo à sua esquerda.
Exemplos:
0,0123 0,000123 0,00000321 0,123

5 )  = 3,1415926... O valor de  é conhecido com um número de algarismos significativos
o
maior do que você jamais usará num cálculo. Conhece-se  com 1.011.196.691 algarismos
significativos.
2.1.1. Adição e subtração

Será mantido na resposta, somente o número de algarismos significativos correspondentes a
quantidade (parcela) com menor número de algarismos significativos à direita da vírgula.
Massa 1 104,65 g (balança de precisão)

Massa 2 0,2248 g (balança analítica)
Massa total 104,87 g
2.1.2. Multiplicação e divisão

As regras são mais complicadas, porém para as pretensões pode-se adotar para a resposta, o
mesmo número de algarismos significativos da medida menos precisa:
Exemplo: 6,3 x 2,14 = 13,482 = 13
6,3
 2,9439252  2,9
2,14
Observação:
Em determinadas situações faz-se necessário expressar a resposta em notação científica:
50,3 x 20,7 = 1041,21 = 1,04.103
Os números resultantes de enumerações ou de contagens, ao contrário das medições, são
naturalmente exatos, e assim, têm uma quantidade ilimitada de algarismos significativos.
2.2. Regras para arredondamento

Um número é arredondado para outro com o número desejado de algarismo significativos, pelo
cancelamento de um ou mais algarismos à direita. A regra é a seguinte:
1o) Se o dígito a ser suprimido é menor que 5 (cinco), o algarismo precedente não é alterado.
2o) Se o dígito a ser suprimido é exatamente 5 (cinco), o algarismo precedente é acrescido
de 1 caso seja ímpar, e mantido caso seja par.
3o) Se o dígito a ser suprimido é maior que cinco ou cinco sucedido de algum algarismo não
nulo, o algarismo precedente é acrescido de 1.
Ao resolver problemas com calculadoras portáteis, os cálculos se fazem com todos os
algarismos admitidos pelas calculadoras, e o arredondamento deve ser feito no final dos cálculos. O
arredondamento no meio dos cálculos podem introduzir erros.
2.3. Notação científica (notação exponencial)

Em química e física principalmente, trabalha-se muitas vezes com números extremamente
grandes ou extremamente pequenos.
Exemplos:
1o) massa de um átomo de carbono = 0,000 000 000 000 000 000 000 019 94 g
2o) 1 mol de átomos = 602 204 500 000 000 000 000 000 átomos
Ao escrever esses números, especialmente aqueles que comportam muitos zeros, antes ou
depois da vírgula, é conveniente empregar a notação científica, que utiliza as potências de dez (10),
para simplificar a escrita destes números.
Um número escrito em notação científica consiste de duas partes multiplicadas (um coeficiente e
uma potência decimal): C x 10n
onde:
C = coeficiente, um número entre 1 (inclusive) e 10 (exclusive): 1  C <10
10n = potência decimal onde n é um número inteiro qualquer.
Exemplos:
a) Números maiores que 1
321 = 3,21 x 102 veja que 1  3,21 < 10
376000 = 3,76 x 105 veja que 1  3,76 < 10
b) Número menor que 1
0,001 = 1 x 10-3 veja que 1  1 < 10
0,0000431 = 4,31 x 10-5 veja que 1  4,31 < 10
2.3.1. Adição e subtração

Para adicionar ou subtrair números escritos em notação científica, primeiro cada número deve ser
escrito com a mesma potência de 10. Em seguida, os coeficientes são adicionados ou subtraídos,
conforme o caso, e o resultado é multiplicado pela potência de 10 comum.
Exemplo:
2,17x105 + 0,30x105 = (2,17 + 0,30)x105 = 2,47x105
(2,17x105) + ( 3,0x104) = ou
5
21,7x104 + 3,0x104 = 24,7x104 = 2,47x10
2.3.2. Multiplicação e divisão

Para multiplicar números escritos em notação exponencial, primeiro multiplicam-se os coeficientes
e em seguida repete-se (multiplica-se) a base 10 e somam-se os expoentes:
Exemplo:
(5,00 x 104) x (1,60 x 102) = (5,00 x 1,60) x 10 4 + 2 = 8,00 x 106
Para dividir números escritos em notação exponencial, primeiro dividem-se os coeficientes e em
seguida repete-se (multiplica-se) a base 10 e subtraem-se os expoentes:
Exemplo:
(6,01 x 10-3) / (5,23 x 10-6) = (6,01 / 5,23) x 10-3-(-6) = 1.149, 14
2.3.3. Potenciação e radiciação

Para elevar um número em notação exponencial a uma potência ou extrair uma raiz utiliza-se as
seguintes regras:
Potenciação: (Cx10n)a = Cax10nxa
n
n
Radiciação: a
c.10  a c .10a
Exemplo:
2,0 x10   2,0 x 10 

2 3 3 2 3
 8,0 x 10 6
2
4,0 x 10 2  4,0 x 10 2  2,0 x10 1  0,2
5 5
4,0 x 10  5
4,0 x10  2,0 x 10
2 2
 632,46
2.4. Ordem de grandeza

Para encontrarmos a ordem de grandeza de um número, procedemos da seguinte forma:
1 – Escreva-o em notação cientifica: C x 10n
2 – Se C  3,16, a ordem de grandeza será 10n+1
3 – Se C  3,16, a ordem de grandeza será 10 n
Exemplos:
6,0x107 OG = 108
3,0x103 OG = 103
4,51  OG = 101
2.5. Operações com calculadoras científicas

Estas operações ficam extremamente facilitadas quando são utilizadas calculadoras científicas.
Daí, que se recomenda aprender a realizar as principais operações matemáticas mencionadas
abaixo.
Use uma calculadora científica para fazer as seguintes operações, anotando a seqüência de
operações:
Operação matemática Tecla Exemplo Operação Resultado
Raiz quadrada 25 5
1
Raiz enésima 3 5
x y 125
Potência xy 53 125
Quadrado x2 2,52 6.25 = 6,25
exp 6.02x1023 =
Expoente 6,02x1023
6,02x1023
-2.90309 =
Logaritmo decimal log Log1,25x10-3
-2,90309
-6.6846117 =
Logaritmo neperiano ln Ln1,25x10-3
-6,6846117
Antilogaritmo decimal 10x Antilog 1 10
Antilogaritmo neperiano ex Antiln 1 2,718281828
3. MEDIDAS DE POSIÇÃO
Uma medida de posição é um valor calculado para um grupo de dados que, de alguma forma, é
utilizado para descrevê-los. Tipicamente o que se deseja é que o valor seja representativo de todos
os valores do grupo. As medidas de posição mais importantes são as medidas de tendência central e
as separatrizes.
As medidas de tendência central recebem esta denominação pelo fato de os dados observados
tenderem, geralmente, a se agrupar em torno dos valores centrais. As principais medidas de
tendência central são: Média aritmética (simples e ponderada); Moda e Mediana.
As separatrizes são medidas de posição que dividem uma série de dados em duas partes
quaisquer. Não tendem, portanto a um valor central. São elas a própria mediana, o quartil; o decil e o
percentil.
3.1. Média aritmética
3.1.1. Média aritmética simples (dados não-agrupados ou isolados)

É a soma de todos os valores observados dividida pelo número total de observações.
n
X i x1  x 2  ...  xn
X i 1

n n
onde: X = média aritmética ou simplesmente média;
n = número de total de observações (tamanho da amostra);
Xi , i = 1, 2, ..., n = observações individuais.
Exemplo: Determinar a média aritmética da série: A = 3, 4, 1, 3, 6, 5, 6.
n
X i
3  4  1 3  6  5  6
X i 1
  4,0
n 7
A média aritmética simples é uma medida de posição que procura representar o centro da
distribuição e é utilizada quando os dados não são agrupados ou se apresentam em estado bruto
(dados isolados).
1º. Exercício resolvido

Dadas as alturas, em cm, de 6 jogadores de vôlei da seleção brasileira: 194, 198, 189, 201, 180,
190, determinar a altura média do time.
Resolução:
n
X i
194  198  189  201  180  190
X i 1
 = 192,0 cm
n 6
2) Dado as notas de uma avaliação de 7alunos: 3, 5, 1, 2, 6, 5, 6, determinar a nota média.
n
X i
3  5  1 2  6  5  6
X i 1
 = 4,0
n 7
Observe que a média aritmética é um parâmetro de medida de existência nem sempre concreta,
ou seja, não existe jogador com 192 cm no primeiro exemplo, nem nota igual a 4,0 no segundo. A
média aritmética significa que o conjunto se comporta como se cada um de seus elementos fosse
igual à média.
Em estatística, convencionou-se representar uma medida descritiva de uma população (parâmetro
populacional) por uma letra grega, enquanto que uma medida descritiva de uma amostra (estatística
amostral) é representada por uma letra romana.
Desse modo, a média aritmética x representa a média de uma amostra de tamanho n. A média
aritmética populacional, , é definida de modo semelhante:

x i
, i = 1, 2, . . . , N
N
onde  é a média aritmética populacional, Xi é o valor da variável e N é o número de itens da
população.
Operacionalmente, as duas fórmulas são idênticas: em ambos os casos são somados todos os
valores, e então o resultado da soma é dividido pelo número de valores da amostra (n) ou da
população (N).
3.1.2. Média aritmética ponderada (dados agrupados sem intervalos de classe )

Nestes casos, em que os dados se revestem de caráter nominal (quase sempre são contagens),
as freqüências são números indicadores da intensidade de cada valor da variável e funcionam como
pesos ou fatores de ponderação. Assim, a média aritmética é dada pela fórmula,
X 
xf i i

x1f1  x 2f2  ...  xnfn
f i f1  f2  ...  fn
onde X é a média aritmética (ponderada), Xi é o valor da variável e fi é a freqüência observada do

valor xi. Veja os exemplos a seguir:

Considere a distribuição abaixo, relativa a 34 famílias de quatro filhos. Tomando como variável o
número de filhos do sexo masculino, calcule o número médio de meninos.
Número de Freqüência
meninos (Xi) (fi)
0 2
1 6
2 10
3 12
4 4
Total 34
Resolução:
Vê-se que se trata de uma média aritmética “ponderada” pelas freqüências.
Portanto, aplica-se a fórmula: X  x f i i

. Logo,
f i
(2x0)  (6x1)  (10x2)  (12x3)  ( 4x 4) 78

X   2,3 meninos
2  6  10  12  4 34
Obs.: Um modo mais prático de se obter a média ponderada, é abrir na tabela uma coluna
correspondente aos produtos xifi :
Número de meninos (xi) Freqüência (fi) xi fi

0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
 34 78
X
x f
i i

78
 2,3 meninos
f i 34
Obs.: Se x, o número de meninos numa família, é uma variável discreta (inteira), a interpretação
do resultado obtido (2 meninos e 3 décimos de menino) pode ser dita como: o maior número de
famílias tem 2 meninos e 2 meninas, sendo que a tendência geral aponta para uma leve
superioridade numérica em relação ao número de meninos.

Determine a média aritmética da série:
Xi 3 4 7 8 12
fi 2 5 8 4 3
Resolução:
Tem-se que Xi são os valores da variável X e fi corresponde a freqüência simples (repetição) de
cada valor Xi. Determina-se a média da seguinte forma:
x f
i Xi fi Xi f I
X
i i
1 3 2 6
2 4 5 20 f i
3 7 8 56
150
4 8 4 32 X   6,8
5 12 3 36 22
 - 22 150
Observe que a média aritmética simples se iguala à média aritmética ponderada quando os pesos
(freqüências) são exatamente iguais.
3.2. Média geométrica simples

A média geométrica de um conjunto n de valores X1, X2, X3,...,Xn é a raiz de ordem n do produto
desses números.
n
G  n
X
i1
i  n X1 . X 2 . X3 .... Xn

Calcule a média aritmética simples e a média geométrica simples dos seguintes conjuntos de
valores A = {2, 4 e 8} e B = {2, 2 e 2}. Compare os valores.
Na prática, quando o número de fatores é muito grande, a média geométrica pode ser calculada
usando logaritmo. Assim:
1
n
 n n 1 n 
G  n  x i    x i   logG  log  x i 
i 1
 i 1  n  i 1 
3.3. Média harmônica simples

É o inverso da média aritmética simples dos inversos.
Dado o conjunto de n valores X1, X2, X3,...,Xn, a média harmônica simples dos n valores é;
1 1 n
H  n
  n
1 1 1 1 1
   ...  
i 1 x x1 x2 xn i 1 x
i i
n n

Calcule a média harmônica dos seguintes conjuntos de valores A = {2, 4 e 8} e B = {2, 2 e 2}.
Compare com os valores da proposta anterior.
3.4. Média quadrática

A média quadrática de um conjunto de valores X1, X2, X3,...,Xn é a raiz quadrada da média
aritmética dos quadrados dos n valores.
X1 2  X 2 2  X 3 2  ...  X n 2  X2
MQ  
n n

Calcule a média quadrática dos seguintes conjuntos de valores A = {2, 4 e 8} e B = {2, 2 e 2}.
Compare com os valores.
Comente comparativamente as várias médias.
3.5. Moda
É o valor que ocorre com maior freqüência dentre os dados observados. Numa amostragem pode
não haver moda (repetição de valores) ou pode haver mais de uma moda.
3.5.1. Moda (dados não-agrupados ou isolados)

A moda de dados não-agrupados corresponde ao(s) valor(es) da série que mais se repete(m).

Determine a moda das séries:
a) A = 3, 4, 1, 3, 6, 5, 6 Mo1 = 3 e Mo2 = 6 (duas modas)
b) B = 70, 75, 76, 80, 82, 83, 90, 180 Série amodal (não apresenta moda)
3.5.2. Moda (dados agrupados sem intervalos de classe)

A moda de dados agrupados sem intervalos de classe também corresponde ao(s) valor(es) da
série que mais se repete(m), ou seja, ela é determinada pelo valor da variável de maior freqüência
simples (fi).

Determine a moda da série agrupada:
Xi 3 4 7 8 12
fi 2 9 8 4 3
Resolução:
A maior freqüência simples é o 9, que corresponde ao valor 4 da variável. Logo, Mo = 4.
3.6. Mediana
É o valor que divide os dados ordenados em duas partes iguais. Se o número de observações
é par, a mediana corresponde à média dos dois valores centrais.
3.6.1. Mediana (dados não-agrupados ou isolados)

Determine a mediana das séries:
a) A = 3, 4, 1, 3, 6, 5, 6 A = 1, 3, 3, 4, 5, 6, 6 Md = 4
80  82
b) B = 70, 75, 76, 80, 82, 83, 90, 180 Md   81
2
3.6.2. Mediana (dados agrupados sem intervalos de classe)
Somar as freqüências simples e dividir por 2 →   fi  ;

 2 
 
Abrir uma coluna para as freqüências acumuladas (FiAC);
Identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências;
A mediana será aquele valor da variável que corresponde a tal freqüência acumulada.

Determine a mediana da série agrupada:
Xi 3 4 7 8 12
fi 2 5 8 4 3
Resolução:
i Xi fi FiAC
1 3 2 2 f i

22
 11
2 4 5 7 2 2
3 7 8 15 Freqüência acumulada imediatamente
superior a 11. Logo, Md = 7
4 8 4 19
5 12 3 22
Total - 22 -

Dado a distribuição: A = -2; -1; -4; 0; -5; -3; 0; 4; 5; 2; determine:
a) A média aritmética ( X )
b) A moda ( Mo )
c) A mediana ( Md )

Dado o comportamento da bolsa de valores do Rio de Janeiro na primeira semana de janeiro de
2002, determine:
2a feira 3a feira 4a feira 5a feira 6a feira
+1,4% +2,4% +2,0% -3,9% -1,9%
a) a variação média é igual a: _____________
b) a variação mediana é igual a: _____________

Qual medida de posição é mais influenciada pelos valores extremos?
a) ( ) média b) ( ) moda c) ( ) mediana
d) ( ) variância e) ( ) desvio padrão

Uma amostra é formada pelas massas de 82 ratos de laboratório. A massa mediana amostral é
determinada pela:
a) soma de todas as massas, dividida por 82
b) média das massas do 41o e 42o valor ordenado
c) massa que mais se repete
d) massa do 41o valor ordenado
e) massa do 42o valor ordenado

Num teste aplicado numa turma de estatística foram obtidas as seguintes notas:
Notas 2 4 6 8 10
Alunos 4 5 7 8 5
Determine:
a) A nota média do agrupamento.
b) A nota que mais se evidencia na turma.
c) A nota que limita as 50% maiores notas.

Em uma pesquisa realizada para se estudar o efeito de um anorexígeno a ser lançado no
mercado, foram constatadas as seguintes idades (anos) dos indivíduos entrevistados:
20 20 20 20 21 21 21 21 21 21 22 22 22 22
22 22 22 23 23 23 23 23 23 23 23 23 23 23
24 24 24 24 24 24 24 24 24 24 24 25 25 25
25 25 25 25 26 26 26 26 26 26 26 26 27 28
Pede-se agrupar os dados e em seguida determinar:
a) A idade média ( X )
b) A idade modal ( Mo )
c) A idade mediana ( Md )
4. MEDIDAS DE DISPERSÃO
4.1. Amplitude total

É a diferença entre o maior e o menor valor observado, ou seja:
R = xmáx - xmín
4.1.1. Amplitude total (dados não-agrupados)

A amplitude total é determinada conforme a definição.

8) Determine a amplitude total das séries:
a) A = 3, 4, 1, 3, 6, 5, 6 R = 6–1=5
b) B = 70, 75, 76, 80, 82, 83, 90, 180 R = 180 – 70 = 110
c) C = 70, 70, 70, 70, 70 R = 0 (dispersão nula)
4.1.2. Amplitude total (dados agrupados sem intervalos de classe)

Mesmo procedimento anterior.

9) Determine a amplitude total da série agrupada:
Xi 3 4 7 8 12
fi 2 5 8 4 2
Resolução:
R = 12 – 3 = 9
4.2. Variância populacional

É a média aritmética dos quadrados dos desvios tomados em relação à média populacional (μ).
 x  
2
 
2 i
4.3. Desvio padrão populacional
 x  
2
  2 i
É a raiz quadrada da variância:
N
Obs.:
O desvio padrão populacional (σ ) pode ser obtido com maior rapidez e precisão quando calculado
x
2
  xi 
2
1   xi  
2
  ou ainda:    xi  N 
i
pela seguinte expressão:  
2
N  N  N 
   

Calcule para as séries (X, Y e Z) abaixo, a média aritmética e o desvio padrão populacional:
Xi X i2 Yi Yi2 Zi Zi2
2 12 1
4 14 2
6 16 3
8 18 4
10 20 5
4.4. Propriedades da média e do desvio padrão

Obs.: Observe que no exercício anterior: Yi = Xi + 10 e Zi = Xi / 2.
A partir dos resultados obtidos é possível fazer as seguintes afirmações sobre as propriedades da
média e do desvio padrão:
Somando-se (ou subtraindo-se) um valor constante de cada um dos valores de uma variável, a
nova média fica aumentada (ou diminuída) dessa constante. Para o exemplo, Y  X  10 .
Multiplicando-se (ou dividindo-se) todos os valores de uma variável por um valor constante, a nova
média fica multiplicada (ou dividida) por essa constante. Para o exemplo, Z  X / 2 .
Somando-se (ou subtraindo-se) um valor constante de cada um dos valores de uma variável, o
novo desvio padrão não será afetado. Para o exemplo, σy = σx.
Multiplicando-se (ou dividindo-se) todos os valores de uma variável por um valor constante, o novo
desvio padrão fica multiplicado (ou dividido) por essa constante. Para o exemplo, σz = σx / 2.

Dado as séries X, Y e Z, marque a alternativa correta:
X = 2, 4, 6, 8, 10 Y = 20, 40, 60, 80, 100 Z = 12, 14, 16, 18, 20
a) ( ) Todas as séries apresentam a mesma amplitude total.
b) ( ) As séries X e Y apresentam a mesma média aritmética.
c) ( ) A série X apresenta o menor desvio padrão.
d) ( ) As séries X e Y apresentam o mesmo desvio padrão.
e) ( ) As séries X e Z apresentam o mesmo desvio padrão.

Determine o desvio padrão populacional da série abaixo:
A = 0,0022; 0,0023; 0,0023; 0,0020; 0,0025; 0,0019; 0,0021
4.5. Desvio padrão populacional (dados agrupados sem intervalos de classe)
f x   fi x i 
2 2
  
i i
Incluem-se as freqüências na fórmula anterior, obtendo-se:
f i
 f 
 i 

10) Determine o desvio padrão da série agrupada:
Xi 3 4 7 8 12
fi 2 5 8 4 3
Resolução:
f x   fi x i
2

2
I xi fi fi x i fi xi2
 
i i
S =
1 3 2 6 18 f i
 f
 i


2 4 5 20 80
3 7 8 56 392 2
1178  150 
4 8 4 32 256 S =   = 7,06 = 2,66
5 12 3 36 432 22  22 
Total - 22 150 1178
4.6. Variância amostral e desvio padrão amostral

Normalmente não conseguimos determinar os parâmetros média e variância da população que
estamos estudando. Retiramos então uma amostra de tamanho n e estimamos o parâmetro
n
x

i
desejado. A média μ da população é estimada pelo estimador: X  i1
e E X   , ou seja, o
n
estimador da média é não tendencioso ou não viciado. Entretanto, a variância 2 da população é
 x  2
x

2 i
estimada por S que é o estimador não viciado da variância. O estimador
n 1
 x 
2
x
S  é um estimador tendencioso ou viciado, pois se demonstra que E (S2 )  2 .
2 i
Assim, o desvio padrão amostral (S) será calculado por: S  S 2


x  x
i
2
. O desenvolvimento
n 1
desta equação fornece uma fórmula operacionalmente mais simples de ser aplicada:
1   xi  2


S   xi 
2
n 1  n 
 
Resumo de fórmulas das 2 principais medidas estatísticas (dados isolados)

População (parâmetro) Amostra (estatística)
Média 
x i
X
x i
N n
1   xi 2  1   xi 2 
   i  S   i 
2 2
Desvio padrão x x
N  N  n 1  n 
   
4.7. Coeficiente de variação

É uma medida relativa de variabilidade, expressa em porcentagem, que compara o desvio padrão
com a média.
S
CV  x 100
X
A grande utilidade do coeficiente de variação é permitir a comparação das variabilidades de
diferentes conjuntos de dados quando as médias dos conjuntos são diferentes.

11) Determine qual dos conjuntos de dados apresenta maior variabilidade:
A = {1, 5, 10, 4} e B = {101, 105, 110, 104}.
Resolução:
1  5  10  4 101  105  110  104
XA  5 XB   105
4 4
S 2

1  52  5  5  10  5  4  5
2 2 2
 14 SA  S2A  14  3,74
A
3
(101 105)2  (105  105)2  (110  105)2  (104  105)2
SB2   14
3
SB  SB2  14  3,74
Neste exemplo tem-se que X A  5  XB  105 e SA = SB = 3,7

Qual conjunto é mais heterogêneo (apresenta maior variabilidade)?
A resposta só pode ser obtida através da comparação entre os coeficientes de variação. Assim:
SA 3,74
CVA  x100  x 100  74,8%
XA 5
SB 3,74
CVB  x 100  x 100  3,6%
XB 105
Conclusão: Como CVB < CVA, pode-se afirmar que existe maior variabilidade entre os valores do
conjunto A (o conjunto A é mais heterogêneo).
Notar que o coeficiente de variação não tem dimensão. É expresso em porcentagem.
4.8. Escore padronizado

É uma medida de afastamento de um elemento ( Xi) em relação ao conjunto (média).
Xi  X
Zi  x 100  500
S
O escore padronizado normalmente varia entre 200 e 800. Se o valor do elemento a ser
comparado (Xi) é igual à média, o escore padronizado será a igual a 500. Se Zi é maior que 500, é
porque o elemento se encontra acima da média do conjunto. Caso contrário, se Zi é menor que 500,
é porque o elemento se encontra abaixo da média do conjunto.

12) Determine em que medida (peso ou idade) o aluno de ordem 3 encontra-se mais afastado em
relação à turma:
Ordem 1 2 3 4 5 6 7 8 9 10
Peso (kg) 58 65 71 66 72 84 68 59 74 64
Idade (anos) 19 21 25 21 32 24 22 18 25 27
Resolução:
Determina-se o escore de cada medida: peso (ZP) e idade (ZI)
58  65  7 1  66  72  84  68  59  74  64 681
XP    68,1 kg
10 10
SP2  58,54 kg 2 (faça os cálculos) SP  S P2  58,54  7,65 kg
XP  XP 71  68,1
ZP  x 100  500  x 100  500  537,9
SP 7,65
XIdade  23,4 anos SI2  17,15 anos2 (faça os cálculos)
SI  SI2  17,15  4,14 anos
XI  XI 25  23,4
ZI  x 100  500  x 100  500  538,6
SI 4,14
Conclusão:
O aluno em questão encontra-se (ligeiramente) mais afastado da turma na variável idade, pois seu
escore padronizado para essa medida (ZI = 538,6) foi maior que o escore determinado para a
variável peso (ZP = 537,9).
4.9. Desvio padrão da média

Se ao invés de uma amostra, tivermos várias amostras provenientes da mesma população,
obteríamos também diversas médias, tantas quantas fossem as amostras e provavelmente todas
diferentes entre si. Considerando o desvio de todas as médias em relação à média das médias,
pode-se calcular o desvio padrão da média. Pode-se demonstrar que a partir de uma única média
chega-se o desvio padrão da média, através da seguinte fórmula:
S
SX 
n
O desvio padrão da média dá uma idéia da qualidade da média. Pode ser considerado como
índice de precisão da média. Veja que ele diminui à medida que aumenta o número de observações.
O resultado da média deve ser expresso por:
X  valor  S X
ESTATÍSTICA INFERENCIAL
5. PROBABILIDADE
O termo probabilidade é usado de modo muito amplo na conversação diária para sugerir certo
grau de incerteza sobre uma ocorrência no passado, no futuro ou no presente.
5.1. Conceitos básicos

Fenômeno: é qualquer acontecimento natural.
Fenômeno determinístico: é um fenômeno que fornece um único resultado sob as mesmas
condições.
Fenômeno probabilístico, aleatório ou estocástico: é um fenômeno que fornece mais de um
resultado sob as mesmas condições.
Experimento Aleatório: é aquele que poderá ser repetido sob as mesmas condições
indefinidamente. Exemplos:
E1: Retirar uma carta de um baralho com 52 cartas e observar seu naipe.
E2: Contar o número total de peças defeituosas da produção diária da máquina A.
E3: Jogar uma moeda dez vezes e observar o número de caras.
Espaço amostral (S): é o conjunto de todos os possíveis resultados de um experimento aleatório.
Evento: qualquer conjunto de resultados de um experimento aleatório.
5.2. Avaliação da probabilidade

O cálculo das probabilidades é enunciada da seguinte forma:
N.C.F. ao evento A
P(A)=
N.T.C.
Lê-se: A probabilidade de ocorrência do evento A é dada pelo quociente entre o número de casos
favoráveis ao evento A (N.C.F. ao evento A) e o número total de casos (N.T.C.).
Note que para avaliar a probabilidade de certo evento, você deve “contar” o número de casos
favoráveis ao evento e o número total de casos possíveis do experimento. Trata-se, em última
análise, de um problema de contagem.
13º. Exercício Resolvido:

Qual a probabilidade de aparecer uma face ímpar no lançamento de um dado?
Resolução:
Seja A o evento: {aparecer um número ímpar}.
Então: A = { 1, 3, 5 }, ou seja, N.C.F. = 3.
Quanto ao número total de casos (N.T.C.) será igual a seis, pois o espaço-amostral desse
experimento é S = {1, 2, 3, 4, 5, 6}. Portanto:
N.C.F.ao.evento.A 3 1
P(A)=    0,5  50%
N.T.C. 6 2
Logo, a probabilidade de aparecer um número ímpar no lançamento de um dado é ½ , 0,50 ou
50%.
5.3. Distribuição de probabilidade
Variável aleatória
É a função que associa a todo evento pertencente a uma partição do espaço amostral um único
número real.
Variável aleatória discreta

É quando assume valores em um conjunto finito ou em um conjunto infinito, porém enumerável.
Exemplo: número de gols numa partida de futebol, número de caras no lançamento de 3 moedas,
etc.
Variável aleatória contínua

É quando pode assumir qualquer valor dentro de um intervalo. Exemplo: tempo de duração de
uma partida de futebol, volume gasto numa titulação, etc.
Distribuição de probabilidade
É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento
correspondente, isto é: P ( X = xi ) = P ( Ai), i = 1, 2, ..., n
No lançamento de três moedas, suponhamos X = número de ocorrências da face cara. A
distribuição de probabilidade de X é dada pelo conjunto de pares Xi, P( Xi ), i = 1, ...,n, como mostram
o quadro e o gráfico abaixo:
P (X )
Xi P (Xi )
0 1/8 3/8  
1 3/8
2 3/8
1/8  
3 1/8
 1,00
0 1 2 3 X
1.1. X
Observe que em todas as distribuições de probabilidades de variáveis aleatórias, a soma das
n
probabilidades é igual a unidade:  P (X )  1
i 1
i
6. DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE
6.1. Distribuição Binomial

O experimento consiste num número finito de tentativas repetidas, cada uma das quais tendo
apenas dois resultados possíveis que são registrados como sucesso (p) ou fracasso (q).
As tentativas repetidas são independentes.
As probabilidades associadas com sucesso (p) e fracasso (q) são conhecidas e não mudam
durante a experiência.
A ordem em que aparecem os elementos num grupo não tem importância.
A Distribuição Binomial fornece resposta à seguinte questão: se há n tentativas independentes,
cada qual tendo a mesma probabilidade p de sucesso e (1 - p ) = q de fracasso, qual é a
probabilidade de ocorrência de x sucessos em n tentativas?
6.1.1. Fórmula geral:

Suponha que um experimento seja realizado n vezes. Seja X o número de sucessos. Se a
probabilidade de sucesso em cada prova é p, então a probabilidade de obter x sucessos é dada por:
n n
P (X = x) =   px qn-x onde:   
n!
x x (n  x )! x !

Em cinco lances de um dado honesto, determinar a probabilidade de aparecer o número três:
a) nenhuma vez
b) duas vezes
c) quatro vezes
d) pelo menos quatro vezes
e) no máximo duas vezes.
Resolução:
O experimento é realizado 5 vezes (n = 5); a probabilidade de sucesso (aparecer o número três) é
p = 1/6, e a de fracasso é q = 1- p = 5/6.
5
5 5
a) P (X = 0) =   p0 q5 =    0,4019
0 6
2 3
5  1 5
b) P (X = 2) =   p2 q3 = 10      0,1608
2 6 6
4 1
5 1 5
c) P (X = 4) =   p4 q1 = 5      0,00322
4 6 6
5
5  1
d) P (X = 4) + P (X = 5) = 0,0032 +   p5 q0 = 0,0032 +    0,00335
5 6
5
e) P (X = 0) + P (X = 1) + P (X = 2) = 0,4019 +   p1 q4 + 0,1608 = 0,9645
 1
6.1.2. Propriedades da Distribuição Binomial

Esperança (média): E (X) =  = n . p
Variância: 2 = n . p . q
Desvio padrão:   n.p. q

Em cem lances de uma moeda honesta, qual é a média do número de caras? Qual é o desvio
padrão?
Resolução:
O experimento é realizado 100 vezes (n = 100); a probabilidade de sucesso (obter cara) é p = 1/2.
O número "esperado " de caras em cem lances de uma moeda é:
E (X) = n . p = 100 ( 1/2 ) = 50.
1 1
O desvio padrão é   100 . . = 5
2 2
22º. Exercício proposto: (aplicação da tabela)

Numa prova de múltipla escolha (5 alternativas), contendo 20 questões, determine a probabilidade
de se obter “chutando”:
a) todas as questões
b) exatamente cinco questões
c) nenhuma questão
d) exatamente quinze questões
e) pelo menos oito questões
f) no máximo dez questões
6.2. Distribuição de Poisson
É comum depararmos com distribuição binomial onde n é muito grande (n  ) e p é muito

pequeno (p  0). Nesses casos, não é possível usar a tabela e os cálculos se tornam complicados.
O jeito é usar computador ou então fazer cálculos aproximados. É aí que entra a distribuição de
Poisson. Ela nada mais é que uma aproximação da distribuição binomial.
Aplica-se a distribuição de Poisson quando:
 valor de n é muito grande (supera o maior valor tabelado. No mínimo superior a 15);
 valor de p é muito pequeno (p  0,1);
 valor da média () não seja muito elevado (0    10).
Quando isso ocorre, a média ( = np) será tomada como  = np. Assim, a distribuição binomial X:
n
B(n,p) onde P (X =x) =   px qn-x pode ser substituída para:
x
e   x
P (X =x)  , onde: e = 2,71828...
x!

Se a probabilidade de um indivíduo sofrer choque anafilático, resultante da injeção de um
determinado soro, é de 0,001, determinar a probabilidade de, em dois mil indivíduos, exatamente três
sofrerem aquela reação.
Resolução:
De acordo com a distribuição binomial, a probabilidade desejada é dada por:
n  2000 
P (X = 3) =   px qn-x =   (0,001) (0,999)
3 2000-3
= 0,1805
x  3 
O resultado não seria tão simples de ser obtido. Por isso resolveremos esse exercício por
Poisson:
x=3  = n . p = 2000 . (0,001) = 2
e 2 . 2 3
P(X=3)=  0,1804
3!

Dez por cento das ferramentas produzidas por um certo processo de fabricação revelaram-se
defeituosas. Determinar a probabilidade de, numa amostra de dez ferramentas escolhidas ao acaso,
exatamente duas serem defeituosas, mediante o emprego da:
a) distribuição binomial
b) distribuição de Poisson.
Resolução:
A probabilidade de uma ferramenta ser defeituosa é p = 0,1 (q = 0,9) e o número de repetições é
n = 10.
 10 
a) P ( X = 2 ) =   (0,1)2 (0,9)8 = 0,1937
2
b)  = n . p = 10 . (0,1) = 1
e 1 . 12
P(X=2)=  0,1839
2!
Obs: Em geral, a aproximação é boa quando os resultados diferem em menos de 1% ou 0,01.
6.2.1. Propriedades da Distribuição Poisson

Esperança (média): E (X) =  =  = n . p
Variância: 2 =  = n . p
Desvio padrão:   n. p

O controle de qualidade de uma montadora de automóveis acusa 1% de falhas no processo de
proteção antioxidante da lataria dos veículos que produz. Calcule a probabilidade de que:
a) nenhum dos 100 veículos encomendados por uma concessionária apresente a falha citada;
b) apenas um veículo apresente a falha citada em um grupo de 200 veículos vistoriados.
7. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE
7.1. Distribuição Normal

Por sua ampla utilização, em especial na Estatística inferencial, a distribuição normal é uma das
mais importantes distribuições teóricas de probabilidade de variável aleatória contínua.
A variável estatura, a idade e o diâmetro dos parafusos produzidos são exemplos de distribuição
normal, onde cada evento possui freqüência diferente dentro do universo.
7.1.1. A Curva Normal
O aspecto gráfico de uma

distribuição normal é o de um
sino, conforme mostra a
figura ao lado.
A curva normal é também
chamada de curva de
Gauss.
Características da curva normal

A variável aleatória X, normalmente distribuída, pode assumir todo ou qualquer valor real.
A variável aleatória normal tem uma função densidade de probabilidade (chamada de curva
normal) que apresenta a forma de um sino e é unimodal no centro exato da distribuição.
A representação gráfica da distribuição normal é simétrica em torno da média (). A média, a
mediana e a moda da distribuição normal são iguais e localizadas no pico da distribuição.
Ela é assintótica, ou seja, a curva aproxima-se cada vez mais do eixo X, mas nunca o toca
efetivamente.
A área total limitada pela curva e pelo eixo das abscissas é igual a 1, uma vez que essa área
corresponde à probabilidade da variável aleatória X assumir qualquer valor real.
Como a curva é simétrica em torno de , a probabilidade de ocorrer valor maior do que a média é
igual a probabilidade de ocorrer valor menor do que a média. Ou seja, ambas as probabilidades são
iguais a 0,5. Assim, P(x > ) = P(x < ) = 0,5.
Uma distribuição normal fica perfeitamente caracterizada por seus dois parâmetros: a média
(populacional)  e a variância (populacional) 2. Desse modo, a variável aleatória X, com distribuição
normal, pode ser denotada por X: N(,2).
A figura abaixo apresenta duas curvas normal com mesma média, mas distintos desvios
padrão
Pode haver também diversas distribuições normal com o mesmo desvio padrão, mas com
distintas médias ou com médias e desvios padrão distintos. Na realidade a distribuição normal é um
nome genérico para definir uma família de infinitas distribuições normal particulares, cada uma com
os seus valores específicos de média e desvio padrão. O que caracteriza, portanto, e diferencia uma
distribuição normal de outra são os valores destes dois parâmetros: a sua média e o seu desvio
padrão.

Faça duas curvas normal com mesmo desvio padrão e diferentes médias.
A função densidade de probabilidade de uma variável aleatória normal é dada por:

 ( X   )2
1
f ( X)  e 22
2 2
7.1.2. Distribuição Normal Padrão

É muito difícil calcular as probabilidades para distribuições normal por meio de cálculos de
integração. Para evitar este trabalho foi definida uma distribuição normal particular chamada de
distribuição normal padrão. Esta distribuição tem as características de ser uma distribuição normal
com média (valor esperado) igual a zero e desvio padrão igual a 1. Em notação matemática dizemos
que: Z ~ N(0,1)
Se X é uma variável aleatória normal com média  diferente de zero e desvio padrão  diferente
de 1 podemos “converter” essa distribuição em uma distribuição normal padrão através da
transformação linear:
X
Z

Mediante essa transformação, construímos uma única tabela, a da normal reduzida, e, através
dela obtemos as probabilidades associadas a todas as distribuições N(, ) .
A nova origem é o zero;

O desvio padrão é a unidade
de medida;
Essa transformação não altera
a forma da distribuição, apenas
refere-se a uma nova escala.

Determine a área sob a curva normal padronizada entre 0 e 1.
Na tabela 1 (anexo), Z = 1,00

corresponde à área (probabilidade)
igual a 0,3413, ou seja, P (0 ≤ Z ≤
1,00) = 0,3413. Então, 34,13% da
área sob a curva estão entre 0 e 1.

Determine a área sob a curva normal padronizada entre -1 e 1.
A área (probabilidade) é a soma

entre as áreas entre -1 e 0 e entre 0
e 1, ou seja, P (-1 ≤ Z ≤ 1,00) = 2 x
0,3413 = 0,6826.

Determine a área sob a curva normal padronizada entre 1 e 2.
A área (probabilidade) é a
diferença entre as áreas entre 0 e 2
e entre 0 e 1, ou seja, P (1,00 ≤ Z ≤
2,00) = P (0 ≤ Z ≤ 2,00) - P (0 ≤ Z ≤
1,00) = 0,4772 - 0,3413 = 0,1359.

Uma indústria produz lâmpadas com vida útil média de 500 horas e desvio padrão de 100 horas.
Supondo distribuição normal, determine a probabilidade de uma lâmpada se queimar entre 650 e 780
horas.
Resolução:
 = 500 h
 = 100 h
P (650  X  780) = ?
P (650  X  780) = P (500  X  780) - P (500  X  650)

780  500
P (500  X  780)  Z2   2,80 Tabela
 0,4974
100
650  500
P (500  X  650)  Z1   1,50 Tabela
 0,4332
100
P (650  X  780) = P (0,00  Z2  2,80) - P (0,00  Z1  1,50) = 0,4974 - 0,4332 = 0,0642 = 6,42%

O uso diário de água por pessoa em uma determinada cidade é normalmente distribuído com
média  igual a 20 litros e desvio padrão  igual a 5 litros.
a) Que percentagem da população usa entre 20 e 24 litros d’água por dia ?
Resolução: (faça a curva para cada item)

 = 20 L =5L
P (20  X  24) = ?
24  20
P (20  X  24)  0,80  0,2881
Tabela
 Z
5
P(20  X  24) = P(0,00  Z  0,80) = 0,2881 (28,81%).
b) Qual é a probabilidade de uma pessoa selecionada ao acaso usar mais que 28 litros d’água por
dia?
P( X  28) = ?
28  20
P( X  28)  Z   1,60 Tabela
 0,4452
5
P( X  28) = P (Z  1,60) = 0,5 - 0,4452 = 0,0548 = 5,48%
c) Qual é a porcentagem da população que consome entre 18 e 26 litros d’água por dia?
P(18  X  26) = ?
P(18  X  26) = P (18  X  20) + P (20  X  26)
18  20
P (18  X  20)  Z   0,40 Tabela
 0,1554
5
26  20
P (20  X  26)  Z   1,20 Tabela
 0,3849
5
P(18  X  26) = P(-0,40  Z  1,20) = 0,1554 + 0,3849 = 0,5403 = 54,03%
7.1.3. Intervalos de confiança

Cerca de 68% (68,27%) da área sob a curva normal está entre menos um e mais um desvio
padrão da média. Isto pode ser escrito como   1 .
Cerca de 95% (95,45%) da área sob a curva normal está entre menos dois e mais dois desvios
padrões da média, escrito como   2 .
Praticamente toda (99,73 %) a área sob a curva normal está entre menos três e mais três desvios
padrões da média, escrito como   3 .
Fórmula geral: IC :   Z . Portanto, X1    Z  e X2    Z 

Para uma população de elementos cuja média é 32,3 e o desvio padrão 1,4, determine os limites
dos intervalos de confiança de:
a) 90% b) 95% c) 98% d) 99%

Suponha que a temperatura T durante o mês de junho seja normalmente distribuída com média de
68ºF e desvio padrão 6ºF. Determine a probabilidade de a temperatura estar entre 70º F e 80ºF.
7.2. Aproximação da Distribuição Binomial pela Distribuição Normal

A distribuição binomial pode ser aproximada satisfatoriamente pela distribuição normal quando n,
o número de provas, é grande e p, a probabilidade de sucesso em cada prova encontra-se em torno
de 0,5.
Essa aproximação, chamada de Moivre-Laplace, pode ser observada pelo exemplo gráfico de
distribuição de probabilidade do número de caras observadas em lançamentos de 3 e 10 moedas,
respectivamente.
P (X) n=3 P (X)

0,3 n = 10
0,5
0,4
0,2
0,3
0,2
0,1
0,1
0,0
0,0
1 2 3
1 2 3 4 5 6 7 8 9 10 11
Número de caras (X)
Número de caras (X)

Lança-se uma moeda 20 vezes. Qual a probabilidade de se obter de uma a cinco caras, usando:
a) Distribuição binomial
b) Distribuição normal
Resolução:
O experimento é realizado 20 vezes (n = 20); a probabilidade de sucesso (obter cara) é 50% (p =
0,5), e a de fracasso é q = 1- p = 0,5.
a) Distribuição binomial
 1
X = No de caras  X : B  20, 
 2
P 1 X  5  P X  1  P X  2  P X  3  P X  4  P X  5
 20   20 
P (X = 1) =   0,5 0,5  0,00002 P (X = 2) =   0,5 0,5  0,00018
1 19 2 18
1 2
 20   20 
P (X = 3) =   0,5 0,5  0,00109 P (X = 4) =   0,5 0,5  0,00462
3 17 4 16
3 4
 20 
P (X = 5) =   0,5 0,5  0,01479
5 15
5
P 1 X  5  0,00002 + 0,00018 + 0,0019 + 0,00462 + 0,1479 = 0,0207 = 2,07%
A representação gráfica da distribuição completa apresenta semelhança com uma curva
normal.
P (X) 0,18
0,16
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
1 3 5 7 9 11 13 15 17 19 21
X (Número de caras)
Quanto maior o valor de n, maior será a semelhança, conforme demonstrou Moivre:

  x  np 
2
n
PX  x     p x qn  x 
1 2 npq
2
e
x 2 . npq
7.2.1. Correção de continuidade (cc)

Usada para melhorar a aproximação, visto que os valores inteiros da distribuição binomial variam
entre o inteiro mais ou menos meio quando aproximados para uma variável contínua:
P X  k   P k  0,5  X  k  0,5
CC
b) Distribuição normal
  np  20 x 0,5  10
 npq  20 x 0,5 x 0,5  5  2,24
Aplicando a correção de continuidade:

P 1 X  5  P 0,5  X  5,5  P( 4,24  Z  2,01)  0,5  0,4778  0,0222
CC
O erro é pequeno (0,0222 – 0,0207 = 0,0015) e diminui à medida que n cresce.

Um sistema é formado pro 100 componentes, cada um dos quais com confiabilidade de 0,95
(probabilidade de funcionamento do componente durante um certo período de tempo). Se esses
componentes funcionam independentemente um do outro e se o sistema completo funciona
adequadamente quando pelo menos 80 componentes funcionam, qual a confiabilidade do sistema?
Resolução:
Seja X: número de componentes que funcionam  X: B (100; 0,95)
A aproximação da distribuição binomial pela normal é dada por:
  np  100 x 0,95  95
  npq  100 x 0,95 x 0,05  4,75  2,18
P  80  X  100   P 79,5  X  100,5  P(7,11  Z  2,52)  0,5  0,4941  0,9941

CC
A confiabilidade do sistema é de 99,41%.

Determinar a probabilidade de se acertar “por palpite” exatamente 10 em 30 questões do tipo
“Verdadeiro-Falso” considerando a distribuição como:
a) binomial
b) normal
7.3. Distribuição t de Student

É uma distribuição usada para pequenas amostras (menos de 30 elementos) de uma mesma
população. Ela é denominada distribuição t de Student porque seu descobridor Gosset publicava
seus trabalhos sob o pseudônimo de “Student”, no início do século XX.
Tipos de teste t
O teste t pode ser usado em três diferentes casos:
1° caso: comparação da média obtida ( X ) com um valor especificado como referência (µ).
2° caso: comparação de 2 conjuntos de dados independentes quanto às médias.
3° caso: comparação de 2 conjuntos de dados pareados (emparelhados).
7.3.1. Comparação da média ( X ) com um valor especificado como referência (µ)
Fórmula geral
x  X 
t calc  média da amostra;
S onde:   média da população;
n S  desvio padrão da amostra; e
n  número de elementos da amostra
Xi  
Note que essa fórmula lembra a da distribuição normal: Z  . Ela resulta da substituição de

S S
X i por X e de  por . A expressão é denominada erro padrão da média.
n n
Decisão: se tcalc > ttab: rejeita-se a hipótese de igualdade entre as médias.

O valor de t tabelado (ttab) é obtido mediante o conhecimento do tamanho da amostra e do nível de
certeza com que se deseja determinar o intervalo em que está a média da população. O nível mais
comum de se usar é o de 95 % de confiança, isto é, quando se determina um intervalo deseja-se que
uma proporção de apenas 5 valores em cada 100 estejam fora desse intervalo.
A partir do tamanho da amostra (n) obtém-se o número de graus de liberdade (indicado por GL, 
ou df). No caso de uma amostra com n elementos, GL = n – 1. Tem-se então na Tabela 2, para o
nível de confiança escolhido, o valor de t correspondente ao número de graus de liberdade da
amostra.
7.3.2. Graus de liberdade

O número de graus de liberdade é igual ao número de informações da amostra (n) menos o
número de parâmetros da população a serem estimados (k) além do parâmetro inerente ao estudo:
 = n – k. Um conjunto qualquer n de números possui n graus de liberdade, mas a soma  X  X
2
 
usada no cálculo de desvio padrão amostral possui n-1 graus de liberdade porque para qualquer
valor definido de X somente n-1 valores podem ser escolhidos independentemente.
A forma da distribuição t é
Z semelhante a da distribuição
normal. Ela é simétrica em relação
à média  = 0, mas apresenta
t
caudas mais “grossas”, ou seja,
maior variância que a normal
reduzida.

Para cada valor de  temos uma curva diferente de t e à medida que aumenta o número de graus
de liberdade () a curva t se eleva e quando n → ∞ , t → N (0,1).

A especificação de um produto garante teor de cálcio igual a 1,5. Foram feitas 12 determinações,
sendo a média dos valores obtidos igual a 1,7 e o desvio padrão igual a 0,22. Verificar se o lote é
aprovado quando se aceita um risco de 5% de erro.
Resolução:
Dados:   1,5 n  12 X  1,7 S  0,22   0,05

Calcula-se o valor de tcalc:
x  1,7  1,5
t calc    3,15
S 0,22
n 12
Localiza-se em tabela o valor de ttab.

O valor de ttab depende do nível de confiança escolhido e do número de graus de liberdade da
amostra. A tabela a seguir apresenta em negrito o valor de ttab igual a 2,20 para o nível de confiança
igual a 95%, que corresponde ao risco   0,05 (nível de significância de 5%), e para 11 graus de
liberdade.
Nível de confiança
GL
90% 95% 99% NC = 100 – α = 95%
1 6,31 12,71 63,66 GL = n – 1 = 11
2 2,92 4,30 9,92 ttab = 2,20
3 2,35 3,18 5,84

...
...
...
...
10 1,81 2,23 3,17

11 1,80 2,20 3,11
Compara-se o valor de t calculado (t calc) com o valor de t tabelado (ttab ).

tcal = 3,15  ttab = 2,20
Conclusão:
Como tcal  ttab , ao nível de 95% de confiança, rejeita-se a hipótese de igualdade entre a média
amostral e a média populacional.
Outra forma de se usar o teste t é por meio do intervalo onde se encontra a média da população,
quando se conhece uma amostra dessa população é dado por:
tS tS
X     X 
n n
Determina-se então em que intervalo deve estar a média da população de onde foi retirada a
amostra. Substituindo-se os valores na fórmula anterior, tem-se:
2,20 x 0,22 2,20 x 0,22
1,7     1,7 
12 12
1,7 – 0,14    1,7 + 0,14 → 1,56    1,84

Como o valor 1,5 não está contido neste intervalo, a conclusão é que: ao nível de 95% de
confiança, deve-se rejeitar a afirmação de que o lote apresente o teor de cálcio igual a 1,5.

Durante o processo de validação do método de determinação de chumbo em alimento, três
analistas efetuaram 7 replicatas usando material de referência. Determine o intervalo de confiança da
média ao nível de 95% para cada um deles.
Replicata Analista 1 Analista 2 Analista 3
1 0,35 0,45 0,36
2 0,36 0,45 0,33
3 0,33 0,42 0,33
4 0,37 0,42 0,35
5 0,35 0,35 0,38
6 0,36 0,36 0,35
7 0,40 0,35 0,33
Resolução:
Inicialmente determinam-se as estatísticas média, desvio padrão e variância para cada analista:
Estatística Analista 1 Analista 2 Analista 3
Média 0,36 0,40 0,35
Variância 0,000467 0,002067 0,000357
Desvio padrão 0,021602 0,045461 0,018898
O intervalo onde se encontra a média da população é dado por:
tS tS
X     X 
n n
A tabela 2 dos Anexos apresenta o valor de t igual a 2,45 para o nível de confiança de 95% (nível
de significância de 5%), e para 6 graus de liberdade (GL = n - 1 = 7 – 1 = 6).
O intervalo de confiança da média ao nível de 95% para o analista 1 é:
2,45 x 0,021602 2,45 x 0,021602
0,36 < μ < 0,36 +
7 7
0,36 – 0,020    0,36 + 0,020 → 0,34    0,38 (IC = 0,36 ± 0,02)

2,45 x 0,045461 2,45 x 0,045461
0,40     0,40 
7 7
0,40 – 0,04    0,40 + 0,040 → 0,36    0,44 (IC = 0,40 ± 0,04)

2,45 x 0,018898 2,45 x 0,018898

0,35     0,35 
7 7
0,35 – 0,02    0,35 + 0,02 → 0,33    0,37 (IC = 0,35 ± 0,02)

Durante o processo de validação do método de determinação de cobre em bebidas, três analistas
efetuaram 8 replicatas usando material de referência.
Replicata Analista 1 Analista 2 Analista 3

1 2,32 2,24 2,23
2 2,30 2,21 2,38
3 2,34 2,35 2,46
4 2,28 2,19 2,32
5 2,42 2,33 2,17
6 2,31 2,21 2,42
7 2,29 2,24 2,34
8 2,38 2,25 2,39
a) Determine para cada um deles a média, a mediana, a amplitude, a variância, o desvio padrão, o
desvio padrão relativo (DPR), o coeficiente de variação (CV%) e o erro padrão da média.
b) Determine o intervalo de confiança da média ao nível de 95% para cada um deles.
7.3.3. Comparação de 2 conjuntos de dados independentes quanto às médias.
7.4. Distribuição F
Sejam duas amostras caracterizadas pelo seu tamanho (n) e pelos seus parâmetros média e
variância.
Por meio da distribuição de F de Snedecor é possível verificar se as variâncias das populações a
que pertencem esta amostras podem ser consideradas homogêneas com o nível de confiança
desejado. Para tal, calcula-se o valor de F pela fórmula:
S12
Fcalc  2 , onde S12  S 22
S2
O valor obtido para Fcalc, chamado F calculado, é comparado com o valor de F tabelado (Ftab).
A tabela 4 dos Anexos apresenta o valor de Ftab ao nível de confiança 95%. O valor de Ftab é dado
em função dos números de graus de liberdade das amostras. O número de graus de liberdade   é
dado pelo número de elementos da amostra menos um 1  n1  1 e 2  n2  1 .
Decisão: se Fcalc > Ftab: rejeita-se a hipótese de homogeneidade de variâncias.

O teste F é usado para comparar duas variâncias. Um exemplo de aplicação é a comparação de
dois métodos ou dois analistas quanto à precisão.

Está sendo proposto um novo processo para determinação de nitrogênio em petróleo, apontado
como mais preciso que o atualmente em uso. Verificar se a informação pode ser aceita no nível de
95% de confiança.
A igualdade entre precisões pode ser testada pela igualdade entre as variâncias. Para o método
em uso foram feitas 8 determinações de nitrogênio e para método proposto, 10 determinações. A
seguir, determinaram-se as medidas de dispersão:
Método Desvio padrão Variância n 
Em uso 25 625 8 8–1=7
Proposto 13 169 10 10 – 1 = 9
Resolução:
maior var iância 625
Fcalc    3,70
menor var iância 169
A tabela a seguir apresenta em negrito o valor de Ftab = 3,29 para o nível de confiança = 95% e
para os graus de liberdade 1  7 e 1  9  ,
1
1 2 3 4 5 6 7

1 161,4 199,5 215,7 224,6 230,2 234,0 236,8
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89
...
...
...
...
...
...
...
9 5,12 4,26 3,86 3,63 3,48 3,37 ...

3,29
Conclusão: como o F calculado é maior que o F tabelado (Fcalc > Ftab), rejeita-se ao nível de 95%
de confiança a homogeneidade de variância. Portanto, o método proposto é mais preciso que o
método em uso.
7.4.1. Comparação de duas médias com variâncias homogêneas

Quando se deseja comparar os resultados obtidos por diferentes analistas, diferentes laboratórios
ou diferentes métodos, deve-se proceder a um teste de médias.
Antes de se realizar esse teste é necessário aplicar o teste F para saber se as variâncias são
homogêneas. Em caso positivo, aplica-se o teste t com a seguinte fórmula:
X1  X 2
t calc 
1 1
SP 
n1 n 2
onde:
SP é o desvio padrão ponderado, dado por:
(n1  1) S12  (n 2  1) S 22
SP 
n1  n 2  2
O número de graus de liberdade é dado por:   n1  n2  2


Faça um teste estatístico no exercício resolvido n° 26 (página 46) para verificar se os analistas 1 e
3 apresentam diferença significativa quanto à precisão. A seguir, verifique se há diferença
significativa ao nível de 95% quanto às médias obtidas.
Obs.: O teste acima só poderá ser aplicado se as variâncias forem homogêneas. Quando não
ocorre homogeneidade de variâncias devemos usar as fórmulas a seguir.
7.4.2. Comparação de duas médias com variâncias não homogêneas

Quando se pretende comparar duas médias com variâncias não homogêneas, aplica-se o teste t
da seguinte forma:
X1  X 2
t calc 
S12 S 22

n1 n 2
O número de graus de liberdade associado ao valor t é a parte inteira do valor de g obtido por:
2
 S12 S 22 
 
n n  Uma vez determinado o valor de g e, com o
g   1 2  nível de significância especificado, procura-se o
2 2
 S12   S 22  valor de t na tabela.
   
n  n 
 1   2
n1  1 n2  1

Faça um teste estatístico no exercício resolvido n° 26 (página 46) para verificar se os analistas 1 e
2 apresentam diferença significativa quanto à precisão. A seguir, verifique se há diferença
significativa ao nível de 95% quanto às médias obtidas.
7.4.3. Comparação de 2 conjuntos de dados pareados (emparelhados).

O teste t é também aplicado para se estudar o efeito de um tratamento quando as observações
são pareadas.
Os experimentos pareados são empregados para comparar pares de indivíduos (onde um só
recebe o tratamento e o outro é o controle). Pode ser ainda para estudar o mesmo fenômeno antes e
depois do tratamento.
Para aplicar o teste t é preciso primeiramente determinar:
a) A diferença entre cada um dos pares (di):
di = Xi – Yi b) A média das diferenças ( d ):
d
d i
c) O desvio padrão das diferenças (Sd):
n
 d 2
d) O valor de t:
d 2

n
Sd  d n
n 1 t calc 
Sd
A seguir, compara-se o valor de tcal com o valor de ttab, encontrado na tabela associado a n -1
graus de liberdade.
Se o valor de tcal for maior que o valor de ttab, rejeita-se a hipótese nula.

Foram preparadas diferentes matrizes de amostras para comparar um método novo com um
tradicional. Verificar se há diferença significativa entre os 2 métodos para o nível de confiança de
95%.
1 2 3 4 5 6 7 8
Método antigo 2,52 3,13 4,33 2,25 2,79 3,04 2,19 2,16
Método novo 3,17 5,00 4,03 2,38 3,68 2,94 2,83 2,18
Resolução:
Tipo de teste: bicaudal
Hipótese nula: H0 : d  0 Hipótese alternativa: H1 : d  0
n  8    8  1  7  t  / 2  2,36 (tabela 2)
Método
Amostra antigo novo Diferença
1 2,52 3,17 -0,65 d n 0,475 8
t calc    1,92
2 3,13 5,00 -1,87 Sd 0,7003
3 4,33 4,03 0,30
Conclusão:
4 2,25 2,38 -0,13
tcal < ttab: não rejeita a hipótese de
5 2,79 3,68 -0,89 igualdade entre os métodos, ou seja, não há
6 3,04 2,94 0,10 indicação significativa, ao nível de confiança
7 2,19 2,83 -0,64 de 95%, para rejeitar H0. Logo, as médias
dos métodos são compatíveis.
8 2,16 2,18 -0,02
Média - - -0,475
Desvio - - 0,7003
8. CRITÉRIOS DE REJEIÇÃO DE RESULTADOS
É freqüente em uma série de medidas, a ocorrência de um resultado que difere marcadamente

dos demais. Logo se instala uma dúvida: deve-se ou não incluir tal medida no cálculo da média?
Se o resultado puder ser atribuído a algum erro, a rejeição é imediata. Porém quando o resultado
é aparentemente normal adota-se critérios estatísticos baseados no conceito de "diferença
significativa" cuja justificativa, é que uma diferença discrepante em qualquer resultado não ocorre
com freqüência elevada. Então diferenças elevadas devem ser devido a algum erro desconhecido. O
problema é estabelecer o que é uma "diferença elevada" para justificar a rejeição do resultado.
Vários critérios aparem em literatura. Entre os critérios simplistas está o teste do quociente (teste Q),
o teste de Grubbs e o teste Cochran.
8.1. Teste Q
Esse teste deve ser aplicado quando se tem de 3 a 7 resultados (antigamente aplicava-se para
até 10 resultados).
Primeiramente devem-se colocar os resultados em ordem crescente. O resultado duvidoso será

um dos valores extremos.
Chama-se Q calculado (Qcalc) o quociente entre a diferença do valor duvidoso e seu vizinho mais
próximo e a amplitude total (R) dos dados.
Xn  Xn 1 X 2  X1
Q calc  ou Q calc 
R R
Comparar o valor de Q calculado (Qcalc) com o de Q tabelado (Qtab), que é um valor crítico de
rejeição para um dado nível de confiança.
Se Qcalc for maior que o Qtab o resultado duvidoso é rejeitado com o nível de confiança
previamente estabelecido: Qcalc > Qtab → Rejeitar
Tabela 3 - Valores críticos do quociente de rejeição Q em diferentes níveis de confiança.
Número de Nível de confiança

observações 90% 95% 99%
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568

Considere a seguinte série ordenada de observações: 40,01; 40,12; 40,16; 40,18; 40,18 e 40,20.
Aplique o teste Q e decida com 95% de confiança se descarta ou não o primeiro resultado
aparentemente duvidoso.
Resolução:
X 2  X1 40,12  40,01
Q calc    0,579
R 40,20  40,01
Qtab = 0,625 (para n = 6 e NC = 95%)
Como Qcalc < Qtab → Não rejeitar o resultado duvidoso ao nível de 95%.
Exercício proposto:
Verifique se algum resultado deve ser rejeitado ao nível de 90% de confiança. Em caso afirmativo,
compare a média e o desvio padrão antes e depois da rejeição.
8.2. Teste de Grubbs

O teste de Grubbs rejeita valores em relação à estimativa do desvio padrão. Este teste, como o
teste Q, observa valores dispersos anômalos maiores ou menores que aparecem no grupo de
medidas (n < 10).
O Teste de Grubbs é utilizado em um dos 3 casos:
1 ou
3 ou
Resumo do procedimento:
Colocar os valores obtidos em ordem crescente (rol);
Calcular o valor de G (Gcalc) para o caso correspondente;
X  X1 Xn  X
G1  ou G1 
S S
Xn  X1 R
G2  ou G2 
S S
 n  3 x Sn2  2 
G3  1    onde : Sn2  2  var iância sem os 2 dados
 n  1 x S2 
 
Comparar o valor de G calculado (Gcalc) com o de G tabelado (Gtab) para o nível de confiança
previamente estabelecido;
Critério de rejeição:
Se: Gcalc ≤ Gtab (5%) → Não rejeitar o valor ao NC considerado;
Se: Gtab (1%) ≥ Gcalc > Gtab (5%) → O valor é considerado suspeito;
Se: Gcalc > Gtab (1%) → Rejeitar (valor disperso ao NC considerado).
NC = 95% NC = 99%
n
G1 G2 G3 G1 G2 G3
3 1,153 2,00 - 1,16 2,00 -
4 1,463 2,43 1,00 1,49 2,44 1,00
5 1,672 2,75 0,98 1,75 2,80 1,00
6 1,822 3,01 0,94 1,94 3,10 0,98
7 1,938 3,22 0,90 2,10 3,34 0,96
8 2,032 3,40 0,85 2,22 3,54 0,92
9 2,110 3,55 0,81 2,32 3,72 0,89
10 2,176 3,68 0,77 2,41 3,88 0,86
12 2,285 3,91 0,70 2,55 4,13 0,80
13 2,331 4,00 0,67 2,61 4,24 0,77
15 2,409 4,17 0,62 2,70 4,43 0,71
20 2,557 4,49 0,52 2,88 4,79 0,61
25 2,663 4,73 0,45 3,01 5,03 0,53
30 2,745 4,89 0,40 3,10 5,19 0,47

Aplique o teste de Grubbs à série de observações da proposta anterior (40,01; 40,12; 40,16;
40,18; 40,18 e 40,20) e decida se o valor suspeito deve ser rejeitado para um nível de confiança de
95%.
8.3. Teste Cochran

O teste de Cochran é um teste unilateral e apesar de ser muito usado tem como limitação que as
variâncias dos conjuntos de dados (t) devem ter o mesmo número de repetições (n).
t
2
Smáxima
n
i 1
i
Cn  t
n
t
S
i 1
2
i
Critério de rejeição:
Se: Ccalc ≤ Ctab (5%) → Não rejeitar o valor ao NC considerado;
Se: Ctab (1%) ≥ Ccalc > Ctab (5%) → O valor é considerado suspeito;
Se: Ccalc > Ctab (1%) → Rejeitar (valor disperso ao NC considerado).
Os testes de rejeição são artifícios que melhoram apenas a precisão. Veja o exemplo abaixo de
medidas tomadas de uma população cujo valor verdadeiro é igual a 19,00:
Medidas Valores
o
1 18,02
2o 18,04
3o 18,93
o
4 18,00
o
5 18,03
a
Apesar da 3 medida estar mais próxima do valor verdadeiro, provavelmente ela seria descartada
em um teste de confiança.
9. ANÁLISE DE VARIÂNCIA
A análise de variância é aplicada para comparar médias de mais de duas populações.

A análise de variância é empregada para responder ao seguinte questionamento: será que as
diferenças entre as médias das amostras são suficientemente grandes para que se possa afirmar
que as médias das populações são diferentes?
O teste F aplicado na análise de variância permite a separação das variabilidades devido aos
tratamentos da variabilidade devido ao acaso ou resíduo.
Se o valor de F calculado for maior que o valor de F tabelado (valor crítico), então se rejeita a
hipótese nula, ou seja, de que as médias dos tratamentos sejam as mesmas.

Para comparar a produtividade de 4 variedades de milho, um agrônomo plantou 20 parcelas
similares inteiramente ao acaso. Verificar ao nível de confiança de 95% se existe diferença entre as
médias das variedades.
Repetições Tratamentos (k)

(r) A B C D
1 25 31 22 33
2 26 25 26 29
3 20 28 28 31
4 23 27 25 34
5 21 24 29 28
Resolução:
O experimento é constituído por 4 tratamentos e cinco repetições.
A seguir procede-se à série de cálculos:
Repetições Tratamentos (k) Soma Tratamentos ao quadrado (k )

2
Soma
(r) A B C D Y A
2
B
2
C
2
D
2
Y
2
1 25 31 22 33 111 625 961 484 1.089 3.159

2 26 25 26 29 106 676 625 676 841 2.818
3 20 28 28 31 107 400 784 784 961 2.929
4 23 27 25 34 109 529 729 625 1.156 3.039
5 21 24 29 28 102 441 576 841 784 2.642
Total (T) 115 135 130 155 535 2.671 3.675 3.410 4.831 14.587
2
T 13.225 18.225 16.900 24.025 72.375
Média 23,0 27,0 26,0 31,0
o
N de tratamentos (k) k= 4
o
N de repetições (r) r= 5
o
N total de repetições (nk) n = kr = 20
o
a) N de graus de liberdade (GL)
De tratamentos k-1= 3
Do total n - 1 = kr - 1 = 19
Do resíduo (n - 1) - (k - 1) = n - k = 16
b) Correção (C).
 Y 2
25  26  ...  282 535 2
C    14.311,25
n 4x5 20
c) Soma de Quadrados Total (SQT)
SQT  Y 2
 C  625  676  ...  784  14.311,25  275,75
d) Soma de Quadrados de Tratamentos (SQTr)
SQTr 
T 2
C
13.225  ...  24.025 - 14.311,25  163,750
r 5
e) Soma de Quadrados de Resíduos (SQR)
SQR  SQT  SQTr  275,75  163,75  112,00
f) Quadrado Médio de Tratamentos (QMTr)
SQTr 163,75
QMTr    54,583
k 1 4 1
g) Quadrado Médio de Resíduo (QMR)
SQR 112,0
QMR    7,00
n k 20  4
h) Valor de F
QMTr 54,583
F   7,80
QMR 7,00
Na análise de variância de um experimento inteiramente ao acaso, o valor de F está associado ao
número de graus de liberdade de tratamentos (numerador) e ao número de graus de liberdade do
resíduo (denominador) para um dado nível de confiança. Para 1  3 e  2  16 o valor de F =
3,24, para o nível de confiança de 95%.
ANÁLISE DE VARIÂNCIA Tabela
Causas de variação GL SQ QM F F crítico
Tratamento 3 163,75 54,58 7,80 3,24
Resíduo 16 112,00 7,00
Total 19 275,75
Conclusão:
Como o valor de F calculado é maior que o valor de F tabelado (valor crítico), rejeita-se a
hipótese nula ao nível do confiança de 95%, ou seja, a hipótese de que as médias dos tratamentos
(variedades) sejam as mesmas.
Valor-p
Não é necessário usar a tabela de F se o cálculo for feito numa planilha eletrônica como o Excel®.
A tabela a seguir apresenta a anova feita para o mesmo exemplo. A hipótese nula é rejeitada se o
valor-p (p-value) for menor que o nível de significância (  ) estabelecido:
Se o valor  p    Re jeita  se H0
Se o valor  p    Aceita H0 v
Anova: fator único (Ferramentas / Análise de dados / anova: fator único
RESUMO
Grupo Contagem Soma Média Variância
Coluna 1 5 115 23 6,5
Coluna 2 5 135 27 7,5
Coluna 3 5 130 26 7,5
Coluna 4 5 155 31 6,5
ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 163,75 3 54,58333 7,797619 0,001976 3,238872
Dentro dos grupos 112 16 7
Total 275,75 19 -
Conclusão: Como o valor  p   (0,001976  0,05 )  Re jeita  se H0
9.1. Análise de variância com número diferente de repetições

Caso não haja o mesmo número de repetições entre os tratamentos, a análise de variância é feita
da mesma forma, com exceção da soma de quadrados de tratamentos (SQTr), dado pela razão entre
cada quadrado da soma de tratamento pela respectiva repetição:
T12 T22 Tk2

SQTr    ...   C
r1 r2 rk
31º. Exercício (semi) resolvido

Verificar ao nível de confiança de 95% se existe diferença entre as médias dos tratamentos.
Replicatas Tratamentos (k)
(r) A B C
1 15 23 19
2 10 16 15
3 13 19 21
4 18 18 14
5 15 - 16
6 13 - -
Resolução:
2 2
Tratamentos (k) Soma Tratamentos ao quadrado (k ) Soma
2 2 2 2
Replicatas (r) A B C Y A B C Y
1 15 23 19 57 225 529 361 1.115
2 10 16 15 41 100 256 225 581
3 13 19 21 53 169 361 441 971
4 18 18 14 50 324 324 196 844
5 15 - 16 31 225 - 256 481
6 13 - - 13 169 - - 169
Total (T) 84 76 85 1.212 1.470 1.479 4.161
2
T 7.056 5.776 7.225
Repetição ( r ) 6 4 5
2
T /r 1.176 1.444 1.445
Média 14,0 19,0 17,0
o
N de tratamentos (k) k= 3
o
N total de repetições (nk) n= 15
o
a) N de graus de liberdade (GL)
De tratamentos k-1= 2
Do total n – 1= 14
Do resíduo (n - 1) - (k - 1) = n - k = 12
b) Correção (C).
 Y  2
C  
n
c) Soma de Quadrados Total (SQT)
SQT  Y 2
C
d) Soma de Quadrados de Tratamentos (SQTr)
T12 T2 T2
SQTr   2  ...  k  C    - 
r1 r2 rk
e) Soma de Quadrados de Resíduos (SQR)
SQR  SQT  SQTr 
f) Quadrado Médio de Tratamentos (QMTr)
SQTr
QMTr   
k 1
g) Quadrado Médio de Resíduo (QMR)
SQR
QMR   
n k
h) Valor de F
QMTr
F   3,96
QMR
ANÁLISE DE VARIÂNCIA
Causas de variação GL SQ QM F
Tratamento 3,96
Resíduo
Total
Conclusão: __________________________________________________________________
____________________________________________________________________________ .
A pressuposição básica para se fazer uma análise de variância é que os erros ou resíduos
( e ij  Yij  y i ) são variáveis aleatórias independentes com distribuição normal de média zero
e variância constante (homocedasticidade). Existem vários testes estatísticos para verificar a
independências dos erros, a normalidade da distribuição e a homocedasticidade, mas não serão
vistos nesse momento.
10. CORRELAÇÃO E REGRESSÃO
Freqüentemente procura-se verificar se existe relação entre duas ou mais variáveis. A massa
corpórea pode estar relacionada com a idade das pessoas; o consumo das famílias pode estar
relacionado com sua renda; a evasão escolar na zona rural pode estar relacionada a colheita da
lavoura. A verificação da existência do grau de relação entre variáveis é objeto de estudo da
correlação. Quando essa correlação existe, é interessante expressá-la por meio de uma equação
que ligue as variáveis.
Ajustamento de uma equação

Para determinar uma equação que relacione as variáveis, um primeiro passo consiste em
colecionar dados das variáveis a serem consideradas.
Uma segunda etapa consiste em locar as coordenadas dos pontos das variáveis num sistema de
coordenadas cartesianas (diagrama de dispersão).
No diagrama de dispersão é possível, às vezes, visualizar uma curva regular que se ajuste aos
dados.
Exemplos:
Y Y
0 X 0
10.1. Equações das principais curvas
As principais curvas de ajustamento e suas respectivas equações estão relacionas abaixo:
Curva Equação
1 Linha reta Y  aX  b
2 Parábola ou curva de 2o grau Y  aX2  bX  c
3 Parábola cúbica ou curva de 3o grau Y  aX3  bX2  cX  d
4 Curva de no grau (polinômio) Y  an Xn  ...  a3 X3  a2 X2  a1X  a0
1
5 Hipérbole Y
aX  b
6 Curva exponencial Y  abx ou log Y  log a  X log b
7 Curva geométrica Y  aXb ou log Y  log a  b log X
Para decidir qual curva deve ser adotada, é conveniente a obtenção de diagramas de dispersão
das variáveis. Para o caso das curvas 6 e 7 é conveniente a construção de diagramas de dispersão
das variáveis transformadas. Por exemplo, se o diagrama de dispersão de logY em função de X
apresentar uma relação linear, a equação a ser adotada tem aspecto de equação 6, enquanto que,
se o logY em função de logX indicar uma relação deste tipo (linear), a equação tem a forma da
equação 7. Para facilitar esse processo, emprega-se papeis especiais para gráficos, na qual uma ou
ambas as escalas são logarítmicas. São denominados papéis semi-log e log-log, respectivamente.
10.2. Correlação
O estudo da correlação tem por objetivo avaliar o grau de relação existente entre duas variáveis
aleatórias. Pode-se determinar de modo quantitativo, quão bem uma reta ou uma curva se ajusta aos
pontos. Por exemplo, a reta do exemplo (a) representa melhor os dados de X e Y, do que para os da
reta (b).
Y Y
0 X 0 X
Aqui será tratada apenas da correlação linear simples.
10.2.1. Correlação linear simples

A correlação linear procura medir a relação entre as variáveis X e Y através da disposição
dos pontos (X, Y) em torno deu uma reta. O instrumento de medida da correlação linear é dado pelo
coeficiente de correlação de Pearson. Para determinar o coeficiente de correlação é necessário
determinar os seguintes somatórios:
Somatório do quadrado dos desvios de X em relação a média:
SXX  X  X
2
 X 2

 X
2
n
Somatório do quadrado dos desvios de Y em relação a média:

SYY   Y  Y 2
  Y2 
 Y 2
n
Somatório do produto dos desvios de X e de Y:
 
SXY   Y  Y X  X   XY    X Y 
n
O coeficiente de correlação é determinado pela seguinte equação:
SXY  XY 
 X Y 
rXY  ou n
SXX.SYY r XY 

 X 2

 X2 
Y 2

Y 2 
 . 
 n   n 
O campo de variação do coeficiente rXY situa-se entre -1 e +1.
 1  rXY  1
Quando r XY  1 a correlação perfeitamente positiva;
Quando r XY  1 a correlação perfeitamente negativa;
Quando rXY  0 não existe correlação ou não é linear.

Exemplo de correlação linear positiva
A correlação será considerada Y

positiva se valores crescentes de X
estiverem associados a valores
crescentes de Y, ou valores
decrescentes de X estiverem
associados a valores decrescentes
da variável Y.
0 X
correlação linear positiva
De um modo geral, para se tirar conclusões a respeito do comportamento simultâneo das
variáveis analisadas, é necessário que 0,6  rXY  1 ,0 .
10.3. Regressão linear simples

O método mais exato de estabelecer uma relação entre dados experimentais, é representar tal
relação sob a forma de equação matemática.
A equação Y = aX + b é conhecida como equação da reta, onde a e b são constantes. Essas
constantes podem ser determinadas pelo método dos mínimos quadrados. As constantes a e b,
podem ser determinadas pelas seguintes relações:
 XY 
 X Y 
SXY n
a = coeficiente angular ou inclinação a ou a
SXX
X 
2  X
2
n
b = coeficiente linear ou intercepto b Y aX
Com os valores de a e b, obtemos a equação da melhor reta e a partir da equação da reta
localizá-la no gráfico.

Para se determinar por espectrofotometria o teor de proteína em uma amostra de albumina
comercial pelo método de Bradford foi feito inicialmente uma curva de calibração a partir da
concentração da albumina padrão (X), em g, versus absorvância lida a 595 nm (Y):
X 30 60 90 120 150 180

Y 0,089 0,169 0,326 0,460 0,620 0,780
a) Determine os coeficientes a e b da reta Y = aX + b pelo método dos mínimos quadrados.
b) Determine a concentração de albumina de uma amostra cuja transmitância foi igual a 0,638.
c) Determine o coeficiente de correlação de Pearson (r).
Resolução:
X Y XY X2 Y2
1 30 0,089 2,67 900 0,0079
2 60 0,169 10,14 3.600 0,0286
3 90 0,326 29,34 8.100 0,1063
4 120 0,460 55,20 14.400 0,2116
5 150 0,620 93,00 22.500 0,3844
6 180 0,780 140,40 32.400 0,6084
Soma 630 2,444 330,75 81.900 1,3472
a) Coeficientes a e b da reta:
 XY 
 X Y  330,75 
630 x 2,444
a n  6  0,00471
 X2 
 X2 81.900 
(630) 2
n 6
bY aX 
Y a X 
2,444
 0,00471x
630
  0,0869
n n 6 6
Equação: Y = 0 , 0 0 4 7 1 X - 0 , 0 8 6 9
b) Concentração de albumina = X
Y = absorvância (A) A = - log T  A = - log 0,638 = 0,195
Equação: Y = 0,0471X - 0,0869  0,195 = 0,0471X - 0,0869  X = 59,98 g
c) Coeficiente de correlação de Pearson (r):
 XY 
 X Y  330,75 
630 x 2,444
r XY  n  6  0,9961
  X2  Y 2   6302  2,4442 
 X  .Y  81.900  .1,3472 
2 2
 
 n   n   6   6 
10.3.1. Coeficiente de determinação ou explicação (R2)

O coeficiente de determinação (R2) indica quantos por cento a variação explicada pela regressão
representa da variação total. Ele é determinado elevando-se r (coeficiente de correlação de Pearson)
ao quadrado: R2 = r2.
Quando R2 = 1 todos os pontos observados se encontram exatamente sobre a curva de
regressão, ou seja, as variações de Y são 100% explicadas pelas variações de X, não havendo,
portanto, desvios em torno da função estimada. Por outro lado, se R2 = 0, as variações de Y são
exclusivamente aleatórias, e a introdução da variável X no modelo não incorporará nenhuma
informação sobres as variações de Y.
O coeficiente de determinação (R2) varia entre 0 e +1 (inclusive): 0  R2   1 .
Se R2 = 98% indica que 98% das variações de Y são explicadas pela variação de X através da
função escolhida para relacionar as variáveis e 2% são atribuídos às outras causas. De uma maneira
geral, considera-se que se:
R2  85%: ajustamento ótimo;
75%  R2  85%: ajustamento bom;
65%  R2  75%: ajustamento regular;
R2  65%: a variável X não explica com segurança a variação de Y.

Determine o coeficiente de determinação (R2) do exemplo anterior e comente o resultado.
Resolução:
c) Coeficiente de determinação (R2):
R2 = r2 = (0,9961)2 = 0,9922
Conclusão: _________________________________________________________________
____________________________________________________________________________
34º. Exercício (semi) resolvido

Os quatro conjuntos de dados a seguir foram preparados pelo estatístico F. J. Anscombe e são
usados com freqüência em aulas sobre correlação:
a) Calcule o coeficiente de correlação para cada um dos conjuntos;
b) Construa o diagrama de dispersão para cada um;
c) Compare os resultados dos itens a e b.
Resolução:
Conjunto 1 Conjunto 2 Conjunto 3 Conjunto 4
X Y X Y X Y X Y
1 10,0 8,04 10,0 9,14 10,0 7,46 8,0 6,58
2 8,0 6,95 8,0 8,14 8,0 6,77 8,0 5,76
3 13,0 7,58 13,0 8,74 13,0 12,74 8,0 7,71
4 9,0 8,81 9,0 8,77 9,0 7,11 8,0 8,84
5 11,0 8,33 11,0 9,26 11,0 7,81 8,0 8,47
6 14,0 9,96 14,0 8,10 14,0 8,84 8,0 7,04
7 6,0 7,24 6,0 6,13 6,0 6,08 8,0 5,25
8 4,0 4,26 4,0 3,10 4,0 5,39 19,0 12,50
9 12,0 10,84 12,0 9,13 12,0 8,15 8,0 5,56
10 7,0 4,82 7,0 7,26 7,0 6,42 8,0 7,91
11 5,0 5,68 5,0 4,74 5,0 5,73 8,0 6,89
Soma 99,0 82,51 99,0 82,51 99,0 82,50 99,0 82,51
Média 9,0 7,50 9,0 7,50 9,0 7,50 9,0 7,50
r
11. REFERÊNCIAS BIBLIOGRÁFICAS
AKANIME, Carlos T.; YAMAMOTO, Roberto K. Estudo Dirigido de Estatística Descritiva. São
Paulo: Érica, 1998.
CIENFUEGOS, Freddy. Estatística Aplicada ao Laboratório. Rio de Janeiro: Interciência, 2005.
DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. São Paulo: Saraiva, 1998.
FARIAS, Alfredo Alves de; SOARES, José Francisco; CÉSAR, Cibele Comini. Introdução à
estatística. Rio de Janeiro: LTC, 1998.
FONSECA, Jairo S., MARTINS, Gilberto de A. Curso de Estatística. 6ª edição. São Paulo: Atlas,
1996.
LAPPONI, Juan Carlos. Estatística usando Excel 5 e 7. São Paulo: Lapponi Treinamento e Editora
Ltda, 1997.
LEVINE, David M. et al. Estatística: Teoria e Aplicações usando Microsoft Excel em Português. Rio
de Janeiro: LTC – Livros Técnicos e Científicos Editora S. A., 2000.
MARTINS, Gilberto de Andrade & DONAIRE, Denis. Princípios de Estatística. São Paulo: Atlas,
1990.
MORETTIN, Luiz Gonzaga. Estatística Básica – v.1 – Probabilidade. São Paulo: Makron Books,
1999.
RIBEIRO JÚNIOR, José Ivo. Análises estatísticas no Excel: guia prático. Viçosa: UFV, 2004.
SPIEGEL, Murray R. Estatística. São Paulo: Makron Books, 1994.
VIEIRA, Sonia; WADA, Ronaldo. Estatística: introdução ilustrada. São Paulo: Atlas, 1986.
12. RESPOSTAS DOS EXERCÍCIOS PROPOSTOS
1)
Universo: alunos de uma escola.

Variável 1: Cor dos cabelos: Qualitativa nominal
Variável 2: Série: Qualitativa ordinal
Variável 3: Estatura: Quantitativa contínua
Variável 4: Número de irmãos: Quantitativa discreta
Universo: casais residentes em uma cidade.

Variável 1: Número de filhos: Quantitativa discreta
Variável 2: Renda familiar: Quantitativa contínua
Variável 3: Classe social: Qualitativa ordinal
Variável 4: Saldo bancário: Quantitativa contínua
2)
Vantagens do censo: maior confiabilidade, maior precisão.
Vantagens da amostragem: menor custo; maior rapidez.
3)
Amostragem sistemática. Suponha-se que não seja possível juntar todos os clientes para se
proceder ao sorteio aleatório. Suponha-se ainda que não haja influência entre os tipos (estratos) de
cliente, como idade, sexo, etc. que justifique a aplicação de uma amostragem estratificada.
4)
100%
C
Ponto
%
1 2 %A
%A 60 40
%B 20 30
%C 20 30 %C
2
1
100%
A 0 20 40 60 80 100 % B
%B
5)
a) Sim, o ponto encontra-se no interior do triângulo;
b) 60% de N2, quando o ponto fica fora do triângulo.
6, 7, 8, e 9) fazer no computador
10, 11 e 12)
Série
A B
Média aritmética simples 4,67 2
Média geométrica 4,00 2
Média harmônica 3,43 2
Média quadrática 5,29 2
13)
Média = -0,4 Moda = 0,0 Mediana = -0,5
14)
a) a variação média é igual a: 0,0
b) a variação mediana é igual a: 1,4
15)
a) (X) média
16)
b) média das massas do 41o e 42o valor ordenado
17)
a) A nota média do agrupamento = 6,3
b) A nota que mais se evidencia na turma = 8,0
c) A nota que limita as 50% maiores notas = 6,0
18)
a) A idade média ( X ) = 23,5
b) A idade modal ( Mo1 ) = 23,0; ( Mo2 ) = 24,0
c) A idade mediana ( Md) = 23,5
19)
Série
X Y Z
Desvio padrão populacional 2,828 2,828 1,414
20)
e) (X) As séries X e Z apresentam o mesmo desvio padrão.
21)
Desvio padrão populacional = 0,0001884
22)
a) P (X = 20) = 1,05E-14
b) P (X = 5) = 0,1746
c) P (X = 0) = 0,0115
d) P (X = 15) = 1,66E-07
e) P ( X  8)  0,0321
f) P ( X  10)  0,9994
23)
a) P (X = 0) = 0,3679
b) P (X = 1) = 0,2707
24)
São duas curvas simétricas de mesmo grau de achatamento situadas no mesmo eixo, uma mais a
direita (maior média).
25)
Intervalo
NC (%) X1 X2
a) 90 29,997 34,603
b) 95 29,556 35,044
c) 98 29,044 35,556
d) 99 28,694 35,906
26)
P(70  X  80)  0,3479
27)
a) binomial: P(X = 10) = 0,02798
b) normal: P (9,5  X  10,5)  0,02787
28)
a) Analista 1 Analista 2 Analista 3

Média 2,33 2,25 2,34
Mediana 2,32 2,24 2,36
Amplitude 0,14 0,16 0,29
Variância 0,00231 0,00334 0,00947
Desvio padrão 0,04811 0,05776 0,09731
DPR 0,02065 0,02567 0,04159
CV (%) 2,06468 2,56692 4,15864
Erro padrão da média 0,01701 0,02042 0,03441
b)
IC (95%) 2,33 ± 0,04 2,25 ± 0,05 2,34 ± 0,08
29)
Os analistas A1 e A3 apresentam a mesma precisão e médias iguais ao nível de confiança de 95%.
30)
Os analistas A1 e A2 não apresentam a mesma precisão, mas apresentam médias iguais ao nível de
confiança de 95%.
31)
Rejeita-se o menor valor (40,01) pelo teste Q. Após a rejeição, a média quase não se altera, mas o
desvio padrão muda significativamente.
com rejeição sem rejeição
Média 40,14 40,17
Desvio padrão 0,064 0,027
32)
Rejeita-se o menor valor (40,01) pelo teste de Grubbs ao NC = 95%.
Tabela 1 - Distribuição Normal

+Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Tabela 2 - Valores de t por nível confiança, segundo os graus de liberdade
 68,27 90 95 95,45 99 99,73

1 1,84 6,31 12,71 13,97 63,66 235,78
2 1,32 2,92 4,30 4,53 9,92 19,21
3 1,20 2,35 3,18 3,31 5,84 9,22
4 1,14 2,13 2,78 2,87 4,60 6,62
5 1,11 2,02 2,57 2,65 4,03 5,51
6 1,09 1,94 2,45 2,52 3,71 4,90
7 1,08 1,89 2,36 2,43 3,50 4,53
8 1,07 1,86 2,31 2,37 3,36 4,28
9 1,06 1,83 2,26 2,32 3,25 4,09
10 1,05 1,81 2,23 2,28 3,17 3,96
11 1,05 1,80 2,20 2,25 3,11 3,85
12 1,04 1,78 2,18 2,23 3,05 3,76
13 1,04 1,77 2,16 2,21 3,01 3,69
14 1,04 1,76 2,14 2,20 2,98 3,64
15 1,03 1,75 2,13 2,18 2,95 3,59
16 1,03 1,75 2,12 2,17 2,92 3,54
17 1,03 1,74 2,11 2,16 2,90 3,51
18 1,03 1,73 2,10 2,15 2,88 3,48
19 1,03 1,73 2,09 2,14 2,86 3,45
20 1,03 1,72 2,09 2,13 2,85 3,42
25 1,02 1,71 2,06 2,11 2,79 3,33
30 1,02 1,70 2,04 2,09 2,75 3,27
35 1,01 1,69 2,03 2,07 2,72 3,23
40 1,01 1,68 2,02 2,06 2,70 3,20
45 1,01 1,68 2,01 2,06 2,69 3,18
50 1,01 1,68 2,01 2,05 2,68 3,16
100 1,01 1,66 1,98 2,03 2,63 3,08
∞ 1,00 1,64 1,96 2,00 2,58 3,00
Tabela 3: Valores críticos para teste Cochran
n = número de resultados para um nível de confiança igual a 99%

df 2 3 4 5 6 7 8 9 10 11
2 1,000 0,995 0,979 0,959 0,937 0,917 0,899 0,882 0,867 0,854
3 0,993 0,942 0,883 0,834 0,793 0,761 0,734 0,711 0,691 0,674
4 0,968 0,864 0,781 0,721 0,676 0,641 0,613 0,590 0,570 0,554
5 0,928 0,789 0,696 0,633 0,588 0,553 0,526 0,504 0,485 0,470
6 0,883 0,722 0,626 0,564 0,520 0,487 0,461 0,440 0,423 0,408
7 0,838 0,664 0,569 0,508 0,466 0,435 0,411 0,391 0,375 0,362
8 0,795 0,615 0,521 0,463 0,423 0,393 0,370 0,352 0,337 0,325
9 0,754 0,573 0,481 0,425 0,387 0,359 0,338 0,321 0,307 0,295
10 0,718 0,536 0,447 0,393 0,357 0,331 0,311 0,295 0,281 0,270
12 0,653 0,475 0,392 0,343 0,310 0,286 0,268 0,254 0,242 0,232
15 0,575 0,407 0,332 0,288 0,259 0,239 0,223 0,210 0,200 0,192
20 0,480 0,330 0,265 0,229 0,205 0,188 0,175 0,165 0,157 0,150
24 0,425 0,287 0,230 0,197 0,176 0,161 0,150 0,141 0,134 0,128
30 0,363 0,241 0,191 0,164 0,145 0,133 0,123 0,116 0,110 0,105
40 0,294 0,192 0,151 0,128 0,114 0,103 0,096 0,090 0,085 0,082
n = número de resultados para um nível de confiança igual a 95%

df 2 3 4 5 6 7 8 9 10 11
2 0,999 0,975 0,939 0,906 0,877 0,853 0,833 0,816 0,801 0,788
3 0,967 0,871 0,798 0,746 0,707 0,677 0,653 0,633 0,617 0,603
4 0,907 0,768 0,684 0,629 0,590 0,560 0,537 0,518 0,502 0,488
5 0,841 0,684 0,598 0,544 0,507 0,478 0,456 0,439 0,424 0,412
6 0,781 0,616 0,532 0,480 0,445 0,418 0,398 0,382 0,368 0,357
7 0,727 0,561 0,480 0,431 0,397 0,373 0,354 0,338 0,326 0,315
8 0,680 0,516 0,438 0,391 0,360 0,336 0,319 0,304 0,293 0,286
9 0,639 0,478 0,403 0,358 0,329 0,307 0,290 0,277 0,266 0,257
10 0,602 0,445 0,373 0,331 0,303 0,282 0,267 0,254 0,244 0,235
12 0,541 0,392 0,326 0,288 0,262 0,244 0,230 0,219 0,210 0,202
15 0,471 0,335 0,276 0,242 0,220 0,203 0,191 0,182 0,174 0,167
20 0,389 0,271 0,221 0,192 0,174 0,160 0,150 0,142 0,136 0,130
24 0,343 0,235 0,191 0,166 0,149 0,137 0,129 0,122 0,116 0,111
30 0,293 0,198 0,159 0,138 0,124 0,114 0,106 0,100 0,096 0,092
40 0,237 0,158 0,126 0,108 0,097 0,089 0,083 0,078 0,075 0,071
Tabela
Estatística Aplicada à Metrologia Química - 4 - Ifes
Função
Vila Velha – 2015 F;  = 0,05
Distribuição JoséUnilateral
Augusto Brunoro 71
1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞

1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
Tabela 5 – Tabela de Números Aleatórios
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 0 5 2 1 0 4 5 8 9 4 6 8 1 4 7 4 9 1 9 3 4 4 7 9 8
2 7 0 3 6 0 1 1 2 5 4 4 4 5 6 6 2 6 6 3 3 8 0 6 1 4
3 1 5 2 9 1 9 4 4 5 9 0 5 4 3 8 6 6 4 0 2 5 4 7 9 5
4 7 1 3 6 5 7 2 8 0 1 8 1 9 1 0 9 0 3 0 3 2 7 9 3 7
5 1 5 1 0 8 7 6 9 7 0 6 4 3 3 9 6 7 1 7 5 9 3 8 6 4
6 4 2 1 6 4 4 8 9 6 2 2 6 1 9 7 7 2 1 0 7 9 5 0 6 6
7 6 7 5 0 7 6 1 8 3 5 1 8 7 1 0 9 8 0 8 6 5 9 6 3 7
8 0 5 6 3 5 3 6 6 5 4 2 8 3 9 9 2 9 0 7 3 4 7 6 0 6
9 5 5 2 9 3 7 8 3 1 9 8 0 0 9 2 6 0 7 9 7 1 6 8 5 6
10 1 5 4 2 9 4 2 5 8 6 9 7 7 9 0 1 9 4 3 6 2 0 7 9 3
11 3 8 1 0 7 0 0 2 5 9 7 1 9 9 5 4 4 4 2 8 7 0 1 8 3
12 4 4 8 7 8 6 9 6 5 8 8 8 4 4 6 3 0 9 5 4 8 7 8 7 8
13 1 4 5 1 0 9 6 6 6 9 9 0 4 0 0 8 8 2 6 3 8 9 1 1 9
14 5 2 3 8 4 7 8 5 7 2 1 5 7 3 6 6 8 9 0 1 6 6 8 4 3
15 1 9 1 0 7 0 5 3 2 9 2 9 3 0 0 6 7 5 7 7 3 1 1 1 3
16 1 1 3 2 7 1 0 7 2 6 0 3 5 0 7 9 6 1 3 5 2 2 2 7 6
17 2 5 5 9 2 7 3 0 6 2 7 8 6 0 3 0 6 9 8 5 1 4 9 3 4
18 6 9 8 6 3 1 8 3 6 4 7 4 7 0 9 5 2 2 0 0 2 6 7 4 9
19 9 7 0 6 8 9 1 1 4 2 8 3 1 8 8 6 7 9 9 6 8 0 2 2 3
20 8 9 0 5 5 2 0 7 9 0 3 5 8 9 9 6 6 6 8 4 3 7 8 5 0
21 1 0 3 1 7 1 3 6 2 4 7 6 5 2 9 4 8 1 2 5 9 0 6 1 6
22 3 7 6 4 9 2 4 7 2 8 9 8 2 9 8 4 7 4 5 0 8 7 0 2 0
23 9 4 4 2 9 9 7 1 9 5 8 5 4 1 5 2 0 4 0 3 2 4 0 9 3
24 8 9 5 3 2 4 7 0 0 6 2 2 0 1 5 5 4 8 0 0 7 2 9 7 9
25 2 5 0 6 5 8 6 9 0 6 1 8 8 0 2 2 2 9 0 5 1 1 4 4 0
26 6 9 2 2 8 4 2 8 4 2 5 6 7 3 5 1 4 6 6 5 9 9 5 0 0
27 2 5 1 8 4 7 1 1 5 4 0 2 9 8 0 0 6 7 9 5 9 2 0 6 9
28 4 0 1 8 7 8 0 9 4 9 5 0 3 1 6 1 0 8 1 3 9 0 1 2 3
29 8 2 3 7 7 8 3 7 1 4 2 5 2 5 7 8 6 0 1 2 5 0 4 7 2
30 8 8 1 2 4 9 5 0 4 8 2 5 3 0 0 9 0 5 7 9 7 7 0 8 2
31 5 4 8 9 7 5 3 9 3 3 1 2 0 9 3 6 6 7 8 1 9 4 8 5 4
32 0 4 2 3 7 0 9 2 5 6 1 9 0 3 6 1 8 1 6 0 1 9 3 9 6
33 3 5 5 3 1 6 2 6 7 8 6 3 8 7 3 9 4 0 7 4 0 0 4 7 2
34 9 4 1 9 9 5 1 0 1 0 3 8 6 3 5 3 5 2 0 7 9 7 8 8 6
35 7 7 1 8 3 2 8 0 4 4 3 7 7 9 8 1 2 4 3 8 7 3 0 6 4
36 3 1 9 2 0 7 0 1 4 8 0 5 5 0 8 0 0 9 1 1 4 6 7 1 3
37 7 8 4 1 3 3 4 8 8 6 5 1 6 3 0 6 4 0 0 6 5 0 6 1 6
38 5 4 9 7 0 4 2 9 1 7 0 3 5 3 8 3 0 7 5 7 9 0 0 5 0
39 8 7 3 6 4 6 5 2 7 9 7 1 0 7 3 9 2 1 4 2 7 8 4 7 1
40 3 1 4 7 2 7 7 0 6 9 0 4 1 0 0 4 9 9 8 6 0 0 5 0 9

Apostila Estatistica Aplicada A MTQ - Ifes VV - 2015

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apostila Estatistica Aplicada A MTQ - Ifes VV - 2015

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 1

1. COLETA E APRESENTAÇÃO DE DADOS ..............................................................................3

10. CORRELAÇÃO E REGRESSÃO ...........................................................................................57

1. COLETA E APRESENTAÇÃO DE DADOS

1.3. Método estatístico

1.3.1. Coleta de informações

1.3.2. Crítica dos dados

1.3.3. Apuração dos dados

1.3.4. Exposição ou apresentação dos dados

1.3.5. Análise dos resultados

1.4.1. Variável qualitativa

Variáveis qualitativas ordinais

Variáveis qualitativas nominais

1.4.2. Variável quantitativa

1º. Exercício Proposto

Universo: alunos de uma escola.

Universo: casais residentes em uma cidade.

1.5. População e amostra

2º. Exercício Proposto

1.6.1. Amostragem casual ou aleatória simples

1.6.2. Amostragem proporcional estratificada

1.6.3. Amostragem sistemática

3º. Exercício proposto

1.7. Apresentação de resultados

1.7.1. Tabelas estatísticas

Produção de café - Brasil - 1991-1995 cabeçalho

Anos Produção (1.000t)

corpo 1992 2.666

Série geográfica ou de localização

Matrículas no Ensino de Terceiro Graus no Brasil em 1973 (ciclo básico)

5º. Exercício proposto

3o - Calcule a razão (escala) E  G

6º. Exercício proposto

Gráfico em colunas ou em barras

7º. Exercício proposto

Gráfico de Barras de uma distribuição ocupacional.

Ocupação (Profissão) Freqüências (fi)

154 159 164 169 174 179 184 189

8º. Exercício proposto

Na prática, as observações obtidas de medições reais são mais ou menos assimétricas em

Opção de especialização Freqüência (fi) %

O correspondente gráfico setorial está representado na figura a seguir:

9º. Exercício proposto

Meio de transporte (fi) (fi%) Angulo (0)

2.1. Algarismos significativos

todos com 3 algarismos significativos

2.1.1. Adição e subtração

Massa 1 104,65 g (balança de precisão)

2.1.2. Multiplicação e divisão

2.2. Regras para arredondamento

2.3. Notação científica (notação exponencial)

2.3.1. Adição e subtração

2.3.2. Multiplicação e divisão

2.3.3. Potenciação e radiciação

2,0 x10   2,0 x 10 

2.4. Ordem de grandeza

2.5. Operações com calculadoras científicas

Antilogaritmo neperiano ex Antiln 1 2,718281828

3.1. Média aritmética

3.1.1. Média aritmética simples (dados não-agrupados ou isolados)

1º. Exercício resolvido

3.1.2. Média aritmética ponderada (dados agrupados sem intervalos de classe )

onde X é a média aritmética (ponderada), Xi é o valor da variável e fi é a freqüência observada do