Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA DESCRITIVA
1.1. Introdução
O Vocábulo Estatística é originado do latim Status (Estado). Foi empregado pela primeira vez por
Godofredo Achenwall, em meados do século XVIII.
A Estatística é historicamente relacionada às coisas do Estado, do Governo e da Administração.
Na mão dos estadistas, constituiu-se de verdadeira ferramenta administrativa. A própria Bíblia nos
leva a essa recuperação histórica: Maria e José viajaram de Nazaré para Belém, na época do
nascimento de Jesus Cristo, para que fossem recenseados. Naquele tempo, por imposição do
imperador César Augusto, toda a população do império romano deveria se alistar em suas cidades
de origem (a palavra “censo” deriva de censere, que em latim significa “taxar”).
1.2. Conceituação
A Estatística possui alguns conceitos antigos. Ela ainda é usada como simples contagem
aritmética; como sinônimo de dados publicados oficialmente ou como transformações matemáticas.
Assim, é comum ouvir alguém dizer: “Aqui estão as estatísticas sobre o jogo realizado ontem!”.
Eis alguns conceitos modernos para a Estatística:
“É a parte da matemática aplicada que se ocupa em obter conclusões a partir de dados
observados”.
“É a estimativa de um parâmetro a partir de uma amostra” (parâmetro é o elemento numérico
usado para caracterizar todo o conjunto).
1.4. Variáveis
A cada fenômeno corresponde um número de resultados possíveis. Exemplos:
Ex.1: para o fenômeno "sexo" são dois os resultados possíveis: sexo masculino e sexo feminino;
Ex.2: para o fenômeno "número de filhos" há um número de resultados possíveis expresso
através dos números naturais: 0, 1, 2, 3, ..., n;
Ex.3: para o fenômeno "estatura" temos uma situação diferente, pois os resultados podem tomar
um número infinito de valores numéricos dentro de um determinado intervalo.
Variável: é o conjunto de resultados possíveis de um fenômeno. Podem ser classificadas como
qualitativas ou quantitativas.
Assim, o número de clientes de um banco pode assumir qualquer um dos valores do conjunto N =
{ 1, 2, 3, ..., 188, ...}, mas nunca valores como 2,5 ou 3,78 ou 4,325. Logo, o número de clientes é
uma variável discreta. Já o saldo da conta desses clientes é uma variável contínua, pois pode
assumir um conjunto não enumerável de valores, como R$172,54 ou R$172,5402, etc. Outro
exemplo de variável contínua é o peso de atletas de uma determinada equipe: um atleta pode pesar
72 kg, como 72,5 kg ou ainda 72,520 kg. A medida depende da precisão do equipamento utilizado,
no caso, uma balança. De um modo geral, as medições dão origem a variáveis contínuas e as con-
tagens ou enumerações dão origem a variáveis discretas.
Designamos as variáveis por letras latinas, em geral, as últimas: X, Y, Z.
Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possíveis de um determinado fenômeno.
Usando a letra X para indicar a variável relativa ao fenômeno considerado, temos: X {2, 3, 5, 8}.
1.5.1. População
População Estatística ou Universo Estatístico é o conjunto de entes portadores de pelo menos
uma característica comum. Os estudantes, por exemplo, constituem uma população, pois apre-
sentam pelo menos uma característica comum: são os que estudam.
Em qualquer estudo estatístico, as características dos elementos que constituem a população de-
vem estar perfeitamente definidas a priori. Isso se dá quando, considerado um elemento qualquer,
podemos afirmar, sem ambigüidade, se esse elemento pertence ou não à população. É necessário,
pois, existir um critério de constituição da população que seja válido para qualquer pessoa, no tempo
ou no espaço.
Por isso, quando pretendemos fazer uma pesquisa entre os alunos das escolas de 1° grau,
precisamos definir quais são os alunos que formam o universo: os que atualmente ocupam as
carteiras das escolas, ou devemos incluir também os que já passaram pela escola? É claro que a
solução do problema vai depender de cada caso em particular.
Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as
observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa
parte proveniente da população em estudo denominamos amostra.
1.5.2. Amostra
É um subconjunto finito de uma população.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 6
Como vimos a Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com
base em resultados verificados em amostras retiradas dessa população.
Mas, para as inferências serem corretas, é necessário garantir que a amostra seja representativa
da população, isto é, a amostra deve possuir as mesmas características básicas da população, no
que diz respeito ao fenômeno que desejamos pesquisar. E preciso, pois, que a amostra ou as
amostras que vão ser usadas sejam obtidas por processos adequados. Há casos, como o de
pesquisas sociais, econômicas e de opinião, em que os problemas de amostragem são de extrema
complexidade. Mas existem também casos em que os problemas de amostragem são bem mais
fáceis. Como exemplo, podemos citar a retirada de amostras para controle de qualidade dos
produtos ou materiais de determinada indústria.
1.6. Amostragem
A amostragem é uma técnica especial para recolher amostras que garante, tanto quanto possível,
o acaso na escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser
escolhido, o que garante à amostra o caráter de representatividade.
estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em
consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada,
que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao
número de elementos dos mesmos.
Exemplo: Suponhamos que no exemplo anterior, dentre os noventa alunos, 54 sejam meninos e
36 sejam meninas, vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10%
da população. Logo, temos:
a) Definição dos estratos:
Sexo População Amostra
M 54 5
F 36 4
Total 90 9
Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90,
meninas. A amostra é obtida usando-se uma Tabela de Números Aleatórios ou simplesmente por
sorteio dos números.
Cabeçalho
Conjunto de informações localizado no topo da tabela que responde às perguntas: O que? (fato);
Onde? (local) e Quando? (tempo).
Corpo
Conjunto de linhas, colunas e subcolunas que contém informações sobre a variável em estudo. O
corpo da tabela é formado por uma coluna indicadora: parte da tabela que especifica o conteúdo
das linhas; por linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que
se inscrevem nos seus cruzamentos com as colunas; e por casas ou células: interseções entre
linhas e colunas que comportam somente um dado numérico.
Rodapé
Espaço abaixo do corpo da tabela reservado para observações pertinentes a tabela, bem como o
registro e identificação da fonte dos dados.
Os seguintes pontos devem ser observados na preparação das tabelas:
Organizar as tabelas, de tal forma que o leitor possa entendê-las sem que seja necessário
recorrer ao texto para a sua compreensão;
Delimitar a estrutura da tabela na parte superior e na parte inferior por traços paralelos;
Recomenda-se não fechar por traços verticais os lados externos da tabela, tanto à direita
como à esquerda;
Quando for necessário deitar a tabela numa página, fazendo a rotação no sentido anti-
horário.
Exemplo geral
1.7.2. Séries
São tabelas estatísticas. Conforme critério de agrupamento, as tabelas são classificadas em série
cronológica, temporal, evolutiva ou histórica, série geográfica ou de localização e série específica.
Série cronológica
É uma série estatística em que os dados são representados segundo a época de ocorrência.
Exemplo dado acima.
Série específica
É uma série estatística em que os dados são agrupados segundo a modalidade de ocorrência.
Exemplo
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 9
1.7.3. Gráficos
O gráfico é uma forma de comunicação do fenômeno em termos visuais. Portanto, representa um
relato matemático-geométrico de um problema, o que facilita sobremaneira a compreensão do
fenômeno estudado. Os relatos científicos, os relatórios técnicos, os relatórios administrativos, os
estudos realizados por professores ou mesmo alunos fazem uso extensivo de gráficos.
Um gráfico, da mesma forma que a tabela, deve ser estruturado com: cabeçalho, corpo e rodapé.
Recomenda-se que o gráfico mantenha uma proporção entre altura e largura entre 3/4 a 2/3 e que
contenha essencialmente, as seguintes características:
Simplicidade: o gráfico deve ser destituído de detalhes de importância secundária, assim como
de traços desnecessários que possam levar a uma análise morosa ou com erros;
Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do
fenômeno em estudo;
Veracidade: o gráfico deve expressar a veracidade sobre o fenômeno em estudo.
Os principais tipos de gráficos são: diagramas, cartogramas e pictogramas. Os pictogramas são
representações pictóricas sobre o fenômeno representado. Os cartogramas apresentam os dados
em cartas geográficas. Nessa apostila apresentaremos somente os principais tipos de diagramas.
Diagramas
São gráficos geométricos de no máximo duas dimensões, e para a sua construção, em geral, faz-
se uso do sistema cartesiano. Nesse sistema, faz-se uso de duas retas perpendiculares; as retas são
os eixos coordenados e o ponto de interseção, a origem. O eixo horizontal é denominado eixo das
abscissas (ou eixo x) e o vertical, eixo das ordenadas (ou eixo dos Y). Exemplo:
Potencial de ionização dos primeiros vinte elementos da tabela periódica
Número Potencial de Número Potencial de
Elemento Elemento
atômico (Z) ionização (kJ/mol) atômico (Z) ionização (kJ/mol)
H 1 1312 Na 11 495,8
He 2 2371 Mg 12 737,6
Li 3 520 Al 13 577,4
Be 4 900 Si 14 786,4
B 5 800 P 15 1021
C 6 1086 S 16 999,6
N 7 1402 Cl 17 1255
O 8 1314 Ar 18 1520
F 9 1681 K 19 418,8
Ne 10 2080 Ca 20 589,5
Fonte: BRADY - Química Geral - volume 1
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 10
Diagramas triangulares
Usam-se os gráficos triangulares, quando se pretende representar três variáveis ao mesmo
tempo. Essas variáveis deverão estar relacionadas entre si, e suas intensidades podem ser
representadas em termos percentuais.
100%A
90
80
70
60
50
40
30
%m/m
20 A
10
0
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 11
Exemplo:
Diagrama ternário de uma liga hipotética formada pelos elementos A, B e C.
100%
C
%A
%C
100%
A 0 20 40 60 80 100 %
% de B B
4º. Exercício proposto
Determine a composição da liga no ponto marcado no diagrama. Localize no diagrama a liga com
40% de B, 30% de A e 30% de C.
% O2
% CH4
Misturas
explosivas
100%
O2
0 20 40 60 80 100 %
% de N2 N2
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 12
Montagem de gráficos
Não existe fórmula pronta para a montagem de um bom gráfico. Existem alguns aspectos que
devem ser observados para não comprometer a qualidade dos dados coletados e algumas dicas que
quando seguidas levam a produção de um bom gráfico, além, é claro de um bom senso crítico.
1o - A escolha do papel deve ser feita de forma que permita a leitura no gráfico do mesmo número
de algarismos significativos que aparecem nos dados;
2o - Para melhor organização do gráfico deve-se deixar uma margem de no mínimo 1cm de cada
lado e na margem inferior e de 3 a 5 cm na margem superior para indicar o que será representado no
gráfico;
3o - Sempre que for possível, utilize todo o papel a fim de não de não comprometer a precisão dos
dados.
Escalas
Aqui reside a maior dificuldade de construção de gráficos. Quando se vence esta etapa, o restante
fica fácil. Algumas dicas:
1o - Determine o comprimento útil do eixo em unidades do papel (mm ou cm) - L, conforme o
caso;
2o - Determine a amplitude da grandeza a ser representada sobre o eixo (G);
Histogramas
São representações gráficas da distribuição de freqüência em forma de gráficos em colunas
justapostas.
Considere a distribuição de freqüências abaixo, resultante da apuração das alturas de uma turma
de alunos.
i Altura ( cm ) xj fi f ir f i% fiAC
1 154 159 156,5 3 3/50 6 3
2 159 164 161,5 6 6/50 12 9
3 164 169 166,5 9 9/50 18 18
4 169 174 171,5 14 14/50 28 32
5 174 179 176,5 11 11/50 22 43
6 179 184 181,5 4 4/50 8 47
7 184 189 186,5 3 3/50 6 50
TOTAL - 50 1 100 -
Histograma da distribuição
de freqüência para a variável
altura dos alunos.
Seja o quadro de distribuição de freqüências abaixo, referente a uma pesquisa que tem por
objetivo categorizar a ocupação (profissão) de 180 pessoas entrevistadas.
70
60
Frequência
50
40
30
20
10
0
Artesanato Trabalho não Gerencial Serviços
qualificado burocráticos
Profissão
Como se vê, esta é outra forma de se apresentar o gráfico de colunas. Aqui não se trata de
contagem, mas ao se categorizar os dados em 4 classes de ocupação que não são mensurados
continuamente, o que se faz é revestir esses dados de um nível categórico ou nominal e, portanto,
destacar a natureza discreta dos mesmos. A utilização de retângulos neste exemplo (não é
obrigatória) objetiva apenas destacar as classes de profissão, que são efetivamente classes
(categorias) e não pontos. Entretanto, observar que os retângulos não estão unidos; caso contrário,
existe um hiato entre as bases representativas das classes, de modo a ressaltar o caráter discreto
dos dados.
Exemplo de gráfico em barras
Produção de cebola - Brasil -1982
Estados Quantidades (t)
São Paulo 255.620
R. G. do Sul 168.555
S. Catarina 113.602
Pernambuco 54.091
Minas Gerais 46.903
Paraná 21.903
Fonte: IBGE
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 15
Polígonos de freqüências
Um polígono de freqüência é um gráfico em linha, sendo as freqüências marcadas sobre
perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe, ou
quando for o caso, pelos valores constantes no eixo horizontal.
Exemplo:
Polígono de
freqüência
Exemplo
Os erros indeterminados seguem uma distribuição normal
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 16
Portanto, as variações nas formas das distribuições (entender como curvas de freqüência) podem
ser caracterizar em termos de simetria ou, conforme haja um acúmulo de dados extremos na cauda
esquerda ou na cauda direita da curva, em termos de assimetria negativa ou positiva.
1.7.4. Ogivas
São gráficos que apresentam a distribuição de freqüência acumulada abaixo de qualquer
limite superior de classe, locado (plotado) em relação a esse limite.
Exemplo: Distribuição das alturas de uma turma de alunos.
Gráficos setoriais
O gráfico setorial é um dos mais simples recursos gráficos, pois consiste em um círculo cujos
setores ou partes do mesmo círculo totalizam 100%. Eles são especialmente úteis quando se deseja
ressaltar a participação do dado no total.
O total é representado pelo círculo que fica dividido em tantos setores quantas forem às partes. As
áreas dos setores circulares são respectivamente proporcionais aos dados da série.
Obtêm-se as áreas proporcionais a cada setor por regra de três simples e direta, lembrando que o
total corresponde a 360o.
Exemplo:
A turma de Licenciatura do TEFEC apresenta a seguinte distribuição de freqüência com relação a
opção de especialização:
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 17
2. MEDIDAS
Conforme visto, medir uma variável constitui o primeiro passo no exame de um determinado
fenômeno. Medir é o ato de expressar numericamente a intensidade de uma determinada grandeza,
em termos de uma unidade. Uma unidade de medida se constitui numa quantidade precisamente
definida da grandeza que se quer medir.
Exemplo:
Grandeza: largura de uma sala;
Unidade: metro
Medida da largura da sala: 3m = 3xm = 3x1m (três vezes a unidade metro).
Veja que na leitura do volume gasto na 1a bureta, há uma incerteza em estimar valor
(interpolação) do número de décimos de mL, enquanto que na 2a bureta, a incerteza está em estimar
o valor do número de centésimos de mL gastos (bureta mais precisa).
Os algarismos necessários para expressar o resultado de uma medida com a mesma precisão do
instrumento usado são chamados algarismos significativos. Portanto, faz-se necessário aprender a
representar uma medida com a precisão do instrumento usado.
A determinação dos algarismos significativos em um número pode ser feita mediante o emprego
das seguintes regras:
1o) Todos os algarismos não nulos em um número, são significativos.
2o) Todos os zeros entre dois algarismos significativos não nulos, são significativos .
Exemplo:
100,122 120,012 110,101 11,0011
todos com 6 algarismos significativos
3o) Todos os zeros tanto à direita da vírgula decimal, como à direita de um dígito não nulo, são
significativos.
Exemplos:
12,00 0,1200 1,200 120,0
todos com 4 algarismos significativos
o
4 ) Todos os zeros à esquerda de um algarismo não nulo, mas à direita de uma vírgula decimal
não são significativos, se não houver algarismos não nulo à sua esquerda.
Exemplos:
0,0123 0,000123 0,00000321 0,123
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 19
maior do que você jamais usará num cálculo. Conhece-se com 1.011.196.691 algarismos
significativos.
Um número escrito em notação científica consiste de duas partes multiplicadas (um coeficiente e
uma potência decimal): C x 10n
onde:
C = coeficiente, um número entre 1 (inclusive) e 10 (exclusive): 1 C <10
10n = potência decimal onde n é um número inteiro qualquer.
Exemplos:
a) Números maiores que 1
321 = 3,21 x 102 veja que 1 3,21 < 10
376000 = 3,76 x 105 veja que 1 3,76 < 10
b) Número menor que 1
0,001 = 1 x 10-3 veja que 1 1 < 10
0,0000431 = 4,31 x 10-5 veja que 1 4,31 < 10
Exemplo:
2
4,0 x 10 2 4,0 x 10 2 2,0 x10 1 0,2
5 5
4,0 x 10 5
4,0 x10 2,0 x 10
2 2
632,46
exp 6.02x1023 =
Expoente 6,02x1023
6,02x1023
-2.90309 =
Logaritmo decimal log Log1,25x10-3
-2,90309
-6.6846117 =
Logaritmo neperiano ln Ln1,25x10-3
-6,6846117
Antilogaritmo decimal 10x Antilog 1 10
3. MEDIDAS DE POSIÇÃO
Uma medida de posição é um valor calculado para um grupo de dados que, de alguma forma, é
utilizado para descrevê-los. Tipicamente o que se deseja é que o valor seja representativo de todos
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 22
os valores do grupo. As medidas de posição mais importantes são as medidas de tendência central e
as separatrizes.
As medidas de tendência central recebem esta denominação pelo fato de os dados observados
tenderem, geralmente, a se agrupar em torno dos valores centrais. As principais medidas de
tendência central são: Média aritmética (simples e ponderada); Moda e Mediana.
As separatrizes são medidas de posição que dividem uma série de dados em duas partes
quaisquer. Não tendem, portanto a um valor central. São elas a própria mediana, o quartil; o decil e o
percentil.
X i x1 x 2 ... xn
X i 1
n n
onde: X = média aritmética ou simplesmente média;
n = número de total de observações (tamanho da amostra);
Xi , i = 1, 2, ..., n = observações individuais.
Exemplo: Determinar a média aritmética da série: A = 3, 4, 1, 3, 6, 5, 6.
n
X i
3 4 1 3 6 5 6
X i 1
4,0
n 7
A média aritmética simples é uma medida de posição que procura representar o centro da
distribuição e é utilizada quando os dados não são agrupados ou se apresentam em estado bruto
(dados isolados).
Resolução:
n
X i
194 198 189 201 180 190
X i 1
= 192,0 cm
n 6
2) Dado as notas de uma avaliação de 7alunos: 3, 5, 1, 2, 6, 5, 6, determinar a nota média.
n
X i
3 5 1 2 6 5 6
X i 1
= 4,0
n 7
Observe que a média aritmética é um parâmetro de medida de existência nem sempre concreta,
ou seja, não existe jogador com 192 cm no primeiro exemplo, nem nota igual a 4,0 no segundo. A
média aritmética significa que o conjunto se comporta como se cada um de seus elementos fosse
igual à média.
Em estatística, convencionou-se representar uma medida descritiva de uma população (parâmetro
populacional) por uma letra grega, enquanto que uma medida descritiva de uma amostra (estatística
amostral) é representada por uma letra romana.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 23
Desse modo, a média aritmética x representa a média de uma amostra de tamanho n. A média
aritmética populacional, , é definida de modo semelhante:
x i
, i = 1, 2, . . . , N
N
onde é a média aritmética populacional, Xi é o valor da variável e N é o número de itens da
população.
Operacionalmente, as duas fórmulas são idênticas: em ambos os casos são somados todos os
valores, e então o resultado da soma é dividido pelo número de valores da amostra (n) ou da
população (N).
X
xf i i
x1f1 x 2f2 ... xnfn
f i f1 f2 ... fn
Resolução:
Vê-se que se trata de uma média aritmética “ponderada” pelas freqüências.
1 6 6
2 10 20
3 12 36
4 4 16
34 78
X
x f
i i
78
2,3 meninos
f i 34
Obs.: Se x, o número de meninos numa família, é uma variável discreta (inteira), a interpretação
do resultado obtido (2 meninos e 3 décimos de menino) pode ser dita como: o maior número de
famílias tem 2 meninos e 2 meninas, sendo que a tendência geral aponta para uma leve
superioridade numérica em relação ao número de meninos.
Resolução:
Tem-se que Xi são os valores da variável X e fi corresponde a freqüência simples (repetição) de
cada valor Xi. Determina-se a média da seguinte forma:
x f
i Xi fi Xi f I
X
i i
1 3 2 6
2 4 5 20 f i
3 7 8 56
150
4 8 4 32 X 6,8
5 12 3 36 22
- 22 150
Observe que a média aritmética simples se iguala à média aritmética ponderada quando os pesos
(freqüências) são exatamente iguais.
1
n
n n 1 n
G n x i x i logG log x i
i 1
i 1 n i 1
X1 2 X 2 2 X 3 2 ... X n 2 X2
MQ
n n
3.5. Moda
É o valor que ocorre com maior freqüência dentre os dados observados. Numa amostragem pode
não haver moda (repetição de valores) ou pode haver mais de uma moda.
Resolução:
A maior freqüência simples é o 9, que corresponde ao valor 4 da variável. Logo, Mo = 4.
3.6. Mediana
É o valor que divide os dados ordenados em duas partes iguais. Se o número de observações
é par, a mediana corresponde à média dos dois valores centrais.
Resolução:
i Xi fi FiAC
1 3 2 2 f i
22
11
2 4 5 7 2 2
3 7 8 15 Freqüência acumulada imediatamente
superior a 11. Logo, Md = 7
4 8 4 19
5 12 3 22
Total - 22 -
c) A mediana ( Md )
a) A idade média ( X )
b) A idade modal ( Mo )
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 28
c) A idade mediana ( Md )
4. MEDIDAS DE DISPERSÃO
Resolução:
R = 12 – 3 = 9
x
2
2 i
x
2
2 i
É a raiz quadrada da variância:
N
Obs.:
O desvio padrão populacional (σ ) pode ser obtido com maior rapidez e precisão quando calculado
x
2
xi
2
1 xi
2
ou ainda: xi N
i
pela seguinte expressão:
2
N N N
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 29
Xi X i2 Yi Yi2 Zi Zi2
2 12 1
4 14 2
6 16 3
8 18 4
10 20 5
f x fi x i
2 2
i i
Incluem-se as freqüências na fórmula anterior, obtendo-se:
f i
f
i
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 30
Resolução:
f x fi x i
2
2
I xi fi fi x i fi xi2
i i
S =
1 3 2 6 18 f i
f
i
2 4 5 20 80
3 7 8 56 392 2
1178 150
4 8 4 32 256 S = = 7,06 = 2,66
5 12 3 36 432 22 22
Total - 22 150 1178
x
i
desejado. A média μ da população é estimada pelo estimador: X i1
e E X , ou seja, o
n
estimador da média é não tendencioso ou não viciado. Entretanto, a variância 2 da população é
x 2
x
2 i
estimada por S que é o estimador não viciado da variância. O estimador
n 1
x
2
x
S é um estimador tendencioso ou viciado, pois se demonstra que E (S2 ) 2 .
2 i
. O desenvolvimento
n 1
desta equação fornece uma fórmula operacionalmente mais simples de ser aplicada:
1 xi 2
S xi
2
n 1 n
Média
x i
X
x i
N n
1 xi 2 1 xi 2
i S i
2 2
Desvio padrão x x
N N n 1 n
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 31
Resolução:
1 5 10 4 101 105 110 104
XA 5 XB 105
4 4
S 2
1 52 5 5 10 5 4 5
2 2 2
14 SA S2A 14 3,74
A
3
(101 105)2 (105 105)2 (110 105)2 (104 105)2
SB2 14
3
SB SB2 14 3,74
Xi X
Zi x 100 500
S
O escore padronizado normalmente varia entre 200 e 800. Se o valor do elemento a ser
comparado (Xi) é igual à média, o escore padronizado será a igual a 500. Se Zi é maior que 500, é
porque o elemento se encontra acima da média do conjunto. Caso contrário, se Zi é menor que 500,
é porque o elemento se encontra abaixo da média do conjunto.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 32
Resolução:
Determina-se o escore de cada medida: peso (ZP) e idade (ZI)
58 65 7 1 66 72 84 68 59 74 64 681
XP 68,1 kg
10 10
XP XP 71 68,1
ZP x 100 500 x 100 500 537,9
SP 7,65
XI XI 25 23,4
ZI x 100 500 x 100 500 538,6
SI 4,14
Conclusão:
O aluno em questão encontra-se (ligeiramente) mais afastado da turma na variável idade, pois seu
escore padronizado para essa medida (ZI = 538,6) foi maior que o escore determinado para a
variável peso (ZP = 537,9).
X valor S X
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 33
ESTATÍSTICA INFERENCIAL
5. PROBABILIDADE
O termo probabilidade é usado de modo muito amplo na conversação diária para sugerir certo
grau de incerteza sobre uma ocorrência no passado, no futuro ou no presente.
Resolução:
Seja A o evento: {aparecer um número ímpar}.
Então: A = { 1, 3, 5 }, ou seja, N.C.F. = 3.
Quanto ao número total de casos (N.T.C.) será igual a seis, pois o espaço-amostral desse
experimento é S = {1, 2, 3, 4, 5, 6}. Portanto:
N.C.F.ao.evento.A 3 1
P(A)= 0,5 50%
N.T.C. 6 2
Logo, a probabilidade de aparecer um número ímpar no lançamento de um dado é ½ , 0,50 ou
50%.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 34
Variável aleatória
É a função que associa a todo evento pertencente a uma partição do espaço amostral um único
número real.
Distribuição de probabilidade
É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento
correspondente, isto é: P ( X = xi ) = P ( Ai), i = 1, 2, ..., n
No lançamento de três moedas, suponhamos X = número de ocorrências da face cara. A
distribuição de probabilidade de X é dada pelo conjunto de pares Xi, P( Xi ), i = 1, ...,n, como mostram
o quadro e o gráfico abaixo:
P (X )
Xi P (Xi )
0 1/8 3/8
1 3/8
2 3/8
1/8
3 1/8
1,00
0 1 2 3 X
1.1. X
Observe que em todas as distribuições de probabilidades de variáveis aleatórias, a soma das
n
probabilidades é igual a unidade: P (X ) 1
i 1
i
n n
P (X = x) = px qn-x onde:
n!
x x (n x )! x !
Resolução:
O experimento é realizado 5 vezes (n = 5); a probabilidade de sucesso (aparecer o número três) é
p = 1/6, e a de fracasso é q = 1- p = 5/6.
5
5 5
a) P (X = 0) = p0 q5 = 0,4019
0 6
2 3
5 1 5
b) P (X = 2) = p2 q3 = 10 0,1608
2 6 6
4 1
5 1 5
c) P (X = 4) = p4 q1 = 5 0,00322
4 6 6
5
5 1
d) P (X = 4) + P (X = 5) = 0,0032 + p5 q0 = 0,0032 + 0,00335
5 6
5
e) P (X = 0) + P (X = 1) + P (X = 2) = 0,4019 + p1 q4 + 0,1608 = 0,9645
1
Resolução:
O experimento é realizado 100 vezes (n = 100); a probabilidade de sucesso (obter cara) é p = 1/2.
O número "esperado " de caras em cem lances de uma moeda é:
E (X) = n . p = 100 ( 1/2 ) = 50.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 36
1 1
O desvio padrão é 100 . . = 5
2 2
Resolução:
De acordo com a distribuição binomial, a probabilidade desejada é dada por:
n 2000
P (X = 3) = px qn-x = (0,001) (0,999)
3 2000-3
= 0,1805
x 3
O resultado não seria tão simples de ser obtido. Por isso resolveremos esse exercício por
Poisson:
x=3 = n . p = 2000 . (0,001) = 2
e 2 . 2 3
P(X=3)= 0,1804
3!
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 37
Resolução:
A probabilidade de uma ferramenta ser defeituosa é p = 0,1 (q = 0,9) e o número de repetições é
n = 10.
10
a) P ( X = 2 ) = (0,1)2 (0,9)8 = 0,1937
2
b) = n . p = 10 . (0,1) = 1
e 1 . 12
P(X=2)= 0,1839
2!
Obs: Em geral, a aproximação é boa quando os resultados diferem em menos de 1% ou 0,01.
Desvio padrão: n. p
Pode haver também diversas distribuições normal com o mesmo desvio padrão, mas com
distintas médias ou com médias e desvios padrão distintos. Na realidade a distribuição normal é um
nome genérico para definir uma família de infinitas distribuições normal particulares, cada uma com
os seus valores específicos de média e desvio padrão. O que caracteriza, portanto, e diferencia uma
distribuição normal de outra são os valores destes dois parâmetros: a sua média e o seu desvio
padrão.
2 2
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 39
A área (probabilidade) é a
diferença entre as áreas entre 0 e 2
e entre 0 e 1, ou seja, P (1,00 ≤ Z ≤
2,00) = P (0 ≤ Z ≤ 2,00) - P (0 ≤ Z ≤
1,00) = 0,4772 - 0,3413 = 0,1359.
b) Qual é a probabilidade de uma pessoa selecionada ao acaso usar mais que 28 litros d’água por
dia?
P( X 28) = ?
28 20
P( X 28) Z 1,60 Tabela
0,4452
5
P( X 28) = P (Z 1,60) = 0,5 - 0,4452 = 0,0548 = 5,48%
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 41
c) Qual é a porcentagem da população que consome entre 18 e 26 litros d’água por dia?
P(18 X 26) = ?
P(18 X 26) = P (18 X 20) + P (20 X 26)
18 20
P (18 X 20) Z 0,40 Tabela
0,1554
5
26 20
P (20 X 26) Z 1,20 Tabela
0,3849
5
P(18 X 26) = P(-0,40 Z 1,20) = 0,1554 + 0,3849 = 0,5403 = 54,03%
Resolução:
O experimento é realizado 20 vezes (n = 20); a probabilidade de sucesso (obter cara) é 50% (p =
0,5), e a de fracasso é q = 1- p = 0,5.
a) Distribuição binomial
1
X = No de caras X : B 20,
2
P 1 X 5 P X 1 P X 2 P X 3 P X 4 P X 5
20 20
P (X = 1) = 0,5 0,5 0,00002 P (X = 2) = 0,5 0,5 0,00018
1 19 2 18
1 2
20 20
P (X = 3) = 0,5 0,5 0,00109 P (X = 4) = 0,5 0,5 0,00462
3 17 4 16
3 4
20
P (X = 5) = 0,5 0,5 0,01479
5 15
5
P 1 X 5 0,00002 + 0,00018 + 0,0019 + 0,00462 + 0,1479 = 0,0207 = 2,07%
A representação gráfica da distribuição completa apresenta semelhança com uma curva
normal.
P (X) 0,18
0,16
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
1 3 5 7 9 11 13 15 17 19 21
X (Número de caras)
n
PX x p x qn x
1 2 npq
2
e
x 2 . npq
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 43
b) Distribuição normal
np 20 x 0,5 10
npq 20 x 0,5 x 0,5 5 2,24
Resolução:
Seja X: número de componentes que funcionam X: B (100; 0,95)
A aproximação da distribuição binomial pela normal é dada por:
np 100 x 0,95 95
Tipos de teste t
O teste t pode ser usado em três diferentes casos:
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 44
1° caso: comparação da média obtida ( X ) com um valor especificado como referência (µ).
2° caso: comparação de 2 conjuntos de dados independentes quanto às médias.
3° caso: comparação de 2 conjuntos de dados pareados (emparelhados).
Fórmula geral
x X
t calc média da amostra;
S onde: média da população;
n S desvio padrão da amostra; e
n número de elementos da amostra
Xi
Note que essa fórmula lembra a da distribuição normal: Z . Ela resulta da substituição de
S S
X i por X e de por . A expressão é denominada erro padrão da média.
n n
A forma da distribuição t é
Z semelhante a da distribuição
normal. Ela é simétrica em relação
à média = 0, mas apresenta
t
caudas mais “grossas”, ou seja,
maior variância que a normal
reduzida.
Para cada valor de temos uma curva diferente de t e à medida que aumenta o número de graus
de liberdade () a curva t se eleva e quando n → ∞ , t → N (0,1).
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 45
Resolução:
x 1,7 1,5
t calc 3,15
S 0,22
n 12
...
...
...
Conclusão:
Como tcal ttab , ao nível de 95% de confiança, rejeita-se a hipótese de igualdade entre a média
amostral e a média populacional.
Outra forma de se usar o teste t é por meio do intervalo onde se encontra a média da população,
quando se conhece uma amostra dessa população é dado por:
tS tS
X X
n n
Determina-se então em que intervalo deve estar a média da população de onde foi retirada a
amostra. Substituindo-se os valores na fórmula anterior, tem-se:
2,20 x 0,22 2,20 x 0,22
1,7 1,7
12 12
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 46
Resolução:
Inicialmente determinam-se as estatísticas média, desvio padrão e variância para cada analista:
Estatística Analista 1 Analista 2 Analista 3
Média 0,36 0,40 0,35
Variância 0,000467 0,002067 0,000357
Desvio padrão 0,021602 0,045461 0,018898
O intervalo onde se encontra a média da população é dado por:
tS tS
X X
n n
A tabela 2 dos Anexos apresenta o valor de t igual a 2,45 para o nível de confiança de 95% (nível
de significância de 5%), e para 6 graus de liberdade (GL = n - 1 = 7 – 1 = 6).
O intervalo de confiança da média ao nível de 95% para o analista 1 é:
2,45 x 0,021602 2,45 x 0,021602
0,36 < μ < 0,36 +
7 7
a) Determine para cada um deles a média, a mediana, a amplitude, a variância, o desvio padrão, o
desvio padrão relativo (DPR), o coeficiente de variação (CV%) e o erro padrão da média.
b) Determine o intervalo de confiança da média ao nível de 95% para cada um deles.
7.4. Distribuição F
Sejam duas amostras caracterizadas pelo seu tamanho (n) e pelos seus parâmetros média e
variância.
Por meio da distribuição de F de Snedecor é possível verificar se as variâncias das populações a
que pertencem esta amostras podem ser consideradas homogêneas com o nível de confiança
desejado. Para tal, calcula-se o valor de F pela fórmula:
S12
Fcalc 2 , onde S12 S 22
S2
O valor obtido para Fcalc, chamado F calculado, é comparado com o valor de F tabelado (Ftab).
A tabela 4 dos Anexos apresenta o valor de Ftab ao nível de confiança 95%. O valor de Ftab é dado
em função dos números de graus de liberdade das amostras. O número de graus de liberdade é
dado pelo número de elementos da amostra menos um 1 n1 1 e 2 n2 1 .
Resolução:
maior var iância 625
Fcalc 3,70
menor var iância 169
A tabela a seguir apresenta em negrito o valor de Ftab = 3,29 para o nível de confiança = 95% e
para os graus de liberdade 1 7 e 1 9 ,
1
1 2 3 4 5 6 7
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89
...
...
...
...
...
...
...
X1 X 2
t calc
1 1
SP
n1 n 2
onde:
SP é o desvio padrão ponderado, dado por:
(n1 1) S12 (n 2 1) S 22
SP
n1 n 2 2
Obs.: O teste acima só poderá ser aplicado se as variâncias forem homogêneas. Quando não
ocorre homogeneidade de variâncias devemos usar as fórmulas a seguir.
X1 X 2
t calc
S12 S 22
n1 n 2
O número de graus de liberdade associado ao valor t é a parte inteira do valor de g obtido por:
2
S12 S 22
n n Uma vez determinado o valor de g e, com o
g 1 2 nível de significância especificado, procura-se o
2 2
S12 S 22 valor de t na tabela.
n n
1 2
n1 1 n2 1
d
d i
c) O desvio padrão das diferenças (Sd):
n
d 2
d) O valor de t:
d 2
n
Sd d n
n 1 t calc
Sd
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 50
A seguir, compara-se o valor de tcal com o valor de ttab, encontrado na tabela associado a n -1
graus de liberdade.
Se o valor de tcal for maior que o valor de ttab, rejeita-se a hipótese nula.
Resolução:
Tipo de teste: bicaudal
n 8 8 1 7 t / 2 2,36 (tabela 2)
Método
Amostra antigo novo Diferença
1 2,52 3,17 -0,65 d n 0,475 8
t calc 1,92
2 3,13 5,00 -1,87 Sd 0,7003
3 4,33 4,03 0,30
Conclusão:
4 2,25 2,38 -0,13
tcal < ttab: não rejeita a hipótese de
5 2,79 3,68 -0,89 igualdade entre os métodos, ou seja, não há
6 3,04 2,94 0,10 indicação significativa, ao nível de confiança
7 2,19 2,83 -0,64 de 95%, para rejeitar H0. Logo, as médias
dos métodos são compatíveis.
8 2,16 2,18 -0,02
Média - - -0,475
Desvio - - 0,7003
8.1. Teste Q
Esse teste deve ser aplicado quando se tem de 3 a 7 resultados (antigamente aplicava-se para
até 10 resultados).
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 51
Resolução:
X 2 X1 40,12 40,01
Q calc 0,579
R 40,20 40,01
Qtab = 0,625 (para n = 6 e NC = 95%)
Como Qcalc < Qtab → Não rejeitar o resultado duvidoso ao nível de 95%.
Exercício proposto:
Verifique se algum resultado deve ser rejeitado ao nível de 90% de confiança. Em caso afirmativo,
compare a média e o desvio padrão antes e depois da rejeição.
1 ou
3 ou
Resumo do procedimento:
Colocar os valores obtidos em ordem crescente (rol);
Calcular o valor de G (Gcalc) para o caso correspondente;
X X1 Xn X
G1 ou G1
S S
Xn X1 R
G2 ou G2
S S
n 3 x Sn2 2
G3 1 onde : Sn2 2 var iância sem os 2 dados
n 1 x S2
Comparar o valor de G calculado (Gcalc) com o de G tabelado (Gtab) para o nível de confiança
previamente estabelecido;
Critério de rejeição:
Se: Gcalc ≤ Gtab (5%) → Não rejeitar o valor ao NC considerado;
Se: Gtab (1%) ≥ Gcalc > Gtab (5%) → O valor é considerado suspeito;
Se: Gcalc > Gtab (1%) → Rejeitar (valor disperso ao NC considerado).
NC = 95% NC = 99%
n
G1 G2 G3 G1 G2 G3
3 1,153 2,00 - 1,16 2,00 -
4 1,463 2,43 1,00 1,49 2,44 1,00
5 1,672 2,75 0,98 1,75 2,80 1,00
6 1,822 3,01 0,94 1,94 3,10 0,98
7 1,938 3,22 0,90 2,10 3,34 0,96
8 2,032 3,40 0,85 2,22 3,54 0,92
9 2,110 3,55 0,81 2,32 3,72 0,89
10 2,176 3,68 0,77 2,41 3,88 0,86
12 2,285 3,91 0,70 2,55 4,13 0,80
13 2,331 4,00 0,67 2,61 4,24 0,77
15 2,409 4,17 0,62 2,70 4,43 0,71
20 2,557 4,49 0,52 2,88 4,79 0,61
25 2,663 4,73 0,45 3,01 5,03 0,53
30 2,745 4,89 0,40 3,10 5,19 0,47
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 53
2
Smáxima
n
i 1
i
Cn t
n
t
S
i 1
2
i
Critério de rejeição:
Se: Ccalc ≤ Ctab (5%) → Não rejeitar o valor ao NC considerado;
Se: Ctab (1%) ≥ Ccalc > Ctab (5%) → O valor é considerado suspeito;
Se: Ccalc > Ctab (1%) → Rejeitar (valor disperso ao NC considerado).
Os testes de rejeição são artifícios que melhoram apenas a precisão. Veja o exemplo abaixo de
medidas tomadas de uma população cujo valor verdadeiro é igual a 19,00:
Medidas Valores
o
1 18,02
2o 18,04
3o 18,93
o
4 18,00
o
5 18,03
a
Apesar da 3 medida estar mais próxima do valor verdadeiro, provavelmente ela seria descartada
em um teste de confiança.
9. ANÁLISE DE VARIÂNCIA
Resolução:
O experimento é constituído por 4 tratamentos e cinco repetições.
A seguir procede-se à série de cálculos:
o
N de tratamentos (k) k= 4
o
N de repetições (r) r= 5
o
N total de repetições (nk) n = kr = 20
o
a) N de graus de liberdade (GL)
De tratamentos k-1= 3
Do total n - 1 = kr - 1 = 19
Do resíduo (n - 1) - (k - 1) = n - k = 16
b) Correção (C).
Y 2
25 26 ... 282 535 2
C 14.311,25
n 4x5 20
c) Soma de Quadrados Total (SQT)
SQT Y 2
C 625 676 ... 784 14.311,25 275,75
d) Soma de Quadrados de Tratamentos (SQTr)
SQTr
T 2
C
13.225 ... 24.025 - 14.311,25 163,750
r 5
e) Soma de Quadrados de Resíduos (SQR)
SQR SQT SQTr 275,75 163,75 112,00
f) Quadrado Médio de Tratamentos (QMTr)
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 55
SQTr 163,75
QMTr 54,583
k 1 4 1
g) Quadrado Médio de Resíduo (QMR)
SQR 112,0
QMR 7,00
n k 20 4
h) Valor de F
QMTr 54,583
F 7,80
QMR 7,00
Na análise de variância de um experimento inteiramente ao acaso, o valor de F está associado ao
número de graus de liberdade de tratamentos (numerador) e ao número de graus de liberdade do
resíduo (denominador) para um dado nível de confiança. Para 1 3 e 2 16 o valor de F =
3,24, para o nível de confiança de 95%.
ANÁLISE DE VARIÂNCIA Tabela
Causas de variação GL SQ QM F F crítico
Tratamento 3 163,75 54,58 7,80 3,24
Resíduo 16 112,00 7,00
Total 19 275,75
Conclusão:
Como o valor de F calculado é maior que o valor de F tabelado (valor crítico), rejeita-se a
hipótese nula ao nível do confiança de 95%, ou seja, a hipótese de que as médias dos tratamentos
(variedades) sejam as mesmas.
Valor-p
Não é necessário usar a tabela de F se o cálculo for feito numa planilha eletrônica como o Excel®.
A tabela a seguir apresenta a anova feita para o mesmo exemplo. A hipótese nula é rejeitada se o
valor-p (p-value) for menor que o nível de significância ( ) estabelecido:
Se o valor p Re jeita se H0
Se o valor p Aceita H0 v
Anova: fator único (Ferramentas / Análise de dados / anova: fator único
RESUMO
Grupo Contagem Soma Média Variância
Coluna 1 5 115 23 6,5
Coluna 2 5 135 27 7,5
Coluna 3 5 130 26 7,5
Coluna 4 5 155 31 6,5
ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 163,75 3 54,58333 7,797619 0,001976 3,238872
Dentro dos grupos 112 16 7
Total 275,75 19 -
Conclusão: Como o valor p (0,001976 0,05 ) Re jeita se H0
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 56
Resolução:
2 2
Tratamentos (k) Soma Tratamentos ao quadrado (k ) Soma
2 2 2 2
Replicatas (r) A B C Y A B C Y
1 15 23 19 57 225 529 361 1.115
2 10 16 15 41 100 256 225 581
3 13 19 21 53 169 361 441 971
4 18 18 14 50 324 324 196 844
5 15 - 16 31 225 - 256 481
6 13 - - 13 169 - - 169
Total (T) 84 76 85 1.212 1.470 1.479 4.161
2
T 7.056 5.776 7.225
Repetição ( r ) 6 4 5
2
T /r 1.176 1.444 1.445
Média 14,0 19,0 17,0
o
N de tratamentos (k) k= 3
o
N total de repetições (nk) n= 15
o
a) N de graus de liberdade (GL)
De tratamentos k-1= 2
Do total n – 1= 14
Do resíduo (n - 1) - (k - 1) = n - k = 12
b) Correção (C).
Y 2
C
n
c) Soma de Quadrados Total (SQT)
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 57
SQT Y 2
C
d) Soma de Quadrados de Tratamentos (SQTr)
T12 T2 T2
SQTr 2 ... k C -
r1 r2 rk
e) Soma de Quadrados de Resíduos (SQR)
SQR SQT SQTr
f) Quadrado Médio de Tratamentos (QMTr)
SQTr
QMTr
k 1
g) Quadrado Médio de Resíduo (QMR)
SQR
QMR
n k
h) Valor de F
QMTr
F 3,96
QMR
ANÁLISE DE VARIÂNCIA
Causas de variação GL SQ QM F
Tratamento 3,96
Resíduo
Total
Conclusão: __________________________________________________________________
____________________________________________________________________________ .
A pressuposição básica para se fazer uma análise de variância é que os erros ou resíduos
( e ij Yij y i ) são variáveis aleatórias independentes com distribuição normal de média zero
e variância constante (homocedasticidade). Existem vários testes estatísticos para verificar a
independências dos erros, a normalidade da distribuição e a homocedasticidade, mas não serão
vistos nesse momento.
Freqüentemente procura-se verificar se existe relação entre duas ou mais variáveis. A massa
corpórea pode estar relacionada com a idade das pessoas; o consumo das famílias pode estar
relacionado com sua renda; a evasão escolar na zona rural pode estar relacionada a colheita da
lavoura. A verificação da existência do grau de relação entre variáveis é objeto de estudo da
correlação. Quando essa correlação existe, é interessante expressá-la por meio de uma equação
que ligue as variáveis.
Uma segunda etapa consiste em locar as coordenadas dos pontos das variáveis num sistema de
coordenadas cartesianas (diagrama de dispersão).
No diagrama de dispersão é possível, às vezes, visualizar uma curva regular que se ajuste aos
dados.
Exemplos:
Y Y
0 X 0
10.1. Equações das principais curvas
As principais curvas de ajustamento e suas respectivas equações estão relacionas abaixo:
Curva Equação
1 Linha reta Y aX b
2 Parábola ou curva de 2o grau Y aX2 bX c
3 Parábola cúbica ou curva de 3o grau Y aX3 bX2 cX d
4 Curva de no grau (polinômio) Y an Xn ... a3 X3 a2 X2 a1X a0
1
5 Hipérbole Y
aX b
6 Curva exponencial Y abx ou log Y log a X log b
7 Curva geométrica Y aXb ou log Y log a b log X
Para decidir qual curva deve ser adotada, é conveniente a obtenção de diagramas de dispersão
das variáveis. Para o caso das curvas 6 e 7 é conveniente a construção de diagramas de dispersão
das variáveis transformadas. Por exemplo, se o diagrama de dispersão de logY em função de X
apresentar uma relação linear, a equação a ser adotada tem aspecto de equação 6, enquanto que,
se o logY em função de logX indicar uma relação deste tipo (linear), a equação tem a forma da
equação 7. Para facilitar esse processo, emprega-se papeis especiais para gráficos, na qual uma ou
ambas as escalas são logarítmicas. São denominados papéis semi-log e log-log, respectivamente.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 59
10.2. Correlação
O estudo da correlação tem por objetivo avaliar o grau de relação existente entre duas variáveis
aleatórias. Pode-se determinar de modo quantitativo, quão bem uma reta ou uma curva se ajusta aos
pontos. Por exemplo, a reta do exemplo (a) representa melhor os dados de X e Y, do que para os da
reta (b).
Y Y
0 X 0 X
Aqui será tratada apenas da correlação linear simples.
SXX X X
2
X 2
X
2
n
Somatório do quadrado dos desvios de Y em relação a média:
SYY Y Y 2
Y2
Y 2
n
Somatório do produto dos desvios de X e de Y:
SXY Y Y X X XY X Y
n
O coeficiente de correlação é determinado pela seguinte equação:
SXY XY
X Y
rXY ou n
SXX.SYY r XY
X 2
X2
Y 2
Y 2
.
n n
1 rXY 1
Quando r XY 1 a correlação perfeitamente positiva;
XY
X Y
SXY n
a = coeficiente angular ou inclinação a ou a
SXX
X
2 X
2
n
b = coeficiente linear ou intercepto b Y aX
Com os valores de a e b, obtemos a equação da melhor reta e a partir da equação da reta
localizá-la no gráfico.
Resolução:
X Y XY X2 Y2
1 30 0,089 2,67 900 0,0079
2 60 0,169 10,14 3.600 0,0286
3 90 0,326 29,34 8.100 0,1063
4 120 0,460 55,20 14.400 0,2116
5 150 0,620 93,00 22.500 0,3844
6 180 0,780 140,40 32.400 0,6084
Soma 630 2,444 330,75 81.900 1,3472
a) Coeficientes a e b da reta:
XY
X Y 330,75
630 x 2,444
a n 6 0,00471
X2
X2 81.900
(630) 2
n 6
bY aX
Y a X
2,444
0,00471x
630
0,0869
n n 6 6
Equação: Y = 0 , 0 0 4 7 1 X - 0 , 0 8 6 9
b) Concentração de albumina = X
Y = absorvância (A) A = - log T A = - log 0,638 = 0,195
Equação: Y = 0,0471X - 0,0869 0,195 = 0,0471X - 0,0869 X = 59,98 g
XY
X Y 330,75
630 x 2,444
r XY n 6 0,9961
X2 Y 2 6302 2,4442
X .Y 81.900 .1,3472
2 2
n n 6 6
Se R2 = 98% indica que 98% das variações de Y são explicadas pela variação de X através da
função escolhida para relacionar as variáveis e 2% são atribuídos às outras causas. De uma maneira
geral, considera-se que se:
R2 85%: ajustamento ótimo;
75% R2 85%: ajustamento bom;
65% R2 75%: ajustamento regular;
R2 65%: a variável X não explica com segurança a variação de Y.
Resolução:
c) Coeficiente de determinação (R2):
R2 = r2 = (0,9961)2 = 0,9922
Conclusão: _________________________________________________________________
____________________________________________________________________________
Resolução:
Conjunto 1 Conjunto 2 Conjunto 3 Conjunto 4
X Y X Y X Y X Y
1 10,0 8,04 10,0 9,14 10,0 7,46 8,0 6,58
2 8,0 6,95 8,0 8,14 8,0 6,77 8,0 5,76
3 13,0 7,58 13,0 8,74 13,0 12,74 8,0 7,71
4 9,0 8,81 9,0 8,77 9,0 7,11 8,0 8,84
5 11,0 8,33 11,0 9,26 11,0 7,81 8,0 8,47
6 14,0 9,96 14,0 8,10 14,0 8,84 8,0 7,04
7 6,0 7,24 6,0 6,13 6,0 6,08 8,0 5,25
8 4,0 4,26 4,0 3,10 4,0 5,39 19,0 12,50
9 12,0 10,84 12,0 9,13 12,0 8,15 8,0 5,56
10 7,0 4,82 7,0 7,26 7,0 6,42 8,0 7,91
11 5,0 5,68 5,0 4,74 5,0 5,73 8,0 6,89
Soma 99,0 82,51 99,0 82,51 99,0 82,50 99,0 82,51
Média 9,0 7,50 9,0 7,50 9,0 7,50 9,0 7,50
r
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 63
AKANIME, Carlos T.; YAMAMOTO, Roberto K. Estudo Dirigido de Estatística Descritiva. São
Paulo: Érica, 1998.
CIENFUEGOS, Freddy. Estatística Aplicada ao Laboratório. Rio de Janeiro: Interciência, 2005.
DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. São Paulo: Saraiva, 1998.
FARIAS, Alfredo Alves de; SOARES, José Francisco; CÉSAR, Cibele Comini. Introdução à
estatística. Rio de Janeiro: LTC, 1998.
FONSECA, Jairo S., MARTINS, Gilberto de A. Curso de Estatística. 6ª edição. São Paulo: Atlas,
1996.
LAPPONI, Juan Carlos. Estatística usando Excel 5 e 7. São Paulo: Lapponi Treinamento e Editora
Ltda, 1997.
LEVINE, David M. et al. Estatística: Teoria e Aplicações usando Microsoft Excel em Português. Rio
de Janeiro: LTC – Livros Técnicos e Científicos Editora S. A., 2000.
MARTINS, Gilberto de Andrade & DONAIRE, Denis. Princípios de Estatística. São Paulo: Atlas,
1990.
MORETTIN, Luiz Gonzaga. Estatística Básica – v.1 – Probabilidade. São Paulo: Makron Books,
1999.
RIBEIRO JÚNIOR, José Ivo. Análises estatísticas no Excel: guia prático. Viçosa: UFV, 2004.
SPIEGEL, Murray R. Estatística. São Paulo: Makron Books, 1994.
VIEIRA, Sonia; WADA, Ronaldo. Estatística: introdução ilustrada. São Paulo: Atlas, 1986.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 64
1)
2)
Vantagens do censo: maior confiabilidade, maior precisão.
Vantagens da amostragem: menor custo; maior rapidez.
3)
Amostragem sistemática. Suponha-se que não seja possível juntar todos os clientes para se
proceder ao sorteio aleatório. Suponha-se ainda que não haja influência entre os tipos (estratos) de
cliente, como idade, sexo, etc. que justifique a aplicação de uma amostragem estratificada.
4)
100%
C
Ponto
%
1 2 %A
%A 60 40
%B 20 30
%C 20 30 %C
2
1
100%
A 0 20 40 60 80 100 % B
%B
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 65
5)
a) Sim, o ponto encontra-se no interior do triângulo;
b) 60% de N2, quando o ponto fica fora do triângulo.
6, 7, 8, e 9) fazer no computador
10, 11 e 12)
Série
A B
Média aritmética simples 4,67 2
Média geométrica 4,00 2
Média harmônica 3,43 2
Média quadrática 5,29 2
13)
Média = -0,4 Moda = 0,0 Mediana = -0,5
14)
a) a variação média é igual a: 0,0
b) a variação mediana é igual a: 1,4
15)
a) (X) média
16)
b) média das massas do 41o e 42o valor ordenado
17)
a) A nota média do agrupamento = 6,3
b) A nota que mais se evidencia na turma = 8,0
c) A nota que limita as 50% maiores notas = 6,0
18)
a) A idade média ( X ) = 23,5
b) A idade modal ( Mo1 ) = 23,0; ( Mo2 ) = 24,0
c) A idade mediana ( Md) = 23,5
19)
Série
X Y Z
Desvio padrão populacional 2,828 2,828 1,414
20)
e) (X) As séries X e Z apresentam o mesmo desvio padrão.
21)
Desvio padrão populacional = 0,0001884
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 66
22)
a) P (X = 20) = 1,05E-14
b) P (X = 5) = 0,1746
c) P (X = 0) = 0,0115
d) P (X = 15) = 1,66E-07
e) P ( X 8) 0,0321
f) P ( X 10) 0,9994
23)
a) P (X = 0) = 0,3679
b) P (X = 1) = 0,2707
24)
São duas curvas simétricas de mesmo grau de achatamento situadas no mesmo eixo, uma mais a
direita (maior média).
25)
Intervalo
NC (%) X1 X2
a) 90 29,997 34,603
b) 95 29,556 35,044
c) 98 29,044 35,556
d) 99 28,694 35,906
26)
P(70 X 80) 0,3479
27)
a) binomial: P(X = 10) = 0,02798
b) normal: P (9,5 X 10,5) 0,02787
28)
29)
Os analistas A1 e A3 apresentam a mesma precisão e médias iguais ao nível de confiança de 95%.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 67
30)
Os analistas A1 e A2 não apresentam a mesma precisão, mas apresentam médias iguais ao nível de
confiança de 95%.
31)
Rejeita-se o menor valor (40,01) pelo teste Q. Após a rejeição, a média quase não se altera, mas o
desvio padrão muda significativamente.
com rejeição sem rejeição
Média 40,14 40,17
Desvio padrão 0,064 0,027
32)
Rejeita-se o menor valor (40,01) pelo teste de Grubbs ao NC = 95%.
Estatística Aplicada à Metrologia Química - Ifes Vila Velha – 2015 José Augusto Brunoro 68
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 0 5 2 1 0 4 5 8 9 4 6 8 1 4 7 4 9 1 9 3 4 4 7 9 8
2 7 0 3 6 0 1 1 2 5 4 4 4 5 6 6 2 6 6 3 3 8 0 6 1 4
3 1 5 2 9 1 9 4 4 5 9 0 5 4 3 8 6 6 4 0 2 5 4 7 9 5
4 7 1 3 6 5 7 2 8 0 1 8 1 9 1 0 9 0 3 0 3 2 7 9 3 7
5 1 5 1 0 8 7 6 9 7 0 6 4 3 3 9 6 7 1 7 5 9 3 8 6 4
6 4 2 1 6 4 4 8 9 6 2 2 6 1 9 7 7 2 1 0 7 9 5 0 6 6
7 6 7 5 0 7 6 1 8 3 5 1 8 7 1 0 9 8 0 8 6 5 9 6 3 7
8 0 5 6 3 5 3 6 6 5 4 2 8 3 9 9 2 9 0 7 3 4 7 6 0 6
9 5 5 2 9 3 7 8 3 1 9 8 0 0 9 2 6 0 7 9 7 1 6 8 5 6
10 1 5 4 2 9 4 2 5 8 6 9 7 7 9 0 1 9 4 3 6 2 0 7 9 3
11 3 8 1 0 7 0 0 2 5 9 7 1 9 9 5 4 4 4 2 8 7 0 1 8 3
12 4 4 8 7 8 6 9 6 5 8 8 8 4 4 6 3 0 9 5 4 8 7 8 7 8
13 1 4 5 1 0 9 6 6 6 9 9 0 4 0 0 8 8 2 6 3 8 9 1 1 9
14 5 2 3 8 4 7 8 5 7 2 1 5 7 3 6 6 8 9 0 1 6 6 8 4 3
15 1 9 1 0 7 0 5 3 2 9 2 9 3 0 0 6 7 5 7 7 3 1 1 1 3
16 1 1 3 2 7 1 0 7 2 6 0 3 5 0 7 9 6 1 3 5 2 2 2 7 6
17 2 5 5 9 2 7 3 0 6 2 7 8 6 0 3 0 6 9 8 5 1 4 9 3 4
18 6 9 8 6 3 1 8 3 6 4 7 4 7 0 9 5 2 2 0 0 2 6 7 4 9
19 9 7 0 6 8 9 1 1 4 2 8 3 1 8 8 6 7 9 9 6 8 0 2 2 3
20 8 9 0 5 5 2 0 7 9 0 3 5 8 9 9 6 6 6 8 4 3 7 8 5 0
21 1 0 3 1 7 1 3 6 2 4 7 6 5 2 9 4 8 1 2 5 9 0 6 1 6
22 3 7 6 4 9 2 4 7 2 8 9 8 2 9 8 4 7 4 5 0 8 7 0 2 0
23 9 4 4 2 9 9 7 1 9 5 8 5 4 1 5 2 0 4 0 3 2 4 0 9 3
24 8 9 5 3 2 4 7 0 0 6 2 2 0 1 5 5 4 8 0 0 7 2 9 7 9
25 2 5 0 6 5 8 6 9 0 6 1 8 8 0 2 2 2 9 0 5 1 1 4 4 0
26 6 9 2 2 8 4 2 8 4 2 5 6 7 3 5 1 4 6 6 5 9 9 5 0 0
27 2 5 1 8 4 7 1 1 5 4 0 2 9 8 0 0 6 7 9 5 9 2 0 6 9
28 4 0 1 8 7 8 0 9 4 9 5 0 3 1 6 1 0 8 1 3 9 0 1 2 3
29 8 2 3 7 7 8 3 7 1 4 2 5 2 5 7 8 6 0 1 2 5 0 4 7 2
30 8 8 1 2 4 9 5 0 4 8 2 5 3 0 0 9 0 5 7 9 7 7 0 8 2
31 5 4 8 9 7 5 3 9 3 3 1 2 0 9 3 6 6 7 8 1 9 4 8 5 4
32 0 4 2 3 7 0 9 2 5 6 1 9 0 3 6 1 8 1 6 0 1 9 3 9 6
33 3 5 5 3 1 6 2 6 7 8 6 3 8 7 3 9 4 0 7 4 0 0 4 7 2
34 9 4 1 9 9 5 1 0 1 0 3 8 6 3 5 3 5 2 0 7 9 7 8 8 6
35 7 7 1 8 3 2 8 0 4 4 3 7 7 9 8 1 2 4 3 8 7 3 0 6 4
36 3 1 9 2 0 7 0 1 4 8 0 5 5 0 8 0 0 9 1 1 4 6 7 1 3
37 7 8 4 1 3 3 4 8 8 6 5 1 6 3 0 6 4 0 0 6 5 0 6 1 6
38 5 4 9 7 0 4 2 9 1 7 0 3 5 3 8 3 0 7 5 7 9 0 0 5 0
39 8 7 3 6 4 6 5 2 7 9 7 1 0 7 3 9 2 1 4 2 7 8 4 7 1
40 3 1 4 7 2 7 7 0 6 9 0 4 1 0 0 4 9 9 8 6 0 0 5 0 9