Escolar Documentos
Profissional Documentos
Cultura Documentos
PROGRAMA DE CERTIFICAÇÃO
OPERACIONAL CST
ESTATÍSTICA II
ELABORAÇÃO: DEZEMBRO/04
CST - Companhia Siderúrgica de Tubarão
FDH - Departamento de Recursos Humanos
FHD - Divisão de Desenvolvimento e Remuneração
Av. Brigadeiro Eduardo Gomes, 930, Jardim Limoeiro - Serra - ES.
CEP: 29163-970
Telefone: 0 XX (27) 3348-1420
Fax: 0 XX (27) 3348-1077
Sumário
1. INTRODUÇÃO...................................................................................................................................... 6
2. DEFINIÇÕES DE TERMOS USADOS EM ESTATÍSTICA............................................................ 7
3. VARIÁVEIS DISCRETAS E CONTÍNUAS..................................................................................... 12
4. POPULAÇÕES E AMOSTRAS ......................................................................................................... 13
4.1. TÉCNICAS DE AMOSTRAGEM ......................................................................................................... 14
4.2. AMOSTRA ALEATÓRIA SIMPLES ..................................................................................................... 15
4.3. AMOSTRA SISTEMÁTICA ................................................................................................................ 15
4.4. AMOSTRA ESTRATIFICADA ............................................................................................................ 15
4.5. AMOSTRA DE CONVENIÊNCIA (GRUPO).......................................................................................... 16
4.6. ERROS DE AMOSTRAGEM............................................................................................................... 16
5. HISTOGRAMAS DE FREQÜÊNCIA............................................................................................... 16
5.1. PRIMEIRA ETAPA: CÁLCULO DA AMPLITUDE (R) .......................................................................... 17
5.2. SEGUNDA ETAPA: DETERMINAÇÃO DO INTERVALO DE CLASSE .................................................... 18
5.3. TERCEIRA ETAPA: PREPARAÇÃO DO FORMULÁRIO DA TABELA DE FREQÜÊNCIA .......................... 19
5.4. QUARTA ETAPA: DETERMINAÇÃO DAS CLASSES .......................................................................... 19
5.5. QUINTA ETAPA: CÁLCULO DO PONTO MÉDIO DE CADA CLASSE .................................................. 20
5.6. SEXTA ETAPA: OBTENÇÃO DAS FREQÜÊNCIAS.............................................................................. 20
6. DESENHANDO UM HISTOGRAMA DE FREQÜÊNCIA ............................................................ 20
6.1. POLÍGONO DE FREQÜÊNCIAS ......................................................................................................... 21
6.2. ESTRATIFICAÇÃO DE HISTOGRAMAS ............................................................................................. 22
7. PARÂMETROS DA DISTRIBUIÇÃO DE FREQÜÊNCIA............................................................ 24
7.1. TENDÊNCIA CENTRAL ................................................................................................................... 25
7.2. DISPERSÃO .................................................................................................................................... 25
7.3. ASSIMETRIA .................................................................................................................................. 25
7.4. CURTOSE ....................................................................................................................................... 25
8. MÉDIA ARITMÉTICA ...................................................................................................................... 26
9. MÉDIA PONDERADA ....................................................................................................................... 27
10. MÉDIA DA RAIZ DA MÉDIA DOS QUADRADOS .................................................................. 29
11. MEDIA HARMÔNICA .................................................................................................................. 30
12. MEDIANA ....................................................................................................................................... 30
13. MODA.............................................................................................................................................. 31
14. MEDIDAS DE DISPERSÃO.......................................................................................................... 32
15. AMPLITUDE .................................................................................................................................. 32
16. VARIÂNCIA ................................................................................................................................... 33
17. DESVIO PADRÃO ......................................................................................................................... 34
18. COEFICIENTE DE VARIAÇÃO ................................................................................................. 36
Estatística
19. FORMATO...................................................................................................................................... 37
20. DISTRIBUIÇÃO DE PROBABILIDADES.................................................................................. 37
20.1. INTRODUÇÃO AO CÁLCULO DE PROBABILIDADES ......................................................................... 38
20.2. REGRA DA ADIÇÃO ........................................................................................................................ 41
20.3. REGRA DO PRODUTO ..................................................................................................................... 42
21. DISTRIBUIÇÃO BINOMIAL ....................................................................................................... 43
22. DISTRIBUIÇÃO DE POISSON .................................................................................................... 45
23. DISTRIBUIÇÃO NORMAL.......................................................................................................... 47
23.1. PROPRIEDADES DA DISTRIBUIÇÃO NORMAL ................................................................................. 47
23.2. CARACTERÍSTICAS ........................................................................................................................ 48
23.3. MODELO MATEMÁTICO ................................................................................................................ 49
23.4. DISTRIBUIÇÃO NORMAL PADRÃO ................................................................................................. 50
23.5. APLICAÇÕES.................................................................................................................................. 54
23.6. DISTRIBUIÇÃO DE AMOSTRAGEM DA MÉDIA ARITMÉTICA............................................................ 56
23.7. ERRO PADRÃO DA MÉDIA ARITMÉTICA ........................................................................................ 58
23.8. TEOREMA DO LIMITE CENTRAL .................................................................................................... 59
24. DISTRIBUIÇÃO UNIFORME (OU RETANGULAR) ............................................................... 60
25. DISTRIBUIÇÃO TRIANGULAR................................................................................................. 62
26. DISTRIBUIÇÃO T (STUDENT) ................................................................................................... 65
27. GRAUS DE LIBERDADE ............................................................................................................. 67
28. INTERVALO DE CONFIANÇA................................................................................................... 67
29. EXERCÍCIOS DE ESTATÍSTICA ............................................................................................... 70
30. RESPOSTAS DOS EXERCÍCIOS DE ESTATÍSTICA.............................................................. 78
Estatística
5
Apresentação
Muitas pessoas ainda pensam que Metrologia se refere apenas a Dimensão e Comprimento,
que se trata de paquímetros, micrômetros, calibres e similares. Este conceito deve ser
corrigido, pois Metrologia é a Ciência da Medição e se refere à medição de qualquer
grandeza física.
Segundo a norma 1 NBR ISO 10012, Comprovação Metrológica é um conjunto de
operações necessárias para assegurar-se de que um dado equipamento de medição está em
condições de conformidade com os requisitos para o uso pretendido.
Quando se relata o resultado de medição de uma grandeza física, é obrigatório que seja
dada alguma indicação quantitativa da qualidade do resultado, de forma tal que aqueles que
o utilizam possam avaliar sua confiabilidade. Sem essa indicação, resultados de medição
não podem ser comparados, seja entre eles mesmos ou com valores de referência
fornecidos numa especificação técnica ou numa norma.
A avaliação da qualidade de medidas é fundamental para a prática gerencial. Segundo o
Dr. William Edwards Deming, “o que se registra ao final de uma determinada operação
de medição é o último produto de uma longa série de operações, desde a matéria-prima
até a operação de medição propriamente dita. A medição é, pois, a parte final deste
processo. Assim, do mesmo modo como é vital controlar estatisticamente as outras partes
deste processo, é vital controlar-se estatisticamente o processo de medição; caso
contrário, não há medida que tenha significado comunicável”.
Estas palavras de Deming mostram a importância do conhecimento e do uso sistemático,
por parte das empresas, da comprovação metrológica, a qual utiliza as técnicas estatísticas
para avaliação da capacidade de sistemas de medição.
O pressuposto básico da metrologia é que toda medida possui erros. Como conseqüência,
nem o valor verdadeiro e nem o valor do erro são conhecidos com exatidão. Como em
outras áreas científicas, por exemplo, a física, na metrologia temos que conviver com a
incerteza e os erros de medição. Convém, portanto, que a incerteza e os erros de medição
sejam tratados de tal modo que as medições possam ter alguma utilidade.
Uma das razões mais comuns de dados com baixa qualidade é a grande variação dos dados.
Por exemplo, um sistema de medição usado para medir a vazão de um gás em uma
tubulação, pode ser sensível à temperatura do gás medido. Neste caso, a variação nos
dados pode ser devida ou a mudanças na vazão ou a mudanças na temperatura do gás. Isto
torna a interpretação dos dados mais difícil e o sistema de medição, conseqüentemente,
menos conveniente ou até mesmo inadequado.
Além disso, outros fatores também influem na medição, por exemplo: o operador, os
equipamentos auxiliares, as condições ambientais, o instrumento de medição etc.
Esta apostila pretende tratar com mais ênfase os componentes de um Sistema de
Comprovação Metrológica, fazendo, contudo, uma breve explanação dos conceitos básicos
de Estatística, necessários à aplicação da metrologia.
1
Norma NBR ISO 10012/2004 – Sistemas de Gestão de Medição – Requisitos para os processos de medição
e equipamento de medição.
Estatística
6
1. INTRODUÇÃO
A estatística inferencial “cuida dos métodos que tornam possíveis a estimativa de uma
característica de uma população ou a tomada de uma decisão referente à população com
base somente em resultados de amostras”.
A estatística inferencial é uma técnica usada para coletar, descrever, analisar e interpretar
os dados numéricos. Ela trata das variações aleatórias contidas nos dados. É conveniente
deixar claro que a estatística inferencial mostra apenas as informações já contidas nos
dados. Nenhuma informação nova é criada por ela. O tratamento estatístico dos dados
permite fazer julgamentos objetivos relacionados com a validade dos resultados,
permitindo vê-los de modos diferentes e a tomada de decisões objetivas e inteligentes
quanto à qualidade e aplicação.
Usando a estatística podemos determinar o valor mais provável de uma grandeza, partindo
de um conjunto de dados de medição, bem como determinar o erro provável e o valor da
incerteza.
Quando se faz apenas uma medição dizemos que a mesma é imprevisível e aleatória.
Entretanto uma série de medições é previsível e determinada. A base da estatística é a
repetição das medições. Com apenas uma medição obtém-se pouca informação do
mensurando, sujeita a erros. Com múltiplas medições os erros aleatórios aparecem como
um espalhamento em torno da média das medições.
Estatística
7
Como é sabido, devido ao alto custo das medições, torna-se impeditivo realizar muitas
medições para caracterizar uma população, daí serem usadas algumas poucas amostras
(medições) para inferir (tirar conclusões) sobre as populações. Por conseqüência, este
processo tem suas limitações, não é exato, podendo estar sujeito a erros. A estatística
inferencial poderá avaliar e controlar o tamanho do erro cometido ao se fazer estas
deduções. Ou seja: a incerteza e o grau de confiança do sistema de medição.
A seguir são apresentados alguns termos usados em estatística, extraídos do Guia 3 para a
Expressão da Incerteza de Medição, que os extraiu da Norma 4 ISO 3534-1. Esta norma
deve ser a primeira fonte a ser consultada para a definição de termos estatísticos não
incluídos nesta apostila.
Amostra: é uma parcela representativa da população que é escolhida para análise com o
propósito de tirarmos conclusões sobre a essa população.
2
Análise dos Sistemas de Medição (MAS), 2a Edição – Fev/ 95.
3
Guia Para a Expressão da Incerteza de Medição – 2a Edição – ABNT – INMETRO – SBM – 1998.
4
ISO 3535-1: 1993 – Statistics – Vocabulary and Symbols – Part 1: Probability and general statistical terms.
Estatística
8
Nota: a característica pode ser ou quantitativa (por variáveis) ou qualitativa (por atributos).
No texto original, o estimador consta como "biased", que não corresponde à tradução "não-
tendencioso”.
5
No texto original, o estimador consta como "biased", que não corresponde à tradução "não-tendencioso”.
Estatística
9
Nota: Estatística, como uma função de variáveis aleatórias, é também uma variável
aleatória e, como tal, assume diferentes valores de uma amostra para outra. O valor da
estatística obtida, usando-se os valores observados nesta função, pode ser utilizado num
teste estatístico ou como estimativa de um parâmetro de população, tal como uma média
ou um desvio padrão.
Nota: um resultado desta operação pode ser expresso como um valor único singular
(estimativa pontual) ou como uma estimativa de intervalo.
Fenômeno Estatístico: qualquer evento que se pretenda analisar, cujo estudo seja possível
da aplicação do método estatístico.
Função distribuição: função que determina, para cada valor x, a probabilidade de que a
variável aleatória X seja menor ou igual a x:
Estatística
10
Notas:
2) Em uma longa série de amostras, a freqüência relativa dos casos nos quais o valor
verdadeiro do parâmetro de população é coberto pelo intervalo de confiança, é maior ou
igual a (1- α).
Intervalo de confiança unilateral: quando T é uma função dos valores observados, tais
que, θ sendo um parâmetro de população a ser estimado, a probabilidade Pr (T ≥ ≈ theta)
[ou a probabilidade Pr (T1 ≤ θ)] é pelo menos igual a (1 - α) [onde (1 - α) é um número
fixo, positivo e menor do que 1], o intervalo do menor valor possível de θ até T (ou o
intervalo de T até o maior valor possível de θ) é um intervalo de confiança (1 - α)
unilateral para θ.
Nota: o limite T do intervalo de confiança é uma estatística e, como tal, geralmente irá
supor diferentes valores de amostra para amostra.
Intervalo estatístico de abrangência: intervalo para o qual pode-se dizer que, com um
dado nível da confiança, ele contém pelo menos uma proporção especificada da população.
Notas:
1) Quando ambos os limites são definidos por estatísticas, o intervalo é bilateral. Quando
um dos dois limites não é finito ou consiste do limite absoluto da variável, o intervalo é
unilateral.
2) Também denominado "intervalo estatístico de tolerância". Este termo não deve ser
usado porque pode ser confundido com “intervalo de tolerância", que é definido na ISO
3534-2.
Estatística
11
Notas:
Variância: uma medida de dispersão, que é a soma dos desvios quadráticos das
observações de sua média aritmética dividida pelo número de observações menos um.
Variável Aleatória: uma variável que pode assumir qualquer um dos valores de um
conjunto especificado de valores e com a qual está associada uma distribuição de
probabilidade.
Nota: Uma variável aleatória que só pode assumir valores isolados é chamada “discreta”.
Uma variável aleatória que pode assumir qualquer valor dentro de um intervalo finito ou
infinito é chamada “contínua”.
Variável aleatória centrada: uma variável aleatória cuja esperança se iguala a zero.
Estatística
12
Pode-se concluir também que os valores das variáveis discretas são obtidas mediante
alguma forma de contagem enquanto que as variáveis contínuas advém de um processo de
medição, freqüentemente fornecidos em alguma unidade de medida. Por outro lado a
interpretação de um valor de uma variável discreta é dada exatamente pelo seu valor
numérico. Quando dizemos que a CST possui dois altos fornos (em 2004), temos a noção
exata do seu significado. Entretanto, não podemos dizer o mesmo da temperatura, pois a
interpretação de uma variável contínua é a de que se trata de um valor aproximado. Isso
decorre do fato de não existirem instrumentos de medida capazes de oferecer precisão
absoluta, além do fato de que existem outros fatores de influência que afetam o resultado
da medida, como, por exemplo, a variabilidade do processo, reajuste do equipamento, troca
de operador, entre outros.
Ao medirmos uma variável contínua, estamos sempre fazendo uma aproximação, cujo
resultado deve ser interpretado como sendo uma aproximação compatível com o nível de
precisão e com o critério utilizado para medir.
Estatística
13
4. POPULAÇÕES E AMOSTRAS
Por definição, população é conjunto total de elementos portadores de, pelo menos, uma
característica comum. Então, qualquer subconjunto não vazio e com menor número de
elementos do que a população constitui uma amostra dessa população. A figura 1 ilustra
este conceito.
População
Amostra
As populações podem ser finitas, como o conjunto dos habitantes de um país ou infinitas
como o número de vezes em que se pode tirar a carta de “7 de paus” de um baralho.
Convém, contudo, ressaltar que mesmo que o pesquisador trabalhasse com a população, o
que seria impossível, mesmo assim, poderia ter um trabalho astronômico para estudá-la e
na maioria dos casos os resultados seriam sempre falhos. Imagine o número de
nascimentos e mortes diários em nosso país. Portanto, vai sempre existir uma imprecisão
no resultado do trabalho. Nesses casos, o estatístico recorre a uma amostra, que
basicamente, constitui uma redução da população a dimensões menores, sem perda das
características essenciais.
Estatística
14
Na metrologia, ocorre o mesmo, pois mesmo que alguém se disponha a fazer, digamos,
100 medições da corrente elétrica de um motor, o resultado será sempre uma amostra
porque, teoricamente, a corrente elétrica pode ser medida um número infinito de vezes.
Além disso, o estudo cuidadoso de uma amostra tem mais valor científico do que o estudo
sumário de toda a população.
a) amostra de julgamento;
b) amostra por quota;
c) fatia.
Em muitos casos, somente a amostra não-probalística está disponível, como por exemplo,
em um julgamento. Nesse caso a opinião de um perito no assunto estudado é fundamental
para que se possa utilizar os resultados obtidos a fim de realizar modificações em um
processo.
Estatística
15
As inferências estatísticas de uma amostra para uma população é feita através de uma
amostra probabilística.
Sempre que a população for constituída de por diferentes extratos, devem ser obtidas
amostras estratificadas.
Estatística
16
Como regra geral, há muitas restrições ao uso de mostras por conveniência. Entretanto,
elas são comuns, em várias áreas, principalmente quando constituem a única maneira de
estudar determinado problema.
5. HISTOGRAMAS DE FREQÜÊNCIA
A tabela 1 apresenta dados brutos, isto é, dados que ainda não foram numericamente
organizados, de medidas de comprimento de 100 eixos fabricados numa Usinagem.
Observe que interpretar essa massa de dados é bastante trabalhoso. Por isso fazemos uso de
alguns recursos para facilitar a análise dos dados. O histograma é um dos métodos usados
que vamos aplicar agora. Siga as seis etapas do método.
Estatística
17
R = Vmax – Vmin,
Sendo:
R = amplitude
Vmax = maior valor entre os 100 valores
Vmin = menor valor entre os 100 valores
No. da Medidas
Amostra (em mm)
1 a 10 4162 4168 4178 4165 4167 4168 4157 4161 4164 4165
11 a 20 4157 4158 4173 4183 4189 4167 4172 4171 4173 4176
21 a 30 4154 4168 4178 4169 4177 4173 4176 4166 4171 4165
31 a 40 4169 4169 4165 4171 4169 4167 4173 4172 4181 4171
41 a 50 4186 4171 4174 4164 4165 4167 4158 4172 4183 4187
51 a 60 4163 4169 4173 4169 4182 4165 4169 4170 4175 4174
61 a 70 4167 4177 4172 4179 4171 4157 4159 4178 4173 4176
71 a 80 4162 4163 4182 4169 4177 4156 4160 4178 4173 4175
81 a 90 4169 4178 4169 4173 4174 4173 4177 4169 4182 4184
91 a 100 4185 4171 4177 4169 4171 4151 4168 4177 4169 4169
Tabela 1 - Dados brutos medidas de comprimento de 100 eixos fabricados (em mm).
Encontrar tanto o menor valor, quanto o maior deles, percorrendo visualmente a lista de
100 valores. Este método é passível de erro quando se tem muitos valores a comparar. É
melhor acrescentar duas colunas à direita da tabela 1 e nomeá-las como “Menor Valor” e
“Maior Valor”. Veja a Tabela 2. Percorrer visualmente cada linha e anotar na coluna
correspondente o “Menor Valor” de cada linha. Percorrer visualmente a coluna “Menor
Valor” e anotar qual é o “Menor Valor”. Repetir o mesmo procedimento para o “Maior
Valor”. Feito isso, é só aplicar a fórmula de cálculo da amplitude e obter:
Estatística
18
Logo obtemos:
a) 38 / 1 = 38
b) 38 / 2 = 19
c) 38 / 5 = 7,6 que deve ser arredondado para 8.
Então vamos optar pela letra c, que nos permitirá 8 classes com intervalo de 5 mm.
Estatística
19
Observe que:
a) a soma das freqüências (f) tem que ser igual à quantidade (n) de dados levantados
(neste caso: 100);
Estatística
20
a) Usando uma folha de papel quadriculado, marcar o eixo horizontal com uma escala
(mm). A escala deve ser baseada na unidade de medida dos dados (kg, oC, mm);
c) Marcar o eixo vertical da esquerda com a escala de freqüência. Traçar o eixo vertical
da direita, marcando nele a escala de freqüência relativa;
Estatística
21
e) Usando o intervalo de classe como base, traçar retângulos cuja altura corresponda à
freqüência daquela classe;
f) Traçar uma linha (traço-ponto) para representar a média e, se houver, traçar linhas
verticais representando os limites da especificação;
g) Anotar a quantidade de dados (n), a média ( x ) e o desvio padrão (s) e quando foi feita
a coleta de dados etc. Veja o exemplo da figura 2 para os dados da tabela 1.
Estatística
22
Por exemplo, na tabela 4 calculamos o ponto médio de cada classe. Vamos repetir o
histograma da figura 2, construindo a figura 3, e vamos marcar neste histograma o ponto
médio de cada classe e em seguida vamos unir os pontos marcados. E para concluir o
gráfico, imaginamos duas classes teóricas, de ponto médio = 0, nos dois extremos do
histograma.
Estatística
23
Foram identificadas diferenças nas temperaturas entre os dois sensores. Este método pode
ser usado para melhorar a qualidade do produto, reduzindo a variação e melhorando a
média do processo. A estratificação é geralmente feita de acordo com a metodologia 6M 6
(também conhecida como “diagrama de Ishikawa”, diagrama de causa-e-efeito ou ainda
“espinha de peixe”). Os 6M são: método, máquina, mão-de-obra, meio-ambiente, matéria
prima e medida.
6
As Ferramentas da Qualidade no Gerenciamento de Processos – Werkema, Maria C. Catarino
Estatística
24
25
20
15
10
0
1 2 3 4 5 6 7
Figura 4 - Histograma de Freqüência da Medição de Temperatura nos lados A e B
16
14
14
12
12
10
10
8
8
6
6
4
4
2 2
0 0
1 2 3 4 5 6 7 1 2 3 4 5 6 7 8
Figura 5 - Histogramas Estratificadas da
Temperatura do Forno
a) lado direito: posição A; b) lado esquerdo: posição B.
Estatística
25
7.2. DISPERSÃO
É a característica que indica o grau de espalhamento dos dados. Também é chamada de
variação.
7.3. ASSIMETRIA
Indica o grau de distorção em uma curva simétrica ou o grau de assimetria. Uma curva
simétrica possui os lados direito e esquerdo da lei de centro iguais. Os dois lados de uma
curva simétrica são imagens de cada lado. Uma curva se distorce para direita quando a
maioria dos valores está agrupada no lado direito da distribuição.
7.4. CURTOSE
É a característica que descreve o pico em uma distribuição. É uma medida relativa para
comparar o pico de duas distribuições. Uma maior curtose significa um pico maior de
freqüência relativa, não maior quantidade de dados.
Estatística
26
8. MÉDIA ARITMÉTICA
Os dados podem ser reduzidos a um único número, para fins de comparação. A média ou
valor médio é o mais representativo de um conjunto de dados ou medições. Quanto maior o
número de medições feitas, melhor será o resultado. O valor médio é a expectativa
matemática do conjunto de dados.
A média aritmética é a média mais usada e é calculada como sendo a soma de todas as
medidas de um conjunto dividida pelo número total de medidas. Se uma variável x possui
os n valores: x1 , x2 , ...., xn , a média aritmética, x , (leia-se: xis barra) é:
x1 + x2 + ... + xn
x=
n
∑x i
Simplificando esta fórmula podemos usar x= i =1
n
Onde:
x = média aritmética
∑x
i =1
i = somatório de todos os valores xi na amostra (i varia de 1 até n)
n = tamanho da amostra
Exemplo: Calcular a média de: 25, 36, 45 e 72. Usando a fórmula, temos:
25 + 36 + 45 + 72
x= = 44,5
4
Logo, a média aritmética, ou simplesmente, a média é: 44,5.
Estatística
27
Quando se tem uma população muito grande de dados (n tende para o infinito), o símbolo
da média é expresso como:
n
∑x i
μ = i =1
n
9. MÉDIA PONDERADA
Às vezes as medições x1 , x2 , ...., xn , estão associadas com certos fatores de peso, como
x1 p1 + x2 p2 + ... + xn pn
xp =
p1 + p2 + ... + pn
A média ponderada é muito usada nas médias escolares, onde se pode atribuir importâncias
(pesos) diferentes ao exame final, trabalhos de casa, aulas práticas e provas mensais.
Em metrologia, a média ponderada mais comum usa as freqüências das medições como
seus respectivos pesos. Freqüência é o número de vezes que um dado é observado.
Freqüência relativa é a percentagem de vezes que um dado é observado.
Estatística
28
x p = x1 f1 + x2 f 2 + ... + xk f k
k
∑fx i i
xp = i =1
k
∑f
i =1
i
(Ponto
Intervalo Ponto
Classe Freqüências Freqüência Freqüência Médio
de Médio
no (Marcas) (f) Relativa Classe) x
Classe da Classe
(Freqüência)
4151,5 a
1 4153,5 || 002 0,002 8307,00
4156,5
4156,5 a
2 4158,5 ||||| ||| 008 0,008 33268,00
4161,5
4161,5 a
3 4163,5 ||||| ||||| ||| 013 0,013 54125,50
4166,5
4166,5 a
4 4168,5 ||||| ||||| ||||| ||||| ||||| 025 0,025 104212,50
4171,5
4171,5 a ||||| ||||| ||||| ||||| |||||
5 4173,5 026 0,026 108511,00
4176,5 |
4176,5 a
6 4178,5 ||||| ||||| ||||| 015 0,015 62677,50
4181,5
4181,5 a
7 4183,5 ||||| ||| 008 0,008 33468,00
4186,5
4186,5 a
8 4188,5 ||| 003 0,003 12565,50
4191,5
Total 100 0,010 417135,00
Média 4171,35
Tabela 6 - Tabela de Freqüência.
Estatística
29
Podemos observar que a soma da coluna Freqüência (f) é 100 (total de elementos que
compõem esta amostra). Para obtermos a média do diâmetro dos 100 eixos desta tabela,
multiplica-se o ponto médio de cada classe (2a coluna) pela respectiva freqüência, somam-
se os produtos e divide-se a soma por n (neste caso, k =8, pois são 8 classes de
freqüência). Então a média é:
k
417135
xp = = 4171,35
100
Quando temos dados positivos e negativos e as suas influências se somam, não podemos
tirar a média aritmética, pois a soma algébrica dos dados cancelam seus valores. Então se
utiliza a fórmula:
x rms = (x2
1 + x 22 + ... + x n2 )
Esta fórmula também é usada em metrologia, quando se quer combinar diversos erros, por
exemplo, numa malha de medição. Neste caso, x1 , x2 , ...., xn , seriam os erros de cada
Estatística
30
n
xh = n
1
∑x
i =1 i
É usada quando se deseja calcular a média de grandezas inversas. Por exemplo: Suponha
que um tanque esteja alimentando três clientes, com vazões individuais de 100, 120 e 140
litros por minuto. Deseja-se saber qual é a vazão média. Aplicando a fórmula da média
harmônica, temos:
n 3
xh = = = 117,76
n
1 ⎛ 1 1 1 ⎞
∑x
i =1
⎜ + + ⎟
⎝ 100 120 140 ⎠
i
12. MEDIANA
A Mediana é o valor central quando os dados estão ordenados por valor e a amostra possui
número ímpar de dados. Por exemplo:
4, 6, 8 12 e 18, a mediana é 8.
Se a amostra contém um número par de dados, a mediana é a média aritmética dos dois
valores que ficam na posição central dos dados ordenados. Por exemplo:
Os dois valores que ficam na posição central são 40 e 60, logo a mediana será:
40 + 60
= 50
2
Veja que no gráfico da Figura 7 os dados estão representados ao longo do eixo e que a
posição da mediana (linha pontilhada) está assinalada (50) e divide a amostra em dois
conjuntos com igual número de dados (4 dados para cada lado).
Estatística
31
A mediana é usada para reduzir o efeito dos valores extremos ou para dados que possam
ser ordenados, mas que não sejam economicamente mensuráveis (tons de cor, aparência
visual, odores). Na curva percentil, é o valor da escala horizontal onde a curva alcança a
altura 50%.
13. MODA
A Moda é o valor que ocorre com maior freqüência. Por exemplo: 12, 14, 15, 15, 15, 18,
29, 29, e 30. A moda é 15, pois este é o número que ocorre maior número de vezes.
Existem conjuntos de dados que não possuem moda, porque nenhum valor se repete maior
número de vezes e existem conjuntos de dados com mais de uma moda. Por exemplo: 7, 8,
9, 10, 11, 12 e 18 não tem moda e o conjunto de números 7, 8, 8, 9, 10, 11, 11, 12 e 18 tem
duas modas, a saber, 8 e 11.
A moda, diferentemente das outras medidas de tendência central, pode ser obtida mesmo
que a variável seja qualitativa. Veja os dados apresentados na tabela 7. O sangue tipo A
ocorreu com maior freqüência entre os doadores de sangue no mês de junho.
Estatística
32
Os dados estão sempre dispersos ao redor da zona de tendência central, e a extensão dessa
dispersão é chamada dispersão ou variação. Uma medida de dispersão é a segunda das
duas medidas mais fundamentais em toda a análise estatística.
15. AMPLITUDE
5, 8, 12, 17 e 32 a amplitude é 32 – 5 = 27
Entretanto a amplitude nem sempre nos mostra certas diferenças contidas nos dados. Sua
deficiência reside no fato de que usa apenas os valores extremos – e não todos os dados.
Mesmo assim, ela é muito usada, principalmente pela facilidade com que é calculada e
interpretada.
Estatística
33
16. VARIÂNCIA
Embora a amplitude seja uma medida de dispersão, como vimos anteriormente, ela não
leva em conta como os dados se distribuem ou se agrupam. Duas maneiras utilizadas para
medir a variação que realmente considera como os dados se distribuem em torno da média
são a variância e o desvio padrão.
fórmula:
s2 =
(x − x ) + (x
1
2
2 )
2
(
− x + ... + xn − x )
2
ou, simplificando
n −1
∑ (x − x )
n n
∑x
2
i
2
i − n x2
s2 = i =1
ou podemos usar também s 2 = i =1
n −1 n −1
Onde:
s 2 = variância
x = média aritmética
n = tamanho da amostra
∑ (x )
n
2
i −x = somatório de todas as diferenças ao quadrado entre os valores xi e
i =1
Estatística
34
podermos calcular o valor desta estatística. Ou seja, se qualquer dos valores de xi livres da
amostra for desconhecido, não poderemos determinar o valor desta estatística, pois todos
os valores da amostra são livres, podendo variar aleatoriamente.
Por outro lado, a estatística da variância expressa pela equação acima, por usar a média, x ,
ao invés do parâmetro populacional µ, tem um grau de liberdade a menos. Isso ocorre
porque o cálculo dessa estatística pressupõe que anteriormente já se tenha usado todos os
valores da amostra no cálculo da média, x , os quais estariam sendo usados uma segunda
vez no cálculo da variância. Ou seja, ao usarmos o mesmo conjunto de dados para
determinar a média, x , e a variância que faz uso do valor da média, perdemos um grau de
liberdade para a determinação da média.
s = s 2 ou substituindo s 2 , temos:
∑ (x + x )
n
2
i
s= i =1
n −1
Estatística
35
x1 + x2 + ... + xn
A média será: x =
n
10 + 12 + 11 + 15
x= = 12
4
∑ (x )
n
2
i −x
A variância será: s 2 = i =1
n −1
s 2
=
(10 − 12) + (12 − 12 ) + (11 − 12) 2 + (15 − 12) 2
2 2
4 −1
s = 4,666 = 2,160
Convém ressaltar que a variância e o desvio padrão nunca podem ser negativos. Entretanto
podem ser zero, o que ocorre quando todos os valores são exatamente iguais. Neste caso, a
amplitude também será zero.
Estatística
36
s
cv( x) = 100 %
x
Onde:
cv( x) = coeficiente de variação
s = desvio padrão
x = média aritmética
A vantagem do coeficiente de variação como uma medida relativa é devido ao fato de que
ele nos permite comparar a variabilidade de dois ou mais conjuntos de dados expressos em
diferentes unidades de medição. Ou então quando comparamos dois ou mais conjuntos de
dados nas mesmas unidades, porém com diferenças entre si de tal monta que não permita
comparação direta entre suas médias e seus desvios padrões. Por exemplo, imagine que em
dois grupos de pessoas tenham sido calculadas a idade média e o desvio padrão, conforme
abaixo:
Grupo 1: x1 = 20 e s1 = 4
Grupo 2: x2 = 50 e s2 = 4
Se ambos os grupos têm o mesmo desvio padrão, a priori, comparar a dispersão de suas
idades é um pouco difícil. Fazendo uso do coeficiente de variação, temos:
Estatística
37
Podemos agora concluir que, mesmo tendo desvio padrão igual, o grupo 1 apresenta uma
variação relativa muito maior (20 %) do que o grupo 2 (8 %).
Além disso, por ser adimensional, o coeficiente de variação permite que se comparem as
dispersões de variáveis cujas unidades sejam irredutíveis.
19. FORMATO
Para saber o formato de um conjunto de dados, basta comparar sua média com sua
mediana, ou seja:
a) distribuição binomial;
b) distribuição de Poisson;
c) distribuição normal
Estatística
38
e) distribuição triangular
f) distribuição t (Student)
Variável discreta é aquela que pode assumir apenas valores isolados ao longo de uma
escala. Por exemplo: o número de altos fornos existentes na CST é uma variável discreta.
Estatística
39
Em um dado experimento um evento deve ocorrer ou não ocorrer, como por exemplo, ao
jogar uma moeda ao ar, a probabilidade da ocorrência de “cara” mais a probabilidade da
não ocorrência de “cara” será sempre igual a 1. Então:
Ou seja, o complemento de um evento X inclui todos os eventos que não fazem parte de X,
e é representado por X’.
Lançando-se uma moeda um número grande de vezes, deverá aparecer cara em metade dos
lançamentos e coroa no restante. A freqüência relativa de caras se aproxima de 0,5
conforme é aumentado o número de lançamentos da moeda. Portanto a freqüência relativa
de um ponto amostral pode ser tomada, aproximadamente, como a sua probabilidade.
Por exemplo: ao jogar a moeda uma única vez, a probabilidade de sair cara é de 0,5 (50%
de chance de acertar). Logo a fórmula é:
1
Probabilidade de CARA = = 0,5
2
Estatística
40
f
P(X) =
p
Onde:
f 1
P( X ) = = = 0,5
p 2
Observe que a probabilidade é sempre expressa por um número adimensional, isto é, sem
unidade de medida.
Veja este exemplo: Qual a probabilidade de sair a face 3 ao lançar um dado uma vez?
Casos possíveis: Face 1, Face 2, Face 3, Face 4, Face 5, Face 6. Ou seja, temos 6 casos
possíveis. Casos favoráveis: somente uma face 3. Logo, usando a fórmula.
Face 3
P(de sair Face 3) =
Face 1 + Face 2 + Face 3 + Face 4 + Face 5 + Face 6
1
= = 0,1666...
6
Estatística
41
3 Faces 3 1
= = = = 0,5
6 Faces 6 2
Por definição, f ≤ p, sendo que f pode ser zero. Veja o seguinte exemplo: Numa única
jogada, qual a possibilidade de sair a face 7. Observe que o dado não possui a face 7. Logo,
0
P(7) = = 0 e dizemos que esta é a menor probabilidade que existe.
6
Em um dado experimento um evento deve ocorrer ou não ocorrer, como por exemplo, ao
jogar uma moeda ao ar, a probabilidade da ocorrência de “cara” mais a probabilidade da
não ocorrência de “cara” será sempre igual a 1. Então:
Ou seja, o complemento de um evento X inclui todos os eventos que não fazem parte de A,
e é representado por X’.
Lançando-se uma moeda um número grande de vezes, deverá aparecer cara em metade dos
lançamentos e coroa no restante. A freqüência relativa de caras se aproxima de 0,5
conforme é aumentado o número de lançamentos da moeda. Portanto a freqüência relativa
de um ponto amostral pode ser tomada, aproximadamente, como a sua probabilidade.
Estatística
42
1 1 2 1
P (2 ou 5) = + = = = 0,333
6 6 6 3
Uma moeda será jogada duas vezes. Qual a probabilidade de ocorrer cara nas duas
jogadas? A probabilidade de ocorrer cara na primeira jogada é:
1
P(ACARA) = = 0,5
2
1
P(BCARA) = = 0,5
2
Porque o fato de ocorrer cara na primeira jogada não modifica a probabilidade de ocorrer
cara na segunda jogada (eventos independentes). Para obter a probabilidade de ocorrer cara
nas duas jogadas (primeira e segunda), faz-se o produto:
1 1 1
{P(ACARA) e P(BCARA) }= 2 * 2 = 4 = 0,25
Suponha que numa urna tenha 3 bolas: duas brancas e uma vermelha. Retirando-se ao
acaso, uma bola e em seguida a outra (sem que a primeira tenha sido recolocada na urna),
qual é a probabilidade de que as duas bolas sejam brancas:
2
P(branca) = 3 = 0,6666...
Estatística
43
A probabilidade de a segunda bola ser branca depende do que ocorreu na primeira retirada.
Se sair bola branca, a probabilidade de a segunda também ser branca é:
1
P(branca) = = 0,5
2
Para obter a probabilidade de as duas bolas retiradas serem brancas, faz-se o produto
2 1 2 1
=
= 3 * 2 = 6 3 = 0,3333...
n!
P ( x) = p x (1 − p) n − x
x!(n − x)!
Estatística
44
Onde:
p = probabilidade de sucesso
Observe que a variável aleatória x pode ser qualquer valor inteiro de 0 até n e que na
fórmula acima o produto do termo p x (1 − p) n − x nos informa a probabilidade de obtermos
exatamente x sucessos entre n observações numa determinada seqüência.
n!
Por outro lado, o termo nos mostra quantas combinações de x sucessos entre n
x!(n − x)!
observações são possíveis. Por isso, toda vez que um conjunto de parâmetros – n e p – é
especificado, uma distribuição binomial pode ser gerada.
Face 3 1
P(de sair Face 3) = =
Face 1 + Face 2 + Face 3 + Face 4 + Face 5 + Face 6 6
Estatística
45
n!
P ( x) = p x (1 − p) n − x
x!(n − x)!
2 3− 2
3! ⎛1⎞ ⎛ 1⎞
⎜ ⎟ ⎜1 − ⎟
P(x = 2) = 2!(3 − 2 )! ⎝6⎠ ⎝ 6⎠
1
3 * 2 *1 ⎛ 1 ⎞⎛ 1 ⎞⎛ 5 ⎞
= ⎜ ⎟⎜ ⎟⎜ ⎟
2 *1(1) ⎝ 6 ⎠⎝ 6 ⎠⎝ 6 ⎠
6 5 5
= * = 3* = 0,0694
2 6 216
(e − μ ) μ x
P( x) =
x!
Estatística
46
Onde:
x = número de sucessos
(e − μ ) μ x
Aplicando a fórmula P ( x) = , temos,
x!
e −3 * 32 9
P(x = 2) = = = 0,2240
2! (2,71828)3 * 2
Neste mesmo problema, qual seria a chance de que mais de dois clientes irão chegar em
um dado minuto?
(e − μ ) μ x
E utilizando a equação P ( x) = , temos
x!
= 1 - 0,4232 = 0,5768
Estatística
47
Deste modo, vemos que existe uma chance de aproximadamente 42,3 % de que dois ou
menos clientes irão chegar ao banco a cada minuto e que existe uma chance de 57,7 % de
que três ou mais clientes irão chegar.
Uma forma abreviada de indicar que a variável x se distribui normalmente (ou tem
distribuição normal) é escrever:
x → N ( μ ;σ 2 )
e) Ela oferece bases para a inferência estatística devido à sua afinidade com o teorema do
limite central.
Estatística
48
23.2. CARACTERÍSTICAS
A curva de distribuição deve ter as seguintes características:
f) Existem infinitas curvas, basta que seja diferente um dos parâmetros: µ ou σ2. Veja a
figura 9;
Estatística
49
h) A área total sob a curva vale 1, porque essa área corresponde à probabilidade de a
variável aleatória assumir qualquer valor real.
1 ⎡ 1 ⎛ x − μ ⎞2 ⎤
F ( x) = exp ⎢− ⎜ ⎟ ⎥
σ 2π ⎢⎣ 2 ⎝ σ ⎠ ⎥⎦
onde:
Estatística
50
Observe a figura 10(a). Imagine uma variável x que tenha distribuição normal com media
aritmética µ e desvio padrão σ, pois se trata de uma população (e não de uma amostra), e o
eixo vertical (das freqüências), for deslocado até o ponto µ, onde se localiza a média
aritmética da população. Esta operação pode ser chamada de “mudança de origem”, em
que o zero “mudou de lugar”. A nova curva ficou como mostrada na figura 10(b).
x−μ
Z=
σ
Onde:
Freqüência
(a) (b)
Figura 10 - Conversão de X em Z .
Estatística
51
Assim, usando a fórmula de conversão, qualquer variável aleatória normal x pode ser
convertida para uma variável normal padronizada Z . Vejamos um exemplo:
µ=0
σ=1
Estas operações e esses dados são muito importantes pelo seguinte:
Estatística
52
µ = 0 e σ2= σ = 1 = 1
2
A variável Z não tem unidade de medida, ou seja, é um número puro. Esta notação
abreviada, x →N(0;1), é muito prática e significa que a variável x se distribui normalmente
(ou tem distribuição normal) e 0 é a média aritmética da população e 1 é a unidade de
medida, ou seja, o desvio padrão.
Veja este exemplo. Suponha que um inspetor tenha feita uma calibração em 45 minutos.
Pela figura 12 podemos concluir que este tempo está a uma unidade padronizada (ou seja, a
um desvio padrão, 1σ) acima da média aritmética. Veja os cálculos utilizando a fórmula de
conversão:
x−μ
Z=
σ substituindo, temos:
45 − 40
Z= =1
5
25 − 40
Z= = −3
5
Estatística
53
Vemos assim que o desvio padrão se tornou uma unidade de medida. Ou seja: 45 minutos é
5 minutos mais demorado (ou seja, 1 desvio padrão) do que o tempo médio de 40 minutos,
assim como o tempo de 25 minutos é 15 minutos (3 desvios padrões) mais rápido do que a
média observada.
A figura 13 nos permite ainda observar mais uma característica da curva normal. Por ser
simétrica, a área total abaixo da curva vale 1, ou seja 100%, entre os limites - ∞ < x < + ∞
pois todos os resultados caem dentro dela. Os traços verticais perpendiculares ao eixo de x
estão graduados em µ-3σ, µ-2σ, µ-1σ, µ, µ+1σ, µ+2σ e µ+3σ. Além disso, a área coberta
por µ±1σ, µ±2σ, µ±3σ vale, respectivamente, 68,26 %, 95,44 % e 99,74% independente de
sua largura.
Estatística
54
23.5. APLICAÇÕES
Vamos agora aprender a usar a tabela de probabilidades (Anexo A). Esta tabela nos
permite resolver diversos problemas que envolvem uma variável x normalmente
distribuída. Suponha x com os seguintes parâmetros: N(45; 4). Qual será o valor de Z para
x = 49,5? Aplicando a fórmula de conversão, temos:
x−μ
Z= e, substituindo:
σ
49,5 − 45
= = 2,25
2
Isto significa que Z está 2,25 desvios padrões à direita da média µ. Agora vamos localizar
este valor na tabela do Anexo A. Para consultar este valor é preciso decompor Z em duas
parcelas, a saber:
Em seguida, localiza-se a primeira parcela (2,2) na margem esquerda da tabela (na vertical)
e a segunda parcela (0,05) na margem superior (na horizontal). Ler o valor da célula
correspondente ao cruzamento destes valores (0,4878), o qual é a probabilidade
correspondente à área da curva entre Zero e o Z calculado. A figura 14 mostra a curva
desta probabilidade.
Estatística
55
x→N(40;25)
x = 45
Z=1
Estatística
56
a) ausência de viés
b) eficiência
c) consistência.
Com respeito à primeira propriedade, podemos dizer que a média das médias aritméticas
de todas as amostras possíveis (de um dado tamanho de amostra n) será igual à média
aritmética da população µ.
SORTEIO NO SORTEIO NO 2
1 1 2 3 4 5
1 1 1,5 2 2,5 3
2 1,5 2 2,5 3 3,5
3 2 2,5 3 3,5 4
4 2,5 3 3,5 4 4,5
5 3 3,5 4 4,5 5
Esta tabela mostra que a média é uma variável, pois também assumiu valores de 1 a 5.
Além disso, existem grupos de dados em que a média ( x ) é constante, por exemplo: 1 e 4,
2 e 3, 3 e 2 e 4 e 1, cuja média é 2,5. Entretanto, verificamos que da população Beta com 5
elementos, tiramos 25 amostras de tamanho n = 2.
Estatística
57
N =5; x = 1, 2, 3, 4, 5
N
∑x i
1 + 2 + 3 + 4 + 5 15
μ= i =1
= = =3
N 5 5
Amostra A
n =2 (tamanho = 2)
x =1; 1,5;2;2,5;...; 5
xi ni xi * ni
1 1 1
1,5 2 3
2 3 6
2,5 4 10
3 5 15
3,5 4 14
4 3 12
4,5 2 9
5 1 5
Soma 25 75
Tabela 9 - Calculando a média das medias aritméticas.
x= ∑xn
i i
=
75
=3
∑n i 25
Comparando, temos x = μ.
Estatística
58
Quanto maior o número de elementos na amostragem, menor será o efeito dos extremos,
tanto acima quanto abaixo da média. Esta característica é expressa estatisticamente no
valor do desvio padrão da média aritmética da amostra. Esta é a medida de variabilidade da
média aritmética de amostra para amostra e é chamada de erro padrão da média
aritmética, σ x . Considerando a amostragem com reposição, o erro padrão da média é
definido como sendo o desvio padrão da população σ dividido pela raiz quadrada do
tamanho da amostra n.
σ
σx =
n
Logo, à medida que cresce o número de elementos (n) na amostra, o erro padrão da média
vai decrescendo a um fator igual à raiz quadrada do tamanho da amostra.
Quando não conhecemos a variância (ou o desvio padrão) da população, usamos a fórmula:
sx
sx =
n
Estatística
59
Neste caso, n significa número de observações em cada amostra. Qual deve ser o tamanho
da amostra? Como regra geral, se o tamanho da amostra for pelo menos igual a 30, a
distribuição de amostras da média aritmética será muito próxima da normal. Mas se temos
alguma informação sobre a população podemos aplicar o teorema do limite central para
tamanhos de população ainda menores. Se a distribuição da população for relativamente
simétrica, recomenda-se pelo menos 15 elementos, mas se a população for normal, a
distribuição de amostragem da média será normal, independentemente do tamanho da
amostra.
padrão finito σ se aproxima de uma distribuição normal com média μ q e desvio padrão
Estatística
60
Área = (a + a) * h = 1
1
h=
2a
e para a variância:
a2
σ 2 (t ) =
3
a2 a
σ (t ) = =
3 3
Estatística
61
Pode-se calcular a probabilidade de que o valor da diferença de potencial seja tal que a - ≤
V ≤ a +, supondo que a resolução declarada fornece fronteiras simétricas para uma
a = 100/2 μV
a = 50 μV
a2
cuja variância σ 2 (t ) = é
3
a 2 (50) 2
σ²( ∆ V ) = = = 833,3 μV
3 3
σ²( ∆ V ) = 833,3 μV
a2 a
e o desvio padrão σ (t ) = = é
3 3
a2 a 50
σ( ∆ V ) = = = = 28,86 ≅ 28,9 μV
3 3 3
σ( ∆ V ) = 28,9 μV
Estatística
62
a2 a
e o desvio padrão σ (t ) = = é
3 3
a2 a 15
σ( ∆ V ) = = = = 8,66 ≅ 8,7 μV
3 3 3
σ( ∆ V ) = 8,7 μV
Acabamos de ver que no caso da distribuição retangular, por não haver conhecimento
específico sobre os possíveis valores de xi dentro de seus limites estimados [a - , a +
] foi
considerado que somente se poderia supor que seria igualmente provável, para xi, tomar
qualquer valor entre esses limites, com probabilidade zero de estar fora deles. Em muitos
casos, é mais realista esperar que valores perto dos limites sejam menos prováveis do que
os que estejam perto do ponto médio. É, então razoável substituir a distribuição retangular
simétrica, por uma distribuição trapezoidal simétrica, tendo lados inclinados iguais (um
trapezóide isósceles), uma base de largura a + - a - = 2a e um topo de largura 2aβ,
Onde 0 ≤ β ≤ 1.
Estatística
63
b * h (a + a ) * h
Área = = =1
2 2
2 1
h= =
2a a
a2
e para a variância: σ (t ) =
2
Estatística
64
a2 a
e calculando o desvio padrão: σ (t ) = =
6 6
Por exemplo, suponha que se disponha poucas informações sobre uma medição, a não ser
estas: Resultado das n = 20 medições, média aritmética μ t = 200 psi e que t é descrito
-
como uma distribuição triangular de limite inferior, a = 194 psi, e de mesmo limite
+ + -
superior a = 206 psi. Logo, a meia-largura a = [a - a ]/2 = (206-194)/2 = 12/2 = 6 psi.
A função densidade de probabilidade de t é, então:
Estatística
65
Pelo que vimos até agora, se n ≥ 30, podemos usar a distribuição normal na estimação da
média da população mesmo não conhecendo bem a população. Para n < 30 somente se a
população for normalmente distribuída e se σ for conhecido. A distribuição t de Student é
utilizada quando a variável x é normalmente distribuída mas o σ não for conhecido.
A fórmula é:
x−μ
t=
sx
n
Onde,
Estatística
66
Como normalmente estes valores vem dividido por 100, temos 2,5/100 = 0,025. No
cruzamento da linha de 40 graus de liberdade com a coluna 0,025 encontramos o valor de t
= 2,0211.
Uma vez que t é uma distribuição simétrica, com uma média aritmética 0, se o valor da
cauda superior é + 2,0211, o valor da cauda inferior será -2,0211. Um valor de t = 2,0211
significa que a probabilidade de t exceder a + 2,0211 é igual a 0,025 ou 2,5%, conforme
ilustrado na figura 20.
Notas:
a) O uso da estatística t pressupõe que a variável tenha na população de onde foi retirada
uma distribuição normal.
c) Não existe uma única distribuição t, mas uma família, ou seja, para cada n existe uma
distribuição e uma curva específica.
Estatística
67
calcular o valor desta estatística. Ou seja, se qualquer dos valores de xi livres da amostra
for desconhecido, não poderemos determinar o valor desta estatística, pois todos os valores
da amostra são livres, podendo variar aleatoriamente. Por outro lado, a estatística da
variância por usar a média, x , ao invés do parâmetro populacional µ, tem um grau de
liberdade a menos. Isso ocorre porque o cálculo dessa estatística pressupõe que
anteriormente já se tenha usado todos os valores da amostra no cálculo da média, x , os
quais estariam sendo usados uma segunda vez no cálculo da variância. Ou seja, ao usarmos
o mesmo conjunto de dados para determinar a média, x , e a variância que faz uso do valor
da média, perdemos um grau de liberdade para a determinação da média.
Estatística
68
O intervalo de confiança da média dá os limites que podem ser reclamados, com um grau
de confiança dado por (1-α)%, para conter o valor desconhecido da média da população.
Quando o desvio padrão da população, σ, é conhecido, o intervalo simétrico vale:
σ σ
x − zα / 2 < μ < x + zα /2
n n
sx s
x − tα /2 < μ < x + tα /2 x
n n
Onde,
O grau de liberdade (ν) é dado por n-1, onde n é o número de dados da amostra (medições).
O nível de significância (α) é igual a um menos o coeficiente de confiança, que
multiplicado por 100, dá o intervalo de confiança (em %). Exemplo: Para 95% de
confiança, significa que se admite que 5% dos valores podem estar fora do intervalo de
confiança. Como na tabela t estes valores estão em probabilidade (0 a 1), logo 5% valem
0,05, então α= 0,05, ou seja: 1- α) = 0,95 que corresponde a 95%.
Estatística
69
Para n = 2 temos n-1 grau de liberdade (ν = n-1). Então se você consultar a tabela 9 da
distribuição t verá que tα / 2 vale 12,71 para 95% de confiança, quando se faz apenas 2
Estatística
70
Estatística Básica
1. As fichas de 60 alunos da 2ª. Série de uma escola pública estão arquivados em ordem
alfabética. Qual é a maneira mais rápida de amostrar um décimo dos alunos
Estatística
71
a) 7,25
b) 8,3
c) 16,155
d) 7,75
8. A média harmônica dos números 8, 9, 10 e 11 é?
a) 9,4
b) 9,5
c) 9,555
d) 9,367
9. A mediana dos números 100, 20, 70, 40 e 60 é?
a) 58
b) 59
c) 60
d) 70
10. A mediana dos números 4, 8, 6, 5, 10 e 7 é?
a) 6.666
b) 6,5
c) 7
d) 7,5
11. A moda dos números 5, 7, 6, 6, 7, 8, 9, 10, 5, 7 é?
e) 5
f) 6
g) 10
h) 7
Estatística
72
a) 5
b) 6
c) 7
d) 8
13. A variância dos números 8, 6, 7 e 9 é:
a) 7,5
b) 1,118
c) 5,477
d) 1,29
a) 1,136
b) 2,340
c) 1,057
d) 2,739
15. Dados a média = 5 e a variância = 3,2, calcular o coeficiente de variação.
a) 64 %
b) 156,25 %
c) 35,78 %
d) 69,88 %
Estatística
73
Probabilidades
a) 5
b) 1.333
c) 1,6666
d) 2
18. Qual a probabilidade de sair face impar numa única jogada?
a) 1,333
b) 0,5
c) 1,666
d) 3
19. Jogando-se uma moeda duas vezes, qual a probabilidade de ocorrer cara nas duas
jogadas?
a) 1,333
b) 1,666
c) 0,25
d) 2
20. Numa urna tem 3 bolas: duas brancas e uma vermelha. Retirando-se ao acaso, uma bola
e em seguida a outra (sem que a primeira tenha sido recolocada na urna), qual é a
probabilidade de que as duas bolas sejam brancas?
a) 0,5
b) 1,3333
c) 1,6666
d) 0,3333
Estatística
74
Distribuição Binomial
a) 6,94%
b) 10,94 %
c) 12,333 %
d) 1,666 %
22. Jogando uma moeda quatro vezes, quais são as chances de se obter duas caras?
a) 23/16
b) 2/3
c) 11/16
d) 15/32
Distribuição de Poisson
23. Se um telefone recebe em média duas chamadas por hora, qual a probabilidade deste
telefone não receber nenhuma chamada em uma hora?
a) 0,15
b) 0,1353
c) 0,2325
d) 0,4
24. Qual a probabilidade do telefone acima receber no máximo duas chamadas em 30
minutos?
a) 0,9197
b) 0,8133
c) 0,3333
d) 0,7156
25. Os parâmetros da distribuição normal são:
a) µ e x
b) σ2 e s2
c) µ e σ2
d) s2 e µ
Estatística
75
26. Numa fábrica, o tempo médio µ para fabricar um eixo é de 35 minutos (distribuição
normal), com desvio padrão σ de 5 minutos. Qual a probabilidade de um trabalhador
escolhido aleatoriamente fabricar um eixo em menos de 25 minutos? Consultar a
tabela de distribuição normal padronizada (Anexo A).
a) 0,4772
b) 0,0228
c) 0,0456
d) 0,73,47
27. Usando os dados do problema anterior, qual seria a probabilidade de que um
trabalhador possa concluir o eixo entre 18 e 22 minutos?
a) 0,2345
b) 0,0482
c) 0,4735
d) 0,1935
Erro Padrão da Média Aritmética
28. Suponha que uma empacotadora esteja ajustada para encher pacotes de café de 400
gramas. Dados anteriores confirmam uma distribuição normal, com média aritmética
de 400 gramas. O desvio padrão da população é conhecido como sendo igual a 12
gramas. Qual o erro padrão da média aritmética para uma amostra de 8 pacotes?
a) 1,50
b) 4,24
c) 4,35
d) 1,48
Estatística
76
29. Suponha que uma empacotadora esteja ajustada para encher pacotes de café de 400
gramas. Dados anteriores confirmam uma distribuição normal, com média aritmética
de 400 gramas. O desvio padrão da população é conhecido como sendo igual a 12
gramas. Qual a probabilidade percentual de que uma amostra de 15 pacotes, escolhida
aleatoriamente das centenas de pacotes, tenha uma média entre 380 e 390 gramas?
a) 40,15 %
b) 45,50 %
c) 12,93 %
d) 10,25 %
30. Considerando os dados do problema anterior, qual a probabilidade percentual de que os
pacotes tenham entre 396 e 400 gramas?
a) 46 %
b) 44,97 %
c) 13,35 %
d) 12,93 %
31. O certificado de calibração de um peso padrão de referência fornece o valor de 1kg,
com incerteza de ± 5 mg, para um fator de abrangência k = 2. Consultando o histórico
de um peso padrão de valor nominal de 1 kg foi possível estimar a deriva do seu valor,
entre duas calibrações, como sendo 1,5 mg. Considerando esta deriva como uma
função de distribuição retangular, qual o valor da função de densidade de
probabilidade?
a) 0,3000 mg
b) 0,3333 mg
c) 3,3333 mg
d) 0,8660 mg
32. Considerando os dados do exercício anterior, qual a variância da deriva?
a) 1,2990 mg
b) 0,70 mg
c) 0,75 mg
d) 3 mg
Estatística
77
33. Supondo haver pouca informação sobre os dados, exceto que se trata de uma
distribuição triangular e que a melhor estimativa de t seja 300 oC, com os valores
limites de a - = a + = 4 oC. Qual seria a função densidade de probabilidade de t?
a) 0,25 oC
b) 0,30 oC
c) 2,256 oC
d) 2,828 oC
34. Considerando os dados do exercício anterior, qual a variância desta função?
a) 2,555 oC
b) 2 oC
c) 16 oC
d) 2,666 oC
35. Para uma distribuição t de Student, qual o valor crítico de t para (1- α) = 0,95 e n = 10?
a) 2,26
b) 2,22
c) 2,82
d) 1,83
Intervalo de Confiança
36. Sabe-se, pelas especificações do fabricante, que o desvio padrão da quantidade de óleo
de soja nas latas de 1 litro é igual a 0,02 litros. Uma amostra aleatória de 50 latas é
selecionada e a quantidade média de óleo por lata de l litro é igual a 0,995 litros.
Calcular o intervalo de confiança de 99 % da verdadeira média da população da
quantidade de óleo de soja contida em uma lata de 1 litro.
a) 0,9877 ≤ μ ≤ 1,0023
b) 0,9834 ≤ μ ≤ 1,0065
c) 0,9945 ≤ μ ≤ 1,0123
d) 0,9845 ≤ μ ≤ 1,0043
Estatística
78
37. Um novo suco de pêssego é testado para o mercado durante 3 meses, em filiais de uma
grande cadeira de supermercados. Os resultados para uma amostra de 21 filiais indicam
vendas médias de R$ 8.600,00 com um desvio padrão da amostra de R$ 240,00.
Calcular o intervalo de confiança para 99 % de vendas desse novo suco.
a) 8.460,89 ≤ μ ≤ 8.739,11
b) 8.464,89 ≤ μ ≤ 8.735,11
c) 8.467,60 ≤ μ ≤ 8.732,40
d) 8.450,99 ≤ μ ≤ 8.749,01
Estatística Básica
1. Resposta: Escolher como amostra uma ficha em cada 6, por exemplo, o 6º , o 12º, o
18º, etc.
2. Resposta: letra A.
3. Resposta: letra C
4. Reposta: letra B
5. Resposta: letra C
6. Resposta: letra A
7. Reposta: letra B
8. Resposta: letra D
9. Resposta: letra C
10. Resposta: letra B
11. Resposta: letra D
12. Resposta: letra A
13. Resposta: Letra D
14. Resposta: letra A
15. Resposta: letra C
Estatística
79
Probabilidades
Estatística
80
Estatística