Você está na página 1de 110
UNIVERSIDAD E FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERR

UNIVERSIDAD E FEDERAL DO RIO GRANDE DO NORTE

CENTRO

DE CIÊNCIAS EXATAS E DA TERR A

DEPA RTAMENTO DE ESTATÍSTICA

Esta tística Aplicada a Engenharia I

Prof. Msc. André L uiz Sena da Rocha

andreroc haest@yahoo.com.br

Natal / RN

ÍNDICE

UNIDADE I - ESTATÍSTICA DESCRITIVA

1

1.1 - NATUREZA E CAMPO DA ESTATÍSTICA

1

1.2 - O MÉTODO ESTATÍSTICO

1

1.3 - POPULAÇÃO, AMOSTRA E TIPOS DE VARIÁVEIS

2

1.4 - REPRESENTAÇÃO TABULAR

7

1.4.1

- Distribuição de Frequências

8

1.5 - REPRESENTAÇÃO GRÁFICA

16

1.5.1 - Gráfico de Setores

16

1.5.2 - Gráfico de Colunas e Barras

17

1.5.3 - Histograma e Polígono de Frequências

18

1.6 – MEDIDAS DE TENDÊNCIA CENTRAL

20

1.6.1 - Média Aritmética

21

 

1.6.2 – Mediana

23

1.6.3 - Moda

27

1.6.4 – Separatrizes

30

1.7 - MEDIDAS DE DISPERSÃO

32

1.7.1 – Variância

34

1.7.2 - Desvio Padrão

36

1.7.3 - Coeficiente de Variação

38

1.8 - ANÁLISE EXPLORATÓRIA DE DADOS

39

1.8.1 - Esquema dos 5-Números

39

 

1.8.2 - Box-Plot

40

UNIDADE II - PROBABILIDADE

43

2.1 - EXPERIMENTOS ALEATÓRIOS

43

2.2 - ESPAÇO AMOSTRAL

44

2.3 - EVENTOS

44

2.4 - RESULTADOS EQUIPROVÁVEIS

47

2.5 – DEFINIÇÕES DE PROBABILIDADE

48

2.6 - PROBABILIDADE CONDICIONAL

50

2.7 - EVENTOS INDEPENDENTES

53

2.8 – VARIÁVEL ALEATÓRIA UNIDIMENSIONAL

54

2.9 - MODELOS DE PROBABILIDADE DISCRETOS

55

2.9.1 - Distribuição

de Bernoulli

55

2.9.2 - Distribuição

Binomial

57

2.10 - PRINCIPAIS DISTRIBUIÇÕES CONTÍNUAS

63

2.10.1 - Distribuição Uniforme

63

2.10.2 - Distribuição Exponencial

64

2.10.3 – Distribuição Normal

64

2.10.4 - Distribuição t de Student

73

UNIDADE III - INFERÊNCIA ESTATÍSTICA

76

4.1

- DISTRIBUIÇÃO AMOSTRAL DA MÉDIA E DA PROPORÇÃO

78

4.1.1 – Distribuição Amostral da Média

78

4.1.2 – Distribuição Amostral da Proporção

79

4.2

- ESTIMAÇÃO POR PONTO E INTERVALO

80

4.2.1 - Estimação Pontual

80

4.2.2 - Estimação Intervalar

80

4.2.2.1- Intervalo de confiança para a média

82

4.2.2.2 - Intervalo de confiança para a proporção

86

4.3

- TESTES DE HIPÓTESES

87

4.3.1 - Teste para a Média quando σ 2 é conhecido

90

4.3.2 - Teste para a Média quando σ 2 é desconhecido

95

4.3.3 - Teste para Proporções

99

4.3.4 - Valor-P

101

REFERÊNCIAS

ANEXOS

ANEXO A - DISTRIBUIÇÃO NORMAL PADRÃO

TABELA B - DISTRIBUIÇÃO T DE STUDENT

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

UNIDADE I ESTATÍSTICA DESCRITIVA

1.1- Natureza e Campo da Estatística

Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados quantitativos, de tal forma que seja possível efetuar julgamentos sobre os mesmos. Ramos da Estatística:

a) Estatística descritiva trata da observação de fenômenos de mesma natureza, da coleta de dados numéricos referentes a esses fenômenos, da sua organização e classificação através de tabelas e gráficos, bem como da análise e interpretação.

b) Probabilidade estatística utilizada para analisar situações que envolvem o acaso (aleatoriedade).

c) Inferência estatística estuda as características de uma população com base em dados obtidos de amostras.

OBS: Estatística Indutiva pode ser denominada como inferência. Portanto, a estatística indutiva estuda as características de uma população, com base em dados obtidos de amostras.

Inferência = Indução + Margem de Erro

1.2- O Método Estatístico

A realização de uma pesquisa deve passar, necessariamente pelas fases apresentadas abaixo:

Definição

do

problema

→→→→

Apresentação

dos dados

Planejamento

→→→→

Coletas

dos

Dados

→→→→

Crítica

dos

→→→→

Tabelas e Gráficos

→→→→

Análise e interpretação dos dados

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

1) Definição do problema Saber exatamente o que se pretende pesquisar, ou seja, definir corretamente o problema. 2) Planejamento determinar o procedimento necessário para resolver o problema, como levantar informações sobre o assunto objeto do estudo. É importante a escolha das perguntas em um questionário, que na medida do possível, devem ser fechadas. O levantamento de dados pode ser de dois tipos: Censitário e Amostragem. Outros elementos do planejamento de uma pesquisa são:

Cronograma das atividades;

Custos envolvidos;

Exame das informações disponíveis;

Delineamento da amostra.

3)

Coleta de Dados consiste na busca ou compilação dos dados.

quanto ao tempo em:

Contínua (inflação, desemprego, etc);

Periódica (Censo);

Ocasional (pesquisa de mercado, eleitoral)

Pode ser classificado,

4) Crítica dos dados objetiva a eliminação de erros capazes de provocar futuros enganos. Faz-se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento.

5) Apresentação dos dados a organização dos dados denomina-se “Série Estatística”. Sua apresentação pode ocorrer por meio de tabelas e gráficos. 6) Análise e Interpretação dos Dados consiste em tirar conclusões que auxiliem o pesquisador a resolver seu problema, descrevendo o fenômeno através do cálculo de medidas estatísticas, especialmente as de posição e as de dispersão.

1.3 - População, Amostra e Tipos de Variáveis

Inferência

Estatística

Amostra e Tipos de Variáveis Inferência Estatística Obtenção de resultados para uma população com base em

Obtenção de resultados para uma população com base em observações extraídas a partir de uma amostra retirada desta população.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

POPULAÇÃO:

É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada característica. Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, como o número de vezes que se pode jogar um dado.

AMOSTRA:

É qualquer subconjunto da população. A técnica de seleção desse subconjunto de elementos é chamada de Amostragem.

Como já vimos, a inferência estatística tem como objetivo a estimação de parâmetros para uma população tendo como base às informações extraídas através de uma amostra. Neste contexto, o estudo dos mais diversos tipos de procedimentos de amostragem se faz necessário.

Exercício 1.1: Dentre os 3000 alunos de uma escola, selecionaram-se 30 e inquiriram-se sobre o programa de televisão preferido. Sendo respondidos como programas preferidos “Telejornal”, “Novelas” e “Cinema”, com 10, 12 e 8 alunos, respectivamente. Responda:

a) a população;

b) a amostra.

Exercício 1.2: Para saber a aceitação de uma nova ração canina para filhotes de médio porte, uma empresa selecionou 200 filhotes com até 6 meses de idade de diversas raças de médio portem, e contabilizou a engorda deles. Indique:

a) a população;

b) a amostra;

Exercício 1.3: Para realizar um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida dos 100 metros com obstáculos, registrou-se o tempo gasto por 16 desses atletas e obtiveram-se os seguintes resultados:

Indique:

a) a população;

b) a amostra;

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Exercício 1.4: Um aluno da UFMG do curso de “Cinema de Animação e Artes Digitais ” realizou um sorteio dentre todas as fitas de VHS da biblioteca de sua Universidade, de 8 fitas para seu Trabalho de Conclusão de Curso.

a) a população;

b) a amostra;

Exercício 1.5: Um aluno de Biblioteconomia da UFRN está fazendo um levantamento de todas as Dissertações do curso de História, Geografia e Pedagogia, defendidas a partir do ano de 2000 e que estão cadastradas no banco de dados da Biblioteca Zila Mamede. Dentre elas eles selecionou 10 de cada curso e contabilizou as datas de defesa

a) a população;

b) a amostra;

As técnicas de amostragem podem ser classificadas em dois grandes grupos: a amostragem probabilística e a amostragem não probabilística.

1. Amostragem Probabilística: neste grupo encontram-se os planos amostrais que utilizam mecanismos aleatórios de seleção dos elementos da amostra, atribuindo a cada um deles uma probabilidade, conhecida à priori, de pertencer à amostra.

2. Amostragem Não Probabilística: neste grupo encontram-se os planos amostrais que não utilizam mecanismos aleatórios de seleção dos elementos da amostra, e dessa forma, não existe nenhuma probabilidade associada à seleção desses elementos.

Ambos os procedimentos têm vantagens e desvantagens. A grande vantagem das amostras probabilísticas é medir a precisão da amostra obtida. Tais medidas já são bem mais difíceis para os procedimentos do outro grupo. Diante disso, amostras probabilísticas são comumente utilizadas na prática. Os tipos de planos de amostragem probabilísticos são os seguintes:

Amostragem Aleatória Simples: cada elemento da população tem a mesma chance (ou probabilidade) de ser selecionado. Os elementos são escolhidos através de sorteio. Para isso, tabelas de números aleatórios são frequentemente utilizadas. Por exemplo, selecionar 5 alunos de uma turma usando a lista de chamada.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Amostragem Estratificada: a população é dividida em estratos (ou grupos) homogêneos, sendo selecionada uma amostra aleatória simples de cada estrato. Por exemplo, selecionar alunos de 5ª a 8ª série de uma determinada escola. Neste caso, cada série corresponde a um estrato, e de cada estrato uma amostra aleatória simples dos alunos é extraída, lembrando que pra tanto seria necessário sorteio a partir da lista de chamada também.

Amostragem Sistemática: os elementos são selecionados segundo uma regra pré-definida. É bastante utilizada quando os elementos da população estão arranjados em uma ordem. Por exemplo, se em uma concessionária deseja-se estimar o preço total dos seus carros a partir de uma amostra de 10 carros selecionar possuindo para tanto uma lista dos carros em ordem de preço do maior para o menor, ou do menor para o maior. Uma observação importante é que, por exemplo, se os elementos escolhidos estiverem em ordem não se deve pegar os primeiros elementos, ou os últimos, ou os do meios, deve-se percorrer elementos de cada parte.

Exercício 1.6: Para cada uma das seguintes situações diga qual o tipo de amostragem foi utilizada.

O conselho universitário de uma universidade deseja conhecer a opinião dos alunos e professores sobre uma resolução a ser votada, que estabelece horários fixos para o atendimento de alunos pelos professores. Para compor a amostra foram sorteados aleatoriamente 10% dos alunos matriculados e 10% dos professores.

Um treinador de uma confederação esportiva deseja dividir 20 times em dois grupos. Para o primeiro grupo seleciona aleatoriamente 10 times, e considera os 10 restantes para o segundo grupo.

Uma lista de corredores de uma maratona contém 1000 nomes, numerados consecutivamente de 1 a 1000. Iniciando-se do 5º nome, uma amostra foi composta considerando sorteados os nomes referentes aos números 15º, 25º, 35º, 45º, 55º e assim sucessivamente até que fossem escolhidos 100 nomes.

Um sociólogo na Universidade de Charleston seleciona 12 homens e 12 mulheres de cada uma de quatro turmas de educação física.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Um treinador sorteia 6 jogadores de seu time de futebol sem mais critério s de seleção e tira uma amostra de urina de cada um.

O programa Planned Parenthood (Planejamento Familiar) pesquisa 500 homens e 5000 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais.

TIPOS DE VARIÁVEIS:

É condição inerente a uma população natural existir variação quanto aos atributos que lhe podem ser estudados. Portanto, a variabilidade é uma característica comum aos dados de observação e experimentos. Um atributo sujeito à variação é descrito em Estatística por uma variável.

Variável

Nominal Qualitativa Ordinal Discreta Quantitativa
Nominal
Qualitativa
Ordinal
Discreta
Quantitativa

Contínua

Variável Qualitativa: os dados podem ser distribuídos em categorias mutuamente exclusivas. Por exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sanguíneo, etc.

- Nominal: as categorias podem ser permutáveis (não existe ordem natural dos seus níveis); Exemplo: [masculino, feminino], [sim, não], [fuma, não fuma];

- Ordinal: as categorias descrevem uma ordenação natural dos seus níveis. Exemplo: [péssimo, ruim, regular, bom, ótimo].

Variável Quantitativa: os dados são expressos através de números. Por exemplo, idade, estatura, peso, etc.

- Discreta: Assumem valores que podem ser associados aos números naturais ( = 1, 2,3,

).

Dá uma ideia de contagem. Exemplo: Número de irmãos dos 30 alunos da turma de Engenharia [0, 1, 2, 5, 3, 4, 1, 0, 2, 3, 5, 4, 0, 1, 2, 2, 1, 0, 1, 1, 2, 0, 0, 3, 2 , 3, 4, 2, 1, 2].

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

- Contínua: Assume infinitos valores em um dado intervalo. Dá uma ideia de medição. Exemplo: altura e/ou peso de animais ou de pessoas. [1.70, 1.57, 1.80, 1.94, 1.68, 1.71]

Exercício 1. 7: Classifique com relação ao tipo de variável as seguintes informações:

Sexo (“Masculino” ou “Feminino”);

Tempo de uso de um HD de 1 TB (em meses completos);

Tempo em horas para término de uma simulação num software;

Altura de jogadores de vôlei de certo time (em metros);

Fuma (“Sim” ou “Não”);

Peso de vigas de concreto (em quilogramas);

Número de filhotes de uma ninhada;

Tolerância ao cigarro (indiferente, incomoda pouco, incomoda muito);

Horas que gasta estudando.

Resultado final de uma disciplina da UFRN (“Aprovado” ou “Reprovado”)

1.4 - Representação Tabular

Consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado, segundo algumas regras práticas e obedecendo (ainda) à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho Nacional de Estatística. As tabelas devem conter:

a) Título - O quê? (fenômeno). Onde? (época). Quando? (local).

b) Cabeçalho - indica o conteúdo das colunas

c) Coluna Indicadora - especifica o conteúdo das linhas

d) Cabeçalho da coluna indicadora - indica o conteúdo da coluna indicadora

e) Corpo - caselas ou células, onde são registrados os dados.

f) Rodapé - notas e identificação da fonte de onde foram coletados os dados.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 1.4.1 - Distribuição de Frequências

1.4.1 - Distribuição de Frequências

Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de distribuição de frequências. Estas podem ser simples (dados não-agrupados) ou por classes (dados agrupados).

DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES:

Série estatística para dados nominais, ordinais e discretos, organizados em uma tabela.

Construção de uma Distribuição de Frequências:

Para a construção de uma distribuição de frequências os seguintes componentes são necessários:

Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados. Exemplo 1.1: Peso (kg) de 14 blocos de concreto (dados brutos):

74

58

69

80

74

95

56

74

76

81

60

57

64

62

Rol: são os dados apresentados em ordem crescente.

 

Exemplo 1.1: Peso (kg) de 14 blocos de concreto (em forma de rol):

 

56 57

58

60

62

64

69

74

74

74

76

80

81

95

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Construção de uma Distribuição de frequências simples

1. Ordenar os dados brutos em forma de rol (ordem crescente)

2. Listar todos os elementos diferentes, numa coluna de nome “X”.

3. Listar a frequência de todos os elementos diferentes numa coluna de nome "fi" ou "frequência".

4. Somar todos os elementos da coluna "fi" (total).

Exemplo 1.2: Numa pesquisa feita para detectar o número de filhos de empregados de uma multinacional, foram encontrados os seguintes valores:

1

4

2

5

3

2

0

3

2

1

5

4

2

5

0

3

2

4

2

3

2

3

2

1

4

2

1

3

4

2

Solução:

 

Rol (dados em ordem crescente):

 

0

0

1

1

1

1

2

2

2

2

2

2

2

2

2

2

3

3

3

3

3

3

4

4

4

4

4

5

5

5

Tabela de Distribuição de Frequências:

 

Número de filhos por empregado de uma multinacional

Número de filhos (X)

fi

f i%

0

2

6,7

1

4

13,3

2

10

33,3

3

6

20

4

5

16,7

5

3

10

Total

30

100

Fonte: Dados Fictícios

Algumas considerações ou conclusões:

Qual o número de funcionários que não tem filhos? Qual o seu percentual? Quantos funcionários têm cinco filhos e qual o seu percentual? A maioria dos funcionários tem quantos filhos? E a minoria? Informe o percentual de ambos.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

INFORMAÇÕES ADICIONAIS NUMA DISTRIBUIÇÃO DE FREQUÊNCIAS Além das informações contidas na tabela, destaca-se outros parâmetros relevantes:

- LI = limite inferior de cada classe;

- LS = limite superior de cada classe;

- P m = ponto médio de cada classe x = (L i + Ls) / 2;

- fi = frequência absoluta = número de ocorrências de cada classe;

- fi % = frequência percentual fi % = (fi / n) 100;

- F = frequência absoluta acumulada "abaixo de";

- F = frequência absoluta acumulada "acima de";

- F% = frequência percentual acumulada "abaixo de";

- F% = frequência percentual acumulada "acima de";

Exemplo 1.3: Veremos como fica a distribuição de frequências simples com essas informações adicionais:

Número de filhos de empregados de uma multinacional

Nº de filhos

fi

f %

F

F

F%

F%

0

2

6,7

2

30

6,7

100

1

4

13,3

6

28

20

93,3

2

10

33,3

16

24

53,3

80

3

6

20

22

14

73,3

46,7

4

5

16,7

27

8

90

26,7

5

3

10

30

3

100

10

Total

30

100

-

-

-

-

Responda:

Fonte: Dados fictícios

a) Quantos empregados têm até 2 filhos? Resp: Se dá por F, sendo igual a 16 filhos.

b) Quantos empregados têm ao menos 4 filhos? Resp: Se dá por F, sendo igual a 8 filhos.

c) Qual o percentual de empregados com no máximo 1 filho? Resp: Se dá por F%, sendo igual a 93,3%.

d) Qual o percentual de empregados com no mínimo 2 filhos? Resp: Se dá por F%, sendo igual a 80%.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES:

Série estatística para dados contínuos. Os números são agrupados em classes, com suas respectivas frequências absolutas, relativas e percentuais, com o objetivo de facilitar ao analista o seu estudo.

Os seguintes componentes são utilizados apenas em distribuição de frequências em classes:

Amplitude Total (A): é a diferença entre o maior valor do rol (LS) e o menor valor (LI).

 

A = LS - LI

   

Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os elementos do rol. Para determinar c, utiliza-se a fórmula de Sturges:

 

C = 1 + (3,33333

)

· log(n)

 

em que n = número de elementos do rol. Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos através da fórmula:

i = A/C

Construção de uma Distribuição de frequências por classes

a) Ordenar os dados brutos em forma de rol (ordem crescente)

b) Calcular a amplitude total: A = LS - LI

c) Calcular o número de classes e arredondar o valor final para um número inteiro utilizando a regra e arredondamento:

C = 1 + (3,33333

)

• log(n)

d) Calcular o intervalo entre classes: i = A / C.

e) A 1º coluna será a das classes. O menor número dos dados em rol será o limite inferior da primeira classe (“LI” da fórmula utilizada na amplitude total “A”), a partir do qual todas as outras classes serão definidas a partir deste número, somando ele ao intervalo entre classes. Exemplo: Para C = 5, i = 1,5 e LI = 7,4 (menor número dos dados em forma de rol). O limite inferior da 1º classe será 7,4 e o limite superior da mesma classe será LI + i = 7,4 + 1,5 = 8,9. Por sua vez, o limite inferior da 2º classe será 8,9 e o superior: 8,9 + i = 8,9 + 1,5 = 10,4. Este procedimento será realizado até termos o número “C” de classes (este previamente calculado).

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

f) Para indicar o intervalo, utilizaremos o símbolo |- . Por exemplo, no caso de haver o limite inferior 7,4 e o limite superior 8,9. Indicaremos este intervalo como : 7,4 |- 8,9. Isso significa todos os números que estão entre 7,4 e o mais próximo possível de 8,9, porém, caso haja um número igual ao limite superior dessa classe, este deverá ser computado apenas na próxima classe (para o Exemplo do número 5, na 2º classe, sendo esta: 8,9 |- 10,4).

g) Uma vez definidas as classes, a tabela de frequências pode ser construída, a partir da 2º coluna de nome “frequência” ou simplesmente “f i ”, fazendo-se o processo de contagem, que consiste em verificar a qual classe cada dado pertence.

OBS: Em algumas situações, pode-se utilizar uma distribuição de frequências por classes para dados discretos quando todos os números ou a maioria são diferentes.

Exemplo 1.4: Construir uma distribuição de frequências para o número diário de experimentos realizados em um laboratório durante duas semanas. [0, 2, 3 ,4 , 5, 10, 12, 7, 9, 0, 5, 13, 17, 10, 6]. Para essa situação, a mais viável será uma distribuição por classes, que deverá seguir o mesmo procedimento, apenas com o cuidado ao calcular o intervalo entre classes (i), o mesmo deverá ser arredondado para um número inteiro.

Exemplo 1.5: Construa de uma Distribuição de Frequências com CLASSES para os dados referentes ao Peso (kg) de 14 blocos de concreto:

56

57

58

60

Solução:

Amplitude Total (A):

Número de Classes (C):

Intervalo de Classe (i):

62

64

69

74

74

74

76

80

81

A = LS – LI = 95 – 56 = 39.

C = 1 + (3,33333

)

· log(n) = 1 + 3,333 · log (14) = 4,82 5.

95

A=39 e C=5 i = A/C = 39/5 = 7,8.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Peso de blocos de concreto

Peso (kg)

fi

fi%

56,0

|- 63,8

5

35,71%

63,8

|- 71,6

2

14,28%

71,6

|- 79,4

4

28,58%

79,4

|- 87,2

2

14,28%

87,2 |-| 95

1

7,14%

Total

14

100%

Fonte: Dados Fictícios

Exemplo 1.6: Um determinado hospital está interessado em analisar a quantidade de creatinina (em miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes internados com problemas renais. Os dados são os seguintes:

1,51

1,65

1,58

1,54

1,65

1,40

1,61

1,08

1,81

1,38

1,56

1,83

1,69

1,22

1,22

1,68

1,47

1,68

1,49

1,80

1,33

1,83

1,50

1,46

1,67

1,60

1,23

1,54

1,73

1,43

2,18

1,46

1,53

1,60

1,59

1,49

1,46

1,72

1,56

1,43

1,69

1,15

1,89

1,47

2,00

1,58

1,37

1,40

1,76

1,62

1,96

1,66

1,51

1,31

2,29

1,58

2,34

1,66

1,71

1,44

1,66

1,36

1,43

1,26

1,47

1,52

1,57

1,33

1,86

1,75

1,57

1,83

1,52

1,66

1,90

1,59

1,47

1,86

1,73

1,55

1,52

1,40

1,86

2,02

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Solução:

Rol (dados em ordem crescente):

1,08

1,15

1,22

1,22

1,23

1,26

1,31

1,33

1,33

1,36

1,37

1,38

1,40

1,40

1,40

1,43

1,43

1,43

1,44

1,46

1,46

1,46

1,47

1,47

1,47

1,47

1,49

1,49

1,50

1,51

1,51

1,52

1,52

1,52

1,53

1,54

1,54

1,55

1,56

1,56

1,57

1,57

1,58

1,58

1,58

1,59

1,59

1,60

1,60

1,61

1,62

1,65

1,65

1,66

1,66

1,66

1,66

1,67

1,68

1,68

1,69

1,69

1,71

1,72

1,73

1,73

1,75

1,76

1,80

1,81

1,86

1,86

1,86

1,86

1,86

1,86

1,89

1,90

1,96

2,00

2,02

2,18

2,29

2,34

Amplitude Total (dá uma ideia do campo de variação dos dados):

A = LS - LI = (2,34) - (1,08) = 1,26 Analisando-se a quantidade de creatinina encontrada na urina dos 84 pacientes verificou-se que, ocorreu a variação de 1,26 no seu campo (de 1,08 a 2,34).

Estabelecer o Número de Classes (c):

 

c = 1 + (3,3333

)

· log(n) = 1 + (3,3333

)

· log(84) = 7,414

c = 7

Estabelecer o Intervalo de Classe (i):

 

i = A / c = (1,26) / 7 = 0,18 Quantidade de creatinina (ml) encontrada na urina de 84 pacientes com problemas renais.

Classes

f

i

f %

P m (X)

f %

f %

F

F

1,08

1,26

5

5,9

1,17

5,9

100

5

84

1,26 1,44 1,44 1,62 1,62 1,80 1,80 1,98 1,98 2,16

13

15,5

1,35

21,4

94,1

18

79

32

38,1

1,53

59,5

78,6

50

66

18

21,4

1,71

80,9

40,5

68

34

11

13,1

1,89

94,0

19,1

79

16

2

2,4

2,07

96,4

6,0

81

5

2,16

2,16 2,34 3 3,6 2,25 100 3,6 84 3

2,34

3

3,6

2,25

100

3,6

84

3

Total

84

100

-

-

-

-

-

Fonte: Dados fictícios

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Observação 1: O melhor valor para representar cada classe é o ponto médio (P m ), o qual se obtém pela fórmula:

P m = L i + (i / 2), ou ainda, P m = (L i + L s ) / 2

Observação 2: 1,08 |- 1,26, intervalo fechado à esquerda (pertencem a classe valores iguais ao extremo inferior) e aberto à direita (não pertencem a classe valores iguais ao extremo superior). De forma análoga, 2,16 |-| 2,34, intervalo fechado à esquerda e à direita.

Responda:

a) Quantos pacientes têm até 1,79 ml de creatinina? Resp: Se dá por F, sendo igual a 68 pacientes.

b) Quantos pacientes têm ao menos 1,98 ml de creatinina? Resp: Se dá por F, sendo igual a 5 pacientes.

c) Qual o percentual de pacientes com no máximo 1,61 ml de creatinina? Resp: Se dá por F%, sendo igual a 59,5%. (mais da metade).

d) Qual o percentual de pacientes com no mínimo 1,98 ml de creatinina? Resp: Se dá por F%, sendo igual a 6%.

Exercício 1.8: Na fabricação de semicondutores, o ataque químico por via úmida é frequentemente usado para remover silicone da parte posterior das pastilhas antes da metalização. A taxa de ataque é uma característica importante no processo. Um tipo de solução pra ataque químico foi estudada, usando uma amostra de 50 pastilhas. As taxas observadas de ataque (10 -3 mils/min) são dadas a seguir:

2,1

4,2

2,7

28,2

9,9

9

2

6,6

3,9

1,6

14,7

9,6

16,1

8,1

8,2

20,2

6,9

4,3

3,3

1,2

4,1

18,4

0,2

6,1

13,5

7,4

0,2

8,3

0,3

1,3

14,1

1,0

2,4

2,4

16,2

8,7

24,1

1,4

8,2

5,8

1,6

3,5

12,2

18

26,7

3,7

12,3

23,1

5,6

0,4

 

EST0323– Estatística Aplicada a Engen haria I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engen haria I – Prof. Msc. André Luiz Sena da Rocha

1.5 - REPRESENTAÇÃO GRÁFICA

Todo o gráfico deve apresenta r título (pode ser colocado tanto acima c omo abaixo) e escala (crescem da esquerda para a di reita e de baixo para cima). As legendas d evem ser colocadas à direita ou abaixo do gráfico. A se guir vemos os principais tipos de gráficos:

1.5.1 - Gráfico de Setores

Também conhecido como Gráfic o de Pizza, este gráfico é usado quando cad a valor representa uma

parte de um todo. É, então, usa do um círculo de raio qualquer, com a área ou ângulo total sendo

proporcional ao total (100%) d a série de dados a representar e a área ou circular sendo proporcional a cad a dado da série.

ângulo de cada setor

Exemplo 1.7: Exemplo de um gr áfico de setores

Tabela 1.1: Principa is rações caninas vendidas numa certa cidade em 2010

Marca da Ração

Percentual (%)

Caninu’s

18

Campeão

15

Foster

24

Pedigree

43

Fonte: Dados Fictícios

Foster 24 Pedigree 43 Fonte: Dados Fictícios Figura 1.1: Princ ipais rações caninas vendidas numa certa

Figura 1.1: Princ ipais rações caninas vendidas numa certa cidade em 2 010

EST0323– Estatística Aplicada a Engen haria I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engen haria I – Prof. Msc. André Luiz Sena da Rocha

1.5.2 - Gráfico de Colunas e Barras

As variações quantitativas da t abela são representadas por colunas dispo stas verticalmente ou

horizontalmente. É usado para re presentar qualquer tipo de série.

Exemplo 1.8: Exemplo de um G ráfico de Barras

Tabela 1.2: Principais causas de

morte nos EUA em 2004

Tipo de mort e

Frequência

Percentual (%)

Acidentes de carro Álcool Armas de fog o Cigarro Doenças Infe cciosas Doenças Ven éreas Drogas Obesidade Outras

856

23,70

457

12,65

985

27,27

247

6,84

112

3,10

98

2,71

631

17,47

124

3,43

102

2,82

Total

3612

100

Fonte: Ie Estatísticas, 2004.

2,82 Total 3612 100 Fonte: Ie Estatísticas, 2004. Figura 1 .2: Principais causas de morte nos

Figura 1 .2: Principais causas de morte nos EUA em 2004

EST0323– Estatística Aplicada a Engen haria I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engen haria I – Prof. Msc. André Luiz Sena da Rocha

Exemplo 1.9: Exemplo de um G ráfico de Colunas

da Rocha Exemplo 1.9: Exemplo de um G ráfico de Colunas Figura 1.3: Prin cipais rações

Figura 1.3: Prin cipais rações caninas vendidas numa certa cidade em 2 010

1.5.3 - Histograma e Polígo no de Frequências

A apresentação tabular d os dados é feita através de uma distribuiçã o de frequências. Fica complementada com uma repres entação gráfica desses mesmos dados. O hi stograma e o polígono de frequências são tipos de gráfic os usados para representar uma distribuição de frequências simples de uma variável quantitativa cont ínua.

Exemplo 1.10: Exemplo de um h istograma e de um polígono de frequências

Tabela 1.3: Distribuição de frequ ências dos preços de ovos - EUA - 1990

Preço dos ovos

f

f

r

F

F%

47

68

19

38

19

38

68

89

19

38

38

76

89

110

9

18

47

94

110

131

2

4

49

98

131

152

1

2

50

100

Total

50

100

-

-

Fonte: GUJARATI. Basic Econo metrics. McGraw-Hill, 3a ed. 1995.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Um histograma é um conjunto de retângulos com bases sobre um eixo horizontal dividido de acordo com os comprimentos de classes, centros nos pontos médios das classes e áreas proporcionais ou iguais às frequências. Um polígono de frequências é um gráfico de linha que se obtém unindo por uma poligonal os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos médios. Para obter as interseções da poligonal com o eixo, cria-se em cada extremo uma classe com frequência nula. Note que esses gráficos podem ser construídos com base nas frequências absolutas ou relativas. O importante é que a escala nos eixos horizontal e vertical, bem como os retângulos, sejam construídos de forma a que suas áreas espelhem a proporcionalidade dessas frequências. Na Figura 1.10 apresentamos o histograma para a distribuição de frequências dada na Tabela 1.17, referente ao preço da dúzia de ovos nos estados americanos em 1990. Aqui cabe uma observação sobre o histograma, que foi construído com o software free R; cada retângulo foi construído de modo que sua área fosse exatamente igual à frequência relativa. Por exemplo, todos os retângulos têm base 21, que é a amplitude de classe. A altura dos dois primeiros retângulos é [área/base = 0,38 / 21 = 0,0180952], de modo que a área resultante é 0,38. Para a terceira classe, temos que [altura = área/base = 0,18 / 21 = 0,0085714]. O ponto fundamental na interpretação de um histograma é compreender que as áreas dos retângulos representam as frequências de cada classe. Como a variável é contínua e a frequência dada se refere a uma classe de valores, a suposição que se faz é que essa frequência se distribui uniformemente pela classe. Na Figura 1.10, a frequência relativa da classe 47 68 é 0,38 (ou 38%) e ela está uniformemente distribuída pela classe, o que significa que subclasses de mesmo comprimento teriam a mesma frequência. Por exemplo, as frequências das classes 4757,5 e 57,568 seriam ambas iguais 0,19. Já a subclasse 8995 teria uma frequência de 0,0085714 × (95−89) = 0,0514286. Mais uma vez, o princípio é que área = frequência. Com relação ao polígono de frequências, a ideia é representar o comportamento “típico” de cada classe através do seu ponto médio. Assim, o polígono de frequência está representado na Figura 1.11

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

HISTOGRAMA

I – Prof. Msc. André Luiz Sena da Rocha HISTOGRAMA Figura 1.4: Histograma da distribuição de

Figura 1.4: Histograma da distribuição de frequência dos preços dos ovos nos estados

POLÍGONO DE FREQUÊNCIAS

dos preços dos ovos nos estados POLÍGONO DE FREQUÊNCIAS Figura 1.5: Polígono de frequência dos preços

Figura 1.5: Polígono de frequência dos preços dos ovos nos estados americanos

1.6 – Medidas de Tendência Central

Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema. Mas é conveniente apresentar medidas que mostrem a informação de maneira resumida.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Medidas de Tendência Central São medidas que tendem para o centro da distribuição e têm a capacidade de representá-la como um todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais são: Média Aritmética, Mediana e Moda e algumas.

1.6.1 - Média Aritmética

A média aritmética pode ser definida em dois tipos: populacional ( µ ) e amostral ( X ). Nos dois

casos existem três situações quanto aos cálculos.

1. Dados apresentados em forma de rol:

A média será:

n

x

i

X =

i=1

soma de todos os elementos do rol

=

n número de elementos do rol

Exemplo 1.11: Número de tonadas a serem trocadas em 12 hotéis de Natal (50, 62, 70, 86, 60, 64,

66, 77, 58, 55, 82, 74)

Análise: O número médio de tomadas para serem trocadas é de 67 por hotel.

X =67

Exercício 1.9: Um gerente de supermercado quer estudar a movimentação de pessoas em seu estabelecimento, constata que 195, 1.002, 941, 768 e 1.283 pessoas entraram no seu estabelecimento nos últimos cinco dias. Descubra o número médio de pessoas que entraram diariamente neste estabelecimento nos últimos cinco dias.

2. Dados apresentados em forma de distribuição de frequência simples:

A média será:

n

x f

i

i

X =

i1 =

n

=

i

1

f

i

Exemplo 1.12: Número de peças com defeitos produzidas em 27 dias em certa fábrica

X

0

1

2

3

4

Total

f

2

4

10

6

5

27

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

n

x f

i

i

X =

i=1

n

=

i

1

f

i

=

(0).(2)

+

(1).(4)

+

(2).(10)

+

(3).(6)

+

(4).(5)

27

= 2,3

Análise: Verifica-se que o número médio de peças com defeitos é de 2,3 por dia.

Exercício 1.10: As informações abaixo apresentam a idade dos usuários de drogas internos numa clínica para tratamento. Determine a idade média dos internos.

Idade

f

i

17 2

 

18 4

 

19 5

 

20 6

 

21 3

 

22 4

 

23 2

 

Total

26

3. Dados apresentados em forma de distribuição de frequência em classes:

A média será:

n

P

m

f

i

X =

i

= 1

n

=

i

1

f

i

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Exemplo 1.13: Nascidos vivos segundo o peso ao nascer, em kg.

Classes

f

i

P

m

1,5 |-

2,0

3

1,75

2,0 |-

2,5

16

2,25

2,5 |-

3,0

31

2,75

3,0 |-

3,5

34

3,25

3,5 |-

4,0

11

3,75

4,0 |- 4,5 4,5 |-| 5,0

4

4,25

1

4,75

Total

100

-

n

P

m

f

i

X =

i1 =

n

f

i

= 1

i

=

(1,75).(3)

+

(2,25).(16)

+

+

(4,75).(1)

100

= 3

Análise: Verifica-se que o peso médio dos 100 nascidos vivos observados é 3 kg.

1.6.2 – Mediana

Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é, é o valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos ficam abaixo dela e 50% ficam acima.

Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou população, em duas partes iguais.

que divide a amostra, ou população, em duas partes iguais. a) 0 Med 100% Variável Discreta:
que divide a amostra, ou população, em duas partes iguais. a) 0 Med 100% Variável Discreta:

a)

0

Med

100%

Variável Discreta: os dados estão dispostos em forma de rol ou em uma distribuição de frequência simples.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Se “n” for ímpar:

Med = elemento central (de ordem

n + 1    )

2

- Exemplo 1.14: Dados em forma de rol:

Seja a amostra: 8, 10, 12, 14, 16 Med =

5

 

+

2

1

= 3 elemento do rol = 12

Interpretação: o 3º elemento do rol (12) divide 50% da distribuição dos dados à direita

e à esquerda.

- Exemplo 1.15: Dados em uma distribuição de frequência simples:

Suponha a seguinte distribuição de frequência simples.

X

f

i

F

1

1

1

2

3

4

3

5

9

4

2

11

Total

11

-

n = 11 (ímpar)

Elemento mediano: [(n+1)/2]º = 6º elemento

3ª classe contém o 6º elemento Med = 3.

Se “n” for par:

Med = média aritmética dos dois elementos centrais (de ordem

- Exemplo 1.16: Dados em forma de rol:

Seja a amostra: 8, 10, 12, 14, 16, 19

 

n

2

n

2

 

+

=

1

 

 

6

2

=

 

 

= 3 elemento do rol

6

2

+

1

 

=

4 elemento do rol

Med =

Mediana =

3 elemento

+

4

elemento

 

2

=

12

+

14

2

= 13

n

2

   e  

n

2

+ 1

  )

Interpretação: a média do 3º e 4º elemento do rol (13) divide 50% da distribuição dos dados à

direita e à esquerda.

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

- Exemplo 1.17: Dados em uma distribuição de frequência simples:

Suponha a seguinte distribuição de frequência simples.

X

f

i

F

82

5

5

85

10

15

87

15

30

89

8

38

90

4

42

Total

42

-

Fonte: Dados fictícios

n = 42 (par) Elemento mediano: (n/2)º = 21º elemento (n/2)º + 1 = 22º elemento 3ª classe contém o 21º e o 22º elemento Med = (87 + 87)/2 = 87

contém o 21º e o 22º elemento Med = (87 + 87)/2 = 87 b) Variável

b)

Variável Contínua: os dados estão agrupados em uma distribuição de frequências em classes, então:

1º Passo: Organizar os dados em forma de rol (ordem crescente);

2º Passo: Calcular a ordem (n/2)º. Como a variável é contínua não importa se é par ou ímpar.

3º Passo: Através da F identificar a classe que contém a mediana, isto é, a posição da mediana.

4º Passo: Utilizar a fórmula:

Med

=

LI

Med

+

P

F

Med

f

Med

.i

Med

- LI Med = limite inferior da classe que contém a mediana;

- P Med = posição da mediana =

f

i /

2

= xº elemento;

- F

- = frequência absoluta acumulada "abaixo de" da classe anterior à classe que contém a

mediana;

- f Me = frequência absoluta da classe que contém a mediana;

- i Me = intervalo da classe que contém a mediana;

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Exemplo 1.18: Temperatura (Cº) para o derretimento de certo material eletrônico.

Temperatura

f

i

P

m

F

150

|- 200

35

175

35

200

|- 250

164

225

199

250

|- 300

31

275

230

300

|- 350

344

325

574

350

|- 400

112

375

686

400|- 450

32

425

718

455 |-| 500

10

475

728

Total

728

-

-

Fonte: Dados fictícios

P Me = (n/2) (728/2) 364º elemento 4ª classe: [300; 350)

Med

=

LI

Med

+

P

F

Med

f

Med

.i

Med

=

300

+

 

364 - 230

344

 

.(50)

=

319,75 C

0

Exercício 1.11: Um determinado hospital está interessado em analisar a quantidade de creatinina

(em miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes internados

com problemas renais. Calcule a Mediana.

Quantidade de creatinina (ml) encontrada na urina de 84 pacientes com problemas renais.

Classes

f

i

F

1,08 |- 1,26

5

5

1,26 |- 1,44

13

18

1,44 |- 1,62

32

50

1,62 |- 1,80

18

68

1,80 |- 1,98

11

79

1,98 |- 2,16

2

81

2,16 |-| 2,34

3

84

Total

84

-

Fonte: Dados fictícios

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

1.6.3 - Moda

É o valor que ocorre com maior frequência na série, ou seja, aquele que mais se repete.

Exemplo: Na série 3, 4, 5, 7, 7, 7, 9, 9

M o = 7

SÉRIE UNIMODAL (TEM UMA ÚNICA MODA)

 

Exemplo: Na série 3, 5, 6, 6, 6, 7, 8

M o = 6

SÉRIE BIMODAL (OCORREM DUAS MODAS)

Exemplo: Na série 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10

M o1 = 5 e M o2 = 9

SÉRIE TRIMODAL (OCORREM TRÊS MODAS)

Exemplo: Na série 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9

M o1 = 4, M o2 = 7 e M o3 = 9

SÉRIE POLIMODAL (OCORREM QUATRO OU MAIS MODAS)

 

Exemplo: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13

M o1 = 0, M o2 = 3, M o3 = 8,

M o4 = 12 e M o5 = 13 SÉRIE AMODAL (NÃO EXISTE MODA) Exemplo: Na série 0, 1, 3, 4, 7, 8 não existe moda

 

a)

DADOS APRESENTADOS EM UMA DISTRIBUIÇÃO DE FREQUÊNCIA SIMPLES.

M o = elemento que tenha maior frequência

Exemplo 1.19:

X

fi

1

13

3

15

6

25

10

8

Total

61

M o = 6

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Exemplo 1.20:

Tipo de Sangue

fi

O

547

A

441

B

123

AB

25

Total

1136

M o = sangue do tipo "O"

b) DADOS APRESENTADOS EM UMA DISTRIBUIÇÃO DE FREQUÊNCIA CLASSES.

Nesse caso, a moda pode ser determinada através de quatro processos.

1. Moda Bruta (M oB )

Corresponde ao ponto médio da classe modal, ou seja,

M oB = (l i + l s )/2

Exemplo 1.21: Quantidade de Creatinina

Classes

f

i

1,08 1,26 1,26 1,44 1,44 1,62 1,62 1,80 1,80 1,98 1,98 2,16

5

13

32

18

11

2

2,16 2,34

2,16 2,34

3

Fonte: Dados fictícios

2. Moda de Pearson (M oP )

Utilizada mais especificamente, juntamente com X e Med, para mostrar o comportamento da distribuição, em relação a concentração ou não de seus elementos.

Mo = 3Med - 2 X

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

Utiliza-se a M oP para a análise da assimetria.

a) Assimetria à esquerda:

b) Simétrica:

M

oP

=

Med

=

c) Assimetria à direita:

M

X < Med < M

oP

(concentração à direita ou nos valores maiores);

X

(concentração no centro);

oP

<

Med

<

X

(concentração à esquerda ou nos valores menores).

X ( concentração à esquerda ou nos valores menores ). Exemplo 1.22: Calcule a moda de

Exemplo 1.22: Calcule a moda de Pearson para os seguintes dados X = 1,61 e Med = 1,57.

Mo = 3Med- 2 X = 3(1,57)- 2(1,61)

=1,49

Análise: M Med X , o que indica uma assimetria à direita, isto é, uma maior concentração à

oP

<

<

esquerda (ou em direção aos valores menores).

Exercício 1.12: Calcule a moda de pearson para a distribuição de frequências abaixo:

Quantidade (ml) encontrada numa amostra de 320 soluções utilizadas num processo químico.

Quantidade (ml)

f

i

F

4,08 |- 5,44

49

49

5,44 |- 6,80

70

119

6,80 |- 8,16

142

261

8,16 |- 9,52

29

290

9,52 |-| 10,88

30

320

Total

320

-

Fonte: Dados fictícios

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

1.6.4 – Separatrizes

Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana, já que se baseiam em sua posição na série. Essas medidas - os quartis, os percentis e os decis - são, juntamente com as medianas, conhecidas pelo nome genérico de separatrizes. Os quartis, decis e percentis são muito similares à mediana, uma vez que também subdividem a distribuição de medidas de acordo com a proporção das frequências observadas. Enquanto a mediana divide a distribuição em duas metades, os quartis dividem-se em quatro quartos, os decis em 10 partes e os pontos percentis dividem a distribuição em 100 partes.

Mediana

(Me)

divide em duas partes iguais

Quartis

(Q 1 , Q 2 e Q 3 )

dividem em quatro partes iguais