Escolar Documentos
Profissional Documentos
Cultura Documentos
ontábeis
ADMINISTRAÇÃO
Caderno de Estatística I
Dom Alberto
Prof: Luciana Andréa Zimmer
C122 ZIMMER, Luciana Andrea
Inclui bibliografia.
CDU 658:657(072)
Página 2
PREFÁCIO
Elvis Martins
Diretor Acadêmico de Ensino
Página 3
Apresentação
Lucas Jost
Diretor Geral
Página 4
Sumário
Apresentação 03
Prefácio 04
Plano de Ensino 06
Aula 1
Estatística básica 10
Aula 2
Descrição de populações e amostras com tabelas 17
Aula 3
Distribuições de freqüências 23
Aula 4
Representação Gráfica I 29
Aula 5
Medidas de tendência central 44
Aula 6
Continuação Aula 5 54
Aula 7
Continuação Aula 5 58
Aula 8
Medidas de dispersão 62
Aula 9
Coeficiente de Variação 74
Aula 10
Continuação Aula 9 77
Aula 11
Continuação Aula 9 81
Aula 12
Probabilidades 88
Página 5
Centro de Ensino Superior Dom Alberto
Plano de Ensino
Identificação
Curso: Administração/Ciências Contábeis Disciplina: Estatística I
Carga Horária (horas): 60 Créditos: 4 Semestre: 2º
Ementa
População e Amostra. Séries Estatísticas. Gráficos Estatísticos. Distribuição de Freqüência. Tipos de
Médias. Medidas de Variabilidade. Medidas de Dispersão. Probabilidade.
Objetivos
Geral: Desenvolver processos cognitivos e a aquisição de atitudes possibilitando o aluno a criar hábito de
investigação e confiança para enfrentar situações novas e formar uma visão ampla e científica da realidade.
Inter-relação da Disciplina
Horizontal: As aplicações da disciplina são processadas de forma a adaptar o conhecimento teórico a uma
situação prática e interdisciplinar ajustada a realidade dos negócios na economia brasileira.
Vertical: Despertar o interesse do aluno na interpretação de dados com vista na utilização de instrumentos
capazes de fornecer um conhecimento científico, no que se refere ao pleno entendimento e leitura de
dados.
Competências Gerais
Reconhecer e definir problemas, equacionar soluções, pensar estrategicamente, introduzir modificações no
processo produtivo, atuar preventivamente, transferir e generalizar conhecimentos e exercer, em diferentes
graus de complexidade, o processo da tomada de decisão;
Desenvolver raciocínio lógico, crítico e analítico para operar com valores e formulações matemáticas
presentes nas relações formais e causais entre fenômenos produtivos, administrativos e de controle, bem
assim expressando-se de modo crítico e criativo diante dos diferentes contextos organizacionais e sociais;
Competências Específicas
Identificar problemas específicos, da estatística descritiva, ler, compreender e interpretar dados.
Coletar e organizar dados.
Habilidades Gerais
Reconhecer e definir problemas, organizar, compreender e interpretar gráficos e demais dados estatísticos
referentes a estatística descritiva.
Habilidades Específicas
Conhecer métodos estatísticos para descrever, analisar e interpretar os dados referentes a estatística
descritiva.
Conteúdo Programático
PROGRAMA
1. Introdução a Estatística;
2. Natureza dos dados: variáveis quantitativas e qualitativas; variáveis discretas e contínuas;
3. População e Amostra;
4. Amostragem: conceitos e tipos;
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”. Página 6
5. Dados absolutos e relativos;
6. Tabelas: conceitos; ROL; elementos essenciais; construção;
7. Séries estatísticas;
8. Gráficos: principais tipos; análise; histogramas;
9. Distribuição de freqüências: intervalos de classes; freqüências: absolutas, relativas e acumuladas;
10. Medidas de tendência central:
- Médias: aritmética, geométrica, ponderada e móvel
- Mediana
- Moda
- Ponto médio.
11. Medidas de posição:
- Escore z
- Quartis, decis e percentis.
12. Medidas de variação:
- Amplitude
- Desvio-padrão
- Variância.
13. Medidas de Assimetria e Curtose..
14. Probabilidade:
- Experimentos
- Espaço amostral
- Eventos
- Arranjos e Combinações.
15. Números índices
Um planejamento não é um esquema de trabalho rígido, inflexível. Pelo contrário, devem-se levar em conta
as situações inesperadas que vão ocorrendo e adaptar ou modificar o que se havia inicialmente previsto, de
acordo com suas observações de classe e necessidades dos alunos.
Há metas que devem ser estabelecidas e alcançadas, sendo necessário que o professor disponha de um fio
condutor para a ação que vai desenvolver e de uma previsão para os resultados dessa ação.
1ª Avaliação
– Peso 8,0 (oito): Prova;
– Peso 2,0 (dois): Trabalho referente ao conteúdo ministrado até a 1a avaliação.
2ª Avaliação
- Peso 8,0 (oito): Prova;
- Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas
provas do SPE)
Observação: As provas do SPE deverão ser realizadas até o dia 30/09/2010 (1ª prova SPE) e até o dia
30/11/2010 (2ª prova SPE), sendo obrigatória a realização de ao menos uma prova.
Avaliação Somativa
A aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez,
permitindo-se a fração de 5 décimos.
O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por ele
obtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas.
Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina no
Página 7
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
bimestre.
O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários,
pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de uma
nota representativa de cada avaliação bimestral.
Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete
(7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados.
Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral,
no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim de
substituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem como
média final de aprovação igual ou superior a cinco (5,0).
Recursos Necessários
Humanos
Professor.
Físicos
Laboratórios, visitas técnicas, etc.
Materiais
Recursos Multimídia.
Bibliografia
Básica
CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002.
SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciências
contábeis. São Paulo: Atlas, 1999. 1 e 2 v.
MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
Complementar
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002.
MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005.
FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990.
Periódicos
Jornais: Gazeta do Sul, Zero Hora.
Revistas: Veja, Isto é.
Sites para Consulta
http://www.mec.gov.br
http://www.ime.usp.br
http://www.ibge.gov.br
Outras Informações
Endereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca:
http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por
Página 8
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Cronograma de Atividades
Aula Consolidação Avaliação Conteúdo Procedimentos Recursos
Apresentação do plano de ensino. Introdução a estatística.
1ª AE QG, AP, DS
Natureza dos dados: tipos de variáveis; População e Amostra;
2ª Amostragem: conceitos e tipos; Dados absolutos e relativos; AE, TI AP, QG, DS
Tabelas: conceitos; ROL; elementos essenciais; construção;
3ª AE AP, QG, DS
Séries estatísticas;
4ª Gráficos: principais tipos; análise; histogramas; AE AP, QG, DS
Distribuição de freqüências:intervalos de classes;
5ª AE AP, QG
freqüências: absolutas, relativas e acumuladas;
Distribuição de freqüências:intervalos de classes;
6ª AE, TI AP, QG
freqüências: absolutas, relativas e acumuladas;
Medidas de tendência central: Médias: aritmética, geométrica,
7ª PA, AE AP, QG
ponderada e móvel
1 Consolidação 1. AE AP, QG
1 1ª Avaliação.
2 Consolidação 2. AE AP, QG
2 2ª avaliação.
3 Avaliação substituta.
Legenda
Código Descrição Código Descrição Código Descrição
AE Aula expositiva QG Quadro verde e giz LB Laboratório de informática
TG Trabalho em grupo RE Retroprojetor PS Projetor de slides
TI Trabalho individual VI Videocassete AP Apostila
SE Seminário DS Data Show OU Outros
PA Palestra FC Flipchart
Página 9
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Aula 1 – Estatística I
Prof. Luciana Zimmer
ESTATÍSTICA BÁSICA
1. INTRODUÇÃO
ESTATÍSTICA: é a ciência dos dados. Ela envolve coletar, classificar, resumir, organizar, analisar e interpretar
informação numérica.
ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos, faziam estimativas das
riquezas individual e social, distribuíam terras ao povo, cobravam impostos.
Aspectos Gerais
A estatística é uma coleção de métodos e técnicas para planejar experimentos, obter dados e organizá-los,
resumi-los, analisá-los, interpretá-los e deles extrair conclusões. Então, tudo que tratar, por pouco que seja, de coleta,
processamento, interpretação e apresentação de dados pertence ao domínio da Estatística, assim como o
planejamento detalhado que precede todas essas atividades.
Há várias razões pelas quais a abrangência da Estatística e a necessidade de estudar a Estatística tem
crescido enormemente nos últimos cinqüenta anos. Uma razão é a abordagem crescentemente quantitativa utilizada
em todas as ciências, bem como na administração e em muitas outras atividades que afetam diretamente nossas
vidas. Isso inclui o uso de técnicas matemáticas na avaliação de controle de poluição, no planejamento de inventários,
na análise de padrões do transito de veículos, no estudo dos efeitos de vários tipos de medicamentos, na avaliação de
técnicas de ensino, na análise do comportamento competitivo de administradores e governos, no estudo de dieta de
longevidade, e assim por diante.
A origem da Estatística moderna remonta em duas áreas de interesse que, na aparência, pouco tem em
comum: governo (ciência política) e jogos de azar. Os governos vêm, de longa data, utilizando recenseamento para
contar indivíduos e propriedades, e o problema de descrever, resumir e analisar dados de censos levou ao
desenvolvimento de métodos que, no início, consistiam principalmente na apresentação de dados em forma de
tabelas e gráficos, constituem o que hoje denominamos estatística descritiva. Esta inclui tudo relacionado com
dados que seja projetado para resumir ou descrever dados, mas sem ir além, ou seja, sem procurar inferir qualquer
coisa que vá além dos próprios dados.
• A Estatística descritiva utiliza métodos numéricos e gráficos para detectar padrões em um conjunto
de dados, para resumir a informação revelada em um conjunto de dados para apresentar a
informação de uma forma conveniente.
Embora a estatística descritiva seja um ramo importante da Estatística e continua sendo amplamente
utilizada, as informações estatísticas quase sempre são obtidas de amostras (pequena parte da população), e isso
significa que sua análise exige generalizações que vão além dos dados. Assim, passamos de métodos que
meramente descrevem para métodos que servem para fazer generalizações, ou seja, uma mudança de ênfase da
estatística descritiva para a inferência estatística. Tais métodos são necessários, por exemplo, para prever
resultados.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.
Página 10
• A Estatística inferencial utiliza uma amostra de dados para fazer estimativas, tomar decisões,
previsões ou outras generalizações acerca de um conjunto maior de dados.
Dados categóricos ou dados qualitativos. Resultam de descrições, por exemplo, grupos sanguíneos,
estado civil ou na religião de pacientes de um hospital.
Exemplos -
3. Populações e Amostras
Quando dissemos que a escolha de uma descrição estatística pode depender da natureza dos dados,
estamos nos referindo, entre outras coisas, à seguinte distinção: se um conjunto de dados consiste em todas as
observações possíveis de um dado fenômeno, dizemos que é uma população; se um conjunto de dados consiste em
apenas uma parte da população, dizemos que é uma amostra.
Originalmente, a Estatística tratava apenas da descrição de populações humanas, resultados de censos.
Mas, à medida que seus objetivos se ampliaram, o termo “população” passou a ter a conotação muito mais ampla. Em
Estatística, “população” é um temo técnico com um significado próprio.
Podemos designar como população qualquer grupo de elementos, depende do contexto em que os itens
serão considerados. Suponhamos, por exemplo, que nos ofereçam um lote com 400 ladrilhos de cerâmicas, que
podemos comprar ou não, dependendo de sua resistência. Se medirmos a resistência à quebra de 20 desses ladrilhos
para estimar a resistência média de todos os ladrilhos, essas 20 mensurações constituem uma amostra da população
que consiste nas resistências de todos os 400 ladrilhos. Em outro contexto, se pensarmos em firmar um contrato de
Página 11
longo prazo para o fornecimento de dezenas de milhares desses ladrilhos, consideraríamos como apenas uma
amostra o conjunto das resistências dos 400 ladrilhos originais.
Distinguiremos ainda dois tipos de populações, as populações finitas e as populações infinitas.
Populações finitas. Consiste em um número finito, ou fixo, de elementos, medidas ou observações.
Exemplos: pesos líquidos de 3000 latas de tintas de um certo lote de produção; pontos obtidos por todos os
candidatos no vestibular de 2008 numa certa universidade.
Populações infinitas. Contém, pelo menos hipoteticamente, um número infinito de elementos. Por exemplo:
quando medimos repetidamente o ponto de ebulição de um composto de silicone (não há limite para o número de
vezes que podemos medir); quando observamos os totais obtidos em repetidas jogadas de um par de dados (não há
limite para o número de vezes que podemos jogar um par de dados).
Escolhemos um ponto de partida, que deve ser um valor entre 1 e k e a partir de então selecionamos cada
k elemento da população para fazer parte da amostra.
− ésimo
Por exemplo, se a Motorola quisesse fazer uma pesquisa sobre seus 107.000 empregados, poderia partir de
uma relação completa dos mesmos e selecionar cada 100º empregado, obtendo uma amostra de 1.070 elementos.
Esse método é simples e utilizado com freqüência.
Página 13
4.2.3 Amostragem de Conveniência
Na amostragem de conveniência, simplesmente utilizamos resultados que já estão disponíveis.
Em alguns casos, os resultados da amostragem de conveniência podem ser muito bons, mas em outros
casos podem apresentar séria tendenciosidade. Ao fazer uma pesquisa sobre pessoas canhotas, seria conveniente
um estudante pesquisar seus próprios colegas de classe, porque estão ao seu alcance imediato. Mesmo que tal
amostra não seja aleatória, os resultados devem ser bem satisfatórios. Em contrapartida, poderia ser muito
conveniente (e talvez mesmo lucrativo) para a ABC News fazer uma pesquisa pedindo aos espectadores que liguem
para um número de telefone “900” para registrar suas opiniões, mas essa pesquisa seria auto-selecionada e os
resultados seriam provavelmente tendenciosos
Um erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais
erros resultam de flutuações amostrais aleatórias.
Ocorre um erro não-amostral quando os dados amostrais são coletados, registrados ou analisados
incorretamente. Tais erros resultam de um erro que não seja uma simples flutuação amostral aleatória, como a
escolha de uma amostra não aleatória e tendenciosa, a utilização de um instrumento de mensuração defeituoso, um
grande número de recusas de resposta ou a cópia incorreta dos dados amostrais.
Se extrairmos uma amostra cuidadosamente, de forma que ela represente realmente a população, podemos
aplicar os métodos descritos neste livro para analisar o erro amostral, mas devemos ter o máximo de cuidado em
minimizar os erros não-amostrais.
Exercício:
b) População: computadores produzidos por uma empresa. Variável: número de peças usadas.
3 - uma agência de turismo tem 2.500 clientes cadastrados. Para melhor atendê-los, foi pesquisada a preferência em
relação ao tempo de duração, ao preço, ao número de acompanhantes, ao número de passeios e à qualidade dos
serviços prestados em uma viagem. Foram consultados de modo imparcial, 700 pessoas.
a) Quantas pessoas têm a população estatística envolvida nessa pesquisa?
Página 14
4- Quais são as etapas básicas do método estatístico?
5. Uma concessionária de automóveis tem cadastrados 3500 clientes e fez uma pesquisa sobre a preferência de
compra em relação a “cor”(branco, vermelho ou azul), “preço”, “número de portas”(duas ou quatro) e “estado de
conservação” (novo ou usado). Foram consultados 210 clientes. Diante dessas informações, responda:
a) Qual é o universo estatístico e qual é a amostra dessa pesquisa?
b) Quais são as variáveis e qual é o tipo de cada uma?
c) Quais os possíveis valores da variável “cor” nessa pesquisa?
6. Ao nascer, os bebês são pesados e medidos, para se saber se estão dentro das tabelas de peso e altura
esperados. Estas duas variáveis são:
a) Qualitativas
b) Ambas discretas.
c) Ambas contínuas.
d) Contínua e discreta, respectivamente.
e) Discreta e contínua, respectivamente.
7. Para cada uma das seguintes variáveis aleatórias, determine se a variável é quantitativa ou qualitativa. Se
quantitativa, determine se a variável de interesse é discreta ou contínua.
a. Número de telefones por domicílio.
b. Tipo de telefone mais utilizado.
c. Número de chamadas de longa distância realizadas por mês.
d. Duração (em minutos) da mais demorada chamada de longa distância.
e. Cor do telefone mais utilizado.
f. Quantia em dinheiro gasto com livros.
g. Número de livros didáticos comprados.
h. Tempo gasto na livraria.
i. Sexo.
j. Principal matéria acadêmica.
k. Número de créditos matriculados para o semestre corrente.
l. Método de pagamento na livraria.
m. Nome do provedor de internet.
n. Tarifa mensal do serviço de internet.
o. Quantidade de tempo gasto por semana navegando na internet.
p. Número semanal de e-mails recebidos.
q. Número mensal de compras on-line.
r. Total gasto em compras on-line.
s. Quantia gasta no mês passado com vestuário.
t. Número de agasalhos que possui.
u. Quantia de tempo gasto no mês passado comprando vestuário.
v. Horário mais provável para compra de vestuário (comercial, à noite ou fim de semana).
w. Loja de departamento preferida.
x. Número de pares de meias que possui.
y. Número de alunos matriculados na disciplina de Estatística I.
z. Disciplinas disponíveis para cursar no semestre corrente.
8. Identifique o tipo de amostragem utilizada: aleatória, estratificada, sistemática, por conglomerado ou conveniência.
a. Ao escrever um livro, o autor baseou suas conclusões em 4.500 respostas a 100.000 questionários
distribuídos a mulheres.
b. Um sociólogo seleciona 12 homens e 12 mulheres de cada uma de quatro turmas de inglês.
c. Um cabo eleitoral escreve o nome de cada senador em cartões separados, mistura-os e extrai 10.
Página 15
d. Um programa de Planejamento Familiar pesquisa 500 homens e 500 mulheres sobre seus pontos de vista
sobre o uso de anticoncepcionais.
e. Um pesquisador médico de uma Universidade entrevista todos os portadores de leucemia em cada um de 20
hospitais selecionados aleatoriamente.
f. Obtém-se uma amostra de um produto extraindo-se cada 100ª unidade de linha de montagem.
g. Geram-se números aleatórios em um computador para selecionar números de série de carros a serem
escolhidos para uma amostra de teste.
h. Um fornecedor de peças para automóvel obtém uma amostra de todos os itens de cada um de 12
fornecedores selecionados aleatoriamente.
i. Um fabricante de automóveis faz um estudo de mercado compreendendo testes de direção feitos por uma
amostra de 10 homens e 10 mulheres em cada uma de quatro diferentes faixas etárias.
j. Um fabricante de automóveis faz um estudo de mercado entrevistando clientes em potencial que solicitam
teste de direção a um revendedor local.
Página 16
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Aula 2 – Estatística I
Representação tabular
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que
tenhamos uma visão global da variação dessa ou dessas variáveis, apresentando esses valores em tabelas e
gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos
determinações administrativas e pedagógicas mais coerentes e científicas.
TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira
sistemática.
• De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :
um traço horizontal ( - ) quando o valor é zero;
três pontos ( ... ) quando não temos os dados;
zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada;
um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor.
Obs.: O lado direito e esquerdo de uma tabela oficial deve ser aberto.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 17
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Em geral, listar, e portanto, organizar dados é a primeira etapa em qualquer tipo de análise estatística.
Como situação típica, consideremos os dados seguintes, que representam o comprimento (em centímetros) de 60
sardinhas pescadas em uma colônia de pescadores:
17,2 18,8 20,7 22,6 18,6 18,3 22,7 24,0 20,0 22,4
16,5 17,8 17,9 24,7 20,7 20,9 25,0 21,0 17,2 18,4
16,5 18,5 20,7 20,0 21,9 17,6 23,4 16,5 24,0 22,5
20,0 22,8 21,4 19,2 22,5 20,8 24,4 17,0 18,9 16,7
17,8 22,7 24,7 22,7 22,4 18,3 24,2 23,1 16,7 16,1
24,2 21,0 24,4 18,8 17,5 18,8 17,2 24,6 21,2 18,6
A coleta desses dados por si só já não é tarefa simples, mas deveria ser evidente que é preciso fazer muito
mais para tornar os números compreensíveis. Seria interessante se soubéssemos os valores extremos (menor e
maior valor). Ocasionalmente, é útil dispor os dados de maneira crescente ou decrescente. A listagem a seguir dos
comprimentos das sardinhas está arranjada em ordem crescente:
16,1 16,5 16,5 16,5 16,7 16,7 17,0 17,2 17,2 17,2
17,5 17,6 17,8 17,8 17,9 18,3 18,3 18,4 18,5 18,6
18,6 18,8 18,8 18,8 18,9 19,2 20,0 20,0 20,0 20,7
20,7 20,7 20,8 20,9 21,0 21,0 21,2 21,4 21,9 22,4
22,4 22,5 22,5 22,6 22,7 22,7 22,7 22,8 23,1 23,4
24,0 24,0 24,2 24,2 24,4 24,4 24,6 24,7 24,7 25,0
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 18
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em
função da época, do local ou da espécie.
SÉRIES HOMÓGRADAS: são aquelas em que a variável descrita apresenta variação discreta ou descontínua.
Podem ser do tipo temporal, geográfica ou específica.
É a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e permanece
constante a época e o fato.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 19
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
É a série cujos dados estão dispostos em correspondência com a espécie ou qualidade, ou seja, varia o fato
e permanece constante a época e o local.
Tabela 5.
PRODUÇÃO BRASILEIRA DE
AÇO BRUTO EM 1991 (em toneladas)
PROCESSOS 1991
Oxigênio básico 17.934
Forno elétrico 4.274
EOF 409
Fonte: Instituto Brasileiro de Siderurgia.
SÉRIES CONJUGADAS:
Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries
de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de
uma série geográfica-temporal.
Tabela 6.
População Urbana do Brasil por Região de 1940 a 1980 (x1000)
REGIÕES
Anos N NE SE S CO
1940 406 3.381 7.232 1.591 271
1950 581 4.745 10.721 2.313 424
1960 958 7.517 17.461 4.361 1.007
1970 1.624 11.753 28.965 7.303 2.437
1980 3.037 17.567 42.810 11.878 5.115
Fonte: Anuário Estatístico (1984)
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 20
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
2. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsitos, 27306 casos de vítimas fatais,
assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores.. Faça uma tabela para representar esses
dados.
3. De acordo com o ministério dos transportes, em 1998, o tamanho das malhas de transporte no Brasil é assim
distribuído: 320480 km de rodovias (estradas municipais não estão incluídas), 29700 km de Ferrovias (inclui as linhas
de trens urbanos) e 40000 km de Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma
tabela para representar esses dados.
4. De acordo com o Ministério de Educação a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos
anos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564.
Faça uma tabela para representar esses dados.
5. Estabelecimentos de ensino da região norte do Brasil em 1982 subdividiam-se em: Rondônia, Acre, Amazonas,
Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente,
segundo o MEC. Faça uma tabela para apresentar esses dados.
6. De acordo com o IBGE(1988), a distribuição dos suicídios ocorridos no Brasil em 1986, segundo a causa atribuída,
foi a seguinte: 263 alcoolismo, 198 por dificuldade financeira, 700 por doença metal, 189 por outro tipo de doença,
416 por desilusão amorosa e 217 por outras causas. Apresente essa distribuição em uma tabela.
7. Explique uma forma de se obter uma amostra estratificada dos empregados de uma empresa em que existam
funcionários de escritório, funcionários de produção e vendedores.
8. Numa escola com 1200 alunos, foi feito um recenseamento, recolhendo-se dados referentes às seguintes
variáveis:
Idade dos alunos; anos de escolaridade; meio de transporte utilizado para ir à escola; local de almoço; número de
irmãos; local de trabalho; número de televisores em casa; local de moradia.
a) Das variáveis observadas, quais são quantitativas e quais são qualitativas?
b) Como organizar uma amostra simples e uma sistemática para fazer esse recenseamento?
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 21
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
9. Deseja-se fazer uma pesquisa em uma população constituída por um número maior de homens que de mulheres.
Como você faria para selecionar uma amostra:
a) com o mesmo número de homens e de mulheres?
b) Com mais mulheres que homens?
10. Suponha que 40% da população mencionada no problema anterior seja constituída por mulheres. Numa amostra
estratificada proporcional formada por 50 indivíduos, qual seria o número de homens e o de mulheres? E numa
amostra composta de 150 pessoas, quais seriam esses números?
11. Uma empresa de publicidade quer fazer um estudo sobre o interesse despertado por certa propaganda entre os
alunos de 10 anos de idade das escolas de Ensino Fundamental de uma cidade. Para isso, pretende estratificar uma
amostra de 300 crianças.
Como a empresa poderia fazer essa amostra a partir dos dados da tabela abaixo?
Escola População
A 400
B 300
C 350
D 450
E 520
F 300
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 22
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Aula 3 – Estatística I
Profª Luciana Zimmer
DISTRIBUIÇÕES DE FREQÜÊNCIAS
Os dados em distribuições de freqüências são uma maneira de apresentar informações
agrupadas. Neste caso a variável pode ser expressa por ponto ( um único valor ) ou por
intervalo ( dentro de um intervalo de valores ). Ao se constituir uma distribuição de freqüências
(DF) precisam-se descrever alguns componentes da mesma.
Tabela Primitiva
Supondo uma coleta amostral de dados relativos aos salários semanais de quarenta
funcionários que compõem uma amostra de uma Empresa Z. Os valores de cada um dos
salários estão listados a seguir:
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Distribuição de Freqüência
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 23
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS
FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 ├ 154 4
154 ├ 158 9
158 ├ 162 11
162 ├ 166 8
166 ├ 170 5
170 ├ 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL
1. As classes devem ser mutuamente excludentes, ou seja, cada valor original deve pertencer
exatamente a uma e só uma classe.
2. Todas as classes devem ser incluídas, mesmo as de freqüência zero.
3. Procurar utilizar a mesma amplitude para todas as classes, embora eventualmente seja
impossível evitar intervalos com extremidade aberta.
4. Escolher números convenientes para limites de classe. Arredondar para cima a fim de ter
menos casas decimais, ou utilizar números adequados à situação.
5. Utilizar entre 5 e 20 classes.
6. As somas das freqüências das diversas classes deve ser igual ao número de observações
originais.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 24
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
4. Amplitude Total ( AT) : É a diferença entre o valor máximo e o valor mínimo da amostra.
AT = Vmax - Vmin
5. Ponto Médio de uma Classe ( Xi) : É o ponto que divide o intervalo de classe em duas
partes iguais.
li + ls
Xi =
2
Exemplo: O ponto médio da segunda classe, em nosso exemplo, é 156.
N = ∑ fi ( população )
n = ∑ fi ( amostra )
Exemplo: Para a distribuição em estudo, temos: n = ∑ fi = 40
K = 1 + 3,33 log n( N )
Onde:
K é o número de classes;
N ou n é o número total de observações.
Para determinar a amplitude do intervalo de classe, temos:
h= N .
K
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 25
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Quando se trata de variáveis discretas de variação relativamente pequena, cada valor pode
ser tomado como um intervalo de classe.
Ex: Uma professora organizou os resultados obtidos em uma prova da seguinte forma:
4–5–7–9–9–4–5–7–9–9–4–5–7–9–9–4–6–8–9–9–4–6–8–9–9
Nota Nº de alunos
Total
TIPOS DE FREQÜÊNCIAS
Freqüências Relativas simples (f ri )
Freqüência Acumulada ( F i )
É o total das freqüências de todos os valores inferiores ao limite superior.
do intervalo de uma dada classe.
Fi = f 1 + f 2 + ... + fi ou Fi = ∑ fi
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 26
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
EXERCÍCIO
1. Complete a seguinte tabela e responda as seguintes perguntas:
84 68 52 47 61 73 77 33 73 68
74 71 81 65 55 57 35 85 88 91
59 80 50 53 55 76 85 73 60 41
67 41 78 56 94 35 45 55 64 74
65 94 48 39 89 98 42 66 69 54
Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para
intervalo das classes.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 27
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
6 2 6 4 3 6 2 6 5 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3
Pede-se:
a) Agrupar os dados numa distribuição de freqüências com intervalo de classes (use Teorema
de STURGES);
b) Determine as freqüências simples e acumuladas (absolutas e relativas);
c) Calcule e interprete: fr 2 , f 3 , Fr 4 e Fr 2 .
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 28
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Aula 4 - Estatística I
Prof. Luciana Zimmer
1. Representação Gráfica
Todas as pessoas efetivamente consomem informações diariamente através dos diversos meios
de comunicação. Uma vez que grande parte do que é ouvido ou lido é lixo ou sucata, deve-se aprender a
avaliar criticamente e descartar aquilo que não possui valor real. Também devemos ter em mente que, às
vezes, essa sucata baseia-se na ignorância; em outras ocasiões, é planejada e maliciosa. Portanto, é
importe ser crítico e cético em relação às informações fornecidas.
Excelência gráfica
1. É uma apresentação bem elaborada de dados, que fornece substância, estatísticas e formas;
2. Comunica idéias complexas com clareza, precisão e eficiência;
3. Fornece ao observador o maior número de idéias, no menor espaço de tempo, com o menor
volume de impressão;
4. Exige que seja transmitida a verdade sobre os dados.
Histogramas
É utilizado para descrever dados numéricos que tenham sido agrupados na forma de distribuições
de freqüências ou distribuições de freqüências relativas.
Ao desenhar um histograma, a variável aleatória de interesse é exibida ao longo do eixo horizontal
(eixo X). O eixo vertical (eixo Y) representa o número (freqüência), proporção ou porcetagem de
observações por intervalo de classe.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 29
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
14
12
Número de Pessoas
10
0
15|---26 26|---37 37|---48 48|---59 59|---70
Idade (Anos)
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 30
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
30%
25%
Percentagem
20%
15%
10%
5%
0%
--- -20 0 20 40 60 80 100
Características:
- Cada barra representa a freqüência do intervalo respectivo;
- Os intervalos devem ter a mesma amplitude;
- As barras devem estar todas juntas.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 31
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Histograma
Histograma com
assimetria positiva
A figura ao lado apresenta um histograma com
assimetria positiva. A média dos dados está localizada à
esquerda do centro da figura e a cauda à direita é
alongada. Esta ocorre quando o limite inferior é controlado
ou quando não podem ocorrer valores abaixo de
determinado limite.
Histograma com
assimetria negativa
A figura apresenta um histograma com
assimetria negativa. A média dos dados está localizada à
direita do centro da figura e a cauda à esquerda é
alongada. Esta forma ocorre quando o limite superior é
controlado ou quando não podem ocorrer valores acima de
certo limite.
Histograma em plateau
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 32
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Histograma com
Dois picos
A figura mostra um histograma com dois picos,
ou duas modas. As freqüências são baixas no centro da
figura, mas existem dois picos fora do centro. Esta forma
ocorre quando duas distribuições com médias bem
diferentes se misturam. Podem estar misturados, por
exemplo, os produtos de dois turnos de trabalho.
Gráficos em Linhas
Usado principalmente para ilustrar uma série temporal.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 33
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Gráfico de Colunas
Usado para ilustrar qualquer tipo de série.
45000 42810
40000
35000
30000
População
25000
20000 17568
15000 11878
10000 5115
3037
5000
0
CO S SE NE N
Regiões
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 34
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
As larguras das barras que deverão ser todas iguais podendo ser adotado qualquer dimensão,
desde que seja conveniente e desde que não se superponham. O número no topo de cada barra pode ou
não ser omitido, se forem conservados, a escala vertical pode ser omitida.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 35
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Gráfico de Barras
As regras usadas para o gráfico de barras são iguais as usadas para o gráfico de colunas.
N 3037
NE 17568
SE 42810
S 11878
CO 5115
Assim como os gráficos de Colunas podem ser construídos gráficos de barras comparativas.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 36
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Características:
• A área do gráfico equivale à totalidade de casos (360º = 100%);
• Cada “fatia” representa a percentagem de cada categoria.
32%
Urbana
Rural
68%
32%
Urbana
Rural
68%
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 37
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 38
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Cartograma
É a representação de uma carta geográfica. Este tipo de gráfico é empregado quando o objetivo é
o de figurar os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas.
Brasil
por vendas (em mil reais)
144
237
300
440
320
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 39
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Atividades
1. O gráfico a seguir ilustra o número de inscritos nos últimos quatro vestibulares que disputaram
as vagas oferecidas pela Universidade de São Paulo (USP) e pelas universidades federais do
Rio de Janeiro (UFRJ), de Minas Gerais (UFMG) e do Rio Grande do Sul (UFRGS).
Com base nessas informações, julgue os itens seguintes como verdadeiro ou falso:
a. De 1997 a 1998, o crescimento percentual do número de inscritos na USP foi maior que o da
UFRGS. (___)
b. Os crescimentos percentuais anuais na UFRJ diminuíram a cada ano. (___)
c. Todas as universidades tiverem crescimento no número de inscritos no referido período. (___)
d. A UFRGS foi a única que apresentou crescimento no número de inscritos. (___)
e. A UFMG teve um crescimento de mais de 100% no número de inscritos no período. (___)
f. A UFRGS teve um crescimento de 3,74%, 36,17% em 97 e 98, respectivamente, e uma
redução de cerca de 3,17% no número de inscritos em 99.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 40
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
2. Numa turma de cursinho de informática, a distribuição das idades dos alunos, segundo o sexo,
é dada pelo gráfico seguinte.
32 40 22 11 34 40 16 26 23 31 27 10 38 17 13
45 25 10 18 23 35 22 30 14 18 20 13 24 35 29
33 48 20 12 31 39 17 58 19 16 12 21 15 12 20
51 12 19 15 41 29 25 13 23 32 14 27 43 37 21
28 37 26 44 11 53 38 46 17 36 28 49 56 19 11
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 41
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
450 500 150 1000 250 275 550 500 225 475 150 450 950 300 800 275
600 750 375 650 150 500 1000 700 475 900 800 275 600 750 375 650
150 500 225 250 150 120 250 360 230 500 350 375 470 600 1030 270
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 42
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 43
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Aula 5- Estatística I
Profª Luciana Zimmer
MEDIDAS DE TENDÊNCIA CENTRAL
Na maior parte das vezes em que os dados estatísticos são analisados, procuramos obter um valor para
representar um conjunto de dados. Este valor deve sintetizar, da melhor maneira possível, o comportamento do
conjunto do qual ele é originário. Nem sempre os dados estudados têm um bom comportamento, isto pode fazer
com que um único valor bem represente ou não o grupo.
As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação
pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as
medidas de tendência central, destacam-se as seguintes: Média aritmética, Moda e Mediana. Cada uma com um
significado diferenciado, porém tendo como serventia representar um conjunto de dados.
A maneira de se obter estas medidas é um pouco diferenciada dependendo de como os dados são
apresentados. Eles podem vir de forma isolada (não grupados) ou ainda ponderada (grupados em intervalos ou
sem intervalo de classe, por ponto).
1– Média Aritmética ( µ ou x )
É o quociente da divisão da soma dos valores da variável pelo número deles:
µ= ∑ xi ou X =
∑ xi
N n
Sendo: µ ou x: média aritmética
Xi: valores da variável
n ou N: número de valores
Exemplo: Selecionados aleatóriamente 10 alunos da turma, e obtemos as seguntes alturas (em m):
1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63 1,77 1,59
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e
visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 44
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
µ= ∑ xi. fi ( população ) X =
∑ xi. fi ( amostra )
N n
Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, adotando-se a variável “número de
filhos do sexo masculino”, determine a média.
N.º de Meninos fi
0 2
1 6
2 10
3 12
4 4
Σ = 34
1.2.2 – Com intervalos de classe: Convenciona-se que todos os valores incluídos em um determinado intervalo de
classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada.
µ= ∑ xi. fi ( população ) X =
∑ xi. fi ( amostra )
N n
onde Xi é o ponto médio da classe.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 45
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Exemplo:
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL
EXERCÍCIOS
b) Consumo (kWh) 5 |--- 25 |--- 45 |--- 65 |--- 85 |--- 105 |--- 125 |--- 145 |--- 165
N.º de Usuários 4 6 14 26 14 8 6 2
c) Custos (R$) 450 |--- 550 |--- 650 |--- 750 |--- 850 |--- 950 |--- 1050 |--- 1150
fi 8 10 11 16 13 5 1
Para uma seqüência numérica x: x 1 , x 2 , ......., x n , a média geométrica simples, que designaremos por xg ,é
definida por:
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 46
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Exemplo: Se X: 2, 4, 6, 9, então:
4 4
xg = 2.4.6.9 = 432 = 4,559
Para uma seqüência numérica x: x 1 , x 2 , ...., x n afetados de pesos p 1 , p 2 , ..., p n respectivamente, a média
geométrica ponderada que designaremos por x g é definida por:
3. Moda (Mo)
A moda de uma distribuição é o valor da variável que tem a maior freqüência absoluta simples, quer dizer aquele
valor que aparece mais [mais se repete]. Existem algumas situações nas quais não existe moda, isto é, todos os
valores da variável só aparecem uma vez, não se repetem.
Em outras situações pode-se ter mais de uma moda, isto é, quando dois ou mais valores da variável têm maior
freqüência [freqüências iguais], neste caso diz-se que o conjunto é bimodal. Podem-se ter três, quatro, etc.
Nestes casos é difícil escolher a moda como um representante do grupo, uma vez que teremos muitos
representantes. Para que se possa obter o valor da moda é necessário que os dados estejam no mínimo em
escala nominal, quer dizer, com qualquer nível de mensuração podemos obter o valor da moda, uma vez que ela
é oriunda apenas de uma contagem. Portanto, a moda é o valor que ocorre com maior freqüência em uma série
de valores.
Exemplo: - o dono do restaurante vai preparar mais o filé de maior saída; maioria tirou “C” numa turma; o
proprietário da loja de sapato vai comprar mais os números de maior saída.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 47
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 12, 12, 12, 13, 15 tem moda igual a 12.
• Amodal: são as séries nas quais nenhuma valor apareça mais vezes que outros.
Exemplo: Xi = 2 3 4 4 4 5 6 7 7 7
Mo 1 = 4 Mo 2 = 7
3.2 – Dados agrupados
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 48
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
4– Mediana (Md): É o número que se encontra no centro de uma série de números, estando estes dispostos
segundo uma ordem. Para que se possa obter o valor da mediana os dados têm que estar em uma escala de
medida no mínimo ordinal, uma vez que se precisa ordená-los.
A mediana é o valor que divide o conjunto ao meio, isto é, concentra antes e depois de si, 50% das observações
ordenadas. Ao contrário da média aritmética a mediana não sofre influência quando temos no conjunto valores
discrepantes [tanto para mais como para menos]. Neste caso a mediana pode melhor representar um conjunto do
que a média aritmética, porém não tem o mesmo significado que aquela.
A mediana pode ou não pertencer ao conjunto do qual ela é originária, vai pertencer sempre que o conjunto tiver
um número ímpar de informações e vai ou não pertencer quando o conjunto tiver um número par de
observações. Com isso já podemos ver que a quantidade de observações influi na maneira pela qual vamos
encontrar o valor da mediana.
4.1. – Dados não-agrupados: Estando ordenados os valores de uma série e sendo n o número de elementos da
série, o valor mediano será, quando n for:
n +1
• impar : o termo de ordem ;
2
n n
• par : a média aritmética dos termos de ordem e + 1 .
2 2
Exemplo 1: Dada à série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, identifique a mediana.
Md= 2, 5, 6, 9, 10, 13, 15, 16, 18
Md = 10
Exemplo 2: Dada à série de valores:
2, 6, 7, 10, 12, 13, 18, 21, calcule a mediana.
Md = 11
• O valor da mediana pode coincidir ou não com um elemento da série.
4.2. – Dados agrupados: Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos
n
extremos, é dada por:
2
4.2.1 – Sem intervalos de classe: É o bastante identificar a freqüência acumulada imediatamente superior à
metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência
acumulada.
Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de
filhos do sexo masculino, determine a mediana:
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 49
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
N.ºde Meninos fi
0 2
1 6
2 10
3 12
4 4
Σ = 34
4.2.2 – Com intervalos de classe: Classe mediana é aquela correspondente à freqüência acumulada
Σf i
imediatamente superior a .
2
Em seguida analisa-se o ponto médio
Exemplo: Calcule a mediana da seguinte distribuição:
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 50
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Σf i
No caso de existir uma freqüência acumulada exatamente igual a , a mediana será o limite superior
2
da classe correspondente.
Exemplo:
i Classes fi Fi
0 |--- 10 1
10 |--- 20 3
20 |--- 30 9
30 |--- 40 7
40 |--- 50 4
50 |--- 60 2
26
EXERCÍCIOS
1 – Considerando os conjuntos de dados calcule a média, a mediana e a moda.
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b) 20, 9, 7, 2, 12, 7, 20, 15, 7
c) 51,6; 48,7; 50,3; 49,5; 48,9
d) 15, 18, 20, 13, 10, 16, 14
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
2 - Os dados abaixo representam todos a idade dos clientes que acessaram a página da internet da Empresa “X”
no mês de julho de 1998.
3 - O Departamento Pessoal de certa firma fez um levantamento dos 120 funcionários de todo o setor de
produção, obtendo os seguintes resultados:
Salário (x sal. min.) Freqüência relativa
0 |----- 2 0,25
2 |----- 4 0,40
4 |----- 6 0,20
6 |----- 8 0,15
Pede-se:
a) Calcule a média dos salários
b) Se for concedido um aumento para esses funcionários de 100%, haverá alteração na média? Justifique.
c) Se for concedido um abono de um salário mínimo para todos os 120 funcionários, haverá alteração na média?
Justifique.
18 |-----20 5
20 |-----22 18
22 |-----24 10
24 |-----26 6
26 |-----28 5
-----------------------------------------------------------------
Tempo de serviço Freqüência acumulada
-----------------------------------------------------------------
5 I---- 10 9
10 I---- 15 12
15 I---- 20 18
20 I----I 25 25
-----------------------------------------------------------------
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 52
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
X : 1, 2, 4, 7, 16
MÊS Jan. Fev. Março Abril Maio Junho Julho Agosto Set. Out. Nov. Dez.
NASC. 38 25 42 30 29 47 18 36 38 43 49 37
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.
Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 53
Aula 6 – Estatística I
Profª Luciana Zimmer
Pede-se:
a) O salário médio, mediano e modal dos funcionários
b) O histograma e o polígono de freqüências da distribuição.
c) Suponha que o presidente da empresa tenha dado um reajuste de 15% aos funcionários.
Qual o novo salário médio?
Página 54
Pede-se calcular, baseado nas médias gráficas, a média, a moda e a mediana.
Pede-se:
Página 55
6. Em uma distribuição de freqüências de amplitudes de classes iguais, sabe-se que o ponto
médio da 1ª classe vale 4 e o da 6ª classe, 24. Se as freqüências absolutas, que vão da 1ª
a 6ª classes, são iguais a 2, 5, 8, 9, 13 e 3 respectivamente, pede-se:
a. A média, a moda e a mediana
b. O gráfico de freqüências acumuladas.
6 5 2 6 4 3 6 2 6 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3
64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73
9. As idades em anos de 25 pessoas presentes nesta sala de aula são: 20, 19, 22, 24, 25,
26, 18, 19, 18, 20, 21, 22, 23, 21, 19, 20, 19, 22, 21, 23, 24, 25, 22, 20, 22. Determine a
média, moda, mediana e ponto médio de idade desse grupo de pessoas.
10. Calcule a média para a amostra abaixo que representa as pessoas apresentados na
questão anterior:
Página 56
PESOS ( Kg) fi
45 |--- 50 2
50 |--- 55 5
55 |--- 60 8
60 |--- 65 5
65 |--- 70 3
70 |--- 75 2
11. A tabela seguinte representa as alturas (em cm) de 56 alunos de uma classe de
estatística.
162 163 148 166 169 154 170 166
164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 158 163 165 164 178 150 168
180 159 152 178 171 165 162 164
166 168 173 160 172 168 169 169
167 176 162 174 179 169 161 164
12. Os dados abaixo apresentam o peso (massa) em Kg de Leitões criados para fins de
pesquisa genética. Calcule a média, moda, mediana e ponto médio.
0,1 0,2 0,6 1,0 1,1 1,1 1,4 2,3 2,6 3,1
3,5 3,5 3,7 4,0 4,3 5,0 5,1 5,4 5,6 6,2
6,5 6,8 7,0 7,1 7,3 7,3 7,4 7,6 7,6 7,7
7,8 7,8 7,8 7,9 9,2 9,2 9,3 9,4 10,1 10,2
10,2 10,6 10,7 10,9 11,0 11,0 11,3 11,5 12,1 12,6
12,7 12,7 13,3 14,2 14,4 14,7 14,9 15,2 16,1 16,1
16,2 16,4 16,5 16,6 16,9 17,0 17,0 17,1 17,9 18,1
18,1 18,4 18,7 18,7 18,8 18,8 18,9 18,9 19,3 19,8
Página 57
Aula 7 – Estatística I
Profª Luciana Zimmer
Pede-se:
a) O salário médio, mediano e modal dos funcionários
b) O histograma e o polígono de freqüências da distribuição.
c) Suponha que o presidente da empresa tenha dado um reajuste de 15% aos funcionários.
Qual o novo salário médio?
Página 58
Pede-se calcular, baseado nas médias gráficas, a média, a moda e a mediana.
Pede-se:
Página 59
6. Em uma distribuição de freqüências de amplitudes de classes iguais, sabe-se que o ponto
médio da 1ª classe vale 4 e o da 6ª classe, 24. Se as freqüências absolutas, que vão da 1ª
a 6ª classes, são iguais a 2, 5, 8, 9, 13 e 3 respectivamente, pede-se:
a. A média, a moda e a mediana
b. O gráfico de freqüências acumuladas.
6 5 2 6 4 3 6 2 6 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3
64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73
9. As idades em anos de 25 pessoas presentes nesta sala de aula são: 20, 19, 22, 24, 25,
26, 18, 19, 18, 20, 21, 22, 23, 21, 19, 20, 19, 22, 21, 23, 24, 25, 22, 20, 22. Determine a
média, moda, mediana e ponto médio de idade desse grupo de pessoas.
10. Calcule a média para a amostra abaixo que representa as pessoas apresentados na
questão anterior:
Página 60
PESOS ( Kg) fi
45 |--- 50 2
50 |--- 55 5
55 |--- 60 8
60 |--- 65 5
65 |--- 70 3
70 |--- 75 2
11. A tabela seguinte representa as alturas (em cm) de 56 alunos de uma classe de
estatística.
162 163 148 166 169 154 170 166
164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 158 163 165 164 178 150 168
180 159 152 178 171 165 162 164
166 168 173 160 172 168 169 169
167 176 162 174 179 169 161 164
12. Os dados abaixo apresentam o peso (massa) em Kg de Leitões criados para fins de
pesquisa genética. Calcule a média, moda, mediana e ponto médio.
0,1 0,2 0,6 1,0 1,1 1,1 1,4 2,3 2,6 3,1
3,5 3,5 3,7 4,0 4,3 5,0 5,1 5,4 5,6 6,2
6,5 6,8 7,0 7,1 7,3 7,3 7,4 7,6 7,6 7,7
7,8 7,8 7,8 7,9 9,2 9,2 9,3 9,4 10,1 10,2
10,2 10,6 10,7 10,9 11,0 11,0 11,3 11,5 12,1 12,6
12,7 12,7 13,3 14,2 14,4 14,7 14,9 15,2 16,1 16,1
16,2 16,4 16,5 16,6 16,9 17,0 17,0 17,1 17,9 18,1
18,1 18,4 18,7 18,7 18,8 18,8 18,9 18,9 19,3 19,8
Página 61
Aula 8– Estatística I
Profª Luciana Zimmer
MEDIDAS DE DISPERSÃO
1. Dispersão ou Variabilidade
A média, ainda que considerada como um número que tem a faculdade de representar uma série
de números não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que
existe entre os valores que compõem o conjunto.
X: 5, 5, 5, 5, 5.
Y: 3, 4, 5, 6, 7.
Z: 5, 0, 10, 8, 2.
Notações:
Quando a seqüência de dados representa uma População à variância será denotada por
σ (x) e o desvio padrão correspondente por σ (x)
2
Quando a seqüência de dados representa uma amostra, a variância será denotada por s2(x)
e o desvio padrão correspondente por s(x).
O desvio médio simples que indicaremos por DMS é definido como sendo uma média aritmética
do desvio de cada elemento da série para a média da série.
Página 62
DMS = ∑ x i - x
n
DMS = ∑| x i – x | f i .
∑ fi
Xi fi
1 2
3 5
4 2
5 1
Página 63
3º) Caso: Variável Contínua
Nesta situação, por desconhecer os valores individuais dos elementos componentes da série,
substituiremos estes valores x i , pelos pontos médios da classe.
Desta forma, o desvio médio simples tem por cálculo a fórmula:
DMS = ∑ x i – x f i
∑ fi
Exercícios:
Xi fi
2 3
4 8
5 10
6 6
8 2
10 1
σ2 ( x) =
∑ (x i − x) 2
n
Exemplo:
Calcule a variância e o desvio padrão da seqüência: X: 4, 5, 8, 5.
A seqüência contém n= 4 elementos e tem por média:
.
Os quadrados das diferenças (x i - x )2 valem:
Neste caso:
2
S (x)=
∑ (x i − x) 2
n −1
Página 65
e
s(x)= s 2 ( x)
Note que a única diferença entre a fórmula de σ 2 ( x) (indicado para Populações) e s2(x)
(indicado para amostras) é o denominador.
Assim,
S2(x) =
∑ ( xi − x) 2 = 9 = 3 e o desvio padrão s(x) = 3 = 1,73 .
n −1 3
σ 2
( x) =
∑ ( x − x)
i
2
fi
∑f i
e o desvio padrão é:
σ ( x) = σ 2 ( x)
s2(x)=
∑ ( x − x) f
i
2
i
∑ f −1 i
e o desvio padrão é:
s(x) = s 2 ( x)
Exemplo 1:
Calcule a variância da séria abaixo, representativa de uma população.
xi fi
2 3
3 5
4 8
5 4
Exemplo 2:
Página 66
Se a variável discreta fosse representativa de uma amostra, a variância seria indicada por
2
s (x) e seria calculada por:
σ 2 ( x) =
∑ ( x − x)
i
2
fi
∑f i
2
s (x) =
∑ ( x − x) f
i
2
i
∑ f −1 i
Exemplo 1:
Calcule a variância e o desvio padrão para a série representativa de uma População:
Exemplo 2:
Se a variável contínua fosse representativa de uma amostra, a variância seria indicada por
2
s (x) e sua fórmula de cálculo seria:
2
s (x) =
∑ ( x − x) f
i
2
i
∑ f −1 i
Página 67
Exercícios:
4) Calcule a variância e o desvio padrão para o número de acidentes diários, observados em um cruzamento,
durante 40 dias. (Amostra)
5) Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas fiscais emitidas na mesma
data, selecionadas em uma loja de departamentos. (Amostra)
Classe Consumo por nota US$ Nº.de notas
1 0 ├ 50 10
2 50 ├ 100 28
3 100 ├ 150 12
4 150 ├ 200 2
5 200 ├ 250 1
6 250 ├ 300 1
6) Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma classe (população).
Classe Alturas (cm) Nº. de alunos
1 150 ├ 160 2
2 160 ├ 170 15
3 170 ├ 180 18
4 180 ├ 190 18
5 190 ├ 200 16
6 200 ├ 210 1
Página 68
Estatística I
Prof. Luciana Zimmer
Medidas de Posição
As Medidas de Posição nos permitem comparar valores, elas nos dão informações
importantes sobre sobre a posição dos dados dentro do conjunto.
Estudaremos aqui:
Escore Z
Quartis, Decis e Percentis.
Escores z
O escore padronizado, ou escore z, é o número de desvios-padrão pelo qual um valor x
dista da média (para mais ou para menos). Obtém-se como segue:
x−x
z= → Amostra
s
OBS: Arredondar z para duas decimais.
x−µ
z= → População
σ
-3 -2 -1 0 1 2 3
z
Exemplo. As alturas da população de homens adultos têm média µ = 175 cm., desvio-
padrão σ = 7,1 cm. e distribuição em forma de sino. O jogador de basquete Michael Jordan
ganhou reputação de gigante por suas proezas no jogo, mas com 198 cm, ele pode ser
considerado excepcionalmente alto, comparado com a população geral de homens adultos?
Determine o escore z para a altura de 198 cm.
Assim como a mediana divide os dados em duas partes iguais, os três quartis,
denotados por Q 1 , Q 2 e Q 3 , dividem as observações ordenadas (dispostas em ordem
crescente) em quatro partes iguais. Ao grosso modo:
- Q 1 separa os 25% inferiores dos 75% superiores dos valores ordenados;
- Q 2 é a mediana;
- Q 3 separa os 75% inferiores dos 25% superiores dos dados.
Página 69
Mais precisamente, ao menos 25 % dos dados serão no máximo iguais a Q 1 , e ao
menos 75% dos dados serão no mínimo iguais a Q 1 . Ao menos75% dos dados serão no
máximo iguais a Q3 , enquanto ao menos 25 % serão, no mínimo, iguais a Q3 .
Há, finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1%
em cada grupo.
Etapa 3:
A) Se L não for um inteiro, arredonde para cima. O próximo inteiro maior que L denota
a posição do p-ésimo percentil.
B) Se L é um inteiro, o p-ésimo percentil é a média dos valores de dados nas posições
L e L+1.
Uma vez dominados os cálculos para os percentis, podemos seguir o mesmo processo
para calcular os quartis e decis fazendo-se os ajustes relativos. Sendo que:
Quartis Decis
Q1 = P25 D1 = P10
Q2 = P50 D2 = P20
Q3 = P75
D9 = P90
Exemplo. A tabela seguinte representa as alturas (em cm) de 56 alunos de uma classe
de estatística.
Página 70
148 150 152 154 155 157 157 157
158 158 158 159 159 160 160 161
162 162 162 163 163 163 164 164
164 164 165 165 165 165 166 166
166 167 168 168 168 169 169 169
169 170 170 171 171 172 172 173
174 175 176 176 178 178 179 180
Atividades
1. Os carros dos estudantes de certa faculdade têm idade média de 7,9 anos com desvio-padrão
de 3,67 anos, determine os escores z para os carros com as seguintes idades:
a. Um GOL de 12 anos
b. Um Corsa de 2 anos
2. Os números de horas que os calouros passam estudando cada semana têm média de 7,06 h e
desvio-padrão de 5,32 h. Determine o escore z para um calouro que estuda 20 horas por
semana.
Página 71
Calcule:
a) Q 1 b) K 3 c) D 1 d) Q 3 e) P 95
Calcule:
a) Q 1 75 b) D 3 75 c) D 7 75 d) Q 2 75 e) P 98 225
7. Uma empresa produz caixas de papelão para embalagens e afirma que o número de
defeitos por caixa se distribui conforme a tabela:
Nº de defeitos Nº de caixas
0 32
1 28
2 11
3 4
4 3
5 1
Página 72
8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte
distribuição:
Pede-se:
a) O número médio de televisores vendidos por dia.
b) A distribuição de freqüências.
c) A porcentagem de dias em que a venda de televisores é menor que 60.
d) A porcentagem de dias em que a venda de televisores é maior ou igual a 80.
e) O histograma e polígono de freqüências.
f) O número mediano de televisores.
g) A moda
h) A amplitude total da série.
i) O desvio médio simples.
j) A variância.
k) O desvio padrão.
Página 73
Estatística I
Profª Luciana Zimmer
Coeficiente de Variação
Se uma série X apresenta média = 10 e desvio padrão = 2 e uma série Y apresenta média
100 e desvio padrão = 5, do ponto de vista da dispersão absoluta, a série Y apresenta maior
dispersão que a série X.
No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y
que é 5 em relação a 100 é um valor menos significativo que o desvio padrão de X que é 2 em
relação a 10.
Isto nos leva a definir as medidas de dispersão relativas: coeficiente de variação e
variância relativa.
O coeficiente de variação de uma série X é indicado por CV (x) definido por:
CV (x) = σ(x)
x
A variância relativa de uma série X é indicada por V(x) e definida por:
V(x) = = σ2(x)
x2
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade,
é um número puro. Portanto, pode ser expresso em percentual.
Deste modo, se calcular o coeficiente de variação da série X citada no início obteremos:
CV (x) = 2/10 = 0,2 ou 20%
CV (y) = 5/100 = 0,05 ou 5%
Comparando os valores destes dois coeficientes concluímos que a série X admite maior
dispersão relativa.
A medida de dispersão relativa prevalece sobre a medida de dispersão absoluta.
Podemos afirmar que uma série que tem a maior dispersão relativa, tem de modo geral a maior
dispersão.
Concluindo: a série Y apresenta maior dispersão absoluta.
A série X apresenta maior dispersão relativa. Portanto, a série X apresenta maior
dispersão.
Medidas de Assimetria
Simetria
X = Mo = Md
Assimetria à direita
(ou positiva)
Mo Md X
Mo < Md < X
Página 75
Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam valores
inferiores à Moda.
Assimetria à esquerda
(ou negativa)
X Md Mo X < Md < Mo
f
f
x x
Histograma de distribuição
simétrica. Histograma de distribuição
(média = mediana = moda) assimétrica para a direita (positiva).
(média > mediana > moda)
x
Histograma de distribuição assimétrica
para a esquerda (negativa).
(média < mediana < moda)
Página 76
Fórmulas para o cálculo do coeficiente de assimetria: Coeficiente de Pearson
1º Coeficiente de Pearson
AS = 0 diz-se que a distribuição é simétrica
x − Mo
AS = AS > 0 diz-se que a distribuição é assimétrica
S positiva (à direita)
Exercícios de Aplicação
Xi fi
1 2
2 10
3 6
4 4
5 2
6 1
Página 77
4 6
5 10
6 6
7 4
8 2
Classe Int. C. fi
1 3 ├5 1
2 5 ├7 2
3 7 ├9 13
4 9 ├ 11 3
5 11 ├ 13 1
5. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi 78 e o desvio
padrão, 8,0. Em Matemática, entretanto, o grau médio final foi 73 e o desvio padrão, 7,6.
6. Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s= 8,01 cm. O peso
médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg.
Página 78
a) Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
b) Se um indivíduo tem estatura de 175 cm e peso de 65 kg em qual obteve uma posição mais
elevada?
7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com coeficiente de
variação de 3,3%. Qual o desvio padrão desse grupo?
8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte
distribuição:
População
Classe Nº de Nº de dias
televisores
1 0 | 20 5
2 20 | 40 25
2 40 | 60 40
3 60 | 80 15
4 80 | 100 10
5 100 | 120 5
∑
e) Calcule o Q 3 da distribuição.
Página 79
b)
Estaturas (cm) fi
150 158 5
158 166 12
166 174 18
174 182 27
182 190 8
∑ = 70
Página 80
Estatística I
Profª Luciana Zimmer
Coeficiente de Variação
Se uma série X apresenta média = 10 e desvio padrão = 2 e uma série Y apresenta média
100 e desvio padrão = 5, do ponto de vista da dispersão absoluta, a série Y apresenta maior
dispersão que a série X.
No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y
que é 5 em relação a 100 é um valor menos significativo que o desvio padrão de X que é 2 em
relação a 10.
Isto nos leva a definir as medidas de dispersão relativas: coeficiente de variação e
variância relativa.
O coeficiente de variação de uma série X é indicado por CV (x) definido por:
CV (x) = σ(x)
x
A variância relativa de uma série X é indicada por V(x) e definida por:
V(x) = = σ2(x)
x2
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade,
é um número puro. Portanto, pode ser expresso em percentual.
Deste modo, se calcular o coeficiente de variação da série X citada no início obteremos:
CV (x) = 2/10 = 0,2 ou 20%
CV (y) = 5/100 = 0,05 ou 5%
Comparando os valores destes dois coeficientes concluímos que a série X admite maior
dispersão relativa.
A medida de dispersão relativa prevalece sobre a medida de dispersão absoluta.
Podemos afirmar que uma série que tem a maior dispersão relativa, tem de modo geral a maior
dispersão.
Concluindo: a série Y apresenta maior dispersão absoluta.
A série X apresenta maior dispersão relativa. Portanto, a série X apresenta maior
dispersão.
Medidas de Assimetria
Simetria
X = Mo = Md
Assimetria à direita
(ou positiva)
Mo Md X
Mo < Md < X
Página 82
Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam valores
inferiores à Moda.
Assimetria à esquerda
(ou negativa)
X Md Mo X < Md < Mo
f
f
x x
Histograma de distribuição
simétrica. Histograma de distribuição
(média = mediana = moda) assimétrica para a direita (positiva).
(média > mediana > moda)
x
Histograma de distribuição assimétrica
para a esquerda (negativa).
(média < mediana < moda)
Página 83
Fórmulas para o cálculo do coeficiente de assimetria: Coeficiente de Pearson
1º Coeficiente de Pearson
AS = 0 diz-se que a distribuição é simétrica
x − Mo
AS = AS > 0 diz-se que a distribuição é assimétrica
S positiva (à direita)
Exercícios de Aplicação
Xi fi
1 2
2 10
3 6
4 4
5 2
6 1
Página 84
4 6
5 10
6 6
7 4
8 2
Classe Int. C. fi
1 3 ├5 1
2 5 ├7 2
3 7 ├9 13
4 9 ├ 11 3
5 11 ├ 13 1
5. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi 78 e o desvio
padrão, 8,0. Em Matemática, entretanto, o grau médio final foi 73 e o desvio padrão, 7,6.
6. Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s= 8,01 cm. O peso
médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg.
Página 85
a) Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
b) Se um indivíduo tem estatura de 175 cm e peso de 65 kg em qual obteve uma posição mais
elevada?
7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com coeficiente de
variação de 3,3%. Qual o desvio padrão desse grupo?
8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte
distribuição:
População
Classe Nº de Nº de dias
televisores
1 0 | 20 5
2 20 | 40 25
2 40 | 60 40
3 60 | 80 15
4 80 | 100 10
5 100 | 120 5
∑
e) Calcule o Q 3 da distribuição.
Página 86
b)
Estaturas (cm) fi
150 158 5
158 166 12
166 174 18
174 182 27
182 190 8
∑ = 70
Página 87
Aula 12– Estatística I
Profª Luciana Zimmer
PROBABILIDADES
Quando solicitados a estudar um fenômeno coletivo, verificamos a necessidade de descrever tal fenômeno por
um modelo matemático que permita explicar da melhor forma possível este fenômeno.
A teoria das probabilidades permite construir modelos matemáticos que explicam um grande número de
fenômenos coletivos e fornecem estratégias para tomadas de decisões.
Conhecidas certas condições, podemos prever a temperatura em que a água entrará em ebulição e a
velocidade com que o corpo atingirá o solo.
Os experimentos cujos resultados podem ser previstos, isto é, podem ser determinados antes da sua
realização, são denominados experimentos determinísticos.
Se esses experimentos forem repetidos várias vezes, nas mesmas condições, não poderemos prever o seu
resultado.
Experimentos que, ao serem realizados repetidas vezes, nas mesmas condições, apresentarem resultados
variados, não sendo possível, portanto, a previsão lógica dos resultados, são denominados experimentos aleatórios.
Um experimento aleatório apresenta as seguintes características fundamentais:
• Pode repetir-se várias vezes nas mesmas condições;
• É conhecido o conjunto de todos os resultados possíveis;
• Não se pode prever qual o resultado.
Embora teoricamente tenhamos exigido as repetições, nas mesmas condições iniciais, isto na prática
dificilmente ocorre. Mesmo quando procuramos manter as mesmas condições iniciais, pequenas variações ocorrerão.
Isto provocará alterações no resultado final.
→ Se as alterações forem mínimas, para a maioria das aplicações práticas elas poderão ser desprezadas.
Podemos afirmar que o resultado final é único, e classificar o fenômeno como determinísticos.
→ Se estas alterações forem significativas, então o fenômeno será classificado de aleatório.
A teoria das probabilidades só é útil e deve ser aplicada quando lidarmos com fenômeno aleatório.
Portanto, o objeto de estudo da teoria das probabilidades são os fenômenos aleatórios.
Vamos restringir nosso estudo a uma classe de fenômenos aleatórios chamados experimentos, que
possuem as seguintes características:
Página 88
a) Repetitividade: o fenômeno pode ser repetido quantas vezes quisermos. Se por algum motivo não
pudermos repetir sistematicamente o fenômeno, ele não será classificado como experimento.
b) Regularidade: característica que diz respeito à possibilidade da ocorrência dos resultados do fenômeno.
A avaliação numérica da possibilidade de ocorrência desses resultados dará origem às probabilidades.
ESPAÇO AMOSTRAL
Se um procedimento A pode ser realizado de n maneiras diferentes e um procedimento B pode ser realizado
de m maneiras diferentes, então o encadeamento dos procedimentos A e B pode ser feito de n x m maneiras
diferentes.
Isto sugere uma disposição gráfica chamada diagrama de árvore.
Veja:
Diagrama de árvore:
C
C
K
C
K K
EVENTO
1. Considere o espaço amostral do lançamento de um dado e a observação da face superior. Descreva, por
seus elementos, os seguintes eventos:
a) A: sair face par.
b) B: sair face com número primo.
c) C: sair face maior que três.
d) D: sair face maior que 6.
e) E: sair face múltipla de 3.
f) F: sair face menor ou igual a 4.
De modo resumido, podemos afirmar que um evento A ocorre quando ocorrerão uns de seus pontos.
Quando ocorrer que um evento seja C = { } não possui elementos, portanto este evento nunca ocorrerá, é
denominado evento impossível.
O próprio espaço amostral S é sempre um evento, como ele contém todos os possíveis resultados do
experimento, S certamente ocorrerá, neste sentido é denominado evento certo.
Página 89
2. Considere o espaço amostral S= { 1,2,3,4,5,6,7,8,9,10} e os seguintes eventos:
A= { 2, 3, 4} B= { 1, 3, 5, 7, 9} C= { 5 } D= { 1, 2, 3 } E = { 2, 4, 6}
Determine:
a) AUB
b) A∩B
c) A∩C
d) (A ∩ D) U E
c) Distribuição dos 4 filhos de uma família, quanto ao sexo, por ordem de nascimento.
FUNÇÃO PROBABILIDADE
Uma vez identificado o espaço amostral S = { a 1, a 2,... a n } de um elemento, podemos associar a cada elemento
sua possibilidade de ocorrência.
Do ponto de vista matemático, esta associação é uma função chamada função probabilidade, que definiremos
da seguinte forma:
Função Probabilidade é uma função definida no espaço amostral S do experimento, assumindo valores reais,
com as seguintes propriedades:
1. 0 ≤ p(a i ) ≤ 1 i = 1,2,…,n
2. ∑ p(a i ) = 1 i = 1,2,…n
PROBABILIDADE DE UM EVENTO
A probabilidade de ocorrência de um evento A, que indicaremos por p(A), é a soma das probabilidades dos
elementos que pertencem a A.
Exemplo:
Lançamento de um dado e observação da face superior. Determine a probabilidade de cada um dos eventos abaixo:
Página 90
Inicialmente, determinamos o espaço amostral e a função de probabilidade.
O espaço amostral é S= { 1, 2, 3, 4, 5, 6}
A função de probabilidade é dada por:
S __P___R
1 _____ p(1) = 1/6
2 _____ p ( 2) = 1/6
3 _____ p ( 3) = 1/6
4 _____ p ( 4) = 1/6
5 _____ p ( 5) = 1/6
6 _____ p ( 6) = 1/6
Exercícios:
1. O experimento consiste em lançar dois dados e observar a diferença dos pontos das faces superiores. Determine o
espaço amostral do experimento.
2. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores. Determine o
espaço amostral do experimento.
3. O experimento consiste em lançar dois dados e observar, em módulo, a diferença dos pontos das faces superiores.
Determine o espaço amostral do experimento.
4. O experimento consiste em lançar dois dados e observar o dobro da soma dos pontos das faces superiores.
Determine a função de probabilidade.
5. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores. Determine a
função de probabilidade.
6. O experimento consiste no lançamento de dois dados e na observação da soma dos pontos das faces superiores.
Determine o espaço amostral do experimento e a função de probabilidade.
TIPOS DE EVENTOS
1. EVENTOS COMPLEMENTARES
Sabemos que um evento pode ocorrer ou não. Sendo “p” a probabilidade de que ele ocorra (sucesso) e “q” a
probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação:
p+q=1→q=1–p
Página 91
Assim, se a probabilidade de se realizar um evento é p = 1 , a probabilidade de que ele não ocorra é:
5
q=1–p→q=1- 1 = 4 .
5 5
Sabemos que a probabilidade de tirar o 4 no lançamento de um dado é p = 1 . Logo, a probabilidade de não tirar
o 4 no lançamento de um dado é: 6
q=1- 1 = 5 .
6 6
2. EVENTOS INDEPENDENTES
Dizemos que dois eventos são independentes quando a realização ou não-realização de um dos eventos não
afeta a probabilidade da realização do outro e vice-versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no
outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto
das probabilidades de realização dos dois eventos.
Assim, sendo p 1 a probabilidade de realização do primeiro evento e p 2 a probabilidade de realização do segundo
evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por:
p = p1 x p2
Exemplo:
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização
do(s) outro(s).
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos,
já que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das
probabilidades de que cada um deles se realize:
p = p1 + p2
Exemplo:
Página 92
EXERCÍCIOS:
1. Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52 cartas?
2. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas?
5. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do
segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus?
6. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1
verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual a
probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca,
preta e verde?
7. De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a
primeira carta ser o às de paus e a segunda ser o rei de paus?
8. Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52 cartas?
9. Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um baralho de 52
cartas?
11. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.
12. Considere o evento de lançar um par de dados. Suponha em que estejamos interessados na soma dos valores
de face mostrados nos dados.
S ____P___ R
Página 93
2_________ p(2) = 0,2
4 _________ p(4) = 0,4
7_________ p(7) = 0,7
8 _________ p(8) = 0,8 pode ser uma função de probabilidade associada, a este espaço amostral.
14. O quadro abaixo representa a classificação por sexo e por estado civil, de um conjunto de 50 deputados
presente em uma reunião.
SEXO
HOMEM MULHER
ESTADO CIVIL
Casado 10 8
Solteiro 5 3
Desquitado 7 5
Divorciado 8 4
a) A – Ser um homem
b) B – Ser uma mulher
c) C – Ser uma pessoa casada
d) D – Ser uma pessoa solteira
e) E – Ser uma pessoa desquitada
f) F – Ser uma pessoa divorciada
15. Um experimento consiste em sortear um aluno em uma classe pela lista de chamada (1 a 20). Determine a
probabilidade dos seguintes eventos:
16. O experimento consiste em retirar duas cartas de um baralho comum e anotar ordenadamente os naipes
destas cartas. Determine o espaço amostral do experimento.
Página 94