Você está na página 1de 94

C iências

ontábeis

ADMINISTRAÇÃO

Caderno de Estatística I
Dom Alberto
Prof: Luciana Andréa Zimmer
C122 ZIMMER, Luciana Andrea

Caderno de Estatística I Dom Alberto / Luciana Andrea Zimmer. –


Santa Cruz do Sul: Faculdade Dom Alberto, 2010.

Inclui bibliografia.

1. Administração – Teoria 2. Ciências Contábeis – Teoria 3. Estatística I


– Teoria I. ZIMMER, Luciana Andrea II. Faculdade Dom Alberto III.
Coordenação de Administração IV. Coordenação de Ciências Contábeis
V. Título

CDU 658:657(072)

Catalogação na publicação: Roberto Carlos Cardoso – Bibliotecário CRB10 010/10

Página 2
PREFÁCIO

A arte de ensinar e aprender pressupõe um diálogo entre aqueles que


interagem no processo, como alunos e professores. A eles cabe a tarefa de
formação, de construção de valores, habilidades, competências necessárias à
superação dos desafios. Entre estes se encontra a necessidade de uma
formação profissional sólida, capaz de suprir as demandas de mercado, de
estabelecer elos entre diversas áreas do saber, de atender às exigências legais
de cada área de atuação, etc.

Nesse contexto, um dos fatores mais importantes na formação de um


profissional é saber discutir diversos temas aos quais se aplicam
conhecimentos específicos de cada área, dispondo-se de uma variedade ampla
e desafiadora de questões e problemas proporcionada pelas atuais
conjunturas. Para que isso se torne possível, além da dedicação daqueles
envolvidos no processo de ensino-aprendizagem, é preciso haver suporte
pedagógico que dê subsídios ao aprender e ao ensinar. Um suporte que
supere a tradicional metodologia expositiva e atenda aos objetivos expressos
na proposta pedagógica do curso.

Considerando esses pressupostos, a produção desse Caderno Dom


Alberto é parte da proposta pedagógica do curso da Faculdade Dom Aberto.
Com este veículo, elaborado por docentes da instituição, a faculdade busca
apresentar um instrumento de pesquisa, consulta e aprendizagem teórico-
prática, reunindo materiais cuja diversidade de abordagens é atualizada e
necessária para a formação profissional qualificada dos alunos do curso.
Ser um canal de divulgação do material didático produzido por
professores da instituição é motivação para continuar investindo da formação
qualificada e na produção e disseminação do que se discute, apresenta, reflete,
propõe e analisa nas aulas do curso. Espera-se que os leitores apreciem o
Caderno Dom Alberto com a mesma satisfação que a Faculdade tem em
elaborar esta coletânea.

Elvis Martins
Diretor Acadêmico de Ensino

Página 3
Apresentação

O Curso de Administração da Faculdade Dom Alberto iniciou sua


trajetória acadêmica em 2004, após a construção de um projeto pautado na
importância de possibilitar acesso ao ensino superior de qualidade que,
combinado à seriedade na execução de projeto pedagógico, propiciasse uma
formação sólida e relacionada às demandas regionais.
Considerando esses valores, atividades e ações voltadas ao
ensino sólido viabilizaram a qualidade acadêmica e pedagógica das aulas, bem
como o aprendizado efetivo dos alunos, o que permitiu o reconhecimento pelo
MEC do Curso de Administração em 2008.
Passados seis anos, o curso mostra crescimento quantitativo e
qualitativo, fortalecimento de sua proposta e de consolidação de resultados
positivos, como a publicação deste Caderno Dom Alberto, que é o produto do
trabalho intelectual, pedagógico e instrutivo desenvolvido pelos professores
durante esse período. Este material servirá de guia e de apoio para o estudo
atento e sério, para a organização da pesquisa e para o contato inicial de
qualidade com as disciplinas que estruturam o curso.
A todos os professores que com competência fomentaram o
Caderno Dom Alberto, veículo de publicação oficial da produção didático-
pedagógica do corpo docente da Faculdade Dom Alberto, um agradecimento
especial.

Lucas Jost
Diretor Geral

Página 4
Sumário

Apresentação 03

Prefácio 04

Plano de Ensino 06

Aula 1
Estatística básica 10
Aula 2
Descrição de populações e amostras com tabelas 17
Aula 3
Distribuições de freqüências 23
Aula 4
Representação Gráfica I 29
Aula 5
Medidas de tendência central 44
Aula 6
Continuação Aula 5 54
Aula 7
Continuação Aula 5 58
Aula 8
Medidas de dispersão 62
Aula 9
Coeficiente de Variação 74
Aula 10
Continuação Aula 9 77
Aula 11
Continuação Aula 9 81
Aula 12
Probabilidades 88

Página 5
Centro de Ensino Superior Dom Alberto

Plano de Ensino
Identificação
Curso: Administração/Ciências Contábeis Disciplina: Estatística I
Carga Horária (horas): 60 Créditos: 4 Semestre: 2º

Ementa
População e Amostra. Séries Estatísticas. Gráficos Estatísticos. Distribuição de Freqüência. Tipos de
Médias. Medidas de Variabilidade. Medidas de Dispersão. Probabilidade.

Objetivos
Geral: Desenvolver processos cognitivos e a aquisição de atitudes possibilitando o aluno a criar hábito de
investigação e confiança para enfrentar situações novas e formar uma visão ampla e científica da realidade.

Específicos: Compreender os conceitos de população, amostra e variável. Construir, ler, analisar e


interpretar vários tipos de gráficos. Resolver problemas que envolvam os conceitos de estatística.
Determinar a probabilidade de um evento num espaço amostra finito, independente da experimentação.
Compreender e aplicar o conceito de distribuição binomial no cálculo de probabilidades.

Inter-relação da Disciplina
Horizontal: As aplicações da disciplina são processadas de forma a adaptar o conhecimento teórico a uma
situação prática e interdisciplinar ajustada a realidade dos negócios na economia brasileira.

Vertical: Despertar o interesse do aluno na interpretação de dados com vista na utilização de instrumentos
capazes de fornecer um conhecimento científico, no que se refere ao pleno entendimento e leitura de
dados.

Competências Gerais
Reconhecer e definir problemas, equacionar soluções, pensar estrategicamente, introduzir modificações no
processo produtivo, atuar preventivamente, transferir e generalizar conhecimentos e exercer, em diferentes
graus de complexidade, o processo da tomada de decisão;

Desenvolver raciocínio lógico, crítico e analítico para operar com valores e formulações matemáticas
presentes nas relações formais e causais entre fenômenos produtivos, administrativos e de controle, bem
assim expressando-se de modo crítico e criativo diante dos diferentes contextos organizacionais e sociais;

Competências Específicas
Identificar problemas específicos, da estatística descritiva, ler, compreender e interpretar dados.
Coletar e organizar dados.

Habilidades Gerais
Reconhecer e definir problemas, organizar, compreender e interpretar gráficos e demais dados estatísticos
referentes a estatística descritiva.

Habilidades Específicas
Conhecer métodos estatísticos para descrever, analisar e interpretar os dados referentes a estatística
descritiva.

Conteúdo Programático
PROGRAMA
1. Introdução a Estatística;
2. Natureza dos dados: variáveis quantitativas e qualitativas; variáveis discretas e contínuas;
3. População e Amostra;
4. Amostragem: conceitos e tipos;
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”. Página 6
5. Dados absolutos e relativos;
6. Tabelas: conceitos; ROL; elementos essenciais; construção;
7. Séries estatísticas;
8. Gráficos: principais tipos; análise; histogramas;
9. Distribuição de freqüências: intervalos de classes; freqüências: absolutas, relativas e acumuladas;
10. Medidas de tendência central:
- Médias: aritmética, geométrica, ponderada e móvel
- Mediana
- Moda
- Ponto médio.
11. Medidas de posição:
- Escore z
- Quartis, decis e percentis.
12. Medidas de variação:
- Amplitude
- Desvio-padrão
- Variância.
13. Medidas de Assimetria e Curtose..
14. Probabilidade:
- Experimentos
- Espaço amostral
- Eventos
- Arranjos e Combinações.
15. Números índices

Estratégias de Ensino e Aprendizagem (metodologias de sala de aula)


O planejamento do trabalho em sala de aula é à base da construção do processo de ensino e
aprendizagem. Planejando a ação, o professor tem a possibilidade de saber exatamente qual o ponto de
partida e o de chegada para cada tema abordado em seu curso.

Um planejamento não é um esquema de trabalho rígido, inflexível. Pelo contrário, devem-se levar em conta
as situações inesperadas que vão ocorrendo e adaptar ou modificar o que se havia inicialmente previsto, de
acordo com suas observações de classe e necessidades dos alunos.

Há metas que devem ser estabelecidas e alcançadas, sendo necessário que o professor disponha de um fio
condutor para a ação que vai desenvolver e de uma previsão para os resultados dessa ação.

Avaliação do Processo de Ensino e Aprendizagem


A avaliação do processo de ensino e aprendizagem deve ser realizada de forma contínua, cumulativa e
sistemática com o objetivo de diagnosticar a situação da aprendizagem de cada aluno, em relação à
programação curricular. Funções básicas: informar sobre o domínio da aprendizagem, indicar os efeitos da
metodologia utilizada, revelar conseqüências da atuação docente, informar sobre a adequabilidade de
currículos e programas, realizar feedback dos objetivos e planejamentos elaborados, etc.

A forma de avaliação será da seguinte maneira:

1ª Avaliação
– Peso 8,0 (oito): Prova;
– Peso 2,0 (dois): Trabalho referente ao conteúdo ministrado até a 1a avaliação.
2ª Avaliação
- Peso 8,0 (oito): Prova;
- Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas
provas do SPE)
Observação: As provas do SPE deverão ser realizadas até o dia 30/09/2010 (1ª prova SPE) e até o dia
30/11/2010 (2ª prova SPE), sendo obrigatória a realização de ao menos uma prova.

Avaliação Somativa
A aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez,
permitindo-se a fração de 5 décimos.
O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por ele
obtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas.
Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina no
Página 7
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
bimestre.

O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários,
pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de uma
nota representativa de cada avaliação bimestral.
Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete
(7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados.
Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral,
no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim de
substituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem como
média final de aprovação igual ou superior a cinco (5,0).

Sistema de Acompanhamento para a Recuperação da Aprendizagem


Serão utilizados como Sistema de Acompanhamento e Nivelamento da turma os Plantões Tira-Dúvidas que
são realizados sempre antes de iniciar a disciplina, das 18h30min às 18h50min, na sala de aula.

Recursos Necessários
Humanos
Professor.
Físicos
Laboratórios, visitas técnicas, etc.
Materiais
Recursos Multimídia.

Bibliografia
Básica
CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002.

SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciências
contábeis. São Paulo: Atlas, 1999. 1 e 2 v.

MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003.

TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.

SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: Pearson Education, 1994.

Complementar
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002.

MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005.

BUNCHAFT G.; KELLNER S. R. O. Estatística sem mistério. Petrópolis: Vozes; 1999.

FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996.

MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990.
Periódicos
Jornais: Gazeta do Sul, Zero Hora.
Revistas: Veja, Isto é.
Sites para Consulta
http://www.mec.gov.br
http://www.ime.usp.br
http://www.ibge.gov.br
Outras Informações
Endereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca:
http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por

Página 8
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Cronograma de Atividades
Aula Consolidação Avaliação Conteúdo Procedimentos Recursos
Apresentação do plano de ensino. Introdução a estatística.
1ª AE QG, AP, DS
Natureza dos dados: tipos de variáveis; População e Amostra;
2ª Amostragem: conceitos e tipos; Dados absolutos e relativos; AE, TI AP, QG, DS
Tabelas: conceitos; ROL; elementos essenciais; construção;
3ª AE AP, QG, DS
Séries estatísticas;
4ª Gráficos: principais tipos; análise; histogramas; AE AP, QG, DS
Distribuição de freqüências:intervalos de classes;
5ª AE AP, QG
freqüências: absolutas, relativas e acumuladas;
Distribuição de freqüências:intervalos de classes;
6ª AE, TI AP, QG
freqüências: absolutas, relativas e acumuladas;
Medidas de tendência central: Médias: aritmética, geométrica,
7ª PA, AE AP, QG
ponderada e móvel
1 Consolidação 1. AE AP, QG

1 1ª Avaliação.

8ª Medidas de tendência central: Mediana; Moda; Ponto médio. AE AP, QG

9ª Medidas de posição: Escore z; Quartis, decis e percentis. AE AP, QG

10ª Medidas de variação: amplitude; desvio-padrão e variância. AE AP, QG

11ª Medidas de Assimetria e Curtose. Números índices. AE, TG AP, QG, DS


Números índices. Probabilidade: Experimentos; Espaço
12ª AE AP, QG, DS
amostral; Eventos;
13ª Probabilidade: Arranjos e Combinações. AE AP, QG

2 Consolidação 2. AE AP, QG

2 2ª avaliação.

3 Avaliação substituta.

Legenda
Código Descrição Código Descrição Código Descrição
AE Aula expositiva QG Quadro verde e giz LB Laboratório de informática
TG Trabalho em grupo RE Retroprojetor PS Projetor de slides
TI Trabalho individual VI Videocassete AP Apostila
SE Seminário DS Data Show OU Outros
PA Palestra FC Flipchart

Página 9
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Aula 1 – Estatística I
Prof. Luciana Zimmer

ESTATÍSTICA BÁSICA

1. INTRODUÇÃO

O que a Estatística significa para você?

ESTATÍSTICA: é a ciência dos dados. Ela envolve coletar, classificar, resumir, organizar, analisar e interpretar
informação numérica.

ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos, faziam estimativas das
riquezas individual e social, distribuíam terras ao povo, cobravam impostos.

Aspectos Gerais

A estatística é uma coleção de métodos e técnicas para planejar experimentos, obter dados e organizá-los,
resumi-los, analisá-los, interpretá-los e deles extrair conclusões. Então, tudo que tratar, por pouco que seja, de coleta,
processamento, interpretação e apresentação de dados pertence ao domínio da Estatística, assim como o
planejamento detalhado que precede todas essas atividades.
Há várias razões pelas quais a abrangência da Estatística e a necessidade de estudar a Estatística tem
crescido enormemente nos últimos cinqüenta anos. Uma razão é a abordagem crescentemente quantitativa utilizada
em todas as ciências, bem como na administração e em muitas outras atividades que afetam diretamente nossas
vidas. Isso inclui o uso de técnicas matemáticas na avaliação de controle de poluição, no planejamento de inventários,
na análise de padrões do transito de veículos, no estudo dos efeitos de vários tipos de medicamentos, na avaliação de
técnicas de ensino, na análise do comportamento competitivo de administradores e governos, no estudo de dieta de
longevidade, e assim por diante.
A origem da Estatística moderna remonta em duas áreas de interesse que, na aparência, pouco tem em
comum: governo (ciência política) e jogos de azar. Os governos vêm, de longa data, utilizando recenseamento para
contar indivíduos e propriedades, e o problema de descrever, resumir e analisar dados de censos levou ao
desenvolvimento de métodos que, no início, consistiam principalmente na apresentação de dados em forma de
tabelas e gráficos, constituem o que hoje denominamos estatística descritiva. Esta inclui tudo relacionado com
dados que seja projetado para resumir ou descrever dados, mas sem ir além, ou seja, sem procurar inferir qualquer
coisa que vá além dos próprios dados.

• A Estatística descritiva utiliza métodos numéricos e gráficos para detectar padrões em um conjunto
de dados, para resumir a informação revelada em um conjunto de dados para apresentar a
informação de uma forma conveniente.

Embora a estatística descritiva seja um ramo importante da Estatística e continua sendo amplamente
utilizada, as informações estatísticas quase sempre são obtidas de amostras (pequena parte da população), e isso
significa que sua análise exige generalizações que vão além dos dados. Assim, passamos de métodos que
meramente descrevem para métodos que servem para fazer generalizações, ou seja, uma mudança de ênfase da
estatística descritiva para a inferência estatística. Tais métodos são necessários, por exemplo, para prever
resultados.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.

Página 10
• A Estatística inferencial utiliza uma amostra de dados para fazer estimativas, tomar decisões,
previsões ou outras generalizações acerca de um conjunto maior de dados.

A coleta, a organização ,a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à


ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, associado a uma margem de
incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a medida da
incerteza ou métodos que se fundamentam na teoria da probabilidade.

2. A natureza dos dados estatísticos


Dados numéricos ou dados quantitativos. São obtidos medindo ou contando, por exemplo, pesos de
ratos utilizados num experimento (obtidos medindo) ou as faltas diárias de alunos numa turma ao longo do ano letivo
(obtidos contando).

Podemos descrever os dados quantitativos distinguido entre discreto e contínuo.

• Dados discretos. Resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável


desses valores. (ou seja, números inteiros.). Ex.: números de ovos que as galinhas põem.
• Dados contínuos. Resultam de um número infinito de valores possíveis que podem ser associados a
pontos em uma escala contínua. Ex: quantidade de leite que as vacas produzem.

Dados categóricos ou dados qualitativos. Resultam de descrições, por exemplo, grupos sanguíneos,
estado civil ou na religião de pacientes de um hospital.

Exemplos -

. Cor dos olhos das aluna: qualitativa

. Produção de café no Brasil: quantitativa contínua

. Número de defeitos em aparelhos de TV: quantitativa discreta

. Comprimento dos pregos produzidos por uma empresa: quantitativa contínua

. O ponto obtido em cada jogada de um dado: quantitativa discreta

3. Populações e Amostras
Quando dissemos que a escolha de uma descrição estatística pode depender da natureza dos dados,
estamos nos referindo, entre outras coisas, à seguinte distinção: se um conjunto de dados consiste em todas as
observações possíveis de um dado fenômeno, dizemos que é uma população; se um conjunto de dados consiste em
apenas uma parte da população, dizemos que é uma amostra.
Originalmente, a Estatística tratava apenas da descrição de populações humanas, resultados de censos.
Mas, à medida que seus objetivos se ampliaram, o termo “população” passou a ter a conotação muito mais ampla. Em
Estatística, “população” é um temo técnico com um significado próprio.
Podemos designar como população qualquer grupo de elementos, depende do contexto em que os itens
serão considerados. Suponhamos, por exemplo, que nos ofereçam um lote com 400 ladrilhos de cerâmicas, que
podemos comprar ou não, dependendo de sua resistência. Se medirmos a resistência à quebra de 20 desses ladrilhos
para estimar a resistência média de todos os ladrilhos, essas 20 mensurações constituem uma amostra da população
que consiste nas resistências de todos os 400 ladrilhos. Em outro contexto, se pensarmos em firmar um contrato de

Página 11
longo prazo para o fornecimento de dezenas de milhares desses ladrilhos, consideraríamos como apenas uma
amostra o conjunto das resistências dos 400 ladrilhos originais.
Distinguiremos ainda dois tipos de populações, as populações finitas e as populações infinitas.
Populações finitas. Consiste em um número finito, ou fixo, de elementos, medidas ou observações.
Exemplos: pesos líquidos de 3000 latas de tintas de um certo lote de produção; pontos obtidos por todos os
candidatos no vestibular de 2008 numa certa universidade.
Populações infinitas. Contém, pelo menos hipoteticamente, um número infinito de elementos. Por exemplo:
quando medimos repetidamente o ponto de ebulição de um composto de silicone (não há limite para o número de
vezes que podemos medir); quando observamos os totais obtidos em repetidas jogadas de um par de dados (não há
limite para o número de vezes que podemos jogar um par de dados).

4. Planejamento da amostra e amostragem


Em Estatística, um planejamento de amostra é um plano definido, completamente determinado antes da
coleta de quaisquer dados, de obter uma amostra de uma dada população. Assim, o plano para extrair uma amostra
aleatória simples de tamanho 12 das 247 farmácias de uma cidade, utilizando uma tabela de números aleatórios de
uma maneira predeterminada, constitui um planejamento de amostra.
Basicamente, existem dois métodos para composição da amostra: probabilístico e não probabilístico ou
intencional.

4.1 Métodos Probabilísticos


O método de amostragem probabilística exige que cada elemento da população possua determinada
probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da
população, a probabilidade de cada elemento será 1/N. Trata-se do método que garante cientificamente a aplicação
das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar
inferências induções sobre a população a partir do conhecimento da amostra.

4.1.1 Amostragem Aleatória


Em uma amostra aleatória, os elementos da população são escolhidos de tal forma que cada um deles
tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de n elementos, de maneira que
toda a mostra de tamanho n possível tenha a mesma chance de ser escolhida.)
As amostras aleatórias podem ser escolhidas por diversos métodos, inclusive a utilização de tabelas de
números aleatórios e de computadores para gerar números aleatórios. Com a amostragem aleatória, espera-se que
todos os grupos da população sejam representados na amostra de forma aproximadamente proporcional. Uma
amostragem descuidada pode facilmente resultar em uma amostra tendenciosa, com características assaz diferentes
das da população que a originou. Em contrapartida, a amostragem aleatória é cuidadosamente planejada para evitar
qualquer tendenciosidade. Por exemplo, a utilização de catálogos telefônicos elimina automaticamente todos aqueles
cujos telefones não figurem no catálogo, e a exclusão desse segmento da população pode facilmente conduzir a
resultados falsos. Há cidades que, por exemplo, 42,5% dos números de telefones não estão no catálogo. Os
pesquisadores costumam contornar esse problema utilizando computadores para gerar números de telefone, de modo
que todos os números sejam possíveis. Eles devem também ter o cuidado de incluir os que inicialmente não foram
encontrados ou se recusaram a responder. Uma empresa constatou que a taxa de recusa para entrevistas telefônicas
é em geral de 20%, no mínimo. O fato de ignorarmos os que inicialmente se recusam a responder pode concorrer
para que nossa amostra seja tendenciosa.

4.1.2 Amostragem Estratificada


Com a amostragem estratificada, subdividimos a população em, no mínimo, duas sub populações (ou
estratos) que compartilham das mesmas características (como sexo) e, em seguida, extraímos uma amostra de cada
estrato.
Em uma pesquisa sobre a Emenda Constitucional da Igualdade de Direitos, poderíamos utilizar o sexo como
base para a criação de dois estratos. Após obter uma relação dos homens e uma relação das mulheres, aplicamos um
método conveniente (como a amostragem aleatória) para escolher determinado número de elementos de cada
relação. Quando os diversos estratos têm tamanhos amostrais que refletem a população global, temos o que se
Página 12
chama amostragem proporcional. No caso de alguns estratos não serem representados na proporção adequada
então os resultados poderão ser ajustados ou ponderados convenientemente.
Para um tamanho fixo de amostra, se escolhemos aleatoriamente elementos de diferentes estratos, temos
chance de obter resultados mais consistentes (e menos variáveis) do que com a simples escolha de uma amostra
aleatória de toda a população. Por essa razão, costuma-se usar a amostragem estratificada para reduzir a variação
nos resultados.

4.1.3 Amostragem Sistemática


Quando se conhece uma listagem dos elementos da população pode-se obter uma amostra aleatória de n
elementos dividindo-se o número de elementos da população pelo tamanho da amostra.
N
k=
n

Escolhemos um ponto de partida, que deve ser um valor entre 1 e k e a partir de então selecionamos cada
k elemento da população para fazer parte da amostra.
− ésimo

Por exemplo, se a Motorola quisesse fazer uma pesquisa sobre seus 107.000 empregados, poderia partir de
uma relação completa dos mesmos e selecionar cada 100º empregado, obtendo uma amostra de 1.070 elementos.
Esse método é simples e utilizado com freqüência.

4.1.4 Amostragem por Conglomerado


Na amostragem por conglomerados, começamos dividindo a área da população em seções (ou
conglomerados); em seguida escolhemos algumas dessas seções e, finalmente, tomamos todos os elementos das
seções escolhidas.
Uma diferença importante entre a amostragem por conglomerados e a amostragem estratificada é que a
amostragem por conglomerados utiliza todos os elementos dos conglomerados selecionados, enquanto a amostragem
estratificada utiliza uma amostra de membros de cada estrato. Pode-se encontrar um exemplo de amostragem por
conglomerado em uma pesquisa pré-eleitoral, onde escolhemos aleatoriamente 30 zonas eleitorais e pesquisamos
todos os elementos de cada uma das zonas escolhidas. Esse método é muito mais rápido e menos dispendioso do
que a escolha de um indivíduo de cada uma das inúmeras zonas da área populacional. Os resultados podem ser
ajustados ou ponderados para corrigir qualquer representação desproporcionada de grupos. A amostragem por
conglomerados é extensamente utilizada pelo governo e por organizações particulares de pesquisa.

4.2 Métodos não Probabilísticos


São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar
os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a
representatividade da população.

4.2.1 Amostragem Acidental


Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se
obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os
entrevistados são acidentalmente escolhidos.

4.2.2 Amostragem Intencional


De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor
a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Por
exemplo, numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de
beleza e entrevista as pessoas que ali se encontram.

Página 13
4.2.3 Amostragem de Conveniência
Na amostragem de conveniência, simplesmente utilizamos resultados que já estão disponíveis.
Em alguns casos, os resultados da amostragem de conveniência podem ser muito bons, mas em outros
casos podem apresentar séria tendenciosidade. Ao fazer uma pesquisa sobre pessoas canhotas, seria conveniente
um estudante pesquisar seus próprios colegas de classe, porque estão ao seu alcance imediato. Mesmo que tal
amostra não seja aleatória, os resultados devem ser bem satisfatórios. Em contrapartida, poderia ser muito
conveniente (e talvez mesmo lucrativo) para a ABC News fazer uma pesquisa pedindo aos espectadores que liguem
para um número de telefone “900” para registrar suas opiniões, mas essa pesquisa seria auto-selecionada e os
resultados seriam provavelmente tendenciosos
Um erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais
erros resultam de flutuações amostrais aleatórias.
Ocorre um erro não-amostral quando os dados amostrais são coletados, registrados ou analisados
incorretamente. Tais erros resultam de um erro que não seja uma simples flutuação amostral aleatória, como a
escolha de uma amostra não aleatória e tendenciosa, a utilização de um instrumento de mensuração defeituoso, um
grande número de recusas de resposta ou a cópia incorreta dos dados amostrais.
Se extrairmos uma amostra cuidadosamente, de forma que ela represente realmente a população, podemos
aplicar os métodos descritos neste livro para analisar o erro amostral, mas devemos ter o máximo de cuidado em
minimizar os erros não-amostrais.

Exercício:

1- Classifique a variável como quantitativa discreta ou quantitativa contínua:


a) População: funcionários de uma empresa. Variável: salários mensais.

b) População: computadores produzidos por uma empresa. Variável: número de peças usadas.

c) População: jogadores de basquete de um clube. Variável: estatura.

2 . Classifique as variáveis em qualitativas ou quantitativas contínuas ou discretas:


a) População: alunos de uma escola.
Variável: cor dos cabelos
b) População: casais residentes em uma cidade.
Variável: número de filhos.

c) População: as jogadas de um dado.


Variável: o ponto obtida em cada jogada.

d) População: peças produzidas por certa máquina.


Variável: número de peças produzidas por hora.
e) População: peças produzidas por certa máquina.
Variável: diâmetro externo.

3 - uma agência de turismo tem 2.500 clientes cadastrados. Para melhor atendê-los, foi pesquisada a preferência em
relação ao tempo de duração, ao preço, ao número de acompanhantes, ao número de passeios e à qualidade dos
serviços prestados em uma viagem. Foram consultados de modo imparcial, 700 pessoas.
a) Quantas pessoas têm a população estatística envolvida nessa pesquisa?

b) A amostra pesquisada foi de quantas pessoas?

c) Quais foram as variáveis qualitativas pesquisadas?

Página 14
4- Quais são as etapas básicas do método estatístico?

5. Uma concessionária de automóveis tem cadastrados 3500 clientes e fez uma pesquisa sobre a preferência de
compra em relação a “cor”(branco, vermelho ou azul), “preço”, “número de portas”(duas ou quatro) e “estado de
conservação” (novo ou usado). Foram consultados 210 clientes. Diante dessas informações, responda:
a) Qual é o universo estatístico e qual é a amostra dessa pesquisa?
b) Quais são as variáveis e qual é o tipo de cada uma?
c) Quais os possíveis valores da variável “cor” nessa pesquisa?

6. Ao nascer, os bebês são pesados e medidos, para se saber se estão dentro das tabelas de peso e altura
esperados. Estas duas variáveis são:
a) Qualitativas
b) Ambas discretas.
c) Ambas contínuas.
d) Contínua e discreta, respectivamente.
e) Discreta e contínua, respectivamente.

7. Para cada uma das seguintes variáveis aleatórias, determine se a variável é quantitativa ou qualitativa. Se
quantitativa, determine se a variável de interesse é discreta ou contínua.
a. Número de telefones por domicílio.
b. Tipo de telefone mais utilizado.
c. Número de chamadas de longa distância realizadas por mês.
d. Duração (em minutos) da mais demorada chamada de longa distância.
e. Cor do telefone mais utilizado.
f. Quantia em dinheiro gasto com livros.
g. Número de livros didáticos comprados.
h. Tempo gasto na livraria.
i. Sexo.
j. Principal matéria acadêmica.
k. Número de créditos matriculados para o semestre corrente.
l. Método de pagamento na livraria.
m. Nome do provedor de internet.
n. Tarifa mensal do serviço de internet.
o. Quantidade de tempo gasto por semana navegando na internet.
p. Número semanal de e-mails recebidos.
q. Número mensal de compras on-line.
r. Total gasto em compras on-line.
s. Quantia gasta no mês passado com vestuário.
t. Número de agasalhos que possui.
u. Quantia de tempo gasto no mês passado comprando vestuário.
v. Horário mais provável para compra de vestuário (comercial, à noite ou fim de semana).
w. Loja de departamento preferida.
x. Número de pares de meias que possui.
y. Número de alunos matriculados na disciplina de Estatística I.
z. Disciplinas disponíveis para cursar no semestre corrente.

8. Identifique o tipo de amostragem utilizada: aleatória, estratificada, sistemática, por conglomerado ou conveniência.
a. Ao escrever um livro, o autor baseou suas conclusões em 4.500 respostas a 100.000 questionários
distribuídos a mulheres.
b. Um sociólogo seleciona 12 homens e 12 mulheres de cada uma de quatro turmas de inglês.
c. Um cabo eleitoral escreve o nome de cada senador em cartões separados, mistura-os e extrai 10.
Página 15
d. Um programa de Planejamento Familiar pesquisa 500 homens e 500 mulheres sobre seus pontos de vista
sobre o uso de anticoncepcionais.
e. Um pesquisador médico de uma Universidade entrevista todos os portadores de leucemia em cada um de 20
hospitais selecionados aleatoriamente.
f. Obtém-se uma amostra de um produto extraindo-se cada 100ª unidade de linha de montagem.
g. Geram-se números aleatórios em um computador para selecionar números de série de carros a serem
escolhidos para uma amostra de teste.
h. Um fornecedor de peças para automóvel obtém uma amostra de todos os itens de cada um de 12
fornecedores selecionados aleatoriamente.
i. Um fabricante de automóveis faz um estudo de mercado compreendendo testes de direção feitos por uma
amostra de 10 homens e 10 mulheres em cada uma de quatro diferentes faixas etárias.
j. Um fabricante de automóveis faz um estudo de mercado entrevistando clientes em potencial que solicitam
teste de direção a um revendedor local.

Página 16
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Aula 2 – Estatística I

Profª Luciana Zimmer

DESCRIÇÃO DE POPULAÇÃOES E AMOSTRAS COM TABELAS

Representação tabular

Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que
tenhamos uma visão global da variação dessa ou dessas variáveis, apresentando esses valores em tabelas e
gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos
determinações administrativas e pedagógicas mais coerentes e científicas.

TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira
sistemática.

• De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :
 um traço horizontal ( - ) quando o valor é zero;
 três pontos ( ... ) quando não temos os dados;
 zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada;
 um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor.

Obs.: O lado direito e esquerdo de uma tabela oficial deve ser aberto.

Elementos Essenciais e Facultativos de uma Tabela:


Podemos determinar que uma tabela estatística é formada por elementos facultativos e por elementos
essenciais:

ELEMENTOS ESSENCIAIS ELEMENTOS FACULTATIVOS


Título: É a parte superior que procede a tabela Fonte: É a indicação da entidade responsável
e que contém a designação do fato observado, o local e pelo fornecimento dos dados.
a época em que foi registrado.
Corpo: É o conjunto de colunas e linhas, Notas: São as informações destinadas a
respectivamente, em ordem vertical e horizontal, que esclarecer o conteúdo das tabelas.
contém as informações sobre o fato observado.
Cabeçalho: É a parte da tabela que especifica Chamadas: São as informações utilizadas para
o conteúdo das colunas. esclarecer certas minúcias em relação as linhas e
colunas.
Coluna Indicadora: É a parte da tabela que Obs. Todos os elementos facultativos de uma
especifica o conteúdo das colunas no sentido vertical. representação tabular estão situados no rodapé.
Linhas: Retas imaginárias que facilitam a
leitura, no sentido horizontal, de dados que se inscrevem
nos seus cruzamentos com as colunas.
Casa ou Cédula: Espaço destinado a um só
número.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 17
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Fonte: IBGE ( rodapé)

Listando dados numéricos

Em geral, listar, e portanto, organizar dados é a primeira etapa em qualquer tipo de análise estatística.
Como situação típica, consideremos os dados seguintes, que representam o comprimento (em centímetros) de 60
sardinhas pescadas em uma colônia de pescadores:

17,2 18,8 20,7 22,6 18,6 18,3 22,7 24,0 20,0 22,4
16,5 17,8 17,9 24,7 20,7 20,9 25,0 21,0 17,2 18,4
16,5 18,5 20,7 20,0 21,9 17,6 23,4 16,5 24,0 22,5
20,0 22,8 21,4 19,2 22,5 20,8 24,4 17,0 18,9 16,7
17,8 22,7 24,7 22,7 22,4 18,3 24,2 23,1 16,7 16,1
24,2 21,0 24,4 18,8 17,5 18,8 17,2 24,6 21,2 18,6

A coleta desses dados por si só já não é tarefa simples, mas deveria ser evidente que é preciso fazer muito
mais para tornar os números compreensíveis. Seria interessante se soubéssemos os valores extremos (menor e
maior valor). Ocasionalmente, é útil dispor os dados de maneira crescente ou decrescente. A listagem a seguir dos
comprimentos das sardinhas está arranjada em ordem crescente:

16,1 16,5 16,5 16,5 16,7 16,7 17,0 17,2 17,2 17,2
17,5 17,6 17,8 17,8 17,9 18,3 18,3 18,4 18,5 18,6
18,6 18,8 18,8 18,8 18,9 19,2 20,0 20,0 20,0 20,7
20,7 20,7 20,8 20,9 21,0 21,0 21,2 21,4 21,9 22,4
22,4 22,5 22,5 22,6 22,7 22,7 22,7 22,8 23,1 23,4
24,0 24,0 24,2 24,2 24,4 24,4 24,6 24,7 24,7 25,0

Esta listagem de dados ordenados, também, no meio estatístico como ROL.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 18
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em
função da época, do local ou da espécie.

SÉRIES HOMÓGRADAS: são aquelas em que a variável descrita apresenta variação discreta ou descontínua.
Podem ser do tipo temporal, geográfica ou específica.

Séries históricas, cronológicas ou temporais


É a série cujos dados estão dispostos em correspondência com o tempo, ou seja, varia o tempo e
permanece constante o fato e o local.

Tabela 1. PREÇO DO ACÉM NO VAREJO Tabela 2. Produção de Petróleo Bruto no Brasil


EM SÃO PAULO – 1989-94 De 1976 a 1980 (x1000m3)
ANOS PREÇO MÉDIO (US$) Anos Produção
1989 2,24 1976 9.702
1990 2,73 1977 9.332
1991 2,12 1978 9.304
1992 1,89 1979 9.608
1993 2,04 1980 10.562
1994 2,62 Fonte: Conjuntura Econômica (fev. 1983)
Fonte: APA

Séries geográficas, espaciais, territoriais ou de localização

É a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e permanece
constante a época e o fato.

Tabela 3. EXPORTAÇÃO BRASILEIRA


1985
IMPORTADORES (%) Tabela 4. População Urbana do Brasil em
América Latina 13,0 1980(x1000)
EUA e Canadá 28,2 Região Produção
Europa 33,9
Norte 3.037
Ásia e Oceania 10,9
Nordeste 17.568
África e Oriente Médio 14,0
Fontes: MIC e SECEX.
Sudeste 42.810
Sul 11.878
Centro-Oeste 5.115
Fonte: Anuário Estátistico (1984)

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 19
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Séries específicas ou categóricas

É a série cujos dados estão dispostos em correspondência com a espécie ou qualidade, ou seja, varia o fato
e permanece constante a época e o local.

Tabela 5.
PRODUÇÃO BRASILEIRA DE
AÇO BRUTO EM 1991 (em toneladas)
PROCESSOS 1991
Oxigênio básico 17.934
Forno elétrico 4.274
EOF 409
Fonte: Instituto Brasileiro de Siderurgia.

SÉRIES CONJUGADAS:

Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries
de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de
uma série geográfica-temporal.

Tabela 6.
População Urbana do Brasil por Região de 1940 a 1980 (x1000)
REGIÕES
Anos N NE SE S CO
1940 406 3.381 7.232 1.591 271
1950 581 4.745 10.721 2.313 424
1960 958 7.517 17.461 4.361 1.007
1970 1.624 11.753 28.965 7.303 2.437
1980 3.037 17.567 42.810 11.878 5.115
Fonte: Anuário Estatístico (1984)

1. Classifique as seguintes séries:


b) AVICULTURA BRASILEIRA 1992
a) PRODUÇÃO DE BORRACHA
NATURAL ESPÉCIE NÚMERO
(1.000 cabeças)
ANOS TONELADAS
Galinhas 204.160
1991 29.543 Galos, frangos e pintos 435.465
1992 30.712 Codornas 2.488
1993 40.663 Fonte: IBGE
Fonte: IBGE

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 20
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

c) VACINAÇÃO CONTRA A d) AQUECIMENTO DE UM MOTOR DE AVIÃO


POLIOMIELITE – 1993 DE MARCA X
REGIÕES QUANTIDADES
Norte 211.209 MINUTOS TEMPERATURA
Nordeste 631.040 ( °C )
Sudeste 1.119.708 0 20
Sul 418.785 1 27
Centro-Oeste 185.823 2 34
FONTE: Ministério da Saúde 3 41
4 49
5 56
6 63
Dados fictícios

2. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsitos, 27306 casos de vítimas fatais,
assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores.. Faça uma tabela para representar esses
dados.

3. De acordo com o ministério dos transportes, em 1998, o tamanho das malhas de transporte no Brasil é assim
distribuído: 320480 km de rodovias (estradas municipais não estão incluídas), 29700 km de Ferrovias (inclui as linhas
de trens urbanos) e 40000 km de Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma
tabela para representar esses dados.

4. De acordo com o Ministério de Educação a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos
anos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564.
Faça uma tabela para representar esses dados.

5. Estabelecimentos de ensino da região norte do Brasil em 1982 subdividiam-se em: Rondônia, Acre, Amazonas,
Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente,
segundo o MEC. Faça uma tabela para apresentar esses dados.

6. De acordo com o IBGE(1988), a distribuição dos suicídios ocorridos no Brasil em 1986, segundo a causa atribuída,
foi a seguinte: 263 alcoolismo, 198 por dificuldade financeira, 700 por doença metal, 189 por outro tipo de doença,
416 por desilusão amorosa e 217 por outras causas. Apresente essa distribuição em uma tabela.

7. Explique uma forma de se obter uma amostra estratificada dos empregados de uma empresa em que existam
funcionários de escritório, funcionários de produção e vendedores.

8. Numa escola com 1200 alunos, foi feito um recenseamento, recolhendo-se dados referentes às seguintes
variáveis:
Idade dos alunos; anos de escolaridade; meio de transporte utilizado para ir à escola; local de almoço; número de
irmãos; local de trabalho; número de televisores em casa; local de moradia.
a) Das variáveis observadas, quais são quantitativas e quais são qualitativas?
b) Como organizar uma amostra simples e uma sistemática para fazer esse recenseamento?

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 21
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

9. Deseja-se fazer uma pesquisa em uma população constituída por um número maior de homens que de mulheres.
Como você faria para selecionar uma amostra:
a) com o mesmo número de homens e de mulheres?
b) Com mais mulheres que homens?

10. Suponha que 40% da população mencionada no problema anterior seja constituída por mulheres. Numa amostra
estratificada proporcional formada por 50 indivíduos, qual seria o número de homens e o de mulheres? E numa
amostra composta de 150 pessoas, quais seriam esses números?

11. Uma empresa de publicidade quer fazer um estudo sobre o interesse despertado por certa propaganda entre os
alunos de 10 anos de idade das escolas de Ensino Fundamental de uma cidade. Para isso, pretende estratificar uma
amostra de 300 crianças.
Como a empresa poderia fazer essa amostra a partir dos dados da tabela abaixo?

Escola População
A 400
B 300
C 350
D 450
E 520
F 300

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando
ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 22
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Aula 3 – Estatística I
Profª Luciana Zimmer

DISTRIBUIÇÕES DE FREQÜÊNCIAS
Os dados em distribuições de freqüências são uma maneira de apresentar informações
agrupadas. Neste caso a variável pode ser expressa por ponto ( um único valor ) ou por
intervalo ( dentro de um intervalo de valores ). Ao se constituir uma distribuição de freqüências
(DF) precisam-se descrever alguns componentes da mesma.

Tabela Primitiva
Supondo uma coleta amostral de dados relativos aos salários semanais de quarenta
funcionários que compõem uma amostra de uma Empresa Z. Os valores de cada um dos
salários estão listados a seguir:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS


PELOS FUNCIONÁRIOS DA EMPRESA Z

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

A esse tipo de tabela, cujos elementos não foram numericamente organizados,


denominamos tabela primitiva ou dados brutos.
O rol é uma lista em que os valores estão dispostos em uma determinada ordem, crescente
ou decrescente. Veja a seguir:

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Distribuição de Freqüência

A freqüência é o número de repetições da observação no conjunto de observações.


A distribuição de freqüência de uma série de observações é uma função que representa os
pares de valores formados por cada observação e seu número de repetições.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 23
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS
FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 ├ 154 4
154 ├ 158 9
158 ├ 162 11
162 ├ 166 8
166 ├ 170 5
170 ├ 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL

Na construção de tabelas de freqüências, devemos observar as seguintes diretrizes:

1. As classes devem ser mutuamente excludentes, ou seja, cada valor original deve pertencer
exatamente a uma e só uma classe.
2. Todas as classes devem ser incluídas, mesmo as de freqüência zero.
3. Procurar utilizar a mesma amplitude para todas as classes, embora eventualmente seja
impossível evitar intervalos com extremidade aberta.
4. Escolher números convenientes para limites de classe. Arredondar para cima a fim de ter
menos casas decimais, ou utilizar números adequados à situação.
5. Utilizar entre 5 e 20 classes.
6. As somas das freqüências das diversas classes deve ser igual ao número de observações
originais.

Elementos de uma Distribuição de Freqüência

1. Classe: Classes de freqüência ou, simplesmente, classe são intervalos de variação da


variável.

As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, . . ., k (onde k é o


número total de classes da distribuição).

Exemplo: O intervalo 154 ├ 158 define a segunda classe (i = 2)


A distribuição é formada por seis classes, podemos afirmar que i = 6.

2. Limites de Classe: Determinam-se limites de classes os extremos de cada classe. O


menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da classe
( ls ).

Exemplo: Na terceira classe do exemplo acima, temos: li 3 = 158 e Ls 3 = 162

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 24
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

3. Amplitude de um Intervalo de Classe (h): É a medida de intervalo que define a classe.


Ela é obtida pela diferença entre os limites superior e inferior. Assim:
h = ls − li

Exemplo: o intervalo de classe do exemplo acima é 4, pois 162 ├ 158 = 4

4. Amplitude Total ( AT) : É a diferença entre o valor máximo e o valor mínimo da amostra.
AT = Vmax - Vmin

Exemplo: A amplitude amostral do exemplo acima é 24, pois 174 ├150 = 24

5. Ponto Médio de uma Classe ( Xi) : É o ponto que divide o intervalo de classe em duas
partes iguais.

li + ls
Xi =
2
Exemplo: O ponto médio da segunda classe, em nosso exemplo, é 156.

6. Freqüência Simples ou Absoluta (fi): É o número de observações correspondentes a


uma classe. A soma de todas as freqüências é representada por:

N = ∑ fi ( população )
n = ∑ fi ( amostra )
Exemplo: Para a distribuição em estudo, temos: n = ∑ fi = 40

7. Número de Classes: Pode-se utilizar a regra de STURGES, que fornece o número de


classes em função do total de casos:

K = 1 + 3,33 log n( N )

Onde:
K é o número de classes;
N ou n é o número total de observações.
Para determinar a amplitude do intervalo de classe, temos:

h= N .
K

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 25
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

SIMBOLOGIA ENTRE OS VALORES DE CLASSE:

 Inclui o valor da esquerda mas não o da direita.


 Inclui o valor da direita mas não o da esquerda.
 Não inclui nem o valor da direita, nem o da esquerda.
 Inclui tanto o valor da direita quanto o da esquerda.

– Distribuição de Freqüência sem Intervalos de Classe

Quando se trata de variáveis discretas de variação relativamente pequena, cada valor pode
ser tomado como um intervalo de classe.
Ex: Uma professora organizou os resultados obtidos em uma prova da seguinte forma:
4–5–7–9–9–4–5–7–9–9–4–5–7–9–9–4–6–8–9–9–4–6–8–9–9

Nota Nº de alunos

Total

TIPOS DE FREQÜÊNCIAS
Freqüências Relativas simples (f ri )

São os valores da razão entre as freqüências simples e a freqüência total.


fi
fri =
n
Exemplo: Calcule a freqüência relativa simples da terceira classe, em nosso exemplo:

Freqüência Acumulada ( F i )
É o total das freqüências de todos os valores inferiores ao limite superior.
do intervalo de uma dada classe.

Fi = f 1 + f 2 + ... + fi ou Fi = ∑ fi

Exemplo: Calcule a freqüência acumulada correspondente à terceira classe, em nosso


exemplo:

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 26
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Freqüência Acumulada Relativa ( F ri )


É a freqüência acumulada da classe, dividida pela freqüência total da distribuição.
Fi
Fri =
n
Exemplo: Para a terceira classe, qual é a freqüência acumulada relativa?

EXERCÍCIO
1. Complete a seguinte tabela e responda as seguintes perguntas:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS


PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais Freqüências Xi fr i % fr i Fi


Fr i %
(R$)
150 ├ 154 4
154 ├ 158 9
158 ├ 162 11
162 ├ 166 8
166 ├ 170 5
170 ├ 174 3
Total 40 1 100

FONTE: PESQUISA DO SETOR DE PESSOAL

a) Quantos empregados têm salário entre R$ 154, inclusive, e R$ 158?


b) Qual a percentagem de empregados cujas salários são inferiores a R$ 154?
c) Quantos empregados têm salário abaixo de R$ 162?
d) Quantos empregados têm salário não inferior a R$ 158?
2. Conhecidas as notas de 50 alunos:

84 68 52 47 61 73 77 33 73 68
74 71 81 65 55 57 35 85 88 91
59 80 50 53 55 76 85 73 60 41
67 41 78 56 94 35 45 55 64 74
65 94 48 39 89 98 42 66 69 54

Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para
intervalo das classes.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 27
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

3. Os resultados do lançamento de um dado 50 vezes foram os seguintes:

6 2 6 4 3 6 2 6 5 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3

Forme uma distribuição de freqüência sem intervalos de classe.

4. Abaixo são mostrados os saldos médios amostrais de 48 contas de clientes do BB S.A.


( dados brutos em US$ 1,00).

450 500 150 1000 250 275 550 500


225 475 150 450 950 300 800 275
600 750 375 650 150 500 700 600
475 900 800 275 600 750 375 650
150 500 225 250 150 120 250 360
230 500 350 375 470 100 270 1000

Pede-se:

a) Agrupar os dados numa distribuição de freqüências com intervalo de classes (use Teorema
de STURGES);
b) Determine as freqüências simples e acumuladas (absolutas e relativas);
c) Calcule e interprete: fr 2 , f 3 , Fr 4 e Fr 2 .

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético
e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 28
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Aula 4 - Estatística I
Prof. Luciana Zimmer

1. Representação Gráfica
Todas as pessoas efetivamente consomem informações diariamente através dos diversos meios
de comunicação. Uma vez que grande parte do que é ouvido ou lido é lixo ou sucata, deve-se aprender a
avaliar criticamente e descartar aquilo que não possui valor real. Também devemos ter em mente que, às
vezes, essa sucata baseia-se na ignorância; em outras ocasiões, é planejada e maliciosa. Portanto, é
importe ser crítico e cético em relação às informações fornecidas.

Função de Dados Gráficos


As funções básicas de um gráfico apropriado incluem o seguinte:
1. Mostrar os dados;
2. Fazer com que o observador se concentre na essência do gráfico, e não na forma como o
gráfico foi desenvolvido;
3. Evitar distorções;
4. Incentivar comparações de dados;
5. Servir a um propósito claro;
6. Estar integrado com as descrições estatísticas e verbais do gráfico.

Excelência gráfica
1. É uma apresentação bem elaborada de dados, que fornece substância, estatísticas e formas;
2. Comunica idéias complexas com clareza, precisão e eficiência;
3. Fornece ao observador o maior número de idéias, no menor espaço de tempo, com o menor
volume de impressão;
4. Exige que seja transmitida a verdade sobre os dados.

 Gráficos utilizados para a análise de uma distribuição de freqüência


Com as tabelas de freqüência, podemos identificar a natureza geral da distribuição dos dados,
bem como construir gráficos que facilitem a visualização dessa distribuição.

Histogramas
É utilizado para descrever dados numéricos que tenham sido agrupados na forma de distribuições
de freqüências ou distribuições de freqüências relativas.
Ao desenhar um histograma, a variável aleatória de interesse é exibida ao longo do eixo horizontal
(eixo X). O eixo vertical (eixo Y) representa o número (freqüência), proporção ou porcetagem de
observações por intervalo de classe.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 29
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Altura em centímetros de 160 alunos do


curso de estatística

Fonte: Departamento de Estatística

Idade (em anos) de um grupo de 30 Clientes de uma loja de


calçados em Santa Cruz do Sul

14

12
Número de Pessoas

10

0
15|---26 26|---37 37|---48 48|---59 59|---70
Idade (Anos)

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 30
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Histograma da Percentagem de Fundos de Alto Risco


35%

30%

25%
Percentagem

20%

15%

10%

5%

0%
--- -20 0 20 40 60 80 100

Pontos Médios da Classe

Como se interpreta um histograma?


Este gráfico é utilizado para variáveis contínuas.

Características:
- Cada barra representa a freqüência do intervalo respectivo;
- Os intervalos devem ter a mesma amplitude;
- As barras devem estar todas juntas.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 31
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Histograma

A simples observação da forma do histograma


permite algumas conclusões. Veja a figura. Os dados têm
uma tendência central. As freqüências mais altas estão no
centro da figura. Nos processos industriais, esta é a forma
desejável.

Histograma com
assimetria positiva
A figura ao lado apresenta um histograma com
assimetria positiva. A média dos dados está localizada à
esquerda do centro da figura e a cauda à direita é
alongada. Esta ocorre quando o limite inferior é controlado
ou quando não podem ocorrer valores abaixo de
determinado limite.

Histograma com
assimetria negativa
A figura apresenta um histograma com
assimetria negativa. A média dos dados está localizada à
direita do centro da figura e a cauda à esquerda é
alongada. Esta forma ocorre quando o limite superior é
controlado ou quando não podem ocorrer valores acima de
certo limite.

Histograma em plateau

Histograma em plateau, isto é, com exceção das


primeiras e das últimas classes, todas as outras têm
freqüências quase iguais. Essa forma ocorre quando se
misturam várias distribuições com diferentes médias.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 32
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Histograma com
Dois picos
A figura mostra um histograma com dois picos,
ou duas modas. As freqüências são baixas no centro da
figura, mas existem dois picos fora do centro. Esta forma
ocorre quando duas distribuições com médias bem
diferentes se misturam. Podem estar misturados, por
exemplo, os produtos de dois turnos de trabalho.

Os histogramas também mostram o grau de dispersão da variável. O histograma à esquerda


mostra pouca dispersão, mas o histograma à direita mostra grande dispersão.

Histogramas com dispersões diferentes

 Gráficos em Linhas
Usado principalmente para ilustrar uma série temporal.

Produção de Petróleo Bruto no


Brasil de 1976 a 1980 (x1000 m³)

Fonte: Conjuntura Econômica (Fev. 1983)

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 33
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Gráfico de linhas comparativas

População Urbana do Brasil por


Região de 1940 a 1980 (x 1000)

Fonte: Conjuntura Econômica (1984)

 Gráficos de colunas ou barras


Representação gráfica da distribuição de freqüências. Este gráfico é utilizado para variáveis
nominais e ordinais.
Características:
• Todas as barras devem ter a mesma largura
• Devem existir espaços entre as barras

Gráfico de Colunas
Usado para ilustrar qualquer tipo de série.

População Urbana do Brasil em 1980 (x 1000)

45000 42810
40000
35000
30000
População

25000
20000 17568
15000 11878
10000 5115
3037
5000
0
CO S SE NE N
Regiões

Fonte: Anuário Estatístico (1984)


Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 34
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Fonte: Anuário Estatístico (1984)

As larguras das barras que deverão ser todas iguais podendo ser adotado qualquer dimensão,
desde que seja conveniente e desde que não se superponham. O número no topo de cada barra pode ou
não ser omitido, se forem conservados, a escala vertical pode ser omitida.

Gráfico de colunas comparativas

a. Colunas Justapostas (gráfico comparativo)

População Urbana do Brasil por Região de


1940 a 1980 (x1000)

Fonte: Anuário Estatístico (1984)

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 35
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

b. Colunas Sobrepostas (gráfico comparativo)

População Urbana do Brasil por Região de


1940 a 1980 (x 1000)

Fonte: Anuário Estatístico (1984)

Gráfico de Barras
As regras usadas para o gráfico de barras são iguais as usadas para o gráfico de colunas.

População Urbana do Brasil em 1980 (x


1000)

N 3037

NE 17568

SE 42810

S 11878

CO 5115

0 10000 20000 30000 40000 50000

Fonte: Anuário Estatístico (1984)

Assim como os gráficos de Colunas podem ser construídos gráficos de barras comparativas.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 36
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

 Gráficos circulares ou de Setores


Representação gráfica da freqüência relativa (percentagem) de cada categoria da variável. Este
gráfico é utilizado para variáveis nominais e ordinais. É uma opção ao gráfico de barras quando se pretende
dar ênfase à comparação das percentagens de cada categoria. A construção do gráfico de setores segue
uma regra de 3 simples, onde as freqüências de cada classe correspondem ao ângulo que se deseja
representar em relação à freqüência total que representa o total de 360.

Características:
• A área do gráfico equivale à totalidade de casos (360º = 100%);
• Cada “fatia” representa a percentagem de cada categoria.

População Urbana e Rural do Brasil em 1980 (x 1000)

32%

Urbana
Rural

68%

Fonte: Anuário Estatístico (1984)

População Urbana e Rural do


Brasil em 1980 (x 1000)

32%

Urbana
Rural

68%

Fonte: Anuário Estatístico (1984)

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 37
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

 Gráfico Pictorial - Pictograma


Tem por objetivo despertar a atenção do público em geral, muito desses gráficos apresentam
grande dose de originalidade e de habilidade na arte de apresentação dos dados.

Evolução da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000)

Fonte: Grandes números da educação brasileira março de 1996

Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes


entrevistados no Canadá

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 38
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

 Gráfico Polar (radar)


É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda a série que
apresenta uma determinada periodicidade.

Precipitação pluviométrica do município de Santa Maria – RS- 1999

Fonte: Base Aérea de Santa Maria

 Cartograma
É a representação de uma carta geográfica. Este tipo de gráfico é empregado quando o objetivo é
o de figurar os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas.

Brasil
por vendas (em mil reais)

144
237
300
440
320

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 39
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Atividades

1. O gráfico a seguir ilustra o número de inscritos nos últimos quatro vestibulares que disputaram
as vagas oferecidas pela Universidade de São Paulo (USP) e pelas universidades federais do
Rio de Janeiro (UFRJ), de Minas Gerais (UFMG) e do Rio Grande do Sul (UFRGS).

Fonte: Época 26/04/99 (com adaptações)

Com base nessas informações, julgue os itens seguintes como verdadeiro ou falso:
a. De 1997 a 1998, o crescimento percentual do número de inscritos na USP foi maior que o da
UFRGS. (___)
b. Os crescimentos percentuais anuais na UFRJ diminuíram a cada ano. (___)
c. Todas as universidades tiverem crescimento no número de inscritos no referido período. (___)
d. A UFRGS foi a única que apresentou crescimento no número de inscritos. (___)
e. A UFMG teve um crescimento de mais de 100% no número de inscritos no período. (___)
f. A UFRGS teve um crescimento de 3,74%, 36,17% em 97 e 98, respectivamente, e uma
redução de cerca de 3,17% no número de inscritos em 99.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 40
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

2. Numa turma de cursinho de informática, a distribuição das idades dos alunos, segundo o sexo,
é dada pelo gráfico seguinte.

Com base nos dados do gráfico, pode-se afirmar que:


a. o número de meninas com, no máximo, 16 anos é maior que o número de meninos nesse
mesmo intervalo de idade. (___)
b. o número total de alunos é 19. (___)
c. a média de idade das meninas é 15 anos. (___)
d. o número de meninos é igual ao número de meninas. (___)
e. o número de meninos com idade maior que 15 anos é maior que o número de meninas
nesse mesmo intervalo de idades. (___)

3. Considere os dados referentes ao consumo de água, em m3, de 75 contas da CORSAN.

32 40 22 11 34 40 16 26 23 31 27 10 38 17 13
45 25 10 18 23 35 22 30 14 18 20 13 24 35 29
33 48 20 12 31 39 17 58 19 16 12 21 15 12 20
51 12 19 15 41 29 25 13 23 32 14 27 43 37 21
28 37 26 44 11 53 38 46 17 36 28 49 56 19 11

a. agrupar os dados em uma distribuição de freqüência. Utilize o limite inferior da distribuição


igual a zero na primeira classe e amplitude de classe 10.
b. determine as freqüências simples e acumuladas ( absolutas e relativas);
c. calcule e interprete: fr 2 , f 3 e Fr 4 – Fr 2 ;
d. construa o correspondente histograma de freqüências relativas.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 41
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

4. Abaixo são mostrados os saldos médios em R$ de 48 contas de clientes do BB Novo S.A.

450 500 150 1000 250 275 550 500 225 475 150 450 950 300 800 275
600 750 375 650 150 500 1000 700 475 900 800 275 600 750 375 650
150 500 225 250 150 120 250 360 230 500 350 375 470 600 1030 270

a. Agrupe os dados numa distribuição de freqüências.


b. Determine as freqüências relativas: simples e acumulada.
c. Apresente o histograma de freqüências relativas.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 42
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 43
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Aula 5- Estatística I
Profª Luciana Zimmer
MEDIDAS DE TENDÊNCIA CENTRAL

Na maior parte das vezes em que os dados estatísticos são analisados, procuramos obter um valor para
representar um conjunto de dados. Este valor deve sintetizar, da melhor maneira possível, o comportamento do
conjunto do qual ele é originário. Nem sempre os dados estudados têm um bom comportamento, isto pode fazer
com que um único valor bem represente ou não o grupo.
As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação
pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as
medidas de tendência central, destacam-se as seguintes: Média aritmética, Moda e Mediana. Cada uma com um
significado diferenciado, porém tendo como serventia representar um conjunto de dados.
A maneira de se obter estas medidas é um pouco diferenciada dependendo de como os dados são
apresentados. Eles podem vir de forma isolada (não grupados) ou ainda ponderada (grupados em intervalos ou
sem intervalo de classe, por ponto).

1– Média Aritmética ( µ ou x )
É o quociente da divisão da soma dos valores da variável pelo número deles:

µ= ∑ xi ou X =
∑ xi
N n
Sendo: µ ou x: média aritmética
Xi: valores da variável
n ou N: número de valores

1.1 – Dados não-agrupados


Quando se deseja conhecer a média dos dados não-agrupados, determinamos à média aritmética simples.

Exemplo: Selecionados aleatóriamente 10 alunos da turma, e obtemos as seguntes alturas (em m):
1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63 1,77 1,59

Calcule a média das alturas.

Solução: Como se trata de uma amostra:

Σxi 1,76+1,73+1,80+1,65+1,70+1,74+1,81+1,63+1,77+1,59 17,18


=
x = = = 1, 718
n 10 10

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e
visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 44
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

1.2 – Dados Agrupados


1.2.1 – Sem intervalos de classe: As freqüências são números indicadores da intensidade de cada valor da
variável, elas funcionam como fatores de ponderação, o que leva a calcular a média aritmética ponderada.

µ= ∑ xi. fi ( população ) X =
∑ xi. fi ( amostra )
N n

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, adotando-se a variável “número de
filhos do sexo masculino”, determine a média.

N.º de Meninos fi
0 2
1 6
2 10
3 12
4 4
Σ = 34

1.2.2 – Com intervalos de classe: Convenciona-se que todos os valores incluídos em um determinado intervalo de
classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada.

µ= ∑ xi. fi ( população ) X =
∑ xi. fi ( amostra )
N n
onde Xi é o ponto médio da classe.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 45
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Exemplo:
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL

EXERCÍCIOS

1 – Calcule a média aritmética das seguintes distribuições amostrais:

a) Classes 30 |--- 50 |--- 70 |--- 90 |--- 110 |--- 130


fi 2 8 12 10 5

b) Consumo (kWh) 5 |--- 25 |--- 45 |--- 65 |--- 85 |--- 105 |--- 125 |--- 145 |--- 165

N.º de Usuários 4 6 14 26 14 8 6 2

c) Custos (R$) 450 |--- 550 |--- 650 |--- 750 |--- 850 |--- 950 |--- 1050 |--- 1150

fi 8 10 11 16 13 5 1

2. Média Geométrica Simples

Para uma seqüência numérica x: x 1 , x 2 , ......., x n , a média geométrica simples, que designaremos por xg ,é
definida por:

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 46
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Exemplo: Se X: 2, 4, 6, 9, então:

4 4
xg = 2.4.6.9 = 432 = 4,559

2.1 Média Geométrica Ponderada

Para uma seqüência numérica x: x 1 , x 2 , ...., x n afetados de pesos p 1 , p 2 , ..., p n respectivamente, a média
geométrica ponderada que designaremos por x g é definida por:

Exemplo: Se x: 1, 2, 5, com pesos 3, 3, 1 respectivamente então:


7 7 7
xg = 13.2 3.51 = 1.8.5 = 40 = 1,6938

3. Moda (Mo)
A moda de uma distribuição é o valor da variável que tem a maior freqüência absoluta simples, quer dizer aquele
valor que aparece mais [mais se repete]. Existem algumas situações nas quais não existe moda, isto é, todos os
valores da variável só aparecem uma vez, não se repetem.
Em outras situações pode-se ter mais de uma moda, isto é, quando dois ou mais valores da variável têm maior
freqüência [freqüências iguais], neste caso diz-se que o conjunto é bimodal. Podem-se ter três, quatro, etc.
Nestes casos é difícil escolher a moda como um representante do grupo, uma vez que teremos muitos
representantes. Para que se possa obter o valor da moda é necessário que os dados estejam no mínimo em
escala nominal, quer dizer, com qualquer nível de mensuração podemos obter o valor da moda, uma vez que ela
é oriunda apenas de uma contagem. Portanto, a moda é o valor que ocorre com maior freqüência em uma série
de valores.

Exemplo: - o dono do restaurante vai preparar mais o filé de maior saída; maioria tirou “C” numa turma; o
proprietário da loja de sapato vai comprar mais os números de maior saída.

3.1 – Dados não-agrupados

A moda é facilmente reconhecida: basta procurar o valor que mais se repete.

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 47
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 12, 12, 12, 13, 15 tem moda igual a 12.

• Amodal: são as séries nas quais nenhuma valor apareça mais vezes que outros.

Exemplo: 3, 5, 8, 10, 13.

• Multimodal: é uma série que possui dois ou mais valores modais.

Exemplo: Xi = 2 3 4 4 4 5 6 7 7 7
Mo 1 = 4 Mo 2 = 7
3.2 – Dados agrupados

3.2.1 – Sem intervalos de classe: É o valor da variável de maior freqüência.


Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, indique a moda dessa distribuição.

3.2.2 – Com intervalos de classe:

A classe que apresenta maior freqüência é denominada classe modal.


O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal.
Damos a esse valor a denominação de moda bruta.

Exemplo: Calcule a moda da seguinte distribuição:


SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$) Freqüências


150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 48
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

4– Mediana (Md): É o número que se encontra no centro de uma série de números, estando estes dispostos
segundo uma ordem. Para que se possa obter o valor da mediana os dados têm que estar em uma escala de
medida no mínimo ordinal, uma vez que se precisa ordená-los.
A mediana é o valor que divide o conjunto ao meio, isto é, concentra antes e depois de si, 50% das observações
ordenadas. Ao contrário da média aritmética a mediana não sofre influência quando temos no conjunto valores
discrepantes [tanto para mais como para menos]. Neste caso a mediana pode melhor representar um conjunto do
que a média aritmética, porém não tem o mesmo significado que aquela.
A mediana pode ou não pertencer ao conjunto do qual ela é originária, vai pertencer sempre que o conjunto tiver
um número ímpar de informações e vai ou não pertencer quando o conjunto tiver um número par de
observações. Com isso já podemos ver que a quantidade de observações influi na maneira pela qual vamos
encontrar o valor da mediana.

4.1. – Dados não-agrupados: Estando ordenados os valores de uma série e sendo n o número de elementos da
série, o valor mediano será, quando n for:
n +1
• impar : o termo de ordem ;
2
n n
• par : a média aritmética dos termos de ordem e + 1 .
2 2

Exemplo 1: Dada à série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, identifique a mediana.
Md= 2, 5, 6, 9, 10, 13, 15, 16, 18
Md = 10
Exemplo 2: Dada à série de valores:
2, 6, 7, 10, 12, 13, 18, 21, calcule a mediana.
Md = 11
• O valor da mediana pode coincidir ou não com um elemento da série.

4.2. – Dados agrupados: Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos
n
extremos, é dada por:
2

4.2.1 – Sem intervalos de classe: É o bastante identificar a freqüência acumulada imediatamente superior à
metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência
acumulada.
Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de
filhos do sexo masculino, determine a mediana:

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 49
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

N.ºde Meninos fi
0 2
1 6
2 10
3 12
4 4
Σ = 34

• No caso de existir uma freqüência acumulada (F i ), tal que:


x + xi +1
a mediana será dada por: Md = i isto é, a mediana será a média aritmética entre o valor da
2
variável correspondente a essa freqüência acumulada e a seguinte.

Exemplo: Determine a mediana da distribuição abaixo:


Xi fi Fi
13 1
14 2
15 1
16 2
17 1
18 1

4.2.2 – Com intervalos de classe: Classe mediana é aquela correspondente à freqüência acumulada
Σf i
imediatamente superior a .
2
Em seguida analisa-se o ponto médio
Exemplo: Calcule a mediana da seguinte distribuição:

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 50
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS


SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL

Σf i
No caso de existir uma freqüência acumulada exatamente igual a , a mediana será o limite superior
2
da classe correspondente.

Exemplo:
i Classes fi Fi
0 |--- 10 1
10 |--- 20 3
20 |--- 30 9
30 |--- 40 7
40 |--- 50 4
50 |--- 60 2
26

EXERCÍCIOS
1 – Considerando os conjuntos de dados calcule a média, a mediana e a moda.
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b) 20, 9, 7, 2, 12, 7, 20, 15, 7
c) 51,6; 48,7; 50,3; 49,5; 48,9
d) 15, 18, 20, 13, 10, 16, 14

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

2 - Os dados abaixo representam todos a idade dos clientes que acessaram a página da internet da Empresa “X”
no mês de julho de 1998.

Faixa etária 0 |-----10 10 |-----20 20 |----- 30 30 |----- 40 40 |-----50 50 |----- 60


N° de casos 27 71 118 20 18 10

Calcule as medidas de tendência central.

3 - O Departamento Pessoal de certa firma fez um levantamento dos 120 funcionários de todo o setor de
produção, obtendo os seguintes resultados:
Salário (x sal. min.) Freqüência relativa
0 |----- 2 0,25
2 |----- 4 0,40
4 |----- 6 0,20
6 |----- 8 0,15

Pede-se:
a) Calcule a média dos salários
b) Se for concedido um aumento para esses funcionários de 100%, haverá alteração na média? Justifique.
c) Se for concedido um abono de um salário mínimo para todos os 120 funcionários, haverá alteração na média?
Justifique.

4 - Considerando a tabela a seguir:


a) Calcular e interpretar estas medidas a média , moda , e mediana da distribuição amostral apresentada abaixo;
b) Calcular e interpretar %fr 3 ,F 4 ,f 2 e %Fr 3 .

Idade de uma amostra de candidatos a um programa de treinamento


Idade (anos) Nº. de Candidatos

18 |-----20 5
20 |-----22 18
22 |-----24 10
24 |-----26 6
26 |-----28 5

5 - Para o seguinte conjunto de observações amostrais determine as medidas de tendência central

-----------------------------------------------------------------
Tempo de serviço Freqüência acumulada
-----------------------------------------------------------------
5 I---- 10 9
10 I---- 15 12
15 I---- 20 18
20 I----I 25 25
-----------------------------------------------------------------

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 52
CENTRO DE ENSINO SUPERIOR DOM ALBERTO

6 - Calcule a média geométrica para as séries:

X : 1, 2, 4, 7, 16

Y : 81, 26, 10, 3, 1

7- No ano 2000, o número de nascimentos, por mês, em uma maternidade foi:

MÊS Jan. Fev. Março Abril Maio Junho Julho Agosto Set. Out. Nov. Dez.
NASC. 38 25 42 30 29 47 18 36 38 43 49 37

a) Calcule a média mensal de nascimentos.


b) Em que meses o número de nascimentos ficou acima da média?

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento
ético e visando ao desenvolvimento Regional”.

Rua Ramiro Barcelos, 892, Centro - Santa Cruz do Sul – RS - CEP 96810-050
Site: www.domalberto.edu.br Página 53
Aula 6 – Estatística I
Profª Luciana Zimmer

Interprete os seguintes problemas:

1. A distribuição dos salários de uma empresa é dada pela tabela abaixo:

Salário (R$) Número de funcionários


500,00 10
1.000,00 5
1.500,00 1
2.000,00 10
2.500,00 4
3.000,00 1

a) Complete a distribuição de freqüências.


b) Calcule a média de salários dessa empresa.
c) Calcule a moda.
d) Calcule a mediana.
e) Interprete os valores encontrados na segunda classe.

2. Considere a distribuição de freqüências relativas aos salários quinzenais da Empresa


Yasmin Ltda:

Salários Quinzenais Número de


(em US$) Funcionários
185  195 10
195  205 15
205  215 12
215  225 19
225  235 21
235  245 35
∑ 112

Pede-se:
a) O salário médio, mediano e modal dos funcionários
b) O histograma e o polígono de freqüências da distribuição.
c) Suponha que o presidente da empresa tenha dado um reajuste de 15% aos funcionários.
Qual o novo salário médio?

3. O registro gráfico seguinte demonstra o número de acidentes graves ocorridos na Indústria


Marbelle S.A. durante determinado exercício fiscal:

Página 54
Pede-se calcular, baseado nas médias gráficas, a média, a moda e a mediana.

4. As informações a seguir referem-se ao imposto pago por 40 empresas em determinado


exercício fiscal:

Pede-se:

a) A média, a moda e a mediana.


b) O gráfico de freqüências acumuladas.

5. Os dados a seguir referem-se a permanência média, em dias, de turistas nos países do


continente europeu no período compreendido entre 1983 e 1986:

a. Organize esses dados numa distribuição de freqüências de intervalos de classes ;


b. Construa o histograma e o polígono de freqüências;
c. Calcular a média, a moda e a mediana da distribuição.

Página 55
6. Em uma distribuição de freqüências de amplitudes de classes iguais, sabe-se que o ponto
médio da 1ª classe vale 4 e o da 6ª classe, 24. Se as freqüências absolutas, que vão da 1ª
a 6ª classes, são iguais a 2, 5, 8, 9, 13 e 3 respectivamente, pede-se:
a. A média, a moda e a mediana
b. O gráfico de freqüências acumuladas.

7. Os resultados do lançamento de um dado 50 vezes foram os seguintes:

6 5 2 6 4 3 6 2 6 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3

a) Forme a distribuição de freqüências.


b) Calcule a média, a moda e a mediana.

8. Considerando as notas de um teste de inteligência aplicado a 100 alunos:

64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73

a) Forme a distribuição de freqüências utlizando Sturges.

b) Calcule a média, a moda e a mediana.

9. As idades em anos de 25 pessoas presentes nesta sala de aula são: 20, 19, 22, 24, 25,
26, 18, 19, 18, 20, 21, 22, 23, 21, 19, 20, 19, 22, 21, 23, 24, 25, 22, 20, 22. Determine a
média, moda, mediana e ponto médio de idade desse grupo de pessoas.

10. Calcule a média para a amostra abaixo que representa as pessoas apresentados na
questão anterior:

Página 56
PESOS ( Kg) fi
45 |--- 50 2
50 |--- 55 5
55 |--- 60 8
60 |--- 65 5
65 |--- 70 3
70 |--- 75 2

11. A tabela seguinte representa as alturas (em cm) de 56 alunos de uma classe de
estatística.
162 163 148 166 169 154 170 166
164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 158 163 165 164 178 150 168
180 159 152 178 171 165 162 164
166 168 173 160 172 168 169 169
167 176 162 174 179 169 161 164

a) Calcule a média, moda, mediana e ponto médio.

12. Os dados abaixo apresentam o peso (massa) em Kg de Leitões criados para fins de
pesquisa genética. Calcule a média, moda, mediana e ponto médio.
0,1 0,2 0,6 1,0 1,1 1,1 1,4 2,3 2,6 3,1
3,5 3,5 3,7 4,0 4,3 5,0 5,1 5,4 5,6 6,2
6,5 6,8 7,0 7,1 7,3 7,3 7,4 7,6 7,6 7,7
7,8 7,8 7,8 7,9 9,2 9,2 9,3 9,4 10,1 10,2
10,2 10,6 10,7 10,9 11,0 11,0 11,3 11,5 12,1 12,6
12,7 12,7 13,3 14,2 14,4 14,7 14,9 15,2 16,1 16,1
16,2 16,4 16,5 16,6 16,9 17,0 17,0 17,1 17,9 18,1
18,1 18,4 18,7 18,7 18,8 18,8 18,9 18,9 19,3 19,8

Página 57
Aula 7 – Estatística I
Profª Luciana Zimmer

Interprete os seguintes problemas:

1. A distribuição dos salários de uma empresa é dada pela tabela abaixo:

Salário (R$) Número de funcionários


500,00 10
1.000,00 5
1.500,00 1
2.000,00 10
2.500,00 4
3.000,00 1

a) Complete a distribuição de freqüências.


b) Calcule a média de salários dessa empresa.
c) Calcule a moda.
d) Calcule a mediana.
e) Interprete os valores encontrados na segunda classe.

2. Considere a distribuição de freqüências relativas aos salários quinzenais da Empresa


Yasmin Ltda:

Salários Quinzenais Número de


(em US$) Funcionários
185  195 10
195  205 15
205  215 12
215  225 19
225  235 21
235  245 35
∑ 112

Pede-se:
a) O salário médio, mediano e modal dos funcionários
b) O histograma e o polígono de freqüências da distribuição.
c) Suponha que o presidente da empresa tenha dado um reajuste de 15% aos funcionários.
Qual o novo salário médio?

3. O registro gráfico seguinte demonstra o número de acidentes graves ocorridos na Indústria


Marbelle S.A. durante determinado exercício fiscal:

Página 58
Pede-se calcular, baseado nas médias gráficas, a média, a moda e a mediana.

4. As informações a seguir referem-se ao imposto pago por 40 empresas em determinado


exercício fiscal:

Pede-se:

a) A média, a moda e a mediana.


b) O gráfico de freqüências acumuladas.

5. Os dados a seguir referem-se a permanência média, em dias, de turistas nos países do


continente europeu no período compreendido entre 1983 e 1986:

a. Organize esses dados numa distribuição de freqüências de intervalos de classes ;


b. Construa o histograma e o polígono de freqüências;
c. Calcular a média, a moda e a mediana da distribuição.

Página 59
6. Em uma distribuição de freqüências de amplitudes de classes iguais, sabe-se que o ponto
médio da 1ª classe vale 4 e o da 6ª classe, 24. Se as freqüências absolutas, que vão da 1ª
a 6ª classes, são iguais a 2, 5, 8, 9, 13 e 3 respectivamente, pede-se:
a. A média, a moda e a mediana
b. O gráfico de freqüências acumuladas.

7. Os resultados do lançamento de um dado 50 vezes foram os seguintes:

6 5 2 6 4 3 6 2 6 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3

a) Forme a distribuição de freqüências.


b) Calcule a média, a moda e a mediana.

8. Considerando as notas de um teste de inteligência aplicado a 100 alunos:

64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73

a) Forme a distribuição de freqüências utlizando Sturges.

b) Calcule a média, a moda e a mediana.

9. As idades em anos de 25 pessoas presentes nesta sala de aula são: 20, 19, 22, 24, 25,
26, 18, 19, 18, 20, 21, 22, 23, 21, 19, 20, 19, 22, 21, 23, 24, 25, 22, 20, 22. Determine a
média, moda, mediana e ponto médio de idade desse grupo de pessoas.

10. Calcule a média para a amostra abaixo que representa as pessoas apresentados na
questão anterior:

Página 60
PESOS ( Kg) fi
45 |--- 50 2
50 |--- 55 5
55 |--- 60 8
60 |--- 65 5
65 |--- 70 3
70 |--- 75 2

11. A tabela seguinte representa as alturas (em cm) de 56 alunos de uma classe de
estatística.
162 163 148 166 169 154 170 166
164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 158 163 165 164 178 150 168
180 159 152 178 171 165 162 164
166 168 173 160 172 168 169 169
167 176 162 174 179 169 161 164

a) Calcule a média, moda, mediana e ponto médio.

12. Os dados abaixo apresentam o peso (massa) em Kg de Leitões criados para fins de
pesquisa genética. Calcule a média, moda, mediana e ponto médio.
0,1 0,2 0,6 1,0 1,1 1,1 1,4 2,3 2,6 3,1
3,5 3,5 3,7 4,0 4,3 5,0 5,1 5,4 5,6 6,2
6,5 6,8 7,0 7,1 7,3 7,3 7,4 7,6 7,6 7,7
7,8 7,8 7,8 7,9 9,2 9,2 9,3 9,4 10,1 10,2
10,2 10,6 10,7 10,9 11,0 11,0 11,3 11,5 12,1 12,6
12,7 12,7 13,3 14,2 14,4 14,7 14,9 15,2 16,1 16,1
16,2 16,4 16,5 16,6 16,9 17,0 17,0 17,1 17,9 18,1
18,1 18,4 18,7 18,7 18,8 18,8 18,9 18,9 19,3 19,8

Página 61
Aula 8– Estatística I
Profª Luciana Zimmer

MEDIDAS DE DISPERSÃO

1. Dispersão ou Variabilidade

A média, ainda que considerada como um número que tem a faculdade de representar uma série
de números não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que
existe entre os valores que compõem o conjunto.

Considerando os seguintes conjuntos de valores das variáveis X, Y e Z:

X: 5, 5, 5, 5, 5.
Y: 3, 4, 5, 6, 7.
Z: 5, 0, 10, 8, 2.

Calculando a média aritmética de cada um desses conjuntos, obtem-se: X = Y = Z = 5.

Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma


variável em torno do valor da média, pode-se dizer que o conjunto Xi apresenta dispersão ou
variabilidade nula e que o conjunto yi apresenta uma dispersão ou variabilidade menor que o
conjunto zi.
Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou
variabilidade entre esses valores e a sua média, é necessário recorre às medidas de dispersão.
Dessas medidas, estudaremos: desvio médio simples, a variância absoluta, o desvio padrão e o
coeficiente de variação ou de variabilidade

Notações:
Quando a seqüência de dados representa uma População à variância será denotada por
σ (x) e o desvio padrão correspondente por σ (x)
2

Quando a seqüência de dados representa uma amostra, a variância será denotada por s2(x)
e o desvio padrão correspondente por s(x).

1. Desvio Médio Simples:

O desvio médio simples que indicaremos por DMS é definido como sendo uma média aritmética
do desvio de cada elemento da série para a média da série.

Cálculo do Desvio Médio Simples:

1º) Caso: Dados Brutos ou Rol

Calculamos inicialmente a média da seqüência. Em seguida identificamos a distância de cada


elemento da seqüência para sua média. Finalmente, calculamos a média destas distâncias.
Se a seqüência for representada por X: x 1 , x 2 , x 3 ,... , x n , então DMS admite como fórmula de
cálculo:

Página 62
DMS = ∑ x i - x
n

Exemplo: Calcule o DMS para a seqüência x : 2, 8, 5, 6.

O DMS é a média aritmética simples destes valores.

2º) Caso: Variável Discreta

No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de


cada elemento representa o número de vezes que este valor figura na série. Conseqüentemente,
haverá repetições de distâncias iguais de cada elemento distinto da série para a média da série.
Assim, a média indicada para estas distâncias é uma média aritmética ponderada.
A fórmula para o cálculo do DMS é:

DMS = ∑| x i – x | f i .
∑ fi

Exemplo: Determinar o DMS para a série:

Xi fi
1 2
3 5
4 2
5 1

Página 63
3º) Caso: Variável Contínua

Nesta situação, por desconhecer os valores individuais dos elementos componentes da série,
substituiremos estes valores x i , pelos pontos médios da classe.
Desta forma, o desvio médio simples tem por cálculo a fórmula:

DMS = ∑ x i – x  f i
∑ fi

Onde x i é o ponto médio da classe i.

Exemplo: Determinar o DMS para a série:

Classe Intervalo de classe fi


1 2  4 5
2 4  6 10
3 6  8 4
4 8  10 1

Exercícios:

1. Calcule o DMS da série X : 3, 8, 12, 3, 9, 7.

2. Interprete o valor obtido na 1ª questão.

3. Calcule o DMS da série Y: 2; 2,5; 3,5; 7; 10; 14,5; 20.

4. Interprete o valor obtido na 3ª questão.

5. Calcule o DMS da série:

Xi fi
2 3
4 8
5 10
6 6
8 2
10 1

6. Interprete o valor obtido na 5ª questão.


Página 64
7. Calcule o DMS da série:

Classe Salários US$ Nº de vendedores


1 70  120 8
2 120  170 28
3 170  220 54
4 220  270 32
5 270  320 12
6 320  370 6

8. Interprete o valor obtido na questão anterior.

9. Qual das variáveis da 5ª e 8ª questões possui maior dispersão absoluta?

2. Cálculo da Variância e Desvio Padrão

1º caso – DADOS BRUTOS OU ROL


a) Se a seqüência representa uma População, a variância é calculada pela formula:

σ2 ( x) =
∑ (x i − x) 2
n
Exemplo:
Calcule a variância e o desvio padrão da seqüência: X: 4, 5, 8, 5.
A seqüência contém n= 4 elementos e tem por média:

.
Os quadrados das diferenças (x i - x )2 valem:

b) Se a seqüência anterior representasse apenas uma amostra, a variância seria denotada


por s2(x) e o desvio padrão por s(x).

Neste caso:
2
S (x)=
∑ (x i − x) 2
n −1

Página 65
e
s(x)= s 2 ( x)

Note que a única diferença entre a fórmula de σ 2 ( x) (indicado para Populações) e s2(x)
(indicado para amostras) é o denominador.
Assim,

S2(x) =
∑ ( xi − x) 2 = 9 = 3 e o desvio padrão s(x) = 3 = 1,73 .
n −1 3

2º caso – VARIÁVEL DISCRETA


Como há repetições de elementos na série, definimos a variância como sendo uma média
aritmética ponderada dos quadrados dos desvios dos elementos da série para a média da série.

a) Se a variável discreta é representativa de uma População, então a variância é dada por:

σ 2
( x) =
∑ ( x − x)
i
2
fi
∑f i

e o desvio padrão é:
σ ( x) = σ 2 ( x)

b) Se a variável discreta é representativa de uma amostra, então a variância é:

s2(x)=
∑ ( x − x) f
i
2
i

∑ f −1 i

e o desvio padrão é:
s(x) = s 2 ( x)

Exemplo 1:
Calcule a variância da séria abaixo, representativa de uma população.
xi fi
2 3
3 5
4 8
5 4

Exemplo 2:
Página 66
Se a variável discreta fosse representativa de uma amostra, a variância seria indicada por
2
s (x) e seria calculada por:

3º caso – VARIÁVEL CONTÍNUA


Novamente, por desconhecer os particulares valores x i da série, substituiremos nas
fórmulas anteriores estes valores pelos pontos médios de classe.
A fórmula da variância para uma variável contínua representativa de uma população é:

σ 2 ( x) =
∑ ( x − x)
i
2
fi
∑f i

Onde x i é o ponto médio da classe i.


Se a variável continua uma amostra então a variância é denotada por s2(x) e sua fórmula de
cálculo é:

2
s (x) =
∑ ( x − x) f
i
2
i

∑ f −1 i

Exemplo 1:
Calcule a variância e o desvio padrão para a série representativa de uma População:

Classe Int. cl. fi


1 0 ├ 4 1
2 4 ├ 8 3
3 8 ├ 12 5
4 12 ├ 16 1

Exemplo 2:
Se a variável contínua fosse representativa de uma amostra, a variância seria indicada por
2
s (x) e sua fórmula de cálculo seria:

2
s (x) =
∑ ( x − x) f
i
2
i

∑ f −1 i

Página 67
Exercícios:

1)Calcule a variância e o desvio padrão da População:


Y: 5, 12, 4, 20, 13, 17.

2) Calcule a variância e o desvio padrão da amostra:


Z: 15, 16, 17, 20, 21.

3) Calcule a variância e o desvio padrão da população:


Idade (anos) Nº. de alunos
17 3
18 18
19 17
20 8
21 4

4) Calcule a variância e o desvio padrão para o número de acidentes diários, observados em um cruzamento,
durante 40 dias. (Amostra)

Nº. de acidentes por dia Nº. de dias


0 30
1 5
2 3
3 1
4 1

5) Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas fiscais emitidas na mesma
data, selecionadas em uma loja de departamentos. (Amostra)
Classe Consumo por nota US$ Nº.de notas
1 0 ├ 50 10
2 50 ├ 100 28
3 100 ├ 150 12
4 150 ├ 200 2
5 200 ├ 250 1
6 250 ├ 300 1

6) Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma classe (população).
Classe Alturas (cm) Nº. de alunos
1 150 ├ 160 2
2 160 ├ 170 15
3 170 ├ 180 18
4 180 ├ 190 18
5 190 ├ 200 16
6 200 ├ 210 1

Página 68
Estatística I
Prof. Luciana Zimmer

Medidas de Posição

As Medidas de Posição nos permitem comparar valores, elas nos dão informações
importantes sobre sobre a posição dos dados dentro do conjunto.

Estudaremos aqui:
 Escore Z
 Quartis, Decis e Percentis.

Escores z
O escore padronizado, ou escore z, é o número de desvios-padrão pelo qual um valor x
dista da média (para mais ou para menos). Obtém-se como segue:
x−x
z= → Amostra
s
OBS: Arredondar z para duas decimais.
x−µ
z= → População
σ

A importância dos escores z na estatística reside no fato de que eles permitem


distinguir entre valores usuais e valores raros, ou incomuns. Consideramos usuais os valores
cujos escores padronizados estão entre -2,00 e 2,00, e incomuns os valores com escore z
inferior a -2,00 ou superior a 2,00.
Valores incomuns Valores Usuais Valores incomuns
Valores incomuns

-3 -2 -1 0 1 2 3
z

Exemplo. As alturas da população de homens adultos têm média µ = 175 cm., desvio-
padrão σ = 7,1 cm. e distribuição em forma de sino. O jogador de basquete Michael Jordan
ganhou reputação de gigante por suas proezas no jogo, mas com 198 cm, ele pode ser
considerado excepcionalmente alto, comparado com a população geral de homens adultos?
Determine o escore z para a altura de 198 cm.

Em comparação com a população geral, Michel Jordan é exepcionalmente alto.

Quartis, Decis e Percentis

Assim como a mediana divide os dados em duas partes iguais, os três quartis,
denotados por Q 1 , Q 2 e Q 3 , dividem as observações ordenadas (dispostas em ordem
crescente) em quatro partes iguais. Ao grosso modo:
- Q 1 separa os 25% inferiores dos 75% superiores dos valores ordenados;
- Q 2 é a mediana;
- Q 3 separa os 75% inferiores dos 25% superiores dos dados.

Página 69
Mais precisamente, ao menos 25 % dos dados serão no máximo iguais a Q 1 , e ao
menos 75% dos dados serão no mínimo iguais a Q 1 . Ao menos75% dos dados serão no
máximo iguais a Q3 , enquanto ao menos 25 % serão, no mínimo, iguais a Q3 .

Analogamente, há nove decis, denotados por D1 , D2 , D3 ,..., D9 , que dividem os dados


em 10 grupos com cerca de 10% deles em cada grupo.

Há, finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1%
em cada grupo.

O processo de determinação do percentil correspondente a um determinado valor x, é


bastante simples, como se pode ver na expressão seguinte.

número de valores inferiores a x


=
percentil do valor x ⋅100
número total de valores

Para o processo inverso, há vários métodos diferentes para achar o valor


correspondente a determinado percentil, sendo um deles:

Cálculo do p-ésimo percentil


Etapa 1: Arranje os dados na ordem crescente
Etapa 2: Calcule o índice L
 k 
= L  ⋅n
 100 
onde
n → número de escores, ou valores, no conjunto de dados
k → percentil a ser utilizado
L → indicador que dá a posição de um escore
Pk → k mo percentil

Etapa 3:
A) Se L não for um inteiro, arredonde para cima. O próximo inteiro maior que L denota
a posição do p-ésimo percentil.
B) Se L é um inteiro, o p-ésimo percentil é a média dos valores de dados nas posições
L e L+1.

Uma vez dominados os cálculos para os percentis, podemos seguir o mesmo processo
para calcular os quartis e decis fazendo-se os ajustes relativos. Sendo que:

Quartis Decis
Q1 = P25 D1 = P10
Q2 = P50 D2 = P20
Q3 = P75 
D9 = P90

Exemplo. A tabela seguinte representa as alturas (em cm) de 56 alunos de uma classe
de estatística.

Página 70
148 150 152 154 155 157 157 157
158 158 158 159 159 160 160 161
162 162 162 163 163 163 164 164
164 164 165 165 165 165 166 166
166 167 168 168 168 169 169 169
169 170 170 171 171 172 172 173
174 175 176 176 178 178 179 180

a. Determine o percentil correspondente a altura 158 cm.

b. Determine o valor correspondente ao 25º percentil, ou seja, determine o valor de P 25 .

c. Determine o valor correspondente ao 7º decil (D 7 ).

d. Determine o valor do terceiro quartil.

Atividades

1. Os carros dos estudantes de certa faculdade têm idade média de 7,9 anos com desvio-padrão
de 3,67 anos, determine os escores z para os carros com as seguintes idades:
a. Um GOL de 12 anos
b. Um Corsa de 2 anos

2. Os números de horas que os calouros passam estudando cada semana têm média de 7,06 h e
desvio-padrão de 5,32 h. Determine o escore z para um calouro que estuda 20 horas por
semana.

3. Qual dos dois escores abaixo acusa melhor posição relativa?


a. Um escore de 60 em um teste com x = 50 e s = 5
b. Um escore de 250 em um teste com x = 200 e s = 20

4. Dois grupos semelhantes de estudantes fazem testes equivalentes de facilidade de linguagem.


Qual dos resultados seguintes indica maior facilidade relativa a linguagem?
a. Uma pontuação de 65 em um teste com x = 70 e s = 10
b. Uma pontuação de 455 em um teste com x = 500 e s = 80

5. A distribuição de frequência abaixo representa a idade de 50 alunos de uma classe de 1º ano


de uma faculdade:
Idade Nº de
(anos) alunos
17 3
18 18
19 17
20 8
21 4

Página 71
Calcule:
a) Q 1 b) K 3 c) D 1 d) Q 3 e) P 95

6. A distribuição de freqüências abaixo representa o consumo por nota de 54 notas fiscais


emitidas durante um dia em uma loja de departamentos

Classe Intervalo de classe N° notas


1 0 ├ 50 10
2 50 ├ 100 28
3 100 ├ 150 12
4 150 ├ 200 2
5 200 ├ 250 1
6 250 ├ 300 1

Calcule:
a) Q 1 75 b) D 3 75 c) D 7 75 d) Q 2 75 e) P 98 225

7. Uma empresa produz caixas de papelão para embalagens e afirma que o número de
defeitos por caixa se distribui conforme a tabela:

Nº de defeitos Nº de caixas

0 32

1 28

2 11

3 4

4 3

5 1

a) O número de defeitos por caixa.


b) A distribuição de freqüências
c) A porcentagem de caixas com dois defeitos.
d) A porcentagem de caixas com mais de três defeitos.
e) O histograma
f) O número mediano de defeitos por caixa.
g) A moda.
h) A amplitude total da série.
i) O desvio médio simples.
j) A variância.
k) O desvio padrão.

Página 72
8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte
distribuição:

Classe Nº de televisores/dia Nºde dias


1 0 ├ 20 5
2 20 ├ 40 25
3 40 ├ 60 40
4 60 ├ 80 15
5 80 ├ 100 10
6 100 ├ 120 5

Pede-se:
a) O número médio de televisores vendidos por dia.
b) A distribuição de freqüências.
c) A porcentagem de dias em que a venda de televisores é menor que 60.
d) A porcentagem de dias em que a venda de televisores é maior ou igual a 80.
e) O histograma e polígono de freqüências.
f) O número mediano de televisores.
g) A moda
h) A amplitude total da série.
i) O desvio médio simples.
j) A variância.
k) O desvio padrão.

Página 73
Estatística I
Profª Luciana Zimmer

Coeficiente de Variação

Se uma série X apresenta média = 10 e desvio padrão = 2 e uma série Y apresenta média
100 e desvio padrão = 5, do ponto de vista da dispersão absoluta, a série Y apresenta maior
dispersão que a série X.
No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y
que é 5 em relação a 100 é um valor menos significativo que o desvio padrão de X que é 2 em
relação a 10.
Isto nos leva a definir as medidas de dispersão relativas: coeficiente de variação e
variância relativa.
O coeficiente de variação de uma série X é indicado por CV (x) definido por:
CV (x) = σ(x)
x
A variância relativa de uma série X é indicada por V(x) e definida por:
V(x) = = σ2(x)
x2
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade,
é um número puro. Portanto, pode ser expresso em percentual.
Deste modo, se calcular o coeficiente de variação da série X citada no início obteremos:
CV (x) = 2/10 = 0,2 ou 20%
CV (y) = 5/100 = 0,05 ou 5%
Comparando os valores destes dois coeficientes concluímos que a série X admite maior
dispersão relativa.
A medida de dispersão relativa prevalece sobre a medida de dispersão absoluta.
Podemos afirmar que uma série que tem a maior dispersão relativa, tem de modo geral a maior
dispersão.
Concluindo: a série Y apresenta maior dispersão absoluta.
A série X apresenta maior dispersão relativa. Portanto, a série X apresenta maior
dispersão.

Responda, justificando em cada caso, as questões abaixo:


1- Qual das séries apresenta maior dispersão absoluta?
Página 74
2- Qual das séries apresenta maior dispersão relativa?
3- Qual das séries apresenta maior dispersão?
_ _
a) A X A = 20 B X B = 20
σ (A) = 2 σ (B) = 5
_ _
b) A: X A = 50 B X B = 100
σ (A) = 2 σ (B) = 3
__ _
c) A X A = 20 B X B = 30
σ2 (A) = 9 σ2 (B) = 16

Medidas de Assimetria

Denomina-se assimetria o grau de afastamento de uma distribuição da unidade de simetria. Em


uma distribuição simétrica tem-se igualdade dos valores da média, mediana e moda.
Exemplos:

Simetria

X = Mo = Md

Toda distribuição deformada é sempre assimétrica. Entretanto, a assimetria pode dar-se na


cauda esquerda ou na direita da curva de freqüências.
 Em uma distribuição assimétrica positiva, ou assimetria à direita, tem-se :

Assimetria à direita
(ou positiva)

Mo Md X
Mo < Md < X

Página 75
 Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam valores
inferiores à Moda.

Assimetria à esquerda
(ou negativa)

X Md Mo X < Md < Mo

Histogramas de distribuições assimétricas e simétrica:

f
f

x x
Histograma de distribuição
simétrica. Histograma de distribuição
(média = mediana = moda) assimétrica para a direita (positiva).
(média > mediana > moda)

x
Histograma de distribuição assimétrica
para a esquerda (negativa).
(média < mediana < moda)

Página 76
Fórmulas para o cálculo do coeficiente de assimetria: Coeficiente de Pearson

1º Coeficiente de Pearson
AS = 0 diz-se que a distribuição é simétrica

x − Mo
AS = AS > 0 diz-se que a distribuição é assimétrica
S positiva (à direita)

AS < 0 diz-se que a distribuição é assimétrica


negativa (à esquerda)

Exercícios de Aplicação

1. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.

Xi fi
1 2
2 10
3 6
4 4
5 2
6 1

3. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.


População
Xi fi
2 2
3 4

Página 77
4 6
5 10
6 6
7 4
8 2

4. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.


Amostra
Classe Int. C. fi
1 0 ├4 10
2 4 ├8 15
3 8 ├ 12 6
4 12 ├ 16 2
5 16 ├ 20 1

2. Classifique, quanto à assimetria, a distribuição abaixo: (amostra)

Classe Int. C. fi
1 3 ├5 1
2 5 ├7 2
3 7 ├9 13
4 9 ├ 11 3
5 11 ├ 13 1

5. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi 78 e o desvio
padrão, 8,0. Em Matemática, entretanto, o grau médio final foi 73 e o desvio padrão, 7,6.

a)Em que disciplina foi maior a dispersão relativa?

b) Se um estudante obteve 75 em Estatística e 71 em Matemática. Em qual dos exames foi mais


elevada a sua posição relativa?

6. Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s= 8,01 cm. O peso
médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg.
Página 78
a) Esses indivíduos apresentam maior variabilidade em estatura ou em peso?

b) Se um indivíduo tem estatura de 175 cm e peso de 65 kg em qual obteve uma posição mais
elevada?

7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com coeficiente de
variação de 3,3%. Qual o desvio padrão desse grupo?

8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte
distribuição:
População
Classe Nº de Nº de dias
televisores
1 0 | 20 5
2 20 | 40 25
2 40 | 60 40
3 60 | 80 15
4 80 | 100 10
5 100 | 120 5

a) Calcule o desvio padrão da distribuição:

b) Calcule a variância populacional da distribuição:

c) Calcule o coeficiente de variação.

d) Classifique, quanto à assimetria, a distribuição segundo o coeficiente de Pearson.

e) Calcule o Q 3 da distribuição.

9. Calcule a média aritmética, a mediana, a moda, o primeiro e o terceiro quartis, a variância,


o desvio padrão, o coeficiente de variação e a assimetria das distribuições de freqüências
abaixo:
a)
NOTAS fi
0  2 5
2  4 8
4  6 14
6  8 10
8  10 7
∑ = 44

Página 79
b)
Estaturas (cm) fi
150  158 5
158  166 12
166  174 18
174  182 27
182  190 8
∑ = 70

Página 80
Estatística I
Profª Luciana Zimmer

Coeficiente de Variação

Se uma série X apresenta média = 10 e desvio padrão = 2 e uma série Y apresenta média
100 e desvio padrão = 5, do ponto de vista da dispersão absoluta, a série Y apresenta maior
dispersão que a série X.
No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y
que é 5 em relação a 100 é um valor menos significativo que o desvio padrão de X que é 2 em
relação a 10.
Isto nos leva a definir as medidas de dispersão relativas: coeficiente de variação e
variância relativa.
O coeficiente de variação de uma série X é indicado por CV (x) definido por:
CV (x) = σ(x)
x
A variância relativa de uma série X é indicada por V(x) e definida por:
V(x) = = σ2(x)
x2
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade,
é um número puro. Portanto, pode ser expresso em percentual.
Deste modo, se calcular o coeficiente de variação da série X citada no início obteremos:
CV (x) = 2/10 = 0,2 ou 20%
CV (y) = 5/100 = 0,05 ou 5%
Comparando os valores destes dois coeficientes concluímos que a série X admite maior
dispersão relativa.
A medida de dispersão relativa prevalece sobre a medida de dispersão absoluta.
Podemos afirmar que uma série que tem a maior dispersão relativa, tem de modo geral a maior
dispersão.
Concluindo: a série Y apresenta maior dispersão absoluta.
A série X apresenta maior dispersão relativa. Portanto, a série X apresenta maior
dispersão.

Responda, justificando em cada caso, as questões abaixo:


1- Qual das séries apresenta maior dispersão absoluta?
Página 81
2- Qual das séries apresenta maior dispersão relativa?
3- Qual das séries apresenta maior dispersão?
_ _
a) A X A = 20 B X B = 20
σ (A) = 2 σ (B) = 5
_ _
b) A: X A = 50 B X B = 100
σ (A) = 2 σ (B) = 3
__ _
c) A X A = 20 B X B = 30
σ2 (A) = 9 σ2 (B) = 16

Medidas de Assimetria

Denomina-se assimetria o grau de afastamento de uma distribuição da unidade de simetria. Em


uma distribuição simétrica tem-se igualdade dos valores da média, mediana e moda.
Exemplos:

Simetria

X = Mo = Md

Toda distribuição deformada é sempre assimétrica. Entretanto, a assimetria pode dar-se na


cauda esquerda ou na direita da curva de freqüências.
 Em uma distribuição assimétrica positiva, ou assimetria à direita, tem-se :

Assimetria à direita
(ou positiva)

Mo Md X
Mo < Md < X

Página 82
 Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam valores
inferiores à Moda.

Assimetria à esquerda
(ou negativa)

X Md Mo X < Md < Mo

Histogramas de distribuições assimétricas e simétrica:

f
f

x x
Histograma de distribuição
simétrica. Histograma de distribuição
(média = mediana = moda) assimétrica para a direita (positiva).
(média > mediana > moda)

x
Histograma de distribuição assimétrica
para a esquerda (negativa).
(média < mediana < moda)

Página 83
Fórmulas para o cálculo do coeficiente de assimetria: Coeficiente de Pearson

1º Coeficiente de Pearson
AS = 0 diz-se que a distribuição é simétrica

x − Mo
AS = AS > 0 diz-se que a distribuição é assimétrica
S positiva (à direita)

AS < 0 diz-se que a distribuição é assimétrica


negativa (à esquerda)

Exercícios de Aplicação

1. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.

Xi fi
1 2
2 10
3 6
4 4
5 2
6 1

3. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.


População
Xi fi
2 2
3 4

Página 84
4 6
5 10
6 6
7 4
8 2

4. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.


Amostra
Classe Int. C. fi
1 0 ├4 10
2 4 ├8 15
3 8 ├ 12 6
4 12 ├ 16 2
5 16 ├ 20 1

2. Classifique, quanto à assimetria, a distribuição abaixo: (amostra)

Classe Int. C. fi
1 3 ├5 1
2 5 ├7 2
3 7 ├9 13
4 9 ├ 11 3
5 11 ├ 13 1

5. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi 78 e o desvio
padrão, 8,0. Em Matemática, entretanto, o grau médio final foi 73 e o desvio padrão, 7,6.

a)Em que disciplina foi maior a dispersão relativa?

b) Se um estudante obteve 75 em Estatística e 71 em Matemática. Em qual dos exames foi mais


elevada a sua posição relativa?

6. Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s= 8,01 cm. O peso
médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg.
Página 85
a) Esses indivíduos apresentam maior variabilidade em estatura ou em peso?

b) Se um indivíduo tem estatura de 175 cm e peso de 65 kg em qual obteve uma posição mais
elevada?

7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com coeficiente de
variação de 3,3%. Qual o desvio padrão desse grupo?

8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte
distribuição:
População
Classe Nº de Nº de dias
televisores
1 0 | 20 5
2 20 | 40 25
2 40 | 60 40
3 60 | 80 15
4 80 | 100 10
5 100 | 120 5

a) Calcule o desvio padrão da distribuição:

b) Calcule a variância populacional da distribuição:

c) Calcule o coeficiente de variação.

d) Classifique, quanto à assimetria, a distribuição segundo o coeficiente de Pearson.

e) Calcule o Q 3 da distribuição.

9. Calcule a média aritmética, a mediana, a moda, o primeiro e o terceiro quartis, a variância,


o desvio padrão, o coeficiente de variação e a assimetria das distribuições de freqüências
abaixo:
a)
NOTAS fi
0  2 5
2  4 8
4  6 14
6  8 10
8  10 7
∑ = 44

Página 86
b)
Estaturas (cm) fi
150  158 5
158  166 12
166  174 18
174  182 27
182  190 8
∑ = 70

Página 87
Aula 12– Estatística I
Profª Luciana Zimmer

PROBABILIDADES

Quando solicitados a estudar um fenômeno coletivo, verificamos a necessidade de descrever tal fenômeno por
um modelo matemático que permita explicar da melhor forma possível este fenômeno.
A teoria das probabilidades permite construir modelos matemáticos que explicam um grande número de
fenômenos coletivos e fornecem estratégias para tomadas de decisões.

Consideremos os seguintes experimentos:


• Aquecimento da água contida em uma panela;
• Queda livre de um corpo.

Conhecidas certas condições, podemos prever a temperatura em que a água entrará em ebulição e a
velocidade com que o corpo atingirá o solo.
Os experimentos cujos resultados podem ser previstos, isto é, podem ser determinados antes da sua
realização, são denominados experimentos determinísticos.

Consideremos também os experimentos:


• Lançamento de uma moeda e leitura das faces voltadas para cima;
• Lançamento de um dado comum e leitura do número voltado para cima;
• Nascimento de uma criança;
• Sorteio de uma carta do baralho.

Se esses experimentos forem repetidos várias vezes, nas mesmas condições, não poderemos prever o seu
resultado.
Experimentos que, ao serem realizados repetidas vezes, nas mesmas condições, apresentarem resultados
variados, não sendo possível, portanto, a previsão lógica dos resultados, são denominados experimentos aleatórios.
Um experimento aleatório apresenta as seguintes características fundamentais:
• Pode repetir-se várias vezes nas mesmas condições;
• É conhecido o conjunto de todos os resultados possíveis;
• Não se pode prever qual o resultado.

Os experimentos aleatórios estão sujeitos à lei do acaso.


Como não podemos prever o resultado, procuraremos descobrir as possibilidades de ocorrência de cada
experimento aleatório.
A teoria da probabilidade estuda a forma de estabelecer as possibilidades de ocorrência de cada experimento
aleatório.

Embora teoricamente tenhamos exigido as repetições, nas mesmas condições iniciais, isto na prática
dificilmente ocorre. Mesmo quando procuramos manter as mesmas condições iniciais, pequenas variações ocorrerão.
Isto provocará alterações no resultado final.
→ Se as alterações forem mínimas, para a maioria das aplicações práticas elas poderão ser desprezadas.
Podemos afirmar que o resultado final é único, e classificar o fenômeno como determinísticos.
→ Se estas alterações forem significativas, então o fenômeno será classificado de aleatório.

A teoria das probabilidades só é útil e deve ser aplicada quando lidarmos com fenômeno aleatório.
Portanto, o objeto de estudo da teoria das probabilidades são os fenômenos aleatórios.
Vamos restringir nosso estudo a uma classe de fenômenos aleatórios chamados experimentos, que
possuem as seguintes características:
Página 88
a) Repetitividade: o fenômeno pode ser repetido quantas vezes quisermos. Se por algum motivo não
pudermos repetir sistematicamente o fenômeno, ele não será classificado como experimento.
b) Regularidade: característica que diz respeito à possibilidade da ocorrência dos resultados do fenômeno.
A avaliação numérica da possibilidade de ocorrência desses resultados dará origem às probabilidades.

ESPAÇO AMOSTRAL

É o conjunto de todos os resultados possíveis de um experimento aleatório. Indicaremos o espaço amostral


por S. Observe:
• No lançamento de uma moeda: S = { cara, coroa}
• No lançamento de um dado: S = { 1, 2, 3, 4, 5, 6 }
• No nascimento de uma criança: S = { menina, menino}

Se um procedimento A pode ser realizado de n maneiras diferentes e um procedimento B pode ser realizado
de m maneiras diferentes, então o encadeamento dos procedimentos A e B pode ser feito de n x m maneiras
diferentes.
Isto sugere uma disposição gráfica chamada diagrama de árvore.
Veja:

a) Lançar duas moedas e observar as faces superiores.


O espaço amostral é: S = { cc, ck, kk, kc }

Diagrama de árvore:
C
C
K
C
K K

EVENTO

Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório.

1. Considere o espaço amostral do lançamento de um dado e a observação da face superior. Descreva, por
seus elementos, os seguintes eventos:
a) A: sair face par.
b) B: sair face com número primo.
c) C: sair face maior que três.
d) D: sair face maior que 6.
e) E: sair face múltipla de 3.
f) F: sair face menor ou igual a 4.

De modo resumido, podemos afirmar que um evento A ocorre quando ocorrerão uns de seus pontos.

Quando ocorrer que um evento seja C = { } não possui elementos, portanto este evento nunca ocorrerá, é
denominado evento impossível.
O próprio espaço amostral S é sempre um evento, como ele contém todos os possíveis resultados do
experimento, S certamente ocorrerá, neste sentido é denominado evento certo.

Página 89
2. Considere o espaço amostral S= { 1,2,3,4,5,6,7,8,9,10} e os seguintes eventos:

A= { 2, 3, 4} B= { 1, 3, 5, 7, 9} C= { 5 } D= { 1, 2, 3 } E = { 2, 4, 6}

Determine:
a) AUB
b) A∩B
c) A∩C
d) (A ∩ D) U E

3. Dê o espaço amostral dos seguintes experimentos:

a) Lançamento simultâneo de três moedas.

b) Lançamento simultâneo de um dado e uma moeda.

c) Distribuição dos 4 filhos de uma família, quanto ao sexo, por ordem de nascimento.

FUNÇÃO PROBABILIDADE

Uma vez identificado o espaço amostral S = { a 1, a 2,... a n } de um elemento, podemos associar a cada elemento
sua possibilidade de ocorrência.
Do ponto de vista matemático, esta associação é uma função chamada função probabilidade, que definiremos
da seguinte forma:
Função Probabilidade é uma função definida no espaço amostral S do experimento, assumindo valores reais,
com as seguintes propriedades:

1. 0 ≤ p(a i ) ≤ 1 i = 1,2,…,n

2. ∑ p(a i ) = 1 i = 1,2,…n

O valor p(a i ) é denominado probabilidade de ocorrência do resultado a i .

PROBABILIDADE DE UM EVENTO
A probabilidade de ocorrência de um evento A, que indicaremos por p(A), é a soma das probabilidades dos
elementos que pertencem a A.

Exemplo:

Lançamento de um dado e observação da face superior. Determine a probabilidade de cada um dos eventos abaixo:

a) Sair face 2 ou face 3.


b) Sair face ímpar.
c) Sair face maior que 1.
d) Sair face 5.
e) Sair face 1 ou 2 ou 3 ou 4 ou 5 ou 6.
f) Sair face múltiplo de 9

Página 90
Inicialmente, determinamos o espaço amostral e a função de probabilidade.
O espaço amostral é S= { 1, 2, 3, 4, 5, 6}
A função de probabilidade é dada por:

S __P___R
1 _____ p(1) = 1/6
2 _____ p ( 2) = 1/6
3 _____ p ( 3) = 1/6
4 _____ p ( 4) = 1/6
5 _____ p ( 5) = 1/6
6 _____ p ( 6) = 1/6

Exercícios:

1. O experimento consiste em lançar dois dados e observar a diferença dos pontos das faces superiores. Determine o
espaço amostral do experimento.

2. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores. Determine o
espaço amostral do experimento.

3. O experimento consiste em lançar dois dados e observar, em módulo, a diferença dos pontos das faces superiores.
Determine o espaço amostral do experimento.

4. O experimento consiste em lançar dois dados e observar o dobro da soma dos pontos das faces superiores.
Determine a função de probabilidade.

5. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores. Determine a
função de probabilidade.

6. O experimento consiste no lançamento de dois dados e na observação da soma dos pontos das faces superiores.
Determine o espaço amostral do experimento e a função de probabilidade.

TIPOS DE EVENTOS

1. EVENTOS COMPLEMENTARES

Sabemos que um evento pode ocorrer ou não. Sendo “p” a probabilidade de que ele ocorra (sucesso) e “q” a
probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação:

p+q=1→q=1–p

Página 91
Assim, se a probabilidade de se realizar um evento é p = 1 , a probabilidade de que ele não ocorra é:
5
q=1–p→q=1- 1 = 4 .
5 5
Sabemos que a probabilidade de tirar o 4 no lançamento de um dado é p = 1 . Logo, a probabilidade de não tirar
o 4 no lançamento de um dado é: 6

q=1- 1 = 5 .
6 6

2. EVENTOS INDEPENDENTES

Dizemos que dois eventos são independentes quando a realização ou não-realização de um dos eventos não
afeta a probabilidade da realização do outro e vice-versa.

Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no
outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto
das probabilidades de realização dos dois eventos.
Assim, sendo p 1 a probabilidade de realização do primeiro evento e p 2 a probabilidade de realização do segundo
evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por:

p = p1 x p2
Exemplo:

Lançamos dois dados. A probabilidade de obtermos 1 no primeiro dado é: p1= 1 .


6
A probabilidade de obtermos 5 no segundo dado é : p2 = 1 .
6

Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo é: p= 1 x 1 = 1 .


6 6 36
3. EVENTOS MUTUAMENTE EXCLUSIVOS

Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização
do(s) outro(s).

Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos,
já que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das
probabilidades de que cada um deles se realize:

p = p1 + p2
Exemplo:

Lançamos um dado. A probabilidade de se tirar o 3 ou o 5 é:

p = 1 + 1 = 2 = 1 , pois, como vimos, os dois eventos são mutuamente exclusivos.


6 6 6 3

Página 92
EXERCÍCIOS:

1. Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52 cartas?

2. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas?

3. Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:


a) A probabilidade de essa peça ser defeituosa.
b) A probabilidade de essa peça não ser defeituosa.

4. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.

5. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do
segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus?

6. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1
verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual a
probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca,
preta e verde?

7. De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a
primeira carta ser o às de paus e a segunda ser o rei de paus?

8. Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52 cartas?

9. Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um baralho de 52
cartas?

10. No lançamento de um dado, qual a probabilidade de se obter um número não-inferior a 5?

11. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.

12. Considere o evento de lançar um par de dados. Suponha em que estejamos interessados na soma dos valores
de face mostrados nos dados.

a) Quantos pontos amostrais são possíveis?


b) Relacione os pontos amostrais.
c) Qual é a probabilidade de se obter o valor 7?
d) Qual é a probabilidade de se obter o valor 9 ou um valor maior?
e) Uma vez que cada lançamento tem seis valores pares possíveis (2, 4, 6, 8, 10, 12) e somente cinco valores
ímpares passíveis (3, 5, 7, 9 e 11) os dados exibirão valores pares com mais freqüência do que valores ímpares. Você
concorda com essa afirmação? Explique.

13. Considere o seguinte espaço amostral de um experimento: S = { 1, 2, 4, 7, 8}. Verifique se a função:

S ____P___ R

1_________ p(1) = 0,1

Página 93
2_________ p(2) = 0,2
4 _________ p(4) = 0,4
7_________ p(7) = 0,7
8 _________ p(8) = 0,8 pode ser uma função de probabilidade associada, a este espaço amostral.

14. O quadro abaixo representa a classificação por sexo e por estado civil, de um conjunto de 50 deputados
presente em uma reunião.

SEXO
HOMEM MULHER
ESTADO CIVIL

Casado 10 8

Solteiro 5 3

Desquitado 7 5

Divorciado 8 4

Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos:

a) A – Ser um homem
b) B – Ser uma mulher
c) C – Ser uma pessoa casada
d) D – Ser uma pessoa solteira
e) E – Ser uma pessoa desquitada
f) F – Ser uma pessoa divorciada

15. Um experimento consiste em sortear um aluno em uma classe pela lista de chamada (1 a 20). Determine a
probabilidade dos seguintes eventos:

a) A – Ser sorteado um número par.


b) B – Não ser sorteado múltiplo de 5.
c) C – Ser sorteado um número maior que 12 e múltiplo de 3.
d) D – Ser sorteado um número menor que 7 e múltiplo de 4.
e) E – Ser sorteado um número menor que 13, maior que 8 e múltiplo de 7.
f) F – Ser sorteado um número real.

16. O experimento consiste em retirar duas cartas de um baralho comum e anotar ordenadamente os naipes
destas cartas. Determine o espaço amostral do experimento.

Página 94

Você também pode gostar