Estatistica Basica PDF

SIRLEI ALVES CHAVES
Estatística Básica
1ª Edição
Brasília/DF - 2019
Autores
Sirlei Alves Chaves
Produção
Equipe Técnica de Avaliação, Revisão Linguística e
Editoração
Sumário
Organização do Livro Didático....................................................................................................................................... 4
Introdução.............................................................................................................................................................................. 6
Capítulo 1
Conceitos fundamentais.............................................................................................................................................. 7
Capítulo 2
Distribuição de frequências.....................................................................................................................................16
Capítulo 3
Medidas estatísticas...................................................................................................................................................27
Capítulo 4
Probabilidade................................................................................................................................................................ 36
Capítulo 5
Distribuição de probabilidade de variáveis aleatórias discretas................................................................52
Capítulo 6
Distribuição de probabilidade de variáveis aleatórias contínuas.............................................................. 59
Organização do Livro Didático
Para facilitar seu estudo, os conteúdos são organizados em capítulos, de forma didática, objetiva e
coerente. Eles serão abordados por meio de textos básicos, com questões para reflexão, entre outros
recursos editoriais que visam tornar sua leitura mais agradável. Ao final, serão indicadas, também,
fontes de consulta para aprofundar seus estudos com leituras e pesquisas complementares.
A seguir, apresentamos uma breve descrição dos ícones utilizados na organização do Livro Didático.
Atenção
Chamadas para alertar detalhes/tópicos importantes que contribuam para a

síntese/conclusão do assunto abordado.
Cuidado
Importante para diferenciar ideias e/ou conceitos, assim como ressaltar para o
aluno noções que usualmente são objeto de dúvida ou entendimento equivocado.
Importante
Indicado para ressaltar trechos importantes do texto.
Observe a Lei
Conjunto de normas que dispõem sobre determinada matéria, ou seja, ela é origem,
a fonte primária sobre um determinado assunto.
Para refletir
Questões inseridas no decorrer do estudo a fim de que o aluno faça uma pausa
e reflita sobre o conteúdo estudado ou temas que o ajudem em seu raciocínio.
É importante que ele verifique seus conhecimentos, suas experiências e seus
sentimentos. As reflexões são o ponto de partida para a construção de suas
conclusões.
4
Organização do Livro Didático
Provocação
Textos que buscam instigar o aluno a refletir sobre determinado assunto antes
mesmo de iniciar sua leitura ou após algum trecho pertinente para o autor
conteudista.
Saiba mais
Informações complementares para elucidar a construção das sínteses/conclusões

sobre o assunto abordado.
Sintetizando
Trecho que busca resumir informações relevantes do conteúdo, facilitando o

entendimento pelo aluno sobre trechos mais complexos.
Sugestão de estudo complementar
Sugestões de leituras adicionais, filmes e sites para aprofundamento do estudo,

discussões em fóruns ou encontros presenciais quando for o caso.
Posicionamento do autor
Importante para diferenciar ideias e/ou conceitos, assim como ressaltar para o
aluno noções que usualmente são objeto de dúvida ou entendimento equivocado.
5
Introdução
Este livro didático destina-se aos alunos do curso de graduação a distância da Faculdade Unyleya e
apresenta uma introdução conceitual do campo da estatística e algumas aplicações. As aplicações
correspondem a problemas contextualizados que exigem a análise de certos dados apresentados
e a escolha de um método conveniente para tratá-los estatisticamente. Sendo assim, ao longo
de cada capítulo, serão discutidas, desenvolvidas e ampliadas algumas técnicas estatísticas, a
fim de, posteriormente, serem aplicadas em situações-problema. Vale ressaltar que as questões
apresentadas irão, constantemente, exigir que o estudante se posicione criticamente em relação a
elas, isto é, a partir de resultados estatísticos, o estudante deverá fornecer critérios para a tomada
de decisão na solução de problemas.
Apesar do forte caráter das aplicações, é importante lembrar que, em todos os momentos, o
rigor característico da linguagem matemática está presente, uma vez que um dos objetivos deste
livro é articular teoria e prática. Vale observar, ainda, que não existe preocupação de esgotar
por completo os conceitos abordados, embora estejam incluídas referências bibliográficas para
aqueles que assim desejarem.
Objetivos
Este livro didático tem como objetivos:
» Servir de instrumento de reflexão, discussão e problematização em torno de temas e

questões fundamentais presentes na prática de uma empresa e/ou organização.
» Entender e usar de forma eficiente e eficaz informações estatísticas extraídas de um

banco de dados.
» Analisar relatórios estatísticos visando avaliar e tomar decisões acertadas; enfatizar

o desenvolvimento do pensamento estatístico e avaliar a credibilidade do valor das
inferências feitas a partir de dados, não só para aqueles que consomem, mas também
para aqueles que produzem.
6
CONCEITOS FUNDAMENTAIS
CAPÍTULO
1
Introdução do capítulo
Este capítulo apresenta algumas definições básicas de conceitos fundamentais relacionados

à estatística. Além disso, busca demonstrar o papel-chave que a estatística desempenha no
raciocínio crítico, seja ele elaborado no decorrer deste curso, no trabalho ou na vida diária.
Objetivos
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
» Identificar os objetivos da ciência estatística.
» Identificar tipos de aplicações estatísticas na empresa.
» Reconhecer os elementos fundamentais da estatística.
» Identificar e escolher adequadamente um método estatístico para análise de populações.
» Classificar dados estatísticos.
» Estabelecer um critério para coleta de dados.
» Entender o papel da estatística no gerenciamento da tomada de decisão.
A estatística e sua importância
Durante muito tempo a estatística foi vista apenas como gráficos e tabelas. Atualmente, no mundo
globalizado em que vivemos, a informação é de fundamental importância nas mais variadas
atividades profissionais como economia, agronomia, administração, biologia etc.
7
CAPÍTULO 1 • Conceitos fundamentais
Importante
A principal ferramenta para transformar uma massa de números (dados) em informações é exatamente a estatística.
As técnicas estatísticas são utilizadas para organizar, apresentar, analisar e interpretar dados. Embora a análise e a
interpretação de dados escape à noção de estatística, estas seriam, na verdade, o seu principal uso.
Como a estatística é uma ciência relativamente nova, muitos ainda não se deram conta da sua
importância para a vida moderna. Com os recentes avanços computacionais, a estatística tem
sido cada vez mais utilizada, pois muitas de suas técnicas envolvem cálculos cansativos que
hoje podem ser facilmente resolvidos por pacotes estatísticos (programas de computadores
específicos para estatística) disponíveis no mercado.
A estatística como ciência é uma área da matemática que, com base na teoria das probabilidades,
estuda métodos para a modelagem de fenômenos. A estatística básica usa os aleatórios, aqueles
fenômenos que produzem dados de observação, tais como temperatura média diária em uma
determinada região ou o índice de inflação mensal de certo país.
Como os fenômenos aleatórios permeiam as mais variadas áreas do conhecimento, esses métodos
usam a estatística como ferramenta na solução de problemas nessas áreas. Por isso, observa-se
que são raros os cursos de graduação que não incluem em sua grade curricular pelo menos uma
disciplina da área de estatística.
A estatística está dividida em duas grandes áreas: a sstatística descritiva e a inferência estatística.
A estatística descritiva é de extrema importância principalmente em pesquisa de levantamento de
dados, pois, diante de uma grande massa de dados (observações), coletados de um determinado
fenômeno (por exemplo, o preço de um produto em todos os supermercados da cidade),
precisa-se de procedimentos estatísticos para organizá-los de forma que este fenômeno possa
ser interpretado de maneira bastante clara.
Os métodos de inferência estatística são utilizados principalmente para tomar decisões diante
de incertezas que são inerentes aos fenômenos aleatórios. Embora já se disponha de métodos
estatísticos bem sofisticados, muitos problemas do nosso dia a dia podem ser resolvidos com a
estatística descritiva.
A estatística descritiva deve ser aplicada na coleta, organização e descrição dos dados, enquanto
que a inferência estatística auxilia na análise e interpretação dos dados.
Sendo assim, em qualquer área do conhecimento, em vários cursos de graduação, é fundamental

que se tenha a matéria estatística, iniciando com uma disciplina cujo conteúdo trate de estatística
descritiva.
8
Conceitos fundamentais • CAPÍTULO 1
Importante
É possível distinguir duas concepções para a palavra ‘estatística’: no plural (estatísticas), indica qualquer coleção de
dados numéricos, reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer. No singular
(estatística), indica a atividade humana especializada ou um corpo de técnicas, ou ainda uma metodologia desenvolvida
para coleta, classificação, apresentação, análise e interpretação de dados quantitativos e utilização desses dados para a
tomada de decisões.
A Éstatística é uma parte da matemática que fornece métodos para a coleta, organização, descrição, análise e
interpretação de dados, viabilizando a utilização deles na tomada de decisões
População e amostra
População é o conjunto de todos os elementos (pessoas, animais, domicílios ou objetos) que

têm em comum a característica ou o atributo de interesse do fenômeno em estudo.
Como exemplo, suponha que queremos estudar o perfil sócio-econômico dos estudantes
universitários da cidade de Manaus. Então, o fenômeno em estudo é o perfil sócio-econômico
dos universitários da cidade de Manaus e a população é formada por todos os estudantes
universitários da cidade de Manaus, ou seja, estudantes matriculados nas universidades e
faculdades localizadas na cidade de Manaus.
Amostra é uma parte da população, selecionada de maneira criteriosa, para efetivamente fornecer
os dados para o estudo.
Figura 1. População e amostra.
População
Amostra
Fonte: https://www.shutterstock.com/g/Bakhtiar+Zein?searchterm=Popula%C3%A7%C3%A3o%20e%20amostra.
Uma amostra representativa de uma população pode ser obtida escolhendo-se aleatoriamente
os elementos que irão compor a amostra e isso nos permite fazer inferências sobre a população.
9
No exemplo acima, a amostra é formada por parte dos estudantes universitários da cidade de
Manaus.
Atenção
Duas observações:
A primeira é que devemos usar procedimentos estatísticos para determinar o tamanho da amostra, ou seja, quantos
elementos devem ser selecionados para fazer parte da amostra.
A segunda é utilizar o método de amostragem (amostragem aleatória simples, amostragem estratificada, amostragem
por conglomerado etc...) mais adequado para os objetivos do levantamento.
Censo e amostragem: quando consideramos todos os elementos da população em um estudo,

realizamos um censo e quando tomamos parte da população estatística básica usando o para o
estudo, realizamos uma amostragem.
Em geral a realização de um censo demanda muito tempo e alto custo, daí o Brasil fazer o censo
a cada dez anos. O censo se torna viável quando a população é pequena e é fácil o acesso aos
seus elementos.
Definição e classificação de variáveis
Quando falamos no estudo do perfil sócio-econômico dos universitários da cidade de Manaus,

fica subentendido que estamos tratando com algumas variáveis, tais como, idade, renda familiar,
número de filhos na família, escolaridade dos pais etc. É importante diferenciar os tipos de
variáveis para que se possa dar o tratamento estatístico adequado a cada uma delas.
As variáveis são classificadas como qualitativas ou quantitativas. Uma variável qualitativa

representa uma qualidade e seus valores são categorias.
Atenção
Se o nosso interesse está voltado para certa variável de determinado grupo de elementos, ela pode ser classificada
em:
Qualitativa, isto é, quando resulta de uma classificação por tipos ou atributos. Sendo assim, pode ser:
» nominal - como, por exemplo, sexo ou cor dos olhos;
» ordinal - como, por exemplo, classe social ou grau de instrução.
Quantitativa, isto é, quando os seus valores indicam quantidades. Dessa forma, a variável pode ser:
» discreta - quando seus possíveis valores formam um conjunto enumerável, finito ou infinito, como, por exemplo,
número de peças defeituosas, número de filhos ou número de carros;
» contínua - quando assume qualquer valor dentro de um intervalo de variação, como, por exemplo, peso, altura,
tempo ou renda.
10
De acordo com as categorias, a variável pode ser subdividida em qualitativa nominal, se as

categorias não impõem uma ordem natural ou qualitativa ordinal, se as categorias impõem
uma ordem natural.
Por outro lado, uma variável quantitativa representa uma quantidade e seus valores são numéricos.
Podem ser subdivididas em quantitativa discreta, quando seus valores são pontos sobre a reta,
geralmente resultado de uma contagem, ou quantitativa contínua, quando seus valores estão
em um intervalo da reta, geralmente resultado de uma medida.
Figura 2. Variáveis estatíscas.
Fonte: https://marketinganalitico.com.br/marketing-e-estatistica-variaveis/
Exemplos:
Variáveis qualitativas nominais - nacionalidade (brasileira, francesa, portuguesa, ...); religião

(católica, evangélica); sexo: (masculino, feminino). Observa-se nessas variáveis que não existe
uma relação de ordem entre as categorias.
Variáveis qualitativas ordinais - escolaridade (ensino fundamental; ensino médio; ensino

superior); classe social (A, B, C, ...). Nesse caso as categorias apresentam uma relação de
ordem natural.
Variáveis quantitativas discretas - número de filhos por família (0, 1, 2, ...); pontos na Carteira
Nacional de Habilitação (0, 7, ..., 20).
Variáveis quantitativas contínuas - peso de indivíduo (em quilograma), altura de indivíduos

(em centímetro), idade, temperatura, etc.
As variáveis são medidas registradas de um dado objeto de estudo, realizadas em diferentes

unidades de observação. Por exemplo, no estudo do perfil dos universitários da cidade de Manaus,
o pesquisador tem “estudante universitário” como objeto ou unidade amostral. Como variáveis,
“idade do estudante”, “renda familiar do estudante” e “curso em que está matriculado”; o valor
da variável depende do estudante avaliado, sendo a medida expressa pela escala escolhida, por
exemplo, idade em anos e renda em salários mínimos.
11
Tipos de dados
Todos os dados (e, por conseguinte, as variáveis que medimos) podem ser classificados
como um dos dois tipos gerais: quantitativo ou qualitativo.
Dados quantitativos são medidas registradas em uma escala numérica de ocorrência

natural.
Exemplo 1: a temperatura (em graus Celsius) em que cada unidade em uma amostra de
25 peças plásticas resistentes ao calor começa a derreter; a atual taxa de desemprego
de cada um dos estados brasileiros da região Sudeste; o salário dos administradores
empregados em multinacionais; o número de mulheres executivas empregadas em cada
uma das amostras de 75 empresas de manufatura.
Quanto aos dados qualitativos, são mensurações que não podem ser medidas em uma
escala numérica natural. Eles só podem ser classificados em grupo de categorias, ou seja,
podem apenas ser classificados em categorias.
Exemplo 2: a afiliação a um partido político, a condição de defeito (defeito ou não) de

cada uma das 100 peças de um microcomputador, a nacionalidade de cem turistas em
visita à cidade do Rio de Janeiro.
Coleta de dados
Em toda pesquisa de levantamento em que queremos fazer afirmações sobre características de

uma população, surgem dois problemas que devem ser tratados com bastante atenção para a
confiabilidade dos resultados do estudo.
O primeiro diz a respeito ao número de unidades a serem observadas, ou seja, o tamanho da

amostra. O segundo refere-se ao plano amostral, isto é, como operacionalizar a coleta dos dados.
Atenção
Na realização de estudos dessa natureza é quase impossível observar todos os elementos da população em estudo,
principalmente devido ao tempo e custo operacional. Portanto, tendo que trabalhar com uma amostra, deve-se
escolher a estatística básica usando uma amostra que seja representativa da população, ou seja, uma cópia o mais fiel
possível da população. Assim, escolhendo-se criteriosamente as unidades amostrais, teremos segurança para usar a
inferência estatística e generalizar os resultados obtidos na amostra para a população.
Fontes de dados
Os dados a serem coletados podem estar previamente armazenados em algum lugar ou podem
ser gerados pelo próprio pesquisador. As fontes de dados podem ser secundárias e primárias.
12
Fontes secundárias: são bancos de dados ou arquivos previamente existentes, onde estão
armazenadas as informações que serão utilizadas no levantamento, ou seja, os dados já existem e o
pesquisador irá lançar mão deles para desenvolver seu estudo. As fichas de cadastro de estudantes
ou de clientes de uma loja de departamentos são exemplos de fonte de dados secundária.
Fontes primárias: dizemos que a fonte é primária quando o próprio pesquisador gera a
informação. As fontes primárias mais utilizadas são a observação direta do fenômeno, que é
um método clássico na pesquisa científica, e o questionário que é o instrumento de pesquisa
do levantamento de dados.
Construção do instrumento de pesquisa
O instrumento de pesquisa é o objeto que reúne um conjunto de questões para gerar um

documento padrão onde serão coletados e registrados os dados da pesquisa. O instrumento
precisa ser bem adequado e direcionado aos objetivos da pesquisa.
Atenção
Para o êxito do instrumento de pesquisa devemos:
» fazer questões tão simples quanto possível;
» acilitar as respostas dos entrevistados;
» elaborar com clareza as perguntas;
» facilitar a memória do sujeito entrevistado;
» evitar realização de cálculos;
» evitar palavras técnicas no instrumento;
» evitar perguntas com respostas dúbias;
» evitar perguntas sugestivas;
» evitar um grande número de questões;
» evitar questões com respostas abertas;
» permitir uma resposta adicional.
O papel da estatística no gerenciamento das tomadas de decisão
O crescimento na coleta de dados, associado ao fenômeno científico, às operações de negócios

e às atividades governamentais (controle de qualidade, auditoria estatística, previsões) tem sido
marcante nas últimas décadas.
Todo dia a mídia apresenta resultados e pesquisas políticas, econômicas e sociais. Na

ênfase cada vez maior do governo a respeito das drogas e dos testes de produtos, por
exemplo, testemunha-se a clara evidência da necessidade de ser capaz de avaliar os
13
dados inteligentemente. Como consequência, cada um de nós tem desenvolvido um

discernimento – uma habilidade de raciocínio para interpretar e entender o significado
dos dados. Essa habilidade pode ajudar a fazer escolhas inteligentes, inferências e
generalizações, isto é, ajudar a pensar criticamente, usando a estatística.
Para refletir
O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística para avaliar
criticamente dados e inferências. É fundamental para o processo que exista variação na população e no processamento
de dados.
Gestores de sucesso confiam muito no uso do pensamento estatístico para ajudá-los a tomar
decisões. O fluxograma da figura 3, mostra o papel da estatística na tomada de decisão.
Figura 3. O papel da estatística na tomada de decisão gerencial.
Fonte: Criação do autor.
Cada problema de tomada de decisão inicia-se no mundo real. Esse problema é, então, formulado
em termos gerenciais e estruturado como uma questão gerencial. Os próximos passos (seguindo
o fluxograma no sentido anti-horário) identificam os papéis que a estatística pode representar
nesse processo. Os problemas gerenciais são traduzidos para problemas estatísticos, os dados
da amostra são coletados e analisados, e a questão estatística é respondida. O próximo passo
14
é usar a resposta para resolver o problema gerencial. A resposta para o problema gerencial
pode sugerir uma reformulação do problema original, uma nova questão ou levar à solução do
problema gerencial.
Sintetizando
Vimos até agora:
» O conceito de estatística.
» Os tipos de aplicações da estatística: descritiva e inferencial.
» Os quatro elementos dos problemas estatísticos descritivos: identificar a população ou amostra, identificar as variáveis,
coletar dados e descrever os dados.
» A caracterização dos tipos de dados: quantitativos (de natureza numérica) e qualitativos (de natureza categórica).
» Os métodos de coleta de dados: observacional, fontes publicadas, pesquisa e plano experimental.
» O papel da estatística no gerenciamento da tomada de decisão.
15
DISTRIBUIÇÃO DE FREQUÊNCIAS
CAPÍTULO
2
Introdução do Capítulo
Caro discente, agora que você já aprendeu como coletar os dados, no capítulo 2 estudará algumas
técnicas estatísticas para organizar esses dados em tabelas. Você verá que para cada tipo de
variável, qualitativa ou quantitativa, existe uma tabela adequada para apresentar os dados.
Objetivos
» Descrever dados qualitativos de uma pesquisa estatística.
» Estabelecer métodos gráficos para descrever dados quantitativos.
» Interpretar e utilizar dados apresentados graficamente.
» Selecionar a maneira mais adequada para representar um conjunto de dados

graficamente.
Variáveis qualitativas
Uma vez coletados os dados, precisamos ter familiaridade com eles e, portanto, é necessário
organizá-los de maneira que essa massa de dados se transforme em informações a respeito do
fenômeno que está sendo estudado.
Ou seja, nosso objetivo neste capítulo é organizar e apresentar os dados em tabelas, de modo a
facilitar o seu manuseio e entendimento do fenômeno.
Classificação simples
Para organizar as observações (dados) de uma variável qualitativa, construímos uma tabela a
partir do conjunto de valores observados. Em uma coluna registramos as categorias da variável
16
Distribuição de frequências • CAPÍTULO 2
e em outra coluna a frequência de cada categoria. Por exemplo, suponha que 50 candidatos
ao vestibular de 2019, tenham respondido a um questionário com a pergunta, qual o grau de
instrução do seu pai? As respostas codificadas são:
1 – Nenhum, 2 – Fundamental, 3 – Médio e 4 – Superior.
Vamos admitir que o conjunto de resposta fosse o seguinte:
3 3 2 2 3 1 3 4 4 2 2 1 4 2 3 2 3 3 3 3 3 2 2 3 1
3 3 3 3 1 1 2 3 2 3 3 2 3 2 3 2 2 2 3 3 3 3 3 3 3
Os dados estão organizados na tabela 1.
Uma tabela deve ter os seguintes elementos:
Título - o título explica o que contém a tabela. Compõe-se da referência (tipo de elemento e
número), da descrição do conteúdo e da data de referência.
Corpo - o corpo é formado pelas linhas e colunas de dados da tabela. É a parte da tabela que
contém os dados e informações.
Cabeçalho - o cabeçalho da tabela é a primeira linha. É a parte superior da tabela que especifica
o conteúdo das colunas. Pode ser constituído de um ou vários níveis.
Coluna indicadora - a coluna indicadora é primeira coluna, especifica o conteúdo das linhas.
Fonte - consiste na indicação da entidade (ou entidades) responsável pelo fornecimento ou

elaboração dos dados e/ou informações constantes da tabela.
Tabela 1. Grau de instrução do pai do candidato, Vestibular 2019.
Grau de Instrução Frequência

Nenhum 5
Fundamental 15
Médio 27
Superior 3
Total 50
Classificação dupla
As informações contidas na tabela 1 podem ser mais detalhadas. Por exemplo, a informação
sobre o grau de instrução dos pais, pode ser informada por sexo ou pelo curso que o
candidato escolheu. Ou seja, podemos construir uma tabela com duas entradas ou dupla
classificação.
17
CAPÍTULO 2 • Distribuição de frequências
Utilizando o exemplo anterior, suponha que no conjunto dos 50 candidatos acima, 30 são do
sexo masculino e 20 do sexo feminino, além disso, 10 candidatos escolheram a área de ciências
exatas, 25 escolheram ciências humanas e 15 escolheram ciências biológicas. Esses dados agora
podem ser apresentados como nas tabelas a seguir:
Tabela 2. Grau de instrução do pai por sexo do candidato, Vestibular 2019.
Frequência
Grau de Instrução Total
Masculino Feminino
Nenhum 3 2 5
Fundamental 5 10 15
Médio 14 13 27
Superior 2 1 3
Total 24 26 50
Note que a coluna da direita contém o total das frequências relativas à variável grau de instrução.
Tais frequências são distribuídas no corpo da tabela conforme as categorias da outra variável de
classificação. Na tabela 2 a variável sexo e na tabela 3 a variável área escolhida. Vejamos:
Tabela 3. Grau de instrução do pai do candidato pela área escolhida, Vestibular 2019.
Frequência
Grau de Instrução Total
Biológicas Exatas Humanas
Nenhum 1 1 3 5
Fundamental 3 4 8 15
Médio 5 8 14 27
Superior 2 0 1 3
Total 11 13 26 50
Variáveis quantitativas
No caso de variável quantitativa discreta, quando existem poucos valores diferentes da variável,
construímos uma tabela semelhante à tabela 1, apenas colocando na coluna indicadora os
diferentes valores da variável. Por exemplo, se fosse perguntado aos candidatos, qual o número
de filhos na sua família, poderíamos ter o resultado apresentado na tabela 4.
18
Tabela 4. Número de filhos na família do candidato, Vestibular 2019.
Número de filhos Frequência

0 5
1 26
2 9
3 5
4 3
5 2
Total 50
Quando existe um grande número de valores diferentes para a variável discreta, ou se a variável
quantitativa é contínua, construímos uma tabela de distribuição em classes de frequências.
Dados brutos
Os dados, na forma como são coletados, são chamados de dados brutos. Depois de ordenados,
em ordem crescente ou decrescente, são chamados de rol. Por exemplo, suponha que coletamos
a idade de cinquenta estudantes do curso de administração, cujos valores são apresentados a
seguir:
Dados Brutos
19 22 19 21 25 26 24 23 28 19
17 20 18 23 29 18 18 20 20 22
26 18 20 27 24 19 20 19 24 17
20 19 17 28 22 19 25 20 22 20
18 18 27 23 19 25 19 24 23 20
Dessa forma (dados brutos), temos dificuldade, por exemplo, de verificar qual a maior idade
no grupo ou qual a idade do estudante mais jovem. Essas questões são facilmente respondidas
quando dispomos os dados, por exemplo, em ordem crescente como segue:
Rol
17 17 17 18 18 18 18 18 18 19
19 19 19 19 19 19 19 19 20 20
20 20 20 20 20 20 20 21 22 22
19
22 22 23 23 23 23 24 24 24 24
25 25 25 26 26 27 27 28 28 29
Agora é simples verificar que o estudante mais jovem no grupo tem 17 anos, assim como o mais
velho tem 29 anos.
Distribuição em classes de frequências
Esses dados podem ser organizados numa tabela de distribuição em classes de frequências.
Importante
Para construir as classes de frequências devemos observar as seguintes regras:

» as classes devem conter todas as observações;
» a primeira classe deve conter o menor valor e a última classe o maior valor;
» cada valor deve ser colocado em uma única classe;
» dDeve-se usar entre 5 e 15 classes, se possível, de mesmo tamanho.
Com os dados do exemplo anterior, vamos construir uma tabela de distribuição em classes de
frequências para a variável idade dos estudantes. Inicialmente observamos que a menor idade é
17 anos e a maior idade é 29 anos, portanto, estes dados têm uma amplitude de 13 anos, vejamos:
Amplitude total = At = maior valor – menor valor = 29 – 17 = 13.
Escolhendo k = 6 classes (e é uma escolha), cada classe deve ter o comprimento aproximado de
At 13
h
= = ≅ 2,16 .
k 6
Para facilitar os cálculos e respeitar a segunda regra, podemos usar h = 2 e como limite inferior
da primeira classe o valor 16. Logo as seis classes de idade são: 16 a 18, 18 a 20, 20 a 22, 22 a 24,
24 a 26 e 26 a 28. Como o maior valor é 29, devemos aumentar mais uma classe para respeitar a
segunda regra, a última classe será 28 a 30.
Tabela 5. Distribuição em classes de frequências para a variável idade.
Número de filhos Frequência

16  18 3
 15
18 20
20  22 10
 8
22 24
24  26 7
26  28 4
 3
28 30
Total 50
20
As classes são fechadas à esquerda e abertas à direita, isto significa que a idade 18 anos pertence
à segunda classe e não à primeira. Por fim, contamos a frequência de cada classe.
Observe que na classe de 16 a 18, encontra-se três vezes a idade 17 anos. Portanto, a primeira
classe tem frequência igual a 3. Para a segunda classe verificamos que aparecem seis vezes a
idade de 18 anos e nove vezes a idade 19 anos, logo, a segunda classe tem frequência igual a 15.
E assim por diante, até a última classe que tem frequência 3, pois os valores correspondentes à
classe 28 a 30 são as idades 28, 28 e 29 anos.
Ao organizamos os dados em uma tabela de distribuição em classes de frequências, não sabemos

mais quais as idades que estão na terceira classe, por exemplo. Sabemos apenas que existem 10
estudantes com 20 anos ou mais e menos de 22 anos.
Elementos de uma distribuição de frequência
Os elementos em uma tabela de distribuição em classes de frequências trazem informações tais

como, a proporção de estudantes com menos de 26 anos, quantos estudantes têm 24 anos ou
mais. Esses elementos estão na tabela 6 e são definidos da seguinte forma, vejamos:
Atenção
A soma de todas as frequências relativas de uma amostra totaliza 100% ou 1.
Tabela 6. Distribuição em Classes de Frequências para a variável idade.
Número de filhos Xi fi Fi fri Fri

16  18 17 3 3 0,06 0,06
18  20 19 15 18 0,30 0,36
20  22 21 10 28 0,20 0,56
22  24 23 8 36 0,16 0,72
24  26 25 7 43 0,14 0,86
26  28 27 4 47 0,08 0,94
28  30 29 3 50 0,06 1,00
Total 50
Saiba mais
Notação para intervalos de classe.

Considere os extremos a e b de um intervalo, então:
a  b: intervalo fechado à esquerda e aberto à direita. Inclui o limite inferior a e exclui o limite superior b;
a  b: intervalo aberto à esquerda e fechado à direita. Exclui o limite inferior a e inclui o limite superior b;
a  b: intervalo fechado à esquerda e à direita. Inclui os dois extremos;
a  b:: intervalo aberto à esquerda e à direita. Exclui os dois limites a e b.
21
Ponto médio da classe (Xi): É o valor que representa todas as observações da classe. É calculado
como sendo a média dos limites da classe. Sendo assim, para a quarta classe temos:
22 + 24
=X4 = 23
2
Frequência simples ou absoluta (fi): É o número de observações na classe. Na quarta classe

existem oito observações, conforme se verifica no rol, sendo quatro vezes a idade 23 anos e
quantro vezes a idade 24 anos, portanto:
F4 = 8
Frequência acumulada (Fi): É a soma das frequências absolutas até a i-ésima classe. Para a quarta
classe, temos:
F4 = F1 + F2 + F3 + F4 = 3 + 15 + 10 + 8 = 36
Frequência relativa (fri): É a proporção de observações na i-ésima classe e é calculada como o

quociente entre a frequência absoluta e o total de observações, ou seja, fri = fi/n. Para a quarta
classe, temos:
f4 8
fr=
4 = = 0,16
n 50
Frequência relativa acumulada (Fri): É a proporção de observações acumuladas até a i-ésima

classe, ou seja, Fri = Fi/n. Ou ainda, a soma das frequências relativas até a i-ésima classe. Para a
quarta classe temos:
F4 36
Fr=
4 = = 0, 72
n 50
Também pode ser calculada da seguinte forma:
Fr4 = Fr1 + Fr2 + Fr3 + Fr4 = 0,06 + 0,30 + 0,20 + 0,16 = 0,72
Apresentação gráfica
O gráfico constitui um importante instrumento de representação de dados, fornecendo uma

comunicação rápida, clara e efetiva, poupando, sobretudo, tempo e esforço na visualização de
dados sumarizados, sendo uma forma de representar uma distribuição de frequências.
Um gráfico deve levar a uma rápida compreensão do fenômeno apresentado e possibilitar uma
correta interpretação dos seus valores. Ele auxilia bastante a apresentação de dados estatísticos
facilitando a sua compreensão.
22
Importante
Um gráfico deve apresentar título e escala. O título deve ser colocado acima do gráfico e descrito como figura. As
escalas devem crescer da esquerda para a direita e de baixo para cima. As legendas explicativas, quando houver
necessidade, devem ser colocadas, de preferência, à direita do gráfico.
Gráfico de pontos
No gráfico de pontos, o valor numérico de cada medição quantitativa do conjunto de dados é

representado por um ponto em uma escala horizontal. Quando os valores se repetem, os pontos
são posicionados um sobre o outro, verticalmente.
Gráfico 1. Número de filhos na família do candidato, Vestibular 2019.
Gráficos de colunas e barras
Gráficos de colunas são empregados para representar a distribuição de frequências de variáveis

qualitativas e quantitativas discretas. Cada categoria ou valor é representado por uma coluna
cuja altura é a sua frequência absoluta ou frequência relativa. Por exemplo: a distribuição de
frequências do gráfico abaixo:
23
Gráfico 2. Número de filhos na família do candidato, Vestibular 2019.
Alternativamente, podemos apresentar as categorias no eixo vertical e a frequências no eixo

horizontal. Os gráficos construídos desta forma são chamados de gráficos de barras. Como
exemplo, a distribuição de frequências está representada no gráfico 3:
Gráfico 3. Grau de instrução do pai do candidato, Vestibular 2019.
Gráfico de setores
O gráfico de setores é utilizado em geral para variáveis qualitativas. Ele é construído dividindo-
se o círculo em setores, cada um correspondendo, de forma proporcional, à frequência simples
24
ou relativa de uma das categorias da variável. O grau de instrução do pai do candidato está
representado no gráfico de setores, que também pode ser chamado de pictórico, da figura abaixo:
Gráfico 4 . Grau de instrução do pai do candidato, Vestibular 2019.
Histogramas
Os histogramas podem ser usados para mostrar tanto a frequência absoluta quanto a frequência
relativa das medidas em cada intervalo de classes. No histograma, os valores numéricos da variável
quantitativa estão divididos em intervalos de classe de mesma largura. Esses intervalos formam
a escala do eixo horizontal. A frequência absoluta ou relativa das observações em cada intervalo
de classe é determinada por uma barra vertical posicionada sobre cada intervalo de classe, cuja
altura corresponde à frequência absoluta ou relativa do intervalo de classe em questão.
Importante
Ao interpretar um histograma, devem-se considerar dois importantes fatores:
O primeiro é a porção da área total abaixo do histograma que fica sobre um intervalo particular do eixo horizontal,
que é igual à frequência relativa de medidas no intervalo.
O segundo é que se pode imaginar a aparência do histograma da frequência relativa para um conjunto de dados
muito grande (uma população).
O histograma que representa a distribuição em classes de frequências da tabela 5 está apresentado

no gráfico 5:
25
Gráfico 5. Histograma da idade de 50 estudantes de Administração.
Enquanto os histogramas proporcionam uma melhor descrição visual dos grupos de dados
(particularmente grupos muito grandes), eles não permitem identificar medidas individuais. Mas
cada uma das medidas originais é visível de alguma forma em um gráfico de pontos e claramente
visíveis em um gráfico de ramo e folhas.
Sintetizando
Vimos até agora:
1. Como descrever dados qualitativos, isto é, identificar classes de categorias, determinar as frequências absolutas e
relativas das classes e representar tais frequências em gráficos de barras e gráficos de pizza.
2. Como descrever dados quantitativos, ou seja, identificar classes de categorias, determinar as frequências absoluta e
relativa das classes e representar tais frequências em gráficos de pontos, de ramos e folhas e em histogramas.
26
CAPÍTULO
MEDIDAS ESTATÍSTICAS 3
Este capítulo apresenta conceitos e métodos para obter medidas de tendência central e medidas
de variabilidade, bem como critérios para interpretar o significado dessas medidas.
Objetivos
» Calcular e interpretar medidas de tendência central.
» Calcular e interpretar medidas numéricas de variabilidade.
» Calcular e interpretar medidas numéricas de posicionamento relativo.
Medidas numéricas de tendência central
Nesta seção, o objetivo é apresentar medidas numéricas descritivas da amostra a fim de fazer
inferências sobre medições correspondentes da população. Existem muitos métodos numéricos
para descrever conjuntos de dados quantitativos. A maior parte deles mede uma de duas
características:
» a tendência central do conjunto de medições, ou melhor, a tendência dos dados

observados se agruparem em torno de valores centrais;
» a variabilidade do conjunto de medições, ou seja, a dispersão dos dados.
Média aritmética
A média aritmética de um conjunto de dados quantitativos é a soma das medições

dividida pelo número de medições contadas no conjunto de dados. A média aritmética
é a mais importante medida de posição. Certamente você já calculou várias vezes a média
27
CAPÍTULO 3 • Medidas estatísticas
aritmética, afinal, para ser aprovado numa disciplina você precisa obter média maior
ou igual a cinco. Notação: x.
Ou seja:
∑
n
x
i =1 i
X=
n
Atenção
n
O símbolo ∑ =1
i=1
xi
significa o somatório dos números xi, com i variando de 1 a n.
Exemplo: digamos que o professor Sirlei tenha realizado cinco testes e você tenha tirado as
seguintes notas: 10, 2, 9, 6 e 8, respectivamente.
Neste caso temos n = 5 observações e a sua média igual a:
10 + 2 + 9 + 6 + 8
=X = 7
5
Como calcular a média de dados agrupados
Quando agrupamos os dados, calculamos a média ponderada onde cada valor x¬ tem peso igual
a sua frequência fi¬, ou seja,
1 k f1 X 1 + f 2 X 2 +… f k X k
=X = ∑ fi X i
n i =1 n = ∑ i =1 fi
k
Exemplo: Para a distribuição de frequências da tabela 4, a média é calculada como segue:
0 . 5 +1 . 26 + 2 . 9 +3 . 5 +4 . 3 + 5 . 2 81
X
= = = 1, 6
50 50
Observe que a média pode não ser um dos valores encontrados na amostra, como também
não temos 1,6 filhos. Este valor, que chamamos de média, representa o centro da distribuição
do número de filhos por família, é como o centro de massa de um corpo na física, é o ponto de
equilíbrio.
Quando os dados estão agrupados em classes de frequências, calculamos a média ponderada

usando Xi como sendo o ponto médio da classe. Exemplo: para a distribuição de frequências da
tabela 5, a média é calculada como segue:
17 . 3 +19 . 15 + 21 . 10 + 23 . 8 + 25 . 7 + 27 . 4 + 29 . 3 1100
X
= = = 22
50 50
Sendo assim, conclui-se que os estudantes do curso de administração apresentam uma média
de 22 anos de idade.
28
Medidas estatísticas • CAPÍTULO 3
Mediana (Md)
A mediana é o valor que ocupa a posição central de uma série de n observações ordenadas.
A mediana divide um conjunto de dados no meio, deixando 50% dos dados abaixo dela e 50%
dos dados acima. O cálculo da mediana depende do número n de observações.
Importante
Se n é ímpar, a mediana é o valor que ocupa a posição central dos dados ordenados. Ou seja, é aquele valor que ocupa
 n +1 
a posição  2  . Vejamos: no caso das notas de estatística, os valores ordenados são 2, 6, 8, 9, 10. Neste caso, n = 5, a
 
posição central é a 3ª observação cujo valor é 8, logo, 8.
Se n é par, a mediana será a média dos termos centrais dos dados ordenados. Ou seja, a mediana será a média entre os
n n +1
valores que ocupam as posições   e   . Sendo assim, voltando ao caso das notas de estatística e considerando seis
2  2 
notas, se as notas ordenadas são 2, 5, 6, 8, 9, 10, então a mediana será a média entre o 3º e o 5º termos, cujos valores são 6
e 8, respectivamente.
Portanto a mediana é dada por Md =  6 + 8  = 7
 2 
Mediana para dados agrupados
Se os dados estão agrupados, o procedimento de cálculo da mediana não se altera. Logo, basta
conferir que os valores já estão ordenados e a posição da mediana é encontrada pela frequência
acumulada.
Tabela 7. Número de filhos na família do candidato, Vestibular 2019.
Número de filhos Frequência (Fi) Fi

0 5 5
1 26 31
2 9 40
3 5 45
4 3 48
5 2 50
Total 50
Neste caso, sendo n = 50 um número par, a mediana será a média entre os valores que ocupam
n n 
as posições  2  o
 + 1
o
e , isto é, o 25º e 26º elementos. Observe pela frequência acumulada que,
  2 
do 1º ao 5º elemento, todos são iguais a zero, do 6º ao 31º, todos são iguais a 1 e portanto, o 25º
1+1
e 26º elementos são iguais a 1 e assim a mediana será dada por Md
= = 1 . Assim, a mediana
2
é 1 filho por família.
29
Importante
Quando os dados estão distribuídos em classes de frequências, como na tabela 8, o procedimento muda totalmente.
n
Primeiro calculamos a posição da mediana, Pos ( Md ) = . Em seguida, pela frequência acumulada, determinamos a
2
classe mediana, que é a classe que contém a mediana. E por fim calculamos a mediana como segue:
Md= li +
( Pos ( Md ) − Fi − i ) x h , onde,
fi
li: é o limite inferior da classe mediana;
Fi - 1 é a frequência acumulada da classe anterior à classe mediana;
fi é a frequência simples da classe mediana;
h é o intervalo de classe.
Número de filhos Xi fi Fi
16  18 17 3 3
18  20 19 15 18
20  22 21 10 28
22  24 23 8 36
24  26 25 7 43
 27 4 47
26 28
28  30 29 3 50
Total 50
Como exemplo, vamos calcular a mediana para a variável idade com os dados da tabela 8. Neste
caso, Pos ( Md=) 50
= 25 . Pela coluna de frequência acumulada, verificamos que o 25º elemento está
2
na classe 20 a 22 anos, ou seja, a terceira classe é a classe mediana. Portanto a mediana é dada por:
Md =
li +
( Pos ( Md ) − Fi − i ) x h =
20 +
( 25 − 18) x 2 =
21, 4
fi 10
Portanto, para este conjunto de idades de estudantes do curso de administração, a idade mediana
é 21,4 anos.
Moda Mo
A moda é o valor que ocorre com maior frequência em um conjunto de dados. Por exemplo,
considere que dez alunos realizaram um teste de estatística obtendo as seguintes notas: 5, 4, 4, 6,
3, 6, 3, 1, 7 e 2. Neste caso, a nota que aparece mais vezes é a nota 3, portanto, para esse conjunto
de notas a moda é 4. Mo = 4
Observação:
30
• Existem conjuntos com duas modas, 5, 6, 6, 8, 9, 10, 10. Conjunto bimodal.
Mo = 6 e Mo = 10
• Existem conjuntos sem moda, 1, 6, 11, 17, 21. Conjunto amodal.
• Existem conjuntos com várias modas. Conjunto polimodal.
Moda para dados agrupados
A moda para dados agrupados como na tabela 7 é simplesmente o valor de maior frequência
simples. Neste caso, a moda vale Mo = 1, pois o valor 1 tem a maior frequência simples que é
igual a 26.
Quando os dados estão agrupados em classes de frequências, a moda pode ser calculada pelo
seguinte método: primeiro determinamos a classe modal, aquela que apresenta a maior frequência
∆1
simples; depois, empregamos a fórmula, Mo= li + x h , onde:
∆1 + ∆ 2
li = limite inferior da classe modal;
∆1 = é a diferença entre a frequência simples da classe modal e a frequência simples da classe

imediatamente anterior à da classe modal;
∆2 = é a diferença entre a frequência simples da classe modal e a frequência simples da classe

imediatamente posterior à da classe modal;
hi = amplitude da classe modal.
Por exemplo, para calcular a moda para os dados da tabela 8, observamos inicialmente que a
classe modal é a segunda classe, cujas idades vão de 18 a 20 anos.
Neste caso, ∆1= f 2 − f 1= 15 − 3 = 12 ∆ 2 = f 2 − f 3 = 15 − 10 = 5 e
Portanto, a moda é calculada como segue:
∆1 12
Mo =li + x h =18 + x 2 =18 + 1, 4 =19, 4
∆1 + ∆ 2 12 + 5
Medidas de dispersão ou de variabilidade
Para descrição adequada de um fenômeno, não basta saber o valor em torno do qual os dados
estão variando, é necessário saber o grau de variabilidade dos dados. Isto é conhecido por meio
das medidas de dispersão. As medidas de variabilidade ou medidas de dispersão que vamos
calcular são: amplitude, variância, desvio padrão e coeficiente de variação.
31
Amplitude
Chama-se amplitude de um conjunto de dados quantitativos a diferença entre a maior e a menor

medição.
Vale lembrar que a amplitude é de fácil cálculo e compreensão, mas é uma medida não muito
apropriada de variação de dados quando os conjuntos de dados são muito grandes. Isso porque
dois conjuntos de dados podem ter a mesma amplitude, mas serem diferentes no que diz respeito
à variação dos dados.
Variância e desvio padrão
A variância, assim como o desvio padrão, são medidas que complementam a informação das
medidas de posição. Para calcular essas medidas de variabilidade, consideramos os desvios de
cada observação em relação à média aritmética, ou seja, Xi – X. Em seguida calculamos a média
dos quadrados dos desvios.
Assim, para um conjunto de valores X1, X2, X3, ..., Xn, a variância, denotada por S2, é calculada
como segue:
∑ (X −X)
n 2
i
S2 = i =1
n −1
Como a variância é uma medida quadrática, sua unidade de medida é o quadrado da unidade de
medida dos dados. Portanto, devemos trabalhar com a raiz quadrada positiva da variância, que
está na mesma unidade de medida dos dados. Esta medida é o desvio padrão, que é denotado
por S, dado por:
∑ (X −X)
n 2
2 i
=S S
= i =1
n −1
Exemplo: voltamos ao exemplo do professor de estatística que realizou cinco testes nos quais
você tirou as seguintes notas: 10, 2, 9, 6 e 8, respectivamente. Neste caso a sua média foi:
1 n 10 + 2 + 9 + 6 + 8
=X = ∑
n i =1
Xi
5
= 7
Logo, a variância é calculada da seguinte forma:
32
( X − X ) (10 − 7 ) + ( 2 − 7 ) + ( 9 − 7 ) + ( 6 − 7 ) + (8 − 7 )
2
∑
n 2 2 2 2 2
2 i
=S = i =1
n −1 5 −1
3 + ( −5 ) + 2 + ( −1) + 1 9 + 25 + 4 + 1 + 1 40
2 2 2 2 2
= = = = 10
4 4 4
E o desvio padrão é calculado assim:
S
= S2
= 10 ≅ 3, 2
Variância e desvio padrão para dados agrupados
Quando os dados estão agrupados, cada valor Xi¬ tem sua frequência correspondente. Neste
caso a variância e o desvio padrão são dados, respectivamente, por:
∑ (X −X) ∑ (X −X)
n 2 n 2
2 i 2 i
= i 1= i 1
S= → S= S=
n −1 n −1
Por exemplo, para os dados da tabela 9, vamos determinar a variância e o desvio padrão do
número de filhos por família. Já vimos que para estes dados a média foi X = 1,7.
Tabela 9. No de filhos na família do candidato, Vestibular 2019.
Número de filhos Frequência (fi) Xifi Fi(Xi – X)2

0 5 0 5(0 - 1,7)2 = 14,45
1 26 26 26(1 - 1,7)2 = 12,74
2 9 18 9(0 - 1,7)2 = 0,81
3 5 15 5(3 - 1,7)2 = 8,45
4 3 12 3(4 - 1,7)2 = 15,87
5 2 10 2(5 - 1,7)2 = 21,78
Total 50 81 74,10
Usando as informações da última coluna da tabela 9 para calcular a variância e desvio padrão
temos:
fi ( X i − X )
2
∑
n
2 74,10
S= i =1
= ≅ 1,51 → S= S 2= 1,51 ≅ 1, 2
n −1 49
Quando os dados estão agrupados em classes de frequências, cada valor Xi¬ será o ponto médio
da classe. Para os dados da tabela 10, já calculamos a média de idade X = 22 anos.
33
Número de filhos Xi fi Xifi Fi(Xi – X)2

16 18 17 3 51 3(17 - 22)2 = 75
18 20 19 15 285 15(19 - 22)2 = 10
20 22 21 10 210 10(21 - 22) 2 = 10
22 24 23 8 184 8(23 - 22) 2 = 8
24 26 25 7 175 7(25 - 22) 2 = 63
26 28 27 4 108 4(27 - 22) 2 = 100
28 30 29 3 87 3(29 - 22) 2 = 147
Total 50 1100 538
Sendo assim, temos:
fi ( X i − X )
2
∑
n
538
S 2= i =1
= ≅ 10,98anos 2 → S= S 2= 10,98 ≅ 3,31 anos
n −1 49
Coeficiente de variação
O desvio padrão, quando analisado individualmente, tem limitações. Por exemplo, um desvio
padrão S = 2, pode ser considerado pequeno, ou insignificante para uma série de valores cuja
média é X = 200, mas se a média for X = 20, esse desvio padrão já é bastante significativo.
Por isso, muitas vezes é conveniente usar uma medida de dispersão relativa para expressar a
variabilidade de um conjunto de dados.
Nesses casos, usamos o coeficiente de variação (CV) comparando o desvio padrão com a média,
ou seja, calculamos CV = S .
X
Como o desvio padrão e a média são expressos na mesma unidade de medida dos dados, o
coeficiente de variação é uma medida de dispersão relativa adimensional e, portanto, o resultado
S
desta divisão deve ser multiplicado por 100 e expresso em porcentagem, isto é, CV = .100 .
X
Exemplo: suponha que para os cinquenta estudantes do curso de administração, foram também
determinadas as alturas de cada um. A média e o desvio padrão das alturas de homens e mulheres
estão na tabela 11.
Tabela 11. Resumo das alturas de 50 estudantes de administração.
Variável Desvio Padrão (S)

Méida ( X )
Altura – homens 183 cm 8 cm
Altura – mulheres 166 cm 5 cm
34
A grande utilidade do coeficiente de correlação é comparar diferentes conjuntos de dados. Vamos

calcular o coeficiente de variação para a variável altura de homens e mulheres.
Homens: S 8
= CV = .100 = .100 0, 0437= .100 4,37%
X 133
S 8
Mulheres:
= CV = .100 = .100 0, 0437
= .100 4,37%
X 133
No exemplo acima, para esses conjuntos de dados de altura de estudantes, as mulheres apresentam
menor dispersão relativa. Concluímos, portanto, que, embora as mulheres sejam mais baixas
que os homens, as alturas das mulheres são mais homogêneas.
Sintetizando
Vimos até agora:
» Como calcular medidas de tendência central como a média, a mediana e a moda.
» Como calcular medidas de variabilidade como a amplitude, a variância e o desvio padrão.
» Como determinar o coeficiente de variação de uma distribuição e a medida de assimetria dela.
35
CAPÍTULO
PROBABILIDADE 4
Este capítulo apresenta métodos e conceitos combinatórios, que consistem no estudo de situações
em que a contagem se reduz, a saber, a quantas maneiras determinado grupo de objetos pode
ser escolhido, sem e com repetições em relação à ordem em que são selecionados. Tais situações
envolvem o desenvolvimento de competências como o planejamento de estratégias na resolução
de problemas, a divisão de problemas em casos, a análise envolvendo números pequenos
levando à generalização, e a crítica dos resultados obtidos. Essas técnicas, muitas vezes, serão
aplicadas em outros tipos de situações-problema, cujo objetivo é investigar qual é a chance de
um evento ocorrer, isto é, obter um número que indica a frequência relativa de ocorrência de
um evento. Obter as chances de determinado evento ocorrer permite, racionalmente, tomar
decisões prevendo eventos futuros.
Objetivos
» Resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou princípio

multiplicativo.
» Resolver problemas que envolvam o cálculo do número de elementos da união de

conjuntos.
» Identificar em situações-problema agrupamentos associados a conjuntos e sequências.
» Reconhecer situações em que os agrupamentos são distinguíveis pela ordem de seus

elementos, ou não, e resolver problemas que envolvam arranjos, combinações e/ou
permutações simples, com elementos repetidos e circulares.
» Reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço

amostral nessas situações-problema;
» Resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis.
36
Probabilidade • CAPÍTULO 4
» Utilizar o princípio multiplicativo no cálculo de probabilidades.
» Resolver problemas que envolvam o cálculo da probabilidade de eventos.
» Identificar eventos independentes e não independentes em situações-problema.
» Resolver problemas que envolvam o conceito de probabilidade condicional e binomial.
» Utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento.
Probabilidades
Todas as vezes que se estudam fenômenos de observação, cumpre-se distinguir o próprio

fenômeno e o modelo matemático (determinístico ou probabilístico) que melhor o explique.
Os fenômenos estudados pela estatística são aqueles cujo resultado, mesmo em condições
normais de experimentação, varia de uma observação para outra, dificultando dessa maneira a
previsão de um resultado.
Para refletir
A probabilidade teve sua origem por volta do século XVII, devido à curiosidade de um cavaleiro, o Chevalier de Méré,
que era muito apaixonado por jogos e, um dia, discutiu com um matemático chamado Blaise Pascal (1654) sobre as
possibilidades de ganhar em jogos com cartas, despertando no matemático um imenso interesse pelo assunto. Então,
Pascal escreveu uma carta para um amigo, também matemático, chamado Pierre de Fermat expondo o problema do
Chavalier de Méré. Para Fermat, o assunto era algo novo e desconhecido. Após a carta do amigo, ele começou a estudar
formas de descrever matematicamente as leis do acaso com maior precisão. Os amigos continuaram se comunicando
por meio de cartas, compartilhando cada nova descoberta. Fermat não tinha um real comprometimento em aprimorar
probabilidade, ele respondia às cartas de Pascal, e resolvia os problemas que o amigo enviava, o que era apenas uma
curiosidade relacionada com jogatinas e apostas. A prova disso pode ser vista em um problema proposto a ele por
Pascal.
O problema dizia o seguinte: “uma pessoa quer tirar seis no dado em oito jogadas, suponhamos que ela tenha feito três
tentativas e falhado, quanto de dinheiro ela poderia apostar em seu sucesso, ou seja, tirar um seis, na quarta jogada?”
1
O problema foi resolvido por Fermat da seguinte forma: a chance de se tirar um seis em um dado é de portanto o
1 6
apostador apostaria do dinheiro disponível para as apostas. Se ele falhar e tiver que jogar o dado uma segunda vez,
6 1
sua chance de tirar um seis ainda é de 6 , e o apostador deve apostar 1 do dinheiro que lhe sobrou da primeira aposta,
1 6
isso daria 6 do total do dinheiro, e assim por diante.
125
Respondendo à questão inicial, a quarta aposta seria de 1296 do dinheiro total.
A observação de um fenômeno casual é recurso poderoso para se entender a sua variabilidade.

Entretanto, com suposições adequadas e sem observar diretamente o fenômeno, podemos criar
um modelo teórico que reproduza de forma bastante satisfatória a distribuição das frequüências
quando o fenômeno é observado diretamente. Tais modelos são os chamados modelos de
probabilidades.
37
CAPÍTULO 4 • Probabilidade
Os fenômenos determinísticos conduzem sempre a um mesmo resultado quando as condições

iniciais são as mesmas. Ex: tempo de queda livre de um corpo. Mantidas as mesmas condições, as
variações obtidas para o valor do tempo de queda livre de um corpo são extremamente pequenas
(em alguns casos, desprezíveis).
Os fenômenos aleatórios podem conduzir a diferentes resultados e mesmo quando as condições

iniciais são as mesmas, existe a imprevisibilidade do resultado. Ex: lançamento de um dado.
Importante
Consideram-se os experimentos aleatórios como fenômenos produzidos pelo homem:
» lançamento de uma moeda honesta;
» lançamento de um dado;
» lançamento de duas moedas;
» retirada de uma carta de um baralho completo, de 52 cartas;
» determinação da vida útil de um componente eletrônico.
A análise desses experimentos revela que:
» cada experimento poderá ser repetido indefinidamente sob as mesmas condições;
» não se conhece em particular o valor do experimento a priori, porém, pode-se descrever todos os possíveis resultados –
as possibilidades;
» quando o experimento for repetido um grande número de vezes, surgirá uma regularidade.
Para a explicação desses fenômenos (fenômenos aleatórios), adota-se um modelo matemático

probabilístico.
Para melhor entendimento desta unidade, é interessante relembrar alguns conceitos básicos no
estudo das probabilidades tais como:
Espaço amostral
Um dos conceitos matemáticos fundamentais utilizados no estudo das probabilidades é o de

conjunto. Um conjunto é uma coleção de objetos ou itens que possuem características comuns.
É importante definir cuidadosamente o que constitui o conjunto em que estamos interessados,
a fim de podermos decidir se determinado elemento é ou não membro do conjunto. Conjunto
é uma coleção bem definida de objetos ou itens.
A probabilidade só tem sentido no contexto de um espaço amostral, que é o conjunto de todos os

resultados possíveis de um experimento. O termo “experimento” sugere a incerteza do resultado
38
antes de fazermos as observações. Os resultados de um experimento (ex: a ocorrência de um

raio, uma viagem etc.) chamam-se eventos.
Evento aleatório (E)
É qualquer subconjunto de um espaço amostral. É também o resultado obtido de cada experimento

aleatório, que não é previsível.
Espaço Amostral (S)
Espaço amostral de um experimento aleatório é o conjunto de todos os possíveis resultados

desse experimento.
Exemplos de espaços amostrais:
S = { c, r } (é composto de dois eventos)
S = { 1, 2, 3, 4, 5, 6 } (é composto de seis eventos)
S = { (c, r), (c, c), (r, c), (r, r)} (é composto de oito eventos)
Genericamente, se o número de pontos (elementos do espaço amostral) amostrais de um espaço

amostral finito é n, então o número de eventos é dado por 2n.
Exemplo: no lançamento de seis moedas, o número de pontos amostrais (resultados possíveis)

é 26 = 64. Portanto, S = 64.
Importante
O complemento de um evento é constituído de todos os resultados no espaço amostral que não façam parte do evento.
Os eventos são mutuamente excludentes, quando não têm elemento em comum, ou se não podem ocorrer
simultaneamente.
Exemplo: na extração de uma só carta, os eventos “a carta é de copas” e a “carta é de ouros” são
mutuamente excludentes, porque uma carta não pode ser ao mesmo tempo de copas e de ouros.
Já os eventos “a carta é de copas” e “a carta é uma figura” não são mutuamente excludentes,
porque algumas cartas de copas são também figuras.
Muitas vezes, é útil representar graficamente um espaço amostral, porque isso torna mais fácil
visualizar os elementos.
Os eventos A e A’ são complementares:
39
Figura 4. Elementos A e A’ são complementares.
Os eventos A e B são mutuamente excludentes porque não se interceptam.
Figura 5. Elementos A e A’ são excludentes.
Os eventos A e B não são mutuamente excludentes, pois têm alguns elementos em comum.
Figura 6. Elementos A e B são mutuamente excludentes.
Operações com eventos aleatórios
40
Consideremos um espaço amostral finito:
=s {e1 , e2 , e3 ,…en }
Sejam A e B dois eventos de S, as seguintes operações são definidas:
I) Reunião – A ∪ B – O evento reunião é formado pelos pontos amostrais que pertencem a pelo
menos um dos eventos.
A ∪ B = {e1 ∈ S |, e1 ∈ Aou e1 ∈ B}
Figura 7. Reunião de dois eventos.
É o evento que ocorre se A ocorre ou B ocorre, ou ambos ocorrem.
II) Interseção – A ∩ B – O evento interseção é formado pelos pontos amostrais que pertencem
simultaneamente aos eventos A e B.
A ∩ B = {e1 ∈ S |, e1 ∈ Aou e1 ∈ B}
Figura 8. Interseção de dois eventos.
Fonte: Criação do autor
É o evento que ocorre se A e B ocorrem. Obs: Se A ∩ B = ∅, A e B são eventos mutuamente exclusivos.
41
Definição de Laplace para probabilidade
A probabilidade de um acontecimento associado a uma certa experiência aleatória é dada pelo

quociente entre o número de casos favoráveis ao acontecimento e o número de casos possíveis.
Podemos representar isso da seguinte forma :
Seja A um acontecimento associado a certa experiência aleatória cujo espaço amostral

é Ω, tendo-se A ⊆ Ω. Seja p(A) a sua probabilidade, então:
Número de casos favoráveis a A

P ( A) =
Número de casos possíveis
Sendo assim, suponha que os experimentos aleatórios têm as seguintes características:
» há um número finito n de eventos elementares (casos possíveis). A união de todos os

eventos elementares é o espaço amostral;
» os eventos elementares são igualmente prováveis;
» todo evento A é uma união de m eventos elementares em m ≤ n que
Portanto, probabilidade de A:
Número de casos favoráveis a A # A m

P (=
A) = =
Número de casos possíveis #Ω n
De acordo com a definição acima temos como consequências imediatas:
Para todo evento A, 0 ≤ P ( A ) ≤ 1 ;
P(Ω) = 1;
P(∅) = 0;
Se A ∩ B = ∅ então P ( A =
 B ) P=
( A) P ( A) + P ( B ) .
Exemplo 1:
Uma urna contém dez bolas numeradas de 1 a 10. Retira-se, ao acaso, uma bola dessa
urna. Qual a probabilidade de se obter uma bola cujo número inscrito é múltiplo de 3?
Solução:
Espaço amostral: Ω = {1, 2, 3, 4, 5, 6, 7, 8, 9,1 0}
Evento: A = {3, 6, 9}
42
#A 3
( A) P=
Logo: P= ( A) =
# Ω 10
Exemplo 2:
Uma moeda é lançada três vezes, sucessivamente. Qual é a probabilidade de observarmos:
a. Exatamente uma cara?
b. No máximo duas caras?
Solução: podemos construir uma árvore de possibilidades, em que as três colunas representem
os possíveis resultados dos três lançamentos. Isto é:
Figura 8. Árvore de possibilidades.
O espaço amostral é dado por:
Ω = {(K,K,K), (K,K,C), (K,C,K), (K,C,C), (C,K,K), (C,K,C), (C,C,K), (C,C,C)}
Logo, #Ω = 8.
a. O evento “exatamente uma cara” corresponde ao conjunto:
A = {(K,C,C), (C,K,C), (C,C,K)}
Daí: #A = 3
43
Portanto:
#A 3
P ( A )= = = 37,5%
#Ω 8
b. O evento “no máximo duas caras” corresponde ao conjunto:
B = {(K,K,C), (K,C,K), (K,C,C), (C,K,K), (C,K,C), (C,C,K), (C,C,C)}
Daí: #B = 7
Portanto:
#B 7
P ( B=
) = = 87,5%
#Ω 8
Espaços de probabilidade
A partir de agora, será introduzida a noção geral de probabilidade.
Seja Ω espaço amostral. Uma função P definida para todos os subconjuntos de W

(chamados eventos) é chamada uma probabilidade se:
1. 0 ≤ P ( A) ≤ 1 , para todo evento A Ω;
2. P(∅) = 0, P(Ω) = 1;
3. Se A e B são eventos disjuntos, então P(A∪B) = P(A) + P(B).
Considerando as consequências do espaço amostral, temos:
P( A ) = 1 – P(A).
Se A ⊂ B, então P(A) = P(B) – P(B – A).
Se A ⊂ B, então P(A) ≤ P(B).
P(A∪B) = P(A) + P(B) – P(A ∩ B).
Exemplo 3:
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei?
ou uma carta de espadas?
Solução:
44
Considere:
A: saída de um rei
B: saída de uma carta de copas
Então:
4 13
P ( A)
= = e P ( B)
52 52
Mas, temos ainda: A ∩ B: saída de um rei de copas, daí:

1
P ( A ∩ B) =
52
Portanto:
4 13 1 16
P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) = + − = ≅ 0,3769%
52 82 52 82
Probabilidade condicional
A probabilidade de um evento A ocorrer, dado que um outro evento B ocorreu, é chamada

probabilidade condicional do evento A dado B.
Por exemplo, a probabilidade de que uma pessoa venha a contrair HIV dado que ele/ela
é um usuário de drogas injetáveis é uma probabilidade condicional.
Um outro exemplo é um estudo sobre panfletos de fármacia, em que se deseja calcular a

probabilidade de que um panfleto de propaganda seja jogado no lixo dado que contém
uma mensagem sobre o cuidado de depositar lixo no local apropriado, ou seja, na lixeira.
Um terceiro exemplo, é uma frase que ocorrerá repetidamente neste material: ‘’Se a
hipótese nula for verdadeira, a probabilidade de se obter um resultado como este é ...’’.
Aqui a palavra se substitui à expressão ‘dado que’, mas o sentido é o mesmo.
A
Com dois eventos, A e B, a probabilidade condicional de A dado B é denotada por P  
 Lixo  . B
, por exemplo, P  HIV 
 ou P 
 Usuário de drogas  
 Mensagem 
Exemplo: frequentemente assumimos, com alguma justificativa, que a paternidade leva a
responsabilidade. Pessoas que passam anos atuando de maneira descuidadosa e irracional
de alguma forma parecem se tornar pessoas diferentes uma vez que elas se tornam pais,
mudando muitos dos seus antigos padrões habituais. Suponha que uma estação de
45
rádio tenha amostrado 100 pessoas, 20 das quais tinham filhos. Eles observaram que 30
dessas pessoas usavam cinto de segurança, e que 15 daquelas pessoas tinham filhos. Os
resultaddos são mostrados na tabela abaixo:
Tabela 12: Distribuição de dados.
Paternidade Usam cinto Não usam cinto Total

Com filho 15 5 20
Sem filho 15 65 80
Total 30 70 100
A partir da informação na tabela podemos calcular probabilidades simples (ou marginais ou

incondicionais), conjuntas e condicionais.
» A probabilidade de uma pessoa amostrada aleatoriamente usar cinto de segurança é

30
= 0,30 ou 30% .
100 15
» A probabilidade de uma pessoa ter filho e usar cinto de segurança é = 0,15 ou 15% .
100
» A probabilidade de uma pessoa usar cinto de segurança dado que tem filho é
15 .
= 0, 75 ou 75%
20 15
» A probabilidade de uma pessoa ter filho dado que usa cinto de segurança é = 0,50 ou 50% .
30
Teorema da probabilidade total
Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral. Seja B um evento
desse espaço. Então:
n
B
P ( B ) = ∑P ( Ai ) . P  
Exercício resolvido i −1  Ai 
Uma urna contém três bolas brancas e duas amarelas. Uma segunda urna contém quatro bolas
brancas e duas amarelas. Escolhe-se, ao acaso, uma urna e dela retira-se, também ao acaso, uma
bola. Qual a probabilidade de que seja branca?
Probabilidade da urna escolhida ser a primeira (três bolas brancas e duas amarelas):
1
P=
2
Probabilidade de uma bola dessa urna ser branca:
3 1 3  3 

=P′ P=
.    = .   
 5   2   5   10 
46
Probabilidade da urna escolhida ser a segunda:

1
P '' =
2
Probabilidade de uma bola esoclhida da segunda urna ser branca:
4 1 4 2 1

P′′′= P′′.  =   .  = =
6 2 6 6 3
Logo, probabilidade total:

1 3 19
P′′′ + P′ = + =
3 10 30
Teorema Bayes
Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral W. Seja B ⊂ W. Sejam
conhecidas e , i = 1, 2, ..., n. Então:
P ( Ai ) . P ( B∣Ai )
=P ( Ai∣B ) = , j 1, 2, ..., n
∑ i =1 i( ) ( )
n
P A . P B∣Ai
Atenção
O Teorema de Bayes é também conhecido como Teorema da Probabilidade a Posteriori. Ele relaciona uma das parcelas
da probabilidade total com a própria probabilidade total.
Exercício resolvido
A urna A contém três bolas vermelhas e duas azuis, e a urna B contém duas bolas vermelhas e
oito azuis. Joga-se uma moeda honesta. Se a moeda der cara, extrai-se uma bola da urna A; se
der coroa, extrai-se uma bola da urna B. Uma bola vermelha é extraída. Qual a probabilidade de
ter saído cara no lançamento?
Figura 10. Probabilidade.
47
P ( X ∩ Ai )
P ( Ai / X ) =
P( X )
Pelo Teorema de Bayes temos:
P ( X ∩ Ai ) P ( X | Ai ) P ( Ai )
P ( Ai B )
= =
P( X ) P ( X | A1 ) P ( A1 ) + P ( X | A2 ) P ( A2 ) +…+ P ( X | An ) P ( An )
P ( X ∩ Ai )
=
∑ P ( X∣A1 ) P ( A1 )
n
i =1
Sendo assim:
3 1 3 3
x
3 20 60 3
) 3 15 22 1= 3 10 2 = 610
P ( Ca / V = = x = = = 0, 75 ou 75%
+ 2 10 8 80 4
x + x +
5 2 10 2 10 20 20
Probabilidade binomial
Considere um experimento com apenas dois resultados possíveis, chamados de sucesso e fracasso.
Vejamos:
» No lançamento de uma moeda não viciada, tome sucesso = cara e fracasso = coroa.
» No lançamento de um dado não viciado, tome sucesso = o resultado é 4 ou 6 e fracasso

= o resultado é 1, 2, 3 ou 5.
Seja p a probabilidade de sucesso e q = 1 – p a probabilidade de fracasso. Vejamos o exemplo

abaixo:
Considere o experimento aleatório: jogue um dado e observe o número mostrado na face de cima.
Nesse caso, o conjunto formado por todos os resultados possíveis do experimento é dado
por: Ω = {1, 2, 3, 4, 5, 6} (Espaço amostral).
Qualquer subconjunto do espaço amostral caracteriza um evento, por exemplo, o

subconjunto A = {2, 4, 6} é o evento que acontece se o número mostrado na face de cima
é par. Assim, A = 3. Uma das perguntas que pode ser feita é: qual a chance (probabilidade)
do evento A ocorrer?
48
Intuitivamente, se esse experimento for repetido em um grande número de vezes, obtém-

se um número par em aproximadamente metade dos casos. Isto é:
» os eventos elementares são todos igualmente prováveis;
» o número de elementos de A é justamente a metade dos elementos de Ω.
Logo, pode-se afirmar que:
Probabilidade de A= A= A 3 1
= =
Ω 6 2 1 3
No exemplo acima, segue que os valores de p são, respectivamente, 2 e 6 .
A partir de cada experimento apresentado no exemplo 4.9, pode-se estar interessado em repeti-
los um número fixo n de vezes. Supondo que a probabilidade p de sucesso se mantém constante
ao longo das provas e que as provas sejam independentes, surge a seguinte questão:
Qual é a probabilidade de obtermos k sucessos nessas n provas?
Para resolver essa questão, utiliza-se o teorema binomial, isto é:
Teorema binomial
A probabilidade de ocorrerem exatamente k sucessos em uma sequência de n provas

independentes, na qual a probabilidade de sucesso em cada prova é p, é igual a:
n k
  p (1 − p )
n−k
k 
Joga-se uma moeda não viciada dez vezes. Qual a probabilidade de se obter exatamente cinco
caras?
Solução:
Tome: sucesso = cara.

1
Assim, p = 2 em cada prova e as provas são independentes. Deve-se obter a probabilidade de
k = 5 sucessos em n = 10 provas. Portanto, pelo teorema binomial, segue que:
5 10 −5
10   1   1 252 63
   1 −  = =
 5  2  2 1024 256
49
A Estatística e o recurso tecnológico
Cálculo da média, variância e desvio padrão
No capítulo 2, vimos como calcular a média, a variância e o desvio padrão de uma amostra.
Agora,vejamos como isso pode ser feito com o auxílio do Excel.
Considere o seguinte conjunto de dados da figura abaixo contidos em uma planilha do Excel:
Figura 11. Salários da empresa XYZ.
Para obter a média salarial dos funcionários, escolha a última célula pertencente à coluna Salário
mensal (R$) e, no menu principal, escolha o ícone fórmulas, isto é:
50
Figura 11. Média dos salários da empresa XYZ.
Agora basta escolher a função desejada, isto é, no caso da média, escolha MÉDIA. Assim, a média
salarial aparecerá calculada na célula selecionada. Analogamente, obtêm-se outros tipos de
médias, a mediana, a moda, a variância e o desvio padrão.
Sintetizando
Vimos até agora:
» Como resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou o princípio multiplicativo.
» Como reconhecer a diferença entre conjuntos e sequências e identificar em situações-problema agrupamentos

associados a conjuntos e sequências.
» Como reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço amostral nessas
situações-problema.
» Como resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis.
» Como resolver problemas que envolvem o cálculo da probabilidade de eventos.
» Como identificar eventos independentes e não independentes em situações-problema.
» Como resolver problemas que envolvam o conceito de probabilidade condicional e binomial.
» Como utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento.
51
CAPÍTULO
DISTRIBUIÇÃO DE PROBABILIDADE
DE VARIÁVEIS ALEATÓRIAS
DISCRETAS 5
Este capítulo apresenta o conceito de variável aleatória discreta e exemplos de distribuições e

probabilidades que servem como modelos para o estudo de experimentos estatísticos.
Objetivos
» Identificar variáveis aleatórias discretas.
» Entender como ocorre a distribuição de probabilidades para variáveis aleatórias discretas.
» Utilizar adequadamente o modelo de distribuição de probabilidade discreta binomial

na resolução de problemas estatísticos.
Preliminares
A seguir, será apresentado o conceito de variável aleatória a fim de associá-lo aos resultados de
um experimento aleatório. Esse conceito estará relacionado a um número real que, juntamente
com a definição de função, permitirá calcular a probabilidade de ocorrência de vários eventos
correspondentes a esse experimento de forma mais simples e fácil.
Definição: uma variável aleatória é aquela que assume valores associados com resultados
aleatórios de um experimento, em que um (e apenas um) valor numérico é marcado para cada
ponto da amostra.
As variáveis aleatórias são classificadas em variáveis aleatórias discretas e variáveis aleatórias

contínuas (esta última a ser tratada na capítulo 6).
Chama-se variável aleatória discreta toda variável aleatória que pode assumir um número de
valores.
52
Distribuição de probabilidade de variáveis aleatórias discretas • CAPÍTULO 5
Exemplo de variáveis aleatórias discretas: o número de vendas feitas por um vendedor em uma
semana de trabalho: x = 0, 1, 2, 3, ...
» O número de consumidores de uma amostra de seiscentas pessoas que preferem o

produto da marca A em relação ao produto da marca B: x = 0, 1, 2, 3, ..., 600.
» O número de clientes esperando serem servidos em um restaurante em um horário

específico: x = 1, 2, 3, ...
Distribuição de probabilidades para variáveis aleatórias

discretas
Uma descrição completa de uma variável aleatória discreta requer as seguintes especificações:
» os possíveis valores que ela pode assumir;
» a probabilidade associada a cada valor.
A distribuição de probabilidade de uma variável aleatória discreta é um gráfico, tabela ou fórmula

que especifica a probabilidade associada em cada valor possível que a variável aleatória pode
assumir.
Vale lembrar que são necessários dois requisitos para uma distribuição de probabilidades de
uma variável aleatória discreta X:
P ( x) ≥ 0∀ x
Σ P ( x) =
1
Média ou valor esperado de uma variável aleatória discreta
A média de uma variável aleatória discreta é o principal parâmetro de posição e indica informações
sobre o centro de sua distribuição de probabilidades.
Chama-se média ou valor esperado de uma variável aleatória discreta e representa-se, por ou
E(x), a seguinte soma:
= ( x)
µ E= ∑x p ( x )
i
i
53
CAPÍTULO 5 • Distribuição de probabilidade de variáveis aleatórias discretas
Importante
Esperado é um termo matemático e não deve ser interpretado como usualmente é aplicado. O valor esperado é a média
da distribuição de probabilidades ou uma medida de tendência central.
João é funcionário de uma empresa de seguros e vendeu uma apólice de seguros de um ano por
US$10.000 com um prêmio anual de US$290. observando tabelas atuariais, verifica-se que a
probabilidade de morte durante o próximo ano para uma pessoa da idade, sexo, nível de saúde
do seu cliente é de 0,001. Qual o ganho esperado (quantidade de dinheiro feito pela empresa)
para uma apólice desse tipo?
Solução
O objetivo do experimento é observar se o cliente viverá no ano seguinte. As probabilidades

associadas com os dois pontos amostrais, viver e morrer, respectivamente, são 0,009 e 0,001. A
variável aleatória de interesse é o ganho X que pode assumir valores discretos na tabela abaixo.
Tabela 13. Variável aleatória.
Ganho Y Ponto amostral Probabilidade

R$ 290 Cliente vive 0,009
- R$ 710 Cliente morre 0,001
Se o cliente vive, então o ganho é de R$ 290. Se o cliente morre, então o ganho é negativo, isto é,
igual a R$ (290 – 1.000) = - R$710.
µ E (=
= x) ∑xip (=
i
xi ) 290 . 0,999 + ( −710 ) . 0, 001
= US $ 280
Portanto, conclui-se que o valor esperado é dado da seguinte forma: se a empresa vender um
número grande de apólices de um ano de R$10.000 para clientes que possuem as características
descritas anteriormente, ela ganha um valor líquido (em média) de R$ 280 por venda no próximo
ano.
No caso das variáveis aleatórias discretas, pode-se também encontrar medidas de variabilidade.
A variância de uma variável aleatória discreta X é dada por:
54
VAR ( X )
= ∑x p ( x ) − µ
I
2
i I
2
O desvio padrão de uma variável aleatória discreta é igual à raiz quadrada da variância, isto é:
DP ( X ) = VAR ( X )
Problema resolvido
Um jogo consiste em lançar uma moeda. Se cair cara, ganham-se R$10,00 e, se cair coroa, perdem-
se R$5,00. Qual o lucro médio do jogo e qual a sua variância?
Solução
Temos que X é a variável lucro, daí:
Tabela 14. Varáveis aleatórias
Resultado Probabilidade () Valor de

Cara R$ 10,00
Coroa R$ 5,00
Portanto:
1 1
µ E ( x=
= ) ∑xip ( x=)
i
i
2
.10 + . ( −5=
2
) R$ 2,50
 1  1
(X )
VAR= ∑x p ( x ) −=
I
2
i I µ 2
 2  2
2,52 R$ 56, 25
100 .  +  25 .  − =
Problema resolvido.
Um dado honesto de seis faces numeradas de 1 a 6 é lançado duas vezes. Qual a

distribuição de probabilidades para o valor da soma de pontos que pode ser obtida nos
dois lançamentos? Qual a média da soma dos pontos no lançamento de dois dados?
55
Soma = 02 : (1,1)
Soma = 03 : (1, 2); (2, 1)
Soma = 04 : (1, 3); (2, 2); (3, 1)
Soma = 05 : (1, 4); (2, 3); (3, 2); (4, 1 )
Soma = 06 : (1, 5); (2, 4); (3, 3); (4, 2); (5, 1)
Soma = 07 : (1, 6); (2, 5), (3, 4); (4, 3); (5, 2); (6, 1)
Soma = 08 : (2, 6); (3, 5); (4, 4); (5, 3); (6, 2)
Soma = 09 : (3, 6); (4, 5); (5, 4); (6, 3)
Soma = 10 : (4, 6); (5, 5); (6, 4)
Soma = 11 : (5, 6); (6, 5)
Soma = 12 : (6, 6)
Temos que:
= ( x)
µ E= ∑x p=
(x )
i
i i
 1   2   3   4   5   6   5   4   3   2   1  252
 2.  +  3.  +  4.  +  5.  +  6.  +  7.  +  8.  +  9.  + 10.  + 11.  + 12.  = = 7
 36   36   36   36   36   36   36   36   36   36   36  36
Temos que:
VAR
= (X ) ∑x p ( x =
I
)−µ
2
i i
2
 1   2   3   4   5   6   5   4 
∑x p ( x ) =  2 . 36  +  3 . 36  +  4 . 36  +  5 . 36  +  6 . 36  +  7 . 36  +  8 . 36  +  9 . 36 
I
2
i i
2 2 2 2 2 2 2 2
 3   2   1  1974
+ 102.  + 112.  + 122.  =
 36   36   36  36
1974 2 1974
VAR =(X ) − 7 → VAR ( X ) = − 49 → VAR ( X ) =
5,833..
36 36
Logo; DP
= (X ) VAR
= (X ) 5,833 2, 415
=
56
Principais distribuições de variáveis aleatórias discretas
Entre as principais distribuições de variáveis aleatórias discretas, estão as distribuições de

Bernoulli, geométrica, de Pascal, hipergeométrica, binomial e a de Poisson. Para fins de nossos
estudos, daremos destaque às distribuições de variáveis aleatórias discretas referentes ao modelo
binomial.
Distribuição binomial
Considere n tentativas independentes de um experimento aleatório. Sabendo-se que cada tentativa

admite duas possibilidades: sucesso e fracasso com probabilidades p e q = 1 – p, respectivamente,
e sendo X o número de sucessos em n tentativas a função
n
P ( X= x=
)   p k q n−k
k 
Define uma distribuição binomial. Segue também que

E ( X ) = np
VAR ( X ) = npq
Exercício resolvido:
Em uma linha de produção, 10% das peças são defeituosas, e as peças são acondicionadas em
caixas com cinco unidades. Seja X a variável aleatória igual ao número de peças defeituosas
encontradas em uma caixa.
a. Qual a probabilidade de uma caixa conter três peças defeituosas?
b. Qual a probabilidade de uma caixa conter duas ou mais peças defeituosas?
c. Qual o valor esperado do desconto na venda de um lote de 1.000 caixas, sabendo-se que
uma caixa com mais de uma peça defeituosa tem um desconto no preço de R$10,00?
Solução:
Temos que:
X = número de peças defeituosas na caixa
N=5
p = p(sucesso) = 0,10
5
a. P ( X =
3) =
  . 0,10 . (1 − 0,10 ) =
3 2
0, 0081
 3
57
b. P ( X ≥ 2 ) =−
1 P( X < 2)
5 5
P ( X < 2 )   . 0,100. (1 − 0,10 ) +   . 0,101. (=
1 − 0,10 ) 0,91854
5 4
=
0 1
Sendo assim, P ( X ≥ 2 ) =−
1 0,91854 =0, 08146
c. Tome Y = valor do desconto por caixa, então:
P ( X ≥ 2) + 0P ( X
= < 2 ) 10 . 0,8146 + 0 . 0,91854
= 0,8146
E(Y) = np = 10
Logo, em um lote de 1.000 caixas, o desconto esperado no preço será de 1 000(0,8146) = R$ 814,60.
Sintetizando
Vimos até agora:
» Como reconhecer e/ou classificar uma variável aleatória discreta.
» Como resolver problemas relacionados às distribuições de probabilidades de variáveis aleatórias discretas.
» Como utilizar adequadamente o modelo binomial de distribuição de probabilidades discretas.
58
CAPÍTULO
DISTRIBUIÇÃO DE PROBABILIDADE
DE VARIÁVEIS ALEATÓRIAS
CONTÍNUAS 6
Este capítulo apresenta o conceito de variável aleatória contínua e exemplos de distribuições de

probabilidades que servem como modelos para o estudo de experimentos estatísticos.
Objetivos
» Identificar variáveis aleatórias contínuas.
» Entender como ocorre a distribuição de probabilidades para variáveis aleatórias

contínuas.
» Utilizar adequadamente o modelo de distribuição de probabilidades contínuas normal

na resolução de problemas estatísticos.
Distribuição de probabilidades para variáveis aleatórias

contínuas
Considere o experimento que consiste em selecionar, ao acaso, uma peça da produção de uma
máquina e determinar o valor do comprimento da peça em milímetros. Nesse caso, dentro de
determinado grau de precisão decorrente da limitação do instrumento de medida, a variável
aleatória X (comprimento da peça) pode assumir qualquer valor em um intervalo da reta real,
sendo, dessa forma, uma variável contínua.
Chama-se variável aleatória contínua toda variável aleatória que pode assumir valores
correspondentes a quaisquer pontos contidos em um ou mais intervalos (isto é, valores que
são incontáveis).
Exemplo 1 – Variáveis aleatórias contínuas
» A quantidade de tempo entre chegadas a um hospital: 0≤x≤∞.
59
CAPÍTULO 6 • Distribuição de probabilidade de variáveis aleatórias contínuas
» A profundidade na qual uma perfuração chega pela primeira vez com sucesso ao petróleo:
0 ≤ x ≤ C , em que C é a profundidade máxima que pode ser obtida.
» O peso de um item de alimentação comprado em um supermercado: 0 ≤ x ≤ 500 .
Nas últimas seções, interessavam apenas situações caracterizadas por variáveis aleatórias discretas.
Agora, o foco está em um outro tipo de variável, isto é, variáveis que aparecem em problemas
nos quais uma grandeza medida assume um valor que pode variar continuamente.
Alguns exemplos como o tempo de espera para ser atendido na emergência de um hospital, o
peso de um camundongo em um experimento de laboratório, o tempo de vida de um capacitor
em um teste de controle de qualidade serão alvo de nossos estudos.
Nos casos citados, não faz sentido associar uma probabilidade a cada valor do resultado de um
experimento, já que existe um número infinito de valores possíveis, distribuídos ao longo de certo
intervalo. Sendo assim, será usada uma função chamada função densidade de probabilidade
para indicar como as probabilidades estão distribuídas ao longo do contradomínio da variável
aleatória.
Observe que uma função contínua f(x) é chamada função densidade de probabilidade se satisfaz
as seguintes condições:
1ª. f ( x ) ≥ 0, ∀x ∈ 
β
2ª. P ( a ≤ x ≤ b ) =f ( x ) dx
∫
∞ α
3ª. ∫ f ( x ) dx = 1
−∞
Nas condições acima, vale observar que a primeira decorre do fato de que as probabilidades não
podem ser negativas. Já a segunda condição indica que a probabilidade de uma variável aleatória
pode assumir valores em um intervalo, sendo este a área sob a curva da função densidade de
probabilidade no intervalo associado. A terceira condição define que a probabilidade do espaço
amostral é 1, isto é, a probabilidade de ocorrência de algum dos resultados possíveis é certa.
60
Distribuição de probabilidade de variáveis aleatórias contínuas • CAPÍTULO 6
Gráfico 6. Função densidade de probabilidade.
Distribuição normal
Entre as principais distribuições de variáveis aleatórias contínuas, está a distribuição normal, à

qual se dará ênfase neste momento.
Diz-se que X é uma variável aleatória normal, ou que a distribuição X é normal, de parâmetros
µ e σ , se a função densidade de X é dada por:
( X − µ )2
1
=f (X ) e 2σ 2
, −∞ < X < ∞
σ 2π
O gráfico de f(x) é dado como na figura a seguir:
Gráfico 7. Distribuição normal.
61
A função anterior apresenta as seguintes características:
O ponto máximo de f(x) é o ponto X = µ ;
Os pontos de inflexão da função são X = µ +σ ;

µ −σ e X =
A curva é simétrica em relação a u ;

E ( X ) µ=
= eVAR ( X ) σ 2
Logo, é possível mostrar que:

∞ ( X − µ )2
1
∫−∞ σ 2π e 2σ 2
dx = 1
Deste modo, para calcular a probabilidade indicada na figura a seguir, deve-se fazer:
Gráfico 8. Cálculo da probabilidade.
a ( X − µ )2
1
P (a ≤ X ≤ b) =
∫b σ 2π e 2σ 2
dx
Este apresenta um grau relativo de dificuldade. Isso porque as integrais envolvidas nesse processo
não possuem solução analítica, de modo que é preciso recorrer a soluções aproximadas. Na
prática, basta construir tabelas de valores aproximados para a distribuição normal padrão,
já que qualquer variável aleatória normal pode ser convertida para a forma padrão por uma
transformação linear. Ou seja:
62
Se X é uma variável aleatória normal de parâmetros µ e σ , uma nova variável aleatória Z é

definida por meio da relação:
X −µ
Z=
σ
A distribuição de Z é a distribuição normal. Sendo assim, pode-se usar a última igualdade
para converter qualquer variável aleatória normal em uma variável padrão. Portanto, torna-se
possível usar uma tabela de probabilidade para a distribuição normal, apresentada no final do
livro didático. Essa tabela tem valores (com precisão de quatro casas decimais) da função de
distribuição cumulativa Φ(x) associada à variável aleatória normal padrão, isto é, da função:
x t2
1 −
Φ (x) = ∫e 2
dt
σ 2π −∞
Vale observar que a tabela contém apenas os valores de Φ(x) para x > 0. Para determinar os valores
de Φ(x) para x< 0, usa-se a relação:
Φ ( −x ) = 1 − Φ ( x )
Sendo assim, se Z é uma variável padrão, temos que:
P ( Z ≤ −=
X ) P(Z ≥ X )
Já que:
P(Z ≥ X ) =
1− P (Z ≤ X )
Importante
Passo a passo para encontrar uma probabilidade correspondendo a uma variável aleatória normal
1º Passo: esboce a distribuição normal e indique a média da variável aleatória x. Então, sombreie a área correspondendo
à probabilidade que você quer encontrar.
2º Passo: converta as bordas da área sombreada de x valores para z valores da variável aleatória normal padrão usando a
fórmula:
X −µ
Z=
σ
3º Passo: use a tabela contida no final do livro didático para encontrar áreas correspondendo aos valores de Z. Se
necessário, use a simetria da distribuição normal para encontrar áreas correspondendo aos valores negativos de Z e o
fato de que a área total de cada lado da média é igual a 0,5 para converter as áreas da tabela contida no final do livro
didático às probabilidades do evento que você sombreou.
63
Exercícios resolvidos:
1. Considere uma distribuição normal com média = 100 e variância VAR(X) = 25. Calcule:
P (100 ≤ X ≤ 106 ) ;
a. 100 − 100
=Z =⇒Z 0
5
Buscando o valor de Z = 0 na tabela temos: 0,00

106 − 100
=Z =⇒ Z 1, 2
5
Buscando o valor de Z = 1,2 na tabela temos: 0,3849
P (100 ≤ X ≤ 106 )= P ( 0 ≤ Z ≤ 1, 2 )=
P ( 0 ≤ Z ) + P ( Z ≤ 1,=
2 ) 0, 0000 + 0,3849
= 0,3849 ou 38, 49%
P ( 89 ≤ X ≤ 107 )
b.
89 − 100
Z= ⇒Z =−2, 2
5
Buscando o valor de Z = -2,2 na tabela temos: 0,4861
107 − 100
=Z =⇒ Z 1, 4
5
64
Gráfico 10. Distribuição normal
P ( 89 ≤ X ≤ 107 ) = P ( −2, 2 ≤ Z ≤ 1, 4 ) =
P ( −2, 2 ≤ Z ≤ 0 ) + P ( 0 ≤ Z ≤ 1, 4 ) = 0, 4861 + 0, 4192 = 0, 9053 ou 90, 53%
c. P (112 ≤ X ≤ 116 ) ;
112 − 100
=Z =⇒ Z 2, 4
5

116 − 100
=Z =⇒ Z 3, 2
5
65
P (112 ≤ X ≤ 116
= ) P ( 2, 2 ≤ Z ≤ 3,=
2)
P ( 0 ≤ Z ≤ 3, 2 ) − P ( 0 ≤ Z ≤ 2, 4 ) =
0, 4819 - 0, 4993 = 0, 0075 ou 0, 75%
P ( X ≥ 108 )
d. ;
108 − 100
=Z =⇒ Z 1, 6
5
P ( X ≥ 108 ) = P ( Z ≥ 1, 6 ) =
0,5 − P ( Z ≥ 1, 6 ) =0,5 − 0, 4452 =0, 0547 ou 5, 47%
2. Um fabricante de peças eletrônicas sabe, por experiências anteriores, que as peças que
ele produz têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração
tem aproximadamente distribuição normal. O fabricante oferece garantia de 312 dias,
ou seja, troca a peça que apresentar defeito nesse período. Sabendo que ele fabrica 1000
peças mensalmente, determine o número de peças que o fabricante deverá trocar pelo
uso da garantia, mensalmente.
Temos que:
=µ 600
= dias, σ 100=dias e X 312.
312 − 600
Z= ⇒Z = −2,88
100
Buscando o valor de Z = -2,88 na tabela temos: 0,4980
66
Gráfico 13:.Distribuição normal
P ( X ≥ 312
= ) P ( Z ≥ −2,88
= )
0,5 − P ( Z ≥ −2,88 ) = 0, 5 - 0, 4980 = 0, 0020
Portanto, deverá substituir mensalmente: 0,002 x 100 = 2 peças.
Sintetizando
Vale lembrar que as variáveis aleatórias normais são usadas para modelar muitos fenômenos naturais, como as notas
obtidas pelos alunos em uma prova e os erros cometidos na medida de uma grandeza física, por exemplo.
Probabilidades normais e distribuições amostrais

simuladas usando o Excel
Para obter probabilidades cumulativas para a variável aleatória normal usando o Excel, primeiro
selecione a aba “Fórmulas”.
67
Figura 13. Opções do menu Excel.
Em seguida, clique em “mais funções” e, posteriormente, selecione “Estatística”, em seguida

clique na distribuição de sua escolha (por exemplo, normal). Veja a figura 14.
Figura 14. Opções distribuição normal.
68
Após clicar na distribuição de sua escolha, nesse caso a distribuição normal, aparecerá uma
caixa de diálogo. Especifique os parâmetros da distribuição (por exemplo, a média m e o desvio
padrão s), clique na probabilidade cumulativa que você deseja (X< = ou >) e especifique o valor
de x de interesse no quadro. Quando você clicar “OK”, a probabilidade normal cumulativa para
o valor de x especificado aparecerá em uma nova planilha Excel.
Figura 15. Parâmetros de distribuição.
Sintetizando
Vimos até agora:
» Como reconhecer e/ou classificar uma variável aleatória contínua.
» Como resolver problemas relacionados às distribuições de probabilidades de variáveis aleatórias contínuas.
» Como utilizar adequadamente o modelo de distribuição normal de probabilidades contínuas.
69
Tabelas estatísticas
Fonte: https://www.ecoevol.ufg.br/adrimelo/bioestat/10-aula-DistNormal-IC.pdf
70
Referências
BARBETTA, P. A. Estatística Aplicada às Ciências Sociais. 5a Edição revisada. Florianópolis: Editora da UFSC. 340p. 2004.
BUSSAB, W. O. e MORETTIN, P. A. Estatística Básica. 6a Edição revisada e atualizada. São Paulo: Editora Saraiva. 2010.
CRESPO, A. Estatística fácil. 19ª ed. São Paulo: Saraiva, 2009.
FARHAT, C. A. V. Introdução à estatística aplicada. São Paulo: FTD, 1988.
FREUND, J. E. e SIMON, G. A. Estatística Aplicada – Economia, Administração e Contabilidade. 9a Edição. Porto

Alegre: Bookman, 2000.
GONZALEZ, N. Estatística básica. Rio de Janeiro: Editora Ciência Moderna, 2008.
LAPPONI, J. C. Estatística usando o Excel. São Paulo: Lapponi treinamento e editora, 2000.
LEVINE, D.; BERENSON, M. L. Estatística: teoria e aplicações. Rio de Janeiro: LTC, 2000.
MAGALHÃES, M. N. e LIMA, A. C. P. Noções de probabilidade e estatística. 4ª Edição. São Paulo: EDUSP, 2002.
MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro: LTC, 1983.
MORETTI N, L. G. Estatística básica: probabilidade. São Paulo: Makron books, 2006.
SILVA, N. N. Amostragem Probabilística. 2a Edição. São Paulo: Edusp, 2001.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1994.
SPIEGEL, M. R. Probabilidade e estatística. São Paulo: McGraw-Hill, 1978.
TOLEDO, G. L. e OVALLE, I. I. Estatística Básica. 2a Edição. São Paulo: Editora Atlas, 1991.
SOARES, J. F.; FARIAS, A. A. e CESAR, C. C. Introdução à Estatística. 2a Edição. Rio de Janeiro: LTC, 1998.
VIEIRA, S. Estatística básica. São Paulo: Cengage Learning, 2012.
Sites consultados
https://www.ecoevol.ufg.br/adrimelo/bioestat/10-aula-DistNormal-IC.pdf
https://www.shutterstock.com/g/Bakhtiar+Zein?searchterm=Popula%C3%A7%C3%A3o%20e%20amostra.
https://marketinganalitico.com.br/marketing-e-estatistica-variaveis/
https://www.ecoevol.ufg.br/adrimelo/bioestat/10-aula-DistNormal-IC.pdf
71

Estatistica Basica PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatistica Basica PDF

Enviado por

Direitos autorais:

Formatos disponíveis

SIRLEI ALVES CHAVES

Chamadas para alertar detalhes/tópicos importantes que contribuam para a

Indicado para ressaltar trechos importantes do texto.

Informações complementares para elucidar a construção das sínteses/conclusões

Trecho que busca resumir informações relevantes do conteúdo, facilitando o

Sugestão de estudo complementar

Sugestões de leituras adicionais, filmes e sites para aprofundamento do estudo,

Este livro didático tem como objetivos:

» Servir de instrumento de reflexão, discussão e problematização em torno de temas e

» Entender e usar de forma eficiente e eficaz informações estatísticas extraídas de um

» Analisar relatórios estatísticos visando avaliar e tomar decisões acertadas; enfatizar

Este capítulo apresenta algumas definições básicas de conceitos fundamentais relacionados

» Identificar os objetivos da ciência estatística.

» Identificar tipos de aplicações estatísticas na empresa.

» Reconhecer os elementos fundamentais da estatística.

» Identificar e escolher adequadamente um método estatístico para análise de populações.

» Classificar dados estatísticos.

» Estabelecer um critério para coleta de dados.

» Entender o papel da estatística no gerenciamento da tomada de decisão.

A estatística e sua importância

Sendo assim, em qualquer área do conhecimento, em vários cursos de graduação, é fundamental

População é o conjunto de todos os elementos (pessoas, animais, domicílios ou objetos) que

Figura 1. População e amostra.

Censo e amostragem: quando consideramos todos os elementos da população em um estudo,

Definição e classificação de variáveis

Quando falamos no estudo do perfil sócio-econômico dos universitários da cidade de Manaus,

As variáveis são classificadas como qualitativas ou quantitativas. Uma variável qualitativa

» nominal - como, por exemplo, sexo ou cor dos olhos;

» ordinal - como, por exemplo, classe social ou grau de instrução.

De acordo com as categorias, a variável pode ser subdividida em qualitativa nominal, se as

Figura 2. Variáveis estatíscas.

Variáveis qualitativas nominais - nacionalidade (brasileira, francesa, portuguesa, ...); religião

Variáveis qualitativas ordinais - escolaridade (ensino fundamental; ensino médio; ensino

Variáveis quantitativas contínuas - peso de indivíduo (em quilograma), altura de indivíduos

As variáveis são medidas registradas de um dado objeto de estudo, realizadas em diferentes

Dados quantitativos são medidas registradas em uma escala numérica de ocorrência

Exemplo 2: a afiliação a um partido político, a condição de defeito (defeito ou não) de

Em toda pesquisa de levantamento em que queremos fazer afirmações sobre características de

O primeiro diz a respeito ao número de unidades a serem observadas, ou seja, o tamanho da

Construção do instrumento de pesquisa

O instrumento de pesquisa é o objeto que reúne um conjunto de questões para gerar um

Para o êxito do instrumento de pesquisa devemos:

» fazer questões tão simples quanto possível;

» acilitar as respostas dos entrevistados;

» elaborar com clareza as perguntas;

» facilitar a memória do sujeito entrevistado;

» evitar realização de cálculos;

» evitar palavras técnicas no instrumento;

» evitar perguntas com respostas dúbias;

» evitar perguntas sugestivas;

» evitar um grande número de questões;

» evitar questões com respostas abertas;

» permitir uma resposta adicional.

O papel da estatística no gerenciamento das tomadas de decisão

O crescimento na coleta de dados, associado ao fenômeno científico, às operações de negócios

Todo dia a mídia apresenta resultados e pesquisas políticas, econômicas e sociais. Na

dados inteligentemente. Como consequência, cada um de nós tem desenvolvido um

Figura 3. O papel da estatística na tomada de decisão gerencial.

Fonte: Criação do autor.

Vimos até agora:

» Os tipos de aplicações da estatística: descritiva e inferencial.

» Os métodos de coleta de dados: observacional, fontes publicadas, pesquisa e plano experimental.

» O papel da estatística no gerenciamento da tomada de decisão.