Estatística - Unidade 1

PROBABILIDADE E ESTATÍSTICA
UNIDADE 1 - ESTATÍSTICA DESCRITIVA

Joelma Iamac Nomura
-1-
Introdução
Proveniente da palavra status em latim, a estatística vem ampliando sua atuação junto à compilação e
organização de dados e gráficos, métodos de planejamento de experimentos, técnicas de análise e inferência
sobre os resultados.
Você sabia que a estatística está relacionada a diversas áreas de pesquisa? Ela pode ser identificada, por
exemplo, no estudo da eficiência de um produto comercial, na previsão do tempo, no número de peças
defeituosas de determinada produção, no risco inerente a um projeto ou até mesmo na transação da Bolsa de
Valores.
Veremos que a estatística se divide em dois ramos bem definidos: a descritiva e a inferencial. Vamos estudar as
diferenças que caracterizam esses dois ramos, assim como suas inter-relações.
Ao final desta unidade, você conseguirá responder algumas de nossas questões propostas: qual a diferença entre
estatística descritiva e inferencial? Como é possível relacionar a leitura dos dados expostos em um gráfico e em
uma tabela? Qual a importância da estatística frente ao processo de produção de uma empresa?
Diante essas questões, iniciamos nossos estudos a respeito desse tema tão importante em nossa formação
acadêmica e profissional. Você perceberá que todo o nosso redor está repleto de dados e de informações
trabalhadas que envolvem aspectos estatísticos.
Bons estudos!
1.1 Conceito
Para iniciar essa seção, vamos partir de uma das questões propostas na introdução desta unidade: você saberia
dizer qual é a diferença entre estatística descritiva e estatística inferencial? Um ponto importante diz respeito à
apresentação dos dados. Enquanto na estatística descritiva a apresentação dos dados é feita a partir de tabelas e
gráficos, sem que haja qualquer inferência sobre algo que ultrapasse os próprios dados, na estatística inferencial
a análise dos dados exige generalizações que ultrapassem os resultados desses dados. No entanto, ambas são
apresentadas quando desejamos prever o fluxo de tráfego em uma rodovia, a dosagem ideal de um medicamento
ou a vida útil de determinado equipamento elétrico. Perceba que nessas situações existem incertezas
estabelecidas por informações parciais e incompletas que nos permitirá selecionar o curso da ação mais
razoável. Assim, de acordo com Freund (2006), podemos afirmar que a estatística descritiva consiste no
conjunto de métodos matemáticos que descreve, resume, organiza e analisa os dados a partir de tabelas e
gráficos, sem que haja qualquer inferência sobre os resultados.
1.1.1. Análise exploratória de dados, tabelas e gráficos

A análise exploratória de dados consiste em um conjunto de técnicas para tratamentos dos dados, e de maneira a
compreendê-la melhor vamos apresentar dois termos que constituem o cerne da estatística: população e
amostra. De acordo com Triola (2017), a população é uma coleção completa de todos os elementos, que podem
ser finitos ou infinitos, a serem estudados, sendo eles pessoas ou objetos. Assim, quando trabalhamos com o
levantamento completo da população (ou universo) contemplando cada um dos seus elementos, temos o censo,
aplicado a populações finitas muito grandes. Dessa forma, na impossibilidade de trabalhar com populações
muito grandes, surge a amostra, que corresponde a uma subcoleção de elementos extraídos de uma população.
Para isso, é necessário que a amostra seja representativa e extraída de técnicas bem definidas, de maneira que
sua análise contemple conclusões válidas sobre a população. Outro termo que merece destaque na estatística é o
de variável, que corresponde às características da população a serem estudadas.
Confira, a seguir, um exemplo de variável e sua representação.
-2-
Quadro 1 - Levantamento dos aspectos socioeconômicos dos empregados da seção de produção de uma
montadora de veículos.
Fonte: Elaborado pela autora, baseado em MORETTIN; BUSSAB, 2010.
Morettin e Bussab (2010) destacam que cada elemento investigado é associado a um ou mais resultados, que
correspondem à realização de uma ou mais características, também chamada de variável (ou variáveis). São elas:
estado civil, grau de instrução, número de filhos, idade, região de procedência e salário.
VOCÊ QUER LER?

O artigo “A importância e o uso da Estatística na área empresarial: uma pesquisa de campo
com empresas do município de Elói Mendes – MG” (SANTOS et al., 2016) demonstra como o
uso de ferramentas estatísticas podem incrementar o planejamento estratégico e as tomadas
de decisão em setores da empresa. Os autores também estabelecem uma relação com a
Pesquisa Operacional. Acesse em:
<https://www.aedb.br/seget/arquivos/artigos16/5024102.pdf>
Distribuição de frequência
A distribuição de frequência, por sua vez, permite que os dados sejam visualizados de uma maneira
relativamente compacta, podendo ser agrupados em certo número de classes, intervalos ou categorias. Neste
sentido, a partir dos dados brutos podemos escolher o número de classes e os intervalos de distribuição e
organização dos dados. Vamos apresentar, a seguir, diferentes distribuições de frequência.
-3-
Tabela 1 - Distribuição de frequência por categorias.
Fonte: Elaborada pela autora, 2019.
Perceba que na tabela, os dados têm natureza qualitativa, ou seja, categórica em que os dados são agrupados em
categorias não numéricas. Agora, vamos observar outra situação distinta:
Tabela 2 - Distribuição de frequência por intervalo de classes.

Na distribuição apontada na tabela acima, os dados estão distribuídos em intervalos de classes e representam,
essencialmente, valores ou quantidades de refeições debitadas dos funcionários da empresa em estudo. Assim,
estamos tratando de uma distribuição que envolve dados quantitativos, ou seja, numéricos, diferentemente da
situação exposta na tabela anterior, de distribuição de frequência por categorias.
Observe que cada classe é denotada por um limite inferior e um limite superior, como, por exemplo, 6 a 10 da
segunda classe. Portanto, é importante assegurar que cada item pertença a uma única classe que, em geral, deve
ter a mesma amplitude
Você saberia dizer como podemos representar e condensar os dados em uma pesquisa? Uma maneira eficaz é a
-4-
Você saberia dizer como podemos representar e condensar os dados em uma pesquisa? Uma maneira eficaz é a
utilização de gráficos. Para as distribuições de frequência, por exemplo, o gráfico mais comum é o histograma,
um gráfico de colunas com uma escala horizontal para os valores dos dados e uma escala vertical para as
frequências. Dessa forma, quando formos construí-lo é importante observar as escalas usadas nos eixos vertical
e horizontal, sendo que as marcações na escala horizontal também podem ser representadas pelo ponto médio
de cada classe.
Figura 1 - Histograma do salário da diretoria de uma empresa.

De acordo com Devore (2018), para a construção de um histograma, o número de variáveis, que pode ser tanto o
número de pessoas que buscam emprego em determinado período, as medições, como o peso de um indivíduo,
ou ainda o tempo médio de reação a um estímulo em particular, representam variáveis numéricas discretas, cujo
número de valores é finito ou infinito. Um histograma também pode representar variáveis numéricas contínuas,
distribuídas em um intervalo completo sobre a linha de números. É o que destaca a figura do histograma do
salário da diretoria de uma empresa, cujos valores são representados em intervalos de classe por variáveis
numéricas contínuas.
É importante destacar que, às vezes, em uma distribuição de frequência, é interessante acrescentar outras
colunas, como a da frequência relativa, que corresponde à razão entre o número de vezes que ocorre o valor e o
número de observações do conjunto de dados e o da frequência acumulada, que corresponde à soma das
frequências de maneira sucessiva.
Como mencionado anteriormente, um histograma também pode representar dados distribuídos por intervalos
de classe que são determinados por:
Assim, se tivermos 100 observações, teremos 10 classes, e se tivermos 250 observações teremos,
-5-
Assim, se tivermos 100 observações, teremos 10 classes, e se tivermos 250 observações teremos,
aproximadamente, 16 classes. Conhecendo o número de classes podemos determinar a amplitude de cada uma
delas, que devem ser iguais ao longo de toda a distribuição.
De acordo com Freund (2006), raramente utilizamos menos de seis classes ou mais de 15 classes, contudo, não
há uma regra específica ou um número exato de classes. É o que acontece com o exemplo a seguir.
Tabela 3 - Distribuição de frequência: tempo gasto para chegar ao trabalho em minutos.

Vamos apresentar também a representação dos dados tabelados a partir do histograma. A partir dele, você
consegue verificar que a maior frequência é de 372 funcionários que gastam de 10 a 19 minutos para chegar ao
trabalho.
Figura 2 - Histograma do tempo gasto por funcionários para chegar ao trabalho.
-6-
Figura 2 - Histograma do tempo gasto por funcionários para chegar ao trabalho.
Fonte: Elaborada pela autora, baseada em LARSON; FARBER, 2010.
A tabela e o histograma ilustram o estudo realizado com 1220 funcionários de uma empresa em relação ao
tempo gasto para chegar ao trabalho. Perceba que nessa situação, a distribuição foi feita em 7 classes com um
intervalo de 9 unidades em cada uma.
Vamos conhecer agora o gráfico de outro polígono de frequência, em que as frequências de classe são
esboçadas sobre os pontos médios de cada classe e unidas a partir de segmentos de reta. Para sua correta
construção, devemos usar as mesmas escalas horizontais e verticais usadas para a construção do histograma. É
conveniente acrescentarmos a frequência zero para que o polígono esteja amarrado à escala horizontal. Veja
uma maneira de apresentar os dados relacionados ao tempo de espera entre erupções do gêiser Old Faithful no
Parque Nacional de Yellowstone, em Wyoming, nos Estados Unidos.
Tabela 4 - Distribuição de frequência da distribuição dos tempos de espera entre erupções do gêiser Old Faithful.
Fonte: Elaborada pela autora, baseada em FREUND, 2006.
Outra forma é o polígono de frequência, como você pode ver a seguir.
-7-
Figura 3 - Polígono de frequência da distribuição dos tempos de espera entre erupções do gêiser Old Faithful.
Fonte: FREUND, 2006, p. 41.
O gráfico de setores (ou comumente conhecido como gráfico de pizza), em geral, é construído a partir da
frequência relativa. Observe.
Tabela 5 - Distribuição de frequência para locação de veículos.

Fonte: Elaborada pela autora, baseado em LARSON; FARBER, 2010.
O gráfico de setores a seguir representa os dados tabelados. Perceba que a maior proporção corresponde a
carros, seguida de caminhões, motocicletas e outros, todos elementos representados por diferentes cores, o que
pode ajudar na visualização e assimilação dos dados.
-8-
Figura 4 - Gráfico de setores para locação de veículos.
Fonte: Elaborada pela autora, baseado em LARSON; FARBER, 2010.
Após aprender os conceitos básicos que cercam a Estatística e as diferentes maneiras que os dados podem ser
representados, vamos conhecer as medidas de tendência central e separatrizes. Frequentemente, é necessário
resumir os dados por um único número que, a seu modo, descreve todo o conjunto. É o que estudaremos a seguir.
1.1.2 Medidas de Tendência Central e Separatrizes

Conforme aponta Freund (2006), os dados são descritos por números muito bem escolhidos que resumem todo
o conjunto de dados. Assim, são escolhidos aspectos particulares estabelecidos por medidas estatísticas que os
descrevem. Vale destacar que uma característica importante de um conjunto de dados é a sua localização e, em
particular, seu centro. Dentre tais medidas, as de tendência central descrevem o meio ou o centro de dados.
Média ou Média Aritmética
Podemos dizer que média, ou média aritmética, é a medida mais conhecida e útil quando precisamos encontrar
o centro de um conjunto de dados. Quando calculada em relação ao número de dados de uma amostra temos a
média amostral, sendo denotada por n.
Definição: a média amostral de observações x1, x2, x3, ..., xn é dada por
; o numerador de se escreve informalmente como , onde a soma inclui todas as
observações amostrais.
Freund (2006) acrescenta de maneira simples que a média de n números é sua soma dividida por n.
Exemplo: a média entre as idades dos 20 alunos de um curso de graduação de Gastronomia é 29,2 anos. O valor
é obtido a partir da soma dos elementos dividida pelo número total de elementos.
Idades:
-9-
Também podemos trabalhar com a média populacional, neste caso, substituindo n (número da amostra) por N
(número da população). Assim, denotaremos a média populacional pela letra grega (“mi”) e escrevemos:
, sendo a soma de todos os N valores de x que formam a população em estudo.
Um aspecto importante diz respeito à distinção entre as descrições de amostra e de população. Perceba que
estamos nos referindo a uma descrição de amostra como uma estatística, e uma descrição da população como
um parâmetro.
É possível que no cálculo da média de uma determinada amostra sejamos induzidos ao erro. Isso, geralmente,
ocorre quando a amostra é formada por algum dado discrepante que pode estar muito acima ou muito abaixo da
maioria dos valores dos demais dados. Nessa situação, é recomendável omitir este valor ou buscar outra média
estatística. Como medida de tendência central, talvez a mediana não seja tão sensível a estes dados discrepantes
como a média.
Mediana
Para calcular a mediana, é necessário, primeiro, ordenar os dados em ordem crescente ou decrescente e
identificar se o número de elementos é ímpar ou par. A mediana corresponde ao elemento do meio, se o número
de elementos n é ímpar, ou é a média aritmética entre dois valores do meio, se n é par.
Devore (2018) aponta que a posição da mediana amostral se obtém a partir dos seguintes cálculos: ,
para n ímpar; e a média aritmética entre os elementos , quando n é par. Observe que estamos
encontrando a posição dos elementos da mediada e não a mediana em si.
De maneira análoga à média populacional, denotamos a mediana populacional como .
Exemplo: nas últimas semanas foram registrados os seguintes números de vacinação em um dado posto de
saúde: 14 – 17 – 20 – 22 – 21 – 25 – 15. Para identificar a mediana, devemos, primeiramente, ordenar os valores
desta forma: 14 – 15 – 17 – 20 – 21 – 22 – 25. Nesse caso, temos n = 7 (ímpar) e a mediana é dada por
elemento. Portanto, a mediana é o número 20. Observe que, se acrescentarmos mais um
elemento, n passará a ser par e a mediana corresponderá ao elemento entre , ou seja,
Devemos localizá-los e tirar a média aritmética entre eles. O número resultante
corresponderá à mediana.
Exemplo: Encontre a posição da mediana para:
a) n = 27
b) n = 46
Solução: Para n = 27 (ímpar), vem: Para n = 46 (par), temos:
Calculando a média entre os , ou seja,
Portanto, mediana é o elemento localizado entre os . Ressaltamos que esta fórmula
nos indica a posição em que o elemento se encontra e não o elemento em si.
Moda
Além da média e mediana, também existem outras medidas de tendência central como a moda. De acordo com
Larson e Farber (2010), a moda de um conjunto de dados é uma entrada do conjunto de dados que ocorre com
maior frequência. É importante ressaltar que caso nenhum dado seja repetido a moda não existe, e caso se repita
- 10 -
maior frequência. É importante ressaltar que caso nenhum dado seja repetido a moda não existe, e caso se repita
temos um conjunto bimodal. Observe o exemplo:
Exemplo: Encontre a moda dos preços das passagens de uma companhia aérea: 388 – 397 – 397 – 400 – 405 –
386. Verificamos que o elemento que mais se repete é 397, portanto, ele é a moda dos preços das passagens.
Até aqui estudamos as medidas de tendência central, ou seja, a média, a mediana e a moda. O próximo passo é
verificar que a mediana é apenas uma medida dentro de muitos quartis que dividem os dados em duas ou mais
partes iguais. Dentre essas medidas temos os quartis.
Quartis
Conforme as ideias expostas por Devore (2018), a mediana (populacional ou amostral) divide o conjunto de
dados em duas partes de mesmo tamanho, contudo, para obtermos melhores medidas de locação, podemos
dividir os dados em mais de duas partes. Dessa maneira, os quartis dividem o conjunto de dados em quatro
partes iguais, sendo eles: o primeiro quartil , o segundo quartil e o terceiro quartil Note que as
observações acima do terceiro quartil constituem o quarto superior do conjunto de dados, o segundo quartil é
idêntico à mediana e o primeiro quartil separa o quarto inferior dos três quartos superiores.
Mas, de acordo com Freund (2006), um problema na análise exploratória de dados exige dividir os dados em
quatro partes iguais ou aproximadamente iguais. Assim, há tantos valores menores que , quanto entre ,
entre e maiores que . Freund (2006, p. 69) também destaca: “ é a mediana de todos os valores
inferiores à mediana de todo o conjunto de dados e é a mediana de todos os valores superiores à mediana de
todo o conjunto de dados”.
De maneira análoga à mediana, podemos identificar a posição dos elementos dos quartis a partir da seguinte
regra. Observe:
Se n é ímpar: posição de ; .
Se n é par: posição de ;
Observe que o cálculo para é o mesmo utilizado para a mediana.
Exemplo: Encontre a posição das medianas , para:
a) n = 32
b) n = 35
Em (a) temos n par, portanto, o cálculo da posição de é dado por:
Já em (b) temos n ímpar, portanto, o cálculo da posição de
1.1.3 Gráfico boxplot

Conforme estudamos anteriormente, alguns gráficos, como histograma, polígono de frequência e gráfico de
setores conduzem impressões gerais sobre os dados fornecidos de determina amostra. O gráfico boxplot, por sua
vez, amplia essa gama de observações, estendendo-se à análise do centro, variabilidade, extensão e a natureza de
qualquer desvio em relação à simetria, além da identificação de outliers, que revelam os dados discrepantes da
maioria.
O boxplot mais simples apresenta os seguintes números: mínimo, quarto inferior, mediana, quarto superior e
máximo. Outro conceito importante para a compreensão de um boxplot é o de dispersão entre os quartos,
denotado por . Esta dispersão corresponde à diferença entre o quarto superior e o quarto inferior que em
notação matemática é:
Devore (2018, p. 38) afirma que “entende-se que a dispersão entre os quartos não será afetada pelas posições de
observações nos menores 25% ou nos maiores 25% dos dados”.
Para sua construção, primeiramente, os dados devem ser ordenados do menor para o maior. A mediana ocupará
a posição central se o número de elementos n for ímpar, o quarto inferior corresponderá à mediana da metade
menor e o quarto superior à mediana da metade maior.
Conforme explica Devore (2018), os quartos são similares aos quartis, contudo os quartis são mais complexos
- 11 -
Conforme explica Devore (2018), os quartos são similares aos quartis, contudo os quartis são mais complexos
que os quartos. Assim, caso seja realizado um cálculo dos quartis, os valores podem ser diferentes daqueles
calculados para os quartos. Observe este exemplo, segundo Devore (2018).
Os dados a seguir consistem em observações do período decorrido até a falha (milhares de horas) para uma
amostra de turbo compressores para um tipo de motor:
1,6 - 2,0 - 2,6 - 3,0 - 3,5 - 3,9 - 4,5 - 4,6 - 4,8 - 5,0
5,1 - 5,3 - 5,4 - 5,6 - 5,8 - 6,0 - 6,0 - 6,1 - 6,3 - 6,5
6,5 - 6,7 - 7,0 - 7,1 - 7,3 - 7,3 - 7,3 - 7,7 - 7,7 - 7,8
7,9 - 8,0 - 8,1 - 8,3 - 8,4 - 8,4 - 8,5 - 8,7 - 8,8 - 9,0
A partir destes números foram registradas as informações: mínimo: 1,6; quarto inferior: 5,05; mediana: 6,5;
quarto superior: 7,85; máximo; 9,0. Os gráficos a seguir mostram que há uma razoável simetria nos 50%
intermediários dos dados.
Figura 5 - Gráfico de pontos: tempo de vida útil.

Fonte: Elaborada pela autora, baseado em DEVORE (2018).
A partir dos dados expostos anteriormente, é criado o gráfico boxplot em que os dados são distribuídos entre os
números 1,6 e 9,0. Ele pode ser representado tanto horizontalmente como verticalmente.
Figura 6 - Boxplot para os dados referentes ao tempo de vida útil.

Fonte: Elaborada pela autora, baseado em DEVORE, 2018.
É importante destacar que qualquer observação mais distante que 1,5 do quarto mais próximo, seja o inferior
ou o superior, é um outlier. Ele é considerado extremo se estiver a mais de 3 do quarto mais próximo, em caso
contrário, ele é considerado moderado.
O boxplot também poderá ser usado em comparações entre outros boxplots, que podem revelar assimetrias
representadas por valores atípicos, nos orientando a uma melhor decisão sobre o produto ou processo.
- 12 -
1.1.4 Medidas de dispersão
Uma característica importante estudada em um conjunto de dados é a diferença ou a variabilidade entre esses
dados, assunto largamente discutido em Inferência Estatística. Um exemplo pode ser observado quando
medimos o pulso de dois pacientes em um hospital, sendo que o primeiro acusa uma taxa de 72, 76 e 74, e o
segundo uma taxa de 71, 91 e 59. Apesar de ambos apresentarem uma taxa média de 74, o segundo paciente teve
uma grande flutuação, evidenciando uma instabilidade nas medidas apontadas.
Dessa maneira, perceba que as medidas de dispersão têm o propósito de medir a variabilidade entre os dados.
Para iniciarmos seu estudo devemos, primeiramente, conhecer o conceito de amplitude. Você saberia defini-lo?
Amplitude corresponde à diferença entre o máximo valor coletado e o mínimo valor coletado em determinado
conjunto de dados. Dessa forma, podemos dizer que a amplitude do primeiro paciente é 76 – 72 = 4, e a do
segundo paciente é 91 – 59 = 32.
Vale destacar que a amplitude não é uma medida muito útil quando o assunto é variação, sendo usada, na
prática, como uma medida de dispersão rápida e fácil quando, por exemplo, desejamos fazer um controle
imediato de peças de matérias-primas ou produtos de pequenas amostras tomadas em intervalos de tempo
regulares.
Para estudar a variação dos dados devemos verificar quão dispersos eles estão em relação à sua média. Dentre
essas medidas, encontramos o desvio-padrão amostral (s), dado por: , sendo a média amostral
do conjunto de dados e n o número de elementos dessa amostra.
O quadrado do desvio padrão amostral é denominado variância amostral ( ). Para encontrar o valor do desvio
padrão populacional ( e da variância populacional ( , basta trocar por e por N, preservando as
mesmas fórmulas. Vale lembrar que o desvio padrão e a variância sempre apresentarão valores positivos.
Conforme destaca Freund (2006), em geral, o propósito em calcular uma estatística amostral como a média, o
desvio padrão e a variância é estimar o parâmetro populacional correspondente. Confira, a seguir, as definições
atribuídas por Larson e Farber (2010) para a variância populacional e o desvio padrão populacional.
Definição: a variância populacional do conjunto de dados de N entradas é:
Variância populacional =
Definição: o desvio padrão populacional de um conjunto de dados populacional de N entradas é a raiz quadrada
da variância populacional.
Desvio padrão populacional =
VOCÊ O CONHECE?
Carl Friedrich Gauss (1777 – 1855) foi matemático, astrônomo e físico alemão que estudou
temas como regressão e o método dos mínimos quadrados por meio da astronomia. Em sua
homenagem, a distribuição normal também é conhecida como distribuição Gaussiana.
Portanto, podemos afirmar que quanto menor o valor do desvio-padrão, menos dispersos estão os valores e,
dessa maneira, mais próximos estão da média. Note ainda que o desvio padrão também é estudado quando
algumas séries são representadas por polígonos de frequência ajustados nas curvas e com um formato
semelhante a um sino, ou seja, uma curva simétrica, como mostra o gráfico a seguir.
- 13 -
Figura 7 - Regra empírica: distribuição (simétrica) com forma de sino.
Fonte: LARSON; FARBER, 2010, p. 73.
Esta curva é chamada de Curva de Gauss ou Curva Normal. Vamos entender como a curva de Gauss se relaciona
com o desvio padrão.
Para a distribuição simétrica em formato de curva, o desvio-padrão tem a maneira apresentada a seguir.
(LARSON; FARBER, 2010) Clique nos itens.
Em torno de 60% dos dados está dentro de um desvio padrão em relação à média.
Em torno de 95% dos dados está dentro de dois desvios padrão em relação à média.
Em torno de 99,7% dos dados está dentro de três desvios padrão em relação à média.
Exemplo: encontre a variância populacional e o desvio-padrão dos salários listados a seguir:
- 14 -
Para desenvolver esta questão é conveniente trabalhar com uma tabela com três colunas:
A partir dos dados tabelados, temos: e Portanto, a variância

populacional é de, aproximadamente, 8,9 e o desvio padrão populacional é de 3,0 ou $ 3000.
1.2 Elementos de probabilidade

Você sabia que a dificuldade de prever determinados acontecimentos no nosso cotidiano resultou na formulação
de modelos matemáticos que definem tais situações e, portanto, nos permitissem tomar decisões mais
proveitosas ou desejáveis? Neste tópico, vamos estudar um novo ramo da Estatística, a Estatística Indutiva.
Inicialmente, vamos conhecer alguns conceitos essenciais para o estudo da probabilidade.
- 15 -
1.2.1 Experimentos aleatórios e espaços amostrais
De acordo com Larson e Farber (2010), um experimento consiste em uma ação ou tentativa pela qual os
resultados específicos são obtidos. O estudo da probabilidade é realizado sobre fenômenos aleatórios,
imprevisíveis, em que as condições iniciais não determinam a possibilidade da existência de um único resultado
em particular que possam ser previsto.
Utilizamos a palavra “resultado” que pode estar relacionada a uma única tentativa ou a várias. Quando há várias
tentativas, o grupo de resultados possíveis de um experimento de probabilidade é chamado de espaço
amostral, sendo seu número de elementos denotado por n(s). Outro conceito importante é o de evento, que
corresponde a um subgrupo do espaço amostral e pode ter um ou mais resultados.
Vamos apresentar um exemplo do uso dos termos experimento aleatório, espaço amostral e evento. Clique nos
itens e observe.
Experimento aleatório
Lançamento de um dado de seis lados.
Espaço amostral
Evento
Sair face ímpar:
Para saber mais, assista o vídeo a seguir.
VOCÊ QUER VER?

O canal Univesp traz diferentes conteúdos, entre eles os temas discutidos até aqui, como
distribuição de frequência, gráficos e medidas de tendência central. No vídeo (2018), você verá
sobre medidas de tendência central e variabilidade. Acesse em:
<https://www.youtube.com/watch?v=efy2kjExwTU>
Dessa forma, podemos classificar os eventos conforme apresentado na interação a seguir. Clique e veja.
Evento simples: é constituído por um único elemento do espaço amostral. Por exemplo, A: ser uma pessoa com
olhos azuis: .
Evento composto: é constituído por dois ou mais elementos do espaço amostral. Por exemplo, E: ser uma
pessoa com problema respiratório: .
Evento impossível: não ocorre. Por exemplo, uma pessoa com cabelos verdes naturais: .
Evento certo: é aquele que corresponde ao próprio espaço amostral. Por exemplo, sair cara ou coroa no
lançamento de dois dados: .
A seguir, falaremos sobre o Diagrama de Venn, acompanhe!
1.2.2 Diagrama de Venn

De maneira análoga às operações com conjuntos, definimos as operações em eventos e o Diagrama de Venn em:
- 16 -
Quadro 2 - Operações em eventos e o Diagrama de Venn.
Fonte: Elaborado pela autora, 2019.
Os espaços amostrais são classificados de acordo com o número de elementos, ou pontos, que contêm. Em
determinadas situações, o conjunto não apresenta elementos, sendo denotado por conjunto vazio, cuja
representação é Conforme aponta Triola (2017), em muitos problemas de probabilidade interessam-nos
os eventos que podem ser expressos em termos de dois ou mais eventos que representam uniões, intersecções e
complementos. Assim, teremos dois eventos, A e B, denotados por , , ou .
- 17 -
1.2.3 Conceitos básicos de probabilidade
Para Devore (2018, p. 52), “dados um experimento e um espaço amostral S, o objetivo da probabilidade é
assegurar a cada evento A um número P(A), chamado de probabilidade do evento A, o qual dará uma medida
precisa da oportunidade que A ocorra”.
A definição clássica diz que a probabilidade de ocorrer determinado resultado na realização de um experimento
é igual à razão entre o número de casos de sucesso (número de elementos do evento A) e o número total do
espaço amostral S. Assim, temos:
Já a probabilidade de fracasso, ou seja, do resultado desejado não ocorrer é dado pelo complemento dele ocorrer.
Acompanhe:
Com base no conceito de complemento de um evento, observe este exemplo: o evento é selecionar um
funcionário entre 20 e 32 anos, sendo que a frequência deste evento é 232. Como o total de frequência é 800, a
probabilidade de selecionar um funcionário entre essas idades é igual a .
Portanto, a probabilidade de o funcionário não ter entre 20 e 32 anos é:
CASO
A probabilidade de fechamento de cada relé do circuito apresentado na figura é dada por p.
Devemos considerar que todos os relês funcionam independentemente. Veja a representação
do circuito (MEYER, 2012, p. 57) e a questão: qual é a probabilidade de que haja corrente entre
os terminais L e R?
Os eventos são, respectivamente:

A={o relê i está fechado}, i = 1,2, 3 e 4; E = {a corrente passa de L para R}; Em consequência,
temos: E=(A1∩A2)(A3∩A4). Como (A ∩A )∪ (A ∩A )não são mutuamente excludentes, então
1 2 3 4
vem: P(E)=(A ∩A ) +P(A ∩A )-P((A ∩A ∩A ∩A .
1 2 3 4 1 2 3 4
2 2 4 2
p +p -p =2p -p4.
Propriedades
De acordo com Devore (2018), temos que:
• para qualquer evento A, , a partir da qual ;

• para qualquer evento A, ;
• eventos não mutuamente exclusivos: ;
• eventos mutuamente exclusivos: ;
• se A, B e C são eventos quaisquer então:
- 18 -
• se A, B e C são eventos quaisquer então:
1.2.4 Técnicas de contagem

Devore (2018) explica que as técnicas de contagem calculam probabilidades que se reduzem a contar diversos
resultados de um experimento que não são igualmente prováveis.
Outra definição atribuída por Aranha e Rodrigues (1997) é que a análise combinatória é a parte da matemática
que se dedica a contar e formar agrupamentos com os elementos de um conjunto dado.
VOCÊ SABIA?
Não é de hoje que ocorrem abusos com a Estatística, sendo que alguns o fazem simplesmente
por descuido ou ignorância; outros têm objetivos pessoais, dando ênfases somente aos dados
que lhes interessam. Por isso, preste muito atenção, pois esses descuidos podem ser
encontrados em algumas situações que evidenciem: pequenas amostras, perguntas
tendenciosas, estimativas por suposição ou mesmo em gráficos enganosos.
O Princípio Fundamental da Contagem (PFC) ou Princípio Multiplicativo

Confira, a seguir, um exemplo de Princípio Multiplicativo.
Exemplo: em um estudo médico, os pacientes são classificados pelo grupo sanguíneo A, B, AB e O, e de acordo
com a sua pressão sanguínea baixa, normal ou alta. De quantas maneiras pode um paciente ser classificado?
Para resolver esta questão devemos fazer um diagrama de árvore, conforme apresentamos na figura abaixo.
- 19 -
Figura 8 - FREUND, 2006, p. 112.
Fonte: Diagrama de Árvore.
Com base no Diagrama de Árvore uma escolha consiste em dois passos, em que o primeiro pode ser realizado de
m maneiras e o segundo de n maneiras, então o número de escolhas possíveis é obtido por maneiras.
Neste sentido, podemos afirmar que é possível expandir o número de passos, ampliando o número de opções,
fornecendo um diagrama mais amplo que o anterior. Perceba que o Diagrama de Árvore possibilita uma
visualização sobre todas as escolhas possíveis, já o Princípio Multiplicativo nos fornece o número exato de
escolhas.
Exemplo: dispondo das letras A, B e C e dos algarismos 1, 2, 3, 5, quantas placas de automóveis formada por três
letras seguidas de quatro algarismo podemos formar?
Solução: se e , portanto, pelo Princípio Multiplicativo, temos: 3 x 4 = 12 maneiras diferentes de
formar as placas.
Exemplo: um vendedor de automóveis novos oferece um carro em quatro estilos, dez acabamentos e três
- 20 -
Exemplo: um vendedor de automóveis novos oferece um carro em quatro estilos, dez acabamentos e três
potências. De quantas maneiras diferentes pode ser encomendado um desses carros?
Solução: como , e , há maneiras diferentes de encomendar um desses carros.
Arranjos e Permutações
Como vimos, a regra de multiplicação de escolhas e sua generalização são utilizadas quando fazemos várias
escolhas sobre um determinado conjunto, porém, muitas vezes, também queremos saber em qual ordem essas
escolhas podem ser feitas. Conforme Freund (2006), quando escolhemos p objetos de um conjunto de n objetos
distintos, um arranjo consiste em uma escolha ordenada desses objetos. Quando n = p, dizemos que um arranjo é
uma permutação.
- Arranjo simples: um arranjo simples de n elementos de um conjunto ordenado com p elementos (sem
repetição) escolhidos entre os n elementos de A.
; em que indica o número de arranjos simples de n elementos p a p.
Lembrando que quando n = p, temos:
, ou seja, as permutações simples com n elementos são um caso particular simples de
arranjos simples
Exemplo: de quantas maneiras oito professores de matemática podem ser distribuídos para lecionar em oito
turmas de um curso de Engenharia?
Solução: Como n = p = 8, temos:
. Portanto, há 40320 maneiras diferentes de alocar os oito professores dentre as oito turmas.
Exemplo: uma turma de teoria de probabilidade é formada por seis homens e quatro mulheres. Aplica-se uma
prova para verificar o desempenho dos estudantes. Vamos supor que nenhum deles tenha tirado a mesma nota.
Quantas diferentes classificações são possíveis? Se os homens forem classificados somente entre si e as mulheres
somente entre si, quantas diferentes classificações são possíveis?
Solução:
classificações possíveis.
Exemplo: supondo que escalar um time de futebol seja distribuir as onze camisas entre os jogadores, determine
quantos times é possível escalar, dispondo de 20 jogadores.
Solução: temos que n = 20 e p = 11. Assim, vem: .
Combinações
Em determinadas situações, precisamos saber o número de maneiras pelas quais podemos escolher p objetos em
um conjunto de n objetos, sem nos importar com a ordem em que esta escolha será feita. Dessa maneira,
estaremos diante de uma combinação de n objetos tomados p a p, dado pela fórmula é:
Agora, clique nos itens a seguir e preste atenção nestas definições.
Arranjo Devemos escolher quem participa e, em seguida, em que ordem: n≠p.
Permutação Só escolhemos em que ordem os elementos ficarão, pois todos participarão: n=p.
Combinação Escolhemos apenas quem participa do subconjunto, sem interesse na ordem.
Exemplo: de quantas maneiras diferentes uma pessoa pode escolher três livros de uma lista de dez best-sellers
supondo que é inconsequente a ordem de escolha dos três livros? (FREUND, 2006).
Solução: sendo n = 10 e p = 3, temos:
- 21 -
1.3 Probabilidade condicional
De acordo com Larson e Farber (2010), uma probabilidade condicional é a probabilidade de um evento ocorrer,
dado que outro evento já tenha ocorrido. Assim, os eventos ocorrem em sequência.
Notação e fórmula: (lê-se: probabilidade de B dado A).
Outra possibilidade é dada por: Neste caso, consideramos que o evento já ocorrido ou já
conhecido é B.
Exemplo: duas cartas são selecionadas, sem reposição, da primeira carta, de um baralho normal. Encontre a
probabilidade de selecionar um rei e então uma dama (LARSON; FARBER, 2010).
Solução: estamos diante uma situação em que não há reposição das cartas. Portanto, são eventos dependentes.
Temos que e devemos selecionar uma dama sabendo que a seleção do rei já ocorreu. Assim, vem:
1.3.1 Eventos independentes

Você sabia que em determinados experimentos a ocorrência de um evento não afeta a probabilidade do outro?
Vejamos um exemplo. Em um jogo de um dado e de uma moeda, o resultado obtido no jogo de dados não tem
qualquer relação com o resultado do jogo da moeda. Dito de outra maneira, tais eventos são considerados
independentes, caso contrário, poderíamos dizer que eles são dependentes um do outro.
Assim, temos a seguinte relação: ; ;
Exemplo: uma moeda é jogada e um dado é lançado. Encontre a probabilidade de obtermos uma cara e, então,
jogar um seis.
Solução:
1.3.2 Teorema de Bayes

Quando estudamos probabilidade condicional, vimos que e representam probabilidades
diferentes, uma vez que estão condicionadas ao conhecimento de B em e à existência de A em .
Portanto, preste atenção, é necessário ter cuidado quando expressamos um evento em relação ao outro. De
maneira a expressar em termos de para quaisquer eventos A e B, criou-se a seguinte fórmula:
Exemplo: em um certo estado onde os automóveis devem ser testados quanto à emissão de gases poluentes,
25% de todos os automóveis emitem quantidades excessivas de gases poluentes. Ao serem testados, 99% de
todos os automóveis que emitem quantidades excessivas de gases poluentes são reprovados, mas 17% dos que
não emitem quantidades excessivas de gases poluentes também são reprovados. Qual é a probabilidade de um
automóvel reprovado no teste emitir uma quantidade excessiva de gases poluentes? (FREUND, 2006).
Solução: os eventos e as probabilidades são:
A: automóvel ser reprovado no teste;
B: automóvel emitir uma quantidade excessiva de gases poluentes
- 22 -
Figura 9 - Diagrama de Árvore representando as probabilidades.
Para calcular . Esta corresponde à probabilidade de um automóvel reprovado

no teste emitir uma quantidade excessiva de gases poluentes.
Síntese
Nessa unidade, aprendemos que a Estatística está presente em diversos contextos do nosso cotidiano e
envolvida na tomada de decisões em diferentes situações, como na Gestão de Projetos, na análise de
confiabilidade de um sistema, na análise de risco de um produto ou processo, nos censos demográficos, entre
outras situações. Para que a análise dos dados seja feita da maneira aprimorada, minimizando os erros de um
projeto, aprendemos os primeiros conceitos que envolvem seu estudo.
Nesta unidade, você teve a oportunidade de:
• distinguir população de amostra; parâmetro de dado estatístico e estatística descritiva e estatística
inferencial;
• representar os dados a partir de histograma, de um polígono de frequência e de um gráfico de setores;
• reconhecer medidas de tendência central e as medidas de dispersão;
• identificar o espaço amostral de um experimento de probabilidade;
• encontrar o complemento de um evento e outras probabilidades a partir do Diagrama de Venn;
• encontrar probabilidades condicionais.
Bibliografia
ARANHA, A. Z., RODRIGUES, M. B. Exercícios de Matemática, vol. 4: análise combinatória e probabilidade. São
Paulo: Policarpo, 1997.
DEVORE J. L. Probabilidade e estatística para engenharia e ciências. Tradução: Solange Aparecida Visconte.
Revisão técnica: Magda Carvalho Pires. São Paulo: Cengage, 2018.
ESTATÍSTICA e Probabilidade - Aula 10 - Medidas de tendência central e variabilidade. 2018. 1 vídeo (22 min 20
- 23 -
ESTATÍSTICA e Probabilidade - Aula 10 - Medidas de tendência central e variabilidade. 2018. 1 vídeo (22 min 20
s). Publicado no canal: UNIVESP. Disponível em: https://www.youtube.com/watch?v=efy2kjExwTU. Acesso em:
11 jul. 2019.
FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. Tradução: Claus Ivo Doering. 11.
ed. Porto Alegre: Bookman, 2006.
LARSON, R; FARBER, B. Estatística Descritiva. Tradução Luciane Ferreira Pauleti Vianna. 4. ed. São Paulo:
Pearson Prentice Hall, 2010.
MEYER, P. L. Probabilidade: aplicações à estatística. 2. ed. Rio de Janeiro: LTC, 2012.
MORETTIN, P. A.; BUSSAB, W. O. Estatística Básica. 6. ed. São Paulo: Saraiva, 2010.
SANTOS, B. M. et al. A importância e o uso da Estatística na área empresarial: uma pesquisa de campo com
empresas do município de Elói Mendes – MG. In: SEGET – SIMPÓSIO DE EXCELÊNCIA EM GESTÃO DE
TECNOLOGIA. 16, 2016, Resende-RJ. Anais [...], Resende, 2016. Disponível em: https://www.aedb.br/seget
/arquivos/artigos16/5024102.pdf. Acesso em: 30 jul. 2019.
TRIOLA, M. F. Introdução à Estatística. 12. ed. Rio de Janeiro: LTC, 2017.
- 24 -

Estatística - Unidade 1

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística - Unidade 1

Enviado por

Direitos autorais:

Formatos disponíveis

PROBABILIDADE E ESTATÍSTICA

UNIDADE 1 - ESTATÍSTICA DESCRITIVA

1.1.1. Análise exploratória de dados, tabelas e gráficos

VOCÊ QUER LER?

Tabela 2 - Distribuição de frequência por intervalo de classes.

Figura 1 - Histograma do salário da diretoria de uma empresa.

Tabela 3 - Distribuição de frequência: tempo gasto para chegar ao trabalho em minutos.

Figura 2 - Histograma do tempo gasto por funcionários para chegar ao trabalho.

Outra forma é o polígono de frequência, como você pode ver a seguir.

Tabela 5 - Distribuição de frequência para locação de veículos.

1.1.2 Medidas de Tendência Central e Separatrizes

Já em (b) temos n ímpar, portanto, o cálculo da posição de

1.1.3 Gráfico boxplot

Figura 5 - Gráfico de pontos: tempo de vida útil.

Figura 6 - Boxplot para os dados referentes ao tempo de vida útil.

Desvio padrão populacional =

Exemplo: encontre a variância populacional e o desvio-padrão dos salários listados a seguir:

A partir dos dados tabelados, temos: e Portanto, a variância

1.2 Elementos de probabilidade

VOCÊ QUER VER?

A seguir, falaremos sobre o Diagrama de Venn, acompanhe!

1.2.2 Diagrama de Venn

Os eventos são, respectivamente:

• para qualquer evento A, , a partir da qual ;

• se A, B e C são eventos quaisquer então:

1.2.4 Técnicas de contagem

O Princípio Fundamental da Contagem (PFC) ou Princípio Multiplicativo

Agora, clique nos itens a seguir e preste atenção nestas definições.

Arranjo Devemos escolher quem participa e, em seguida, em que ordem: n≠p.

Combinação Escolhemos apenas quem participa do subconjunto, sem interesse na ordem.

Notação e fórmula: (lê-se: probabilidade de B dado A).

1.3.1 Eventos independentes

1.3.2 Teorema de Bayes

Para calcular . Esta corresponde à probabilidade de um automóvel reprovado

Você também pode gostar