Você está na página 1de 44

Métodos Quantitativos

Função Afim e Função Quadrática

Função
Dado certo elemento (que pode ser um objeto, um número, uma pessoa, etc.), a função o
relaciona a outro, podendo este ser tão diverso quanto o primeiro.
Para compreender a ideia de função, primeiramente é necessário relembrar alguns
conceitos, conjunto, elemento e pertinência. Para uma melhor compreensão, observe os
seguintes exemplos:
❏ Conjunto das vogais: A = {a, e, i, o, u}.
❏ Conjunto dos planetas do sistema solar: B = {Mercúrio, Vênus, Terra, ..., Netuno}.
❏ Conjunto dos meses do ano: C = {janeiro, fevereiro, ..., dezembro}.
No primeiro exemplo, A é o símbolo utilizado para representar o conjunto das vogais;
cada vogal é um elemento do conjunto. Podemos dizer inclusive que a vogal u pertence ao
conjunto A, afirmação que pode ser expressa sinteticamente por 𝑢 ∈ 𝐴 (lê-se: u pertence a
A). A consoante m não pertence ao conjunto A e escrevemos 𝑚 ∉ 𝐴 (lê-se: m não pertence
a A). Os exemplos mais conhecidos de conjuntos são:
❏ Números naturais: N = { 1, 2, 3, 4, 5, 6, ..., 99, 100, 101,...};
❏ Números inteiros: Z = {..., -7, - 6, ..., -1, 0, 1, 2, ..., 5, 6, 7, ...};
❏ Números inteiros, sem o zero: {..., -7, - 6, ..., -1, 1, 2, ...,5, 6, 7, ...};

❏ Números racionais: = (lê-se: Q é o conjunto dos números a b


❏ tais que a pertence a z e b pertence a z*)
37 1 1 10
❏ Números reais: {..., -50, ..., - , ..., π, ..., -2, ..., - , ..., 0, ..., , ..., 1, ..., ,
𝑒 2 2 9
..., 2, ...,π, ..., 4, ..., 7π, ...};
Plano cartesiano - uma relação R pode ser visualizada graficamente em um diagrama
denominado plano cartesiano. Veja, por exemplo, a representação gráfica da relação R =
{(0,0) (2,0), (3,3)} no plano cartesiano.

Função Afim
A função afim, por exemplo, é amplamente utilizada no comércio (para atualização de
preços e rateio de custos), na engenharia e na arquitetura (para construção de plantas
baixas), na área de saúde e indústria farmacêutica (para cálculo de dosagens de
medicamentos) etc.
Lei de Formação - f(x) = ax+b
Função Quadrática
A função quadrática também possui um leque de aplicações muito grande, sendo
utilizada principalmente em problemas envolvendo cálculos de área e em otimização, para
estudo de erros.
É uma função f:R⇨R ja lei de formação é f(x) = ax2 + bx + c, com a≠0. Os valores a,b e c
são denominados coeficientes e ax2 é o termo dominante.
Parábola - é o gráfico de uma função quadrática.
2 2
1 −𝑏 + 𝑏 − 4𝑎𝑐 2 −𝑏 − 𝑏 − 4𝑎𝑐
Zeros da Função Quadrática - 𝑥 = 2𝑎
e 𝑥 = 2𝑎
2
,caso existam. O valor ∆ = 𝑏 − 4𝑎𝑐 é denominado discriminante ou "delta".
Sinal, Mínimo e Máximo da Função Quadrática
❏ Extremo - maior ou menor valor atingido por uma função.
❏ Máximo - maior valor atingido por uma função.
❏ Mínimo - menor valor atingido por uma função.
Em uma função quadrática, o extremo geralmente está associado ao vértice de seu
gráfico. Este corresponderá a um máximo se a concavidade estiver voltada para baixo. E
será um mínimo, caso contrário.
Vértice

❏ O vértice será o ponto mais:


❏ Alto - se a concavidade do gráfico estiver voltada para baixo, o coeficiente do
termo dominante será negativo.

❏ Baixo - se a concavidade do gráfico estiver voltada para cima, o coeficiente


do termo dominante será positivo.
Estatística Descritiva
Você acha que a estatística é algo novo? De jeito nenhum!
Esse lance de “contar gente”, por exemplo, é bem antigo… Crespo (2009) que o diga!
Esse autor afirma que desde os tempos antigos, diversos povos já faziam esses registros
de número de habitantes, de nascimentos, de óbitos, além disso, eles faziam levantamentos
sobre riqueza individual e social, distribuição igual de terras ao povo, cobrança de impostos
e também faziam inquéritos quantitativos por processo o que hoje conhecemos como
“estatísticas”.
O estudo da estatística permeia os mais diversos campos do conhecimento, como as
ciências biológicas, agroecológicas, computação, medicina e outras áreas, sendo esse
estudo aplicado tanto com o intuito de constatar fatos como também de percepção de
tendências.
Dessa forma podemos conceituar a estatística como: “A ciência dos Dados”.
A Estatística é um ramo da matemática aplicada que fornece métodos para a coleta,
classificação, sumarização, organização, análise e interpretação de dados para o respaldo e
para a tomada de decisões.
Outra forma de conceituar estatística é com base em Berquó (1981) que a define como
um ramo do conhecimento científico que consta de um conjunto de processos que têm por
objeto a observação, a classificação formal e a análise dos fenômenos coletivos ou de
massa (descritivos); ele acrescenta, também, que a estatística investiga a possibilidade de
fazer referências válidas a partir dos dados observados e buscar métodos capazes de
permitir esta inferência (indutiva).
Observe que geralmente estamos na posição de receptores das informações, mas
em determinadas situações, assumimos o papel ativo na construção da informação,
principalmente, quando realizamos pesquisas. O importante é destacar que seja na
condição de receptor de produtor delas, a estatística se apresenta como ciência
imprescindível, já que ela cuida do tratamento de dados e seus significados.

Interpretação de Gráficos
Os gráficos são utilizados para apresentar os dados estatísticos e o objetivo do uso deles
é produzir no investigador, ou no público em geral, uma impressão mais rápida e lúdica de
fenômeno em estudo.
Os meios de comunicação e as evoluções tecnológicas nos levam a uma exposição cada
vez maior de informações apresentadas com tratamento estatístico, como a utilização de
gráficos, tabelas e medidas estatísticas.
Ao nos depararmos com uma informação tratada estatisticamente, é muito importante
que tenhamos a capacidade de interpretar, compreender, estabelecer relações e realizar
previsões a partir dos dados expostos, já que a abordagem estatística é utilizada para
fortalecer as informações que estão sendo apresentadas, entretanto, a leitura crítica da
informação como um todo deve ser feita para evitarmos acreditar em fake news.
Tipos de Gráficos
Podemos representar os dados estatísticos por meio de gráficos e existem diversas
formas de fazer isso. Apresentaremos aqui apenas dois dos modelos de gráficos mais
utilizados: Diagramas e Pictogramas.
❏ Diagramas - gráficos geométricos de no máximo duas dimensões. Este grupo é
composto pelos seguintes tipos de gráficos:
❏ Gráfico em Linhas:

❏ Gráfico em Curvas:

❏ Gráfico em Colunas:

❏ Gráfico em Barras:
❏ Gráficos de Setores “Gráfico de Pizza”:

❏ Pictogramas - é a representação gráfica mais lúdica, com a complementação de


figuras e símbolos.
Pensamento Científico
Os gráficos apresentados foram criados a partir de uma pesquisa.
Para chegar aos resultados apresentados, possibilitando conclusões, os pesquisadores
precisaram conhecer minimamente os caminhos da pesquisa científica. Na posição ativa da
construção do conhecimento, ou seja, quando você interage com o objeto de estudo, é
indispensável desenvolvermos o pensamento científico.
Quando fazemos pesquisa, tratamos de hipóteses e queremos comprová-las, para isso o
pensamento científico precisa estar presente e concretizado por meio de uma linguagem
teórica sobre os conceitos e hipóteses científicas (hipótese científica ou inferência dedutiva).
Já para a etapa da comprovação, é necessária a utilização de uma linguagem e um
método operacional cujos conceitos estão organizados em dois grupos da estatística:
Descritiva e Inferencial.
❏ Estatística Descritiva - trata da organização, sumarização e descrição de um
conjunto de dados. É nesta parte que os gráficos são construídos e com base no
cálculo de medidas de tendência central e de dispersão.
❏ Estatística Inferencial - Martins (2009) define a estatística inferencial como “métodos
que tornam possível a estimação de características de uma população baseada em
resultados amostrais”.

Métodos de Pesquisa
Método - é um conjunto de caminhos organizados para de chegar a um fim que se
deseja. Existem, dentro do método científico, dois importantes métodos para a realização de
uma pesquisa:
❏ Método Experimental - consiste em manter constantes todas as causas (fatores)
menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus
efeitos, caso existam. (CRESPO 2009).
❏ Método Estatístico - diante da impossibilidade de manter as causas constantes,
admitem todas essas causas presentes variando-as, registrando essas variações e
procurando determinar, no resultado final, que influências cabem a cada uma delas.
(CRESPO 2009).

Observação → Perguntas → Hipóteses → Experimento → Análise → Conclusão

O IBGE - Estatística na Prática


O IBGE - Instituto Brasileiro de Geografia e Estatística - é o principal provedor de dados
e de informações do país. O trabalho realizado pelo IBGE atende às necessidades dos mais
diversos segmentos da sociedade civil bem como dos órgãos das esferas governamentais:
federal, estadual e municipal.
Por isso, como descrito em seu site institucional, a missão do IBGE é “retratar o Brasil
com informações necessárias ao conhecimento de sua realidade e ao exercício da
cidadania".
As principais funções do IBGE consistem em:
❏ Produção e análise de informações estatísticas;
❏ Coordenação e consolidação das informações estatísticas;
❏ Produção e análise de informações geográficas;
❏ Coordenação e consolidação das informações geográficas;
❏ Estruturação e implantação de um sistema das informações ambientais;
❏ Documentação e disseminação de informações e coordenação dos sistemas
estatístico e cartográfico nacionais.

Censo
Conjunto de dados estatísticos que informa diferentes características dos habitantes de
uma região (escola, bairro, cidade, estado, país, ou qualquer outra região). O censo nos
fornece informações, tais como: quantos somos, como somos, onde estamos e como
vivemos.
O censo demográfico é apenas uma das várias possibilidades de censo; existem outros
tipos de censo como, por exemplo, o censo agropecuário, o censo eleitoral, o censo escolar,
etc.

Recenseamento
Segundo Camargo (2019) a ONU define recenseamento da população como o conjunto
das operações que consistem em recolher, agrupar e publicar dados demográficos,
econômicos e sociais relativos a um momento determinado ou a certo períodos para todos
os habitantes de um país ou território e acontece de forma periódica. No Brasil, o
recenseamento acontece de dez em dez anos.

Variáveis Estatísticas
São as características da pesquisa, isto é, atributos mensuráveis que observamos para
então concluir algo. Pode-se avaliar uma variável ou um conjunto delas. Existem diferentes
tipos de variáveis e podemos classificá-las em qualitativas e quantitativas.
A identificação e o estudo das variáveis irão permitir a descrição da população e o
estabelecimento de comparações entre grupos ou até mesmo caracterizar um grupo
específico.
❏ Variáveis Quantitativas - representada por um ou mais números. Relacionada a
valores numéricos. Se divide em dois grupos:
❏ Variáveis Quantitativas Discretas - são representada por números inteiros.
Exemplo: A quantidade de colaboradores em uma empresa, etc.
❏ Variáveis Quantitativas Contínuas - os valores numéricos podem assumir
valores quebrados, isto é, decimais. Exemplo: A altura das pessoas em
metro (1,54), etc.
Exemplos:
Idade; Massa Corporal;

Altura; Salário (renda);

Preços; Quantidade de Cômodos;

Nota final da prova; Etc.


❏ Variáveis Qualitativas - representada por um ou mais nomes. Relacionada a uma
qualidade, atributo a qualquer outra característica cuja forma de se classificar seja a
partir de um nome. Às vezes, esses nomes estão ordenamos ou hierarquizados, às
vezes não, o que nos leva a separação desse grupo em dois:
❏ Variável Qualitativa Ordinal - possui uma ordem, sequência, ela define
categorias. Exemplo: Estado civil: solteiro, casado, divorciado/separado,
viúvo; Grau de de concordância de uma pessoa com relação a algum
assunto: não concordo, concordo pouco, concordo, concordo muito, etc.
❏ Variável Qualitativa Nominal - não necessita de uma ordenação. Exemplo:
Tipos de veículos automotores: passeio, conversível, pick-up, antigo, SUV;
Cor do cabelo de uma mulher: branco, loiro, ruivo, preto, etc.
Exemplos:
Altura (baixo, Profissão (agricultor,
médio, alto); comerciante, bombeiro, etc.);

Gênero (homem Cor dos olhos (azuis,pretos,


cis, mulher cis, castanhos, etc.)
etc.);
Resumo:

Técnicas de Amostragem
O estudo das técnicas de amostragem é necessário para garantir a representatividade de
todos os perfis.
Deve-se traçar um caminho composto de fases para fazer a estatística de forma correta.
No planejamento temos a definição dos objetivos, das características da amostra, do
método de aquisição e do processamento de dados.
A pesquisa científica, observacional ou experimental busca dados sobre a tese a ser
comprovada e estabelece comparações entre grupos com características distintas. A
primeira pergunta do pesquisador no início da pesquisa é: “Serão coletados os dados de
toda uma população ou de apenas uma parcela representativa dessa população?” Para
tanto, é necessário definir os conceitos de população e amostra.
❏ População - conjunto de elementos que têm em comum uma determinada
característica.
❏ Amostra - todo subconjunto não vazio e com número menor de elementos da
população.
Para Vieira (2008), definir qual deve ser o tamanho de uma amostra é uma das principais
dificuldades encontradas nos trabalhos de levantamento amostral; segunda a autora, o
tamanho da amostra é independente do tamanha da população; já que o tamanho da
amostra, por si só, não determina se ela é boa ou de má qualidade, o que mais importa em
uma amostra é o seu grau de similaridade com a população.
Para o cálculo do tamanho da amostra, deve-se levar em consideração os seguintes
fatores:
❏ O nível de confiança;
❏ A precisão desejada para os resultados obtidos;
❏ A variabilidade dos dados (o quanto estão dispersos em relação à característica em
estudo) e o custo.
Explicação sobre População e Amostra:

Quando utilizamos o termo população, nos referirmos sempre a uma população


estatística e não a população geográfica.
A população estatística são os elementos, objetos, pessoas e etc. que são interesse para
determinado estudo. Já a população geográfica pode conter elementos que não nos
interessa, então nem sempre a população estatística vai coincidir com a população
geográfica.
Exemplo: Suponha-se que está sendo realizado uma pesquisa com o intuito de descobrir
quem ganhará as próximas eleições para presidente da república. A população geográfica
será todos os brasileiros sem exceções e a população estatística será todos os brasileiros
que votam, ou seja, os eleitores.
Portanto, naturalmente não teremos pessoas com menos de 16 anos de idade.
Não é possível entrevistar todos os eleitores, então na estatística o que é feito é pegar
uma parte do todo, ou seja, um determinado número (amostra) da população estatística. A
parte desse todo será a amostra.
O processo de obtenção dessa amostra é chamado de amostragem e para realizar um
processo de amostragem utiliza técnicas de amostragem.
Tipos de Amostragem
Na classificação geral do levantamento de coleta de amostra temos duas possibilidades
de coletas:
❏ Coleta Probabilística - ao realizar esse tipo de coleta, o pesquisador escolhe um
método, podendo ser simples, sistemático, estratificado ou por conglomerado e sabe
que cada unidade amostral tem a mesma probabilidade de pertencer a amostra.
❏ Amostragem Probabilística Simples - esse tipo de amostragem, também
chamada simples ao acaso, aleatória, casual, elementar, randômica, etc., é
equivalente a um sorteio lotérico. Nela, todos os elementos da população têm
igual probabilidade de pertencer à amostra, e todas as possíveis amostras
têm também igual probabilidade de ocorrer.
Sendo N o número de elementos da população e n o número de elementos
da amostra, cada elemento da população tem probabilidade n/N de pertencer
à amostra. A essa relação n/N denomina-se fração de amostragem.
Por outro lado, sendo a amostragem feita sem reposição, a suposição que
fazemos em geral, é que existem (n) possíveis amostras, todas igualmente
prováveis.
Na prática a amostragem simples ao acaso pode ser realizado numerando-se
a população de 1 a N, sorteando-se, a seguir, por meio de um dispositivo
aleatório qualquer, n números dessa sequência, os quais corresponderão
aos elementos sorteados para a amostra. Um instrumento útil para realizar o
sorteio acima descrito é a tabela de números ao acaso, Tal tabela é
simplesmente constituída por inúmeros dígitos que foram obtidos por algum
processo equivalente a um sorteio. Os elementos da amostra são escolhidos
aleatoriamente, podendo ser por meio de sorteios, de sistemas como a
tabela excel, calculadora científica ou de qualquer outra forma aleatória.
Porém, ainda assim, deve-se ter o cuidado de ter uma amostra
representativa.
Exemplo: Em um grupo de 80 pessoas, precisamos de uma amostra com 20
pessoas, então, fazemos da seguinte forma:
1. Enumeramos as 80 pessoas;
2. Realizamos o sorteio de 20 números, de 1 a 80, pode ser no mesmo
formato de um bingo;
3. Após o sorteio, teremos as 20 pessoas selecionadas para compor a
amostra, que representa 25% da população.
❏ Amostragem Probabilística Sistemática - os elementos da amostra são
escolhidos a partir de um fator de repetição, intervalo fixo, isto é, fixamos o
tamanho da população ou, quando necessário, um valor aproximado e
identificamos cada um pela sua posição. Quando os elementos da população
se apresentam ordenados e a retirada dos elementos da amostra é feita
periodicamente, temos uma amostragem sistemática. Assim, por exemplo,
em uma linha de produção, podemos, a cada dez itens produzidos, retirar um
para pertencer a uma amostra da produção diária.
Exemplo 1: N = 800, n = 50 e com a população já ordenada, poderemos
adotar o seguinte procedimento: sortear um número de 1 a 16 (nota-se que
800/50 = 16), o qual indicaria o primeiro elemento sorteado para a amostra;
os demais elementos seriam periodicamente retirados de 16 em 16.
800 ÷ 50 = 16 − 𝑠𝑜𝑟𝑡𝑒𝑖𝑜 𝑑𝑒 1 𝑎 16 = 7 (𝑒𝑥𝑒𝑚𝑝𝑙𝑜) − 7, 23, 39... (𝑠𝑜𝑚𝑎 7 + 16 = 23 + 1
Exemplo 2: Em um grupo de 100 pessoas, precisamos de uma amostra com
20 pessoas, então, faremos da seguinte forma:
1. Enumeramos as 100 pessoas de 1 a 20;
2. Realizamos o sorteio entre 1 a 20;
3. Considerem que o número sorteado foi 6, então, todas as pessoas
com o número 6 farão parte da amostra.
A principal vantagem da amostragem sistemática está na grande facilidade
na determinação dos elementos da amostra. O perigo em adotá-la está na
possibilidade da existência de ciclos de variação da variável de interesse,
especialmente se o período desses ciclos coincidir com o período de retirada
dos elementos da amostra. Por outro lado, se a ordem dos elementos na
população não tiver qualquer relacionamento com a variável de interesse,
então a amostragem sistemática terá efeitos equivalente à causal simples,
podendo ser utilizada sem restrições.
❏ Amostragem Probabilística Estratificada - população é agora vista como um
conjunto de grupos e não como um todo, a população é dividida em
subgrupos ou estratos, sem sobrepor os elementos. A amostragem
estratificada consiste em especificar quantos elementos de amostra serão
retirados em cada estrato.
É costume considerar três tipos de amostragem estratificada:
❏ Uniforme - sorteia-se igual número de elementos em cada estrato.
❏ Proporcional - o número de elementos sorteados em cada estrato é
proporcional ao número de elementos existentes no estrato.
❏ Ótimo - (quase não usado), por sua vez, toma em cada estrato um
número de elementos proporcional ao número de elementos do
estrato e também a variação da variável de interesse no estrato,
medida pelo seu desvio-padrão.
Evidentemente, a amostragem estratificada uniforme será, em geral,
recomendável se os estratos da população forem pelo menos
aproximadamente do mesmo tamanho; caso contrário, será em geral
preferível a estratificação proporcional, por fornecer uma amostra mais
representativa da população.
Exemplo Uniforme: Uma empresa de telemarketing tem 400 funcionários com
o intuito de fazer uma pesquisa estatística, referente ao trabalho, mostrou
para o pesquisador a seguinte informação: Na empresa há 204 mulheres e
196 homens. Se o pesquisador precisa de uma amostra com 50 pessoas,
então, fazemos da seguinte forma:
1. Separamos os dois grupos (estratos), 204 mulheres e 196 homes;
2. Para termos uma amostra uniforme de 50 pessoas, precisamos de 25
mulheres e 25 homens. (50 ÷ 2 = 25)
3. Para cada estrato, podemos utilizar os métodos anteriores (simples
ou sistemático) e assim teremos as 50 pessoas.
Exemplo Proporcional: Uma pesquisa tem como objetivo saber a opinião de
homens e mulheres a respeito de um novo produto. Sabe-se que em um
grupo de 100 pessoas, há 40 mulheres e 60 homens. Nesse caso,
precisamos levar em consideração os perfis dentro da população. Se o
pesquisador precisa de uma amostra com 20 pessoas, então, fazemos da
seguinte forma:
1. Separamos os dois grupos (estratos), 40 mulheres e 60 homens;
2. Para termos uma amostra de 20 pessoas, precisamos de 8 mulheres
e 12 homens;
3. Para cada estrato, podemos utilizar os métodos anteriores (simples
ou sistemático);
4. Por fim, somamos as 20 pessoas com a mesma representatividade
da população.
❏ Amostragem Probabilística por Conglomerados (por clusters) - quando a
população apresenta uma subdivisão em pequenos grupos, chamados
conglomerados, é possível - e muitas vezes conveniente - fazer-se a
amostragem por meio desses conglomerados, a qual consiste em sortear um
número suficiente de conglomerados, cujos elementos constituirão a
amostra. Ou seja, as unidades de amostragem, sobre as quais é feito o
sorteio, passam a ser os conglomerados e não mais os elementos individuais
da população. Esse tipo de amostragem é às vezes adotado por motivos de
ordem prática e econômica. Os elementos da amostra são escolhidos
aleatoriamente de forma natural por grupos (clusters); esse método se faz
necessário em situações nas quais é impossível ou inviável criar um quadro
de amostragem de uma população - alvo porque ela é espalhada
geograficamente e o custa da recolha de dados é relativamente alto.
❏ Coleta Não Probabilística - ao realizar esse tipo de coleta, o pesquisador escolhe de
maneira deliberada os elementos da amostra, utilizando seus próprios critérios de
escolha. O problema desse tipo de amostragem é que não se conhece a
probabilidade de cada unidade amostral pertencer à amostra.
Existem três classificações para este tipo de amostra: intencional, voluntária e
acidental. Entretanto, só garantimos a ausência de vícios utilizando as técnicas
probabilísticas.
Esses métodos são subjetivos, ou seja, o pesquisador define sua amostra com
intencionalidade, de maneira voluntária ou por acidente e deve deixar isso muito
claro em seus relatórios de pesquisa.
❏ Amostragem Não Probabilística Acidental - também chamada de amostra por
conveniência, o pesquisador seleciona membros da população mais
acessíveis. Vale recordar que este tipo de amostragem é utilizada quando
não temos acesso a lista completa dos indivíduos que formam a população,
portanto não sabemos a probabilidade que cada indivíduo tem de ser
selecionado para a amostra.
Exemplo: Entrevistar os gerentes gerais dos hotéis x e y, pois foram os que
autorizaram a entrevista.
❏ Amostragem Não Probabilística Intencional - também chamada de amostra
por julgamento, o pesquisador usa o seu julgamento para selecionar os
membros da população que são boas fontes de informação precisa.
Seleciona um subgrupo da população, que com base nas informações
disponíveis, possa ser considerado representativo de toda a população;
Requer conhecimento da população e do subgrupo conhecido.
Exemplo: Entrevista com os representantes de turma do curso de turismo,
aplicação de questionários com os líderes da comunidade.
❏ Amostragem Não Probabilística Proporcional - também chamada de amostra
por quota, o pesquisador entrevista um número pré-definido de pessoas em
cada uma das várias categorias. Apresenta maior rigor dentre as
amostragens não-probabilísticas;
Etapas: classificar a população, determinar a proporção da população para
cada classe, fixar cotas em observância à proporção das classes
consideradas;
É utilizada quando não existe um cadastro da população que possibilite a
realização do sorteio necessário a amostragem aleatória mas, ao mesmo
tempo, existe informação suficiente sobre o perfil populacional.
Exemplo: Em geral é utilizada em pesquisa eleitoral e pesquisa de mercado.
Resumo:

Coleta de Dados
❏ Coleta Indireta - é feita a partir dos dados já coletados anteriormente por meio da
coleta direta ou do conhecimento de fenômenos relacionados ao objeto de estudo
como, por exemplo, citando uma pesquisa já realizada.
❏ Coleta Direta - é aquela realizada pelo próprio pesquisador, utilizando os diferentes
meios disponíveis questionários, entrevistas, levantamento de registros
(nascimentos, óbitos, notas fiscais, impostos, etc.). A coleta direta pode ser
classificada de três formas: contínua,periódica ou ocasional.
❏ Coleta Direta Contínua - como o próprio nome já sugere, coleta direta é
classificada como contínua quando é feita de forma continuada, como
registros de casamentos nascimentos e óbitos, importação e exportação de
mercadorias, prontuários, frequência de alunos às aulas, etc.
❏ Coleta Direta Periódica - quando a coleta é feita em intervalos constantes de
tempo, ela é classificada como periódica, por exemplo, os censos (10 em 10
anos), avaliações bimestrais dos alunos, ENADE - Exame Nacional de
Desempenho dos Estudantes - com periodicidade máxima trienal para cada
área do conhecimento, etc.
❏ Coleta Direta Ocasional - quando a coleta é feita em determinada situação
pontual, para atender a um objetivo específico, essa coleta é classificada
como ocasional, por exemplo, uma pesquisa para traçar o perfil de
comunidade e suas demandas por formação profissional, superpopulação de
algas em praia, pesquisa de um produto no mercado, etc.
Resumo:

Tabelas Estatísticas
A Associação Brasileira de Normas Técnicas (ABNT), através da norma NBR
14724:2011. conceitua tabela como forma não discursiva de apresentar informações das
quais o dado numérico se destaca como informação central, em outras palavras, tabela é
um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de
maneira organizada (sistemática).
Segundo ALVES (2013), uma tabela deve apresentar a seguinte estrutura: cabeçalho,
corpo e rodapé.
Estrutura de uma Tabela:

Tipos de Tabelas
❏ Tabelas Primitivas - a primeira tabela que surge quando se organiza os dados,
também chamada tabela primitiva (ROL - organização dos dados por ordem de
valor), é simplesmente a tabela organizada, na qual os elementos são ordenados de
maneira crescente ou decrescente. Após a organização dos dados, é possível
identificar a frequência com que os dados aparecem e, a partir disso, gerar uma
tabela compacta.
❏ Série histórica - (também conhecida como temporais ou cronológicas) consiste em
que o elemento variável é o fator cronológico, como no exemplo ao lado, em que
este é representado em anos.
Tabela sobre o total de alunos do IFB do campus planaltinha entre 2009 e 2018.

❏ Série específica ou categórica - descreve os valores da variável em determinado


tempo e local, discriminados segundo especificações ou categorias. Observe a
tabela a seguir e perceba que as categorias neste caso são as áreas de formação.
Tabela sobre áreas interesse para qualificação - produtores rurais da comunidade -
2019.

❏ Série geográfica - (também conhecida como espacial, territorial ou de localização)


descreve os valores da variável, em determinado tempo, discriminados segundo a
localização geográfica da variável. Na tabela a seguir, o tempo fixado foi maio de
2019 e os espaços geográficos definidos foram os estados de São Paulo, Paraná e
Rio Grande do Sul.
Tabela sobre os três estados brasileiros com mais cursos superiores EaD
registrados em maio de 2019.

❏ Tabelas de Dupla Entrada - este tipo de tabela é utilizado quando há necessidade de


apresentar diferentes situações ao mesmo tempo ou quando se pretende comparar
dados. As tabelas de dupla entrada são compostas de séries estatísticas resultantes
da combinação das séries estatísticas temporais, geográficas ou específicas.
Tabela sobre quantidade de cursos superiores, presenciais e EaD, registrados no
Brasil em maio de 2019.

Frequência
Frequência - A quantidade de vezes que um dado surge no conjunto de dados.
A organização facilita a visualização e a padronização, favorecendo o processo de
avaliação desses dados. Essa organização pode ocorrer por meio de agrupamento.
Em muitos casos, o agrupamento inadequado pode inviabilizar a análise dos dados. Por
essa razão, é muito importante conhecer as formas adequadas de organização dos dados
coletados para uma pesquisa.
❏ A nutricionista de uma escola fez a medição da massa (kg) de alguns alunos para
analisar o cardápio escolar e montou a seguinte tabela:

❏ Inicialmente, vamos organizar esses dados em ROL - Organização dos dados em


ordem crescente ou decrescente:

Tabela Primitiva (ROL) ⇧


❏ Há uma visível melhora, porém podemos melhorar mais ainda transformando essa
tabela primitiva em uma tabela de frequência.
Como definir a frequência? Agregar as respostas iguais e contar quantas vezes cada
uma apareceu.
Distribuir frequências é organizar da melhor forma os dados, isto é, tabulá-los.
Observe que, para a situação anterior, os dados ficaram bem organizados, mas se a
diversidade de características fosse maior, se tornaria inviável organizá-los:
Tabela de Frequência ⇧
Tipos de Distribuição de Frequência
Na estatística, o estudo sobre frequências se em grupos que se diferenciam de acordo
com a sua função na tabela:
❏ Frequência Absoluta (f) - dados absolutos da frequência. Representa a quantidade
exata de vezes em que cada elemento aparece.
❏ Frequência Relativa (fr) - dados comparados com a amostra. Compara cada
categoria com o todo, sendo representada na forma de decimal ou em porcentagem.
Exemplo (f) e (fr): Foi feita uma pesquisa, durante 30 dias, sobre a qualidade do
almoço em um restaurante universitário. Os resultados obtidos foram:
bom, ruim, bom, ótimo, ótimo, bom, ruim, bom, bom, ótimo, regular, regular, ruim,
regular, péssimo, péssimo, regular, péssimo, regular, ótimo, regular, regular, ruim,
regular, ótimo, péssimo, ótimo, bom, ruim, bom.
Organizando os dados em tabela temos:
❏ Frequências Absoluta Acumulada (fa) - acumula as categorias. Somatório das
categorias absolutas.
❏ Frequência Relativa Acumulada (fra) - acumula as categorias. Somatório das
categorias relativas (percentuais).
Exemplo (fa) e (fra):

Com a frequência acumulada, podemos fazer as seguintes leituras:


❏ 9 estudantes, ou quase 30% deles, classificaram o restaurante como
péssimo ou ruim.
❏ 49.9% (79,8%- 29,9%) dos estudantes classificaram o restaurante como
regular ou bom.
❏ As três primeiras categorias representam a opinião de mais de 55% dos
estudantes.
❏ Obs:𝑓𝑎 − 4 + 5 = 9 + 8 = 17 + 7 = 24 + 6 = 30.
𝑓𝑟𝑎 − 13, 3% + 16, 6% = 29, 9% + 26, 6% = 56, 5% + 23, 3% = 79, 8% + 20% = 100%
❏ Intervalo de Classe - agrupar os dados por intervalo de classe. Utilizado quando há
muitas informações, em específico muitas categorias. Representa um espaço
delimitado por dois valores, incluindo eles ou não, cuja frequência será dada para a
quantidade de elementos que fazem parte desse grupo.
Amplitude - tamanho do intervalo ou diferença entre o maior e o menor valor. A
amplitude é definida pelo pesquisador, a partir de um critério subjetivo, porém,
existem orientações para definir o tamanho ideal para cada situação.
Exemplo para melhor compreensão: As notas da avaliação de 70 alunos estão em
rol, abaixo. Observe que quanto maior o número de categorias, mais trabalhosa é a
organização dos dados em uma tabela de frequência. Cada nota pode ser tratada
como categoria única, uma em cada linha, mas isso torna o trabalho inviável, por
isso, apresentamos o conceito de intervalo de classe para categorias.

Tabela em ROL ⇧

Tabela sem utilizar os intervalos de classe ⇧ Tabela utilizando os intervalos de classe ⇧

Conceitos importantes:


Exemplo: 16, 18, 18, 20, 20, 20, 22, 23, 23, 24, 25, 26, 26, 29, 30.
Tabela 1 Tabela 2
Classes Quantidade Classes Quantidade

15 |― 20 (15-19) 3 15 ―| 20 (15-20) 6

20 |―| 25 (20-25) 8 20 ― 25 (21-24) 4

25 ―| 30 (26-30) 4 25 |―| 30 (25-30) 5

Total 15 Total 15
❏ LI - Limite Inferior
❏ LS - Limite Superior
❏ AT - Amplitude Total
❏ h - Amplitude de Classe ou do Intervalo
❏ k - Número de Classes
❏ n - Número da amostra (dados coletados; número de pessoas, etc.)
❏ log - função que possui na calculadora científica

Formas para Definir a Amplitude:


❏ Subjetivo - o pesquisador define a quantidade de classes e o tamanho de
cada classe que vai ter em sua tabela. Podemos definir por categorias ou
alguma outra “regra”.
Por Categorias - aqui as categorias ou critérios são as idades:
Classes Critério Amplitude de Classe

10 |― 14 Crianças 4 (h= 14ー10=4)

14 |― 18 Adolescentes 4 (h= 18ー14=4)

18 |― 30 Adultos Jovens 12 (h= 30ー18=12)

30 |― 40 Adultos 10 (h= 40ー30=10)

40 |― 60 Adultos Velhos 20 (h= 60ー40=20)


60 |―| 70 Idosos 10 (h= 70ー60=10)
Arredondando para ter números inteiros - isso é algo bom pra se fazer em
qualquer uma das regras. Calculamos a diferença entre o maior e o menor
valor.
Exemplo (dados referente ao exemplo de compreensão): 9,4 (maior) ー 3,2
(menor) = 6,2 - para uma maior precisão dos dados, sempre arredondamos
para cima, dessa forma a seguinte equação será:
9,5 (maior) ー 3,5 (menor) = 6,0 - dividiremos o resultado pela quantidade de
intervalo de classes proposta (linhas), caso o exercício não informe um valor,
iremos dividir o resultado por 5 (então teremos 5 linhas), sendo assim:
6/5 = 1,2 - arredondamos o resultado final, então a Amplitude Total será igual
a 1,5. Ou seja, eu irei agrupar os intervalos de classe de 1,5 em 1,5 dados.
No intervalo entre 2,0 e 3,5 existem 12 elementos, 2,0⊢3,5 (intervalos de 2,0
a 3,5, incluindo o 2,0 e excluindo o 3,5).
❏ Número de Classes Fixados - usado quando já se tem definido o número de
classes - h = AT/k.
Exemplo: Suponhamos que desejamos construir 7 classes. O valor mínimo
da nossa amostra é 10 e o máximo é 70. Siga os passos a seguir para saber
como se resolve essa questão:
1. Achamos o valor da amplitude total da tabela
AT = 70 ー 10 = 60
2. Depois disso definimos de acordo com o resultado da AT a amplitude
de classes
h = AT/k (k - número de classes)
h = 60/7 (veja que o exercício denominou a quantidade de classes) =
8,57. Quando temos um número com decimais, podemos arredondar
o mesmo. Arredondamos sempre para cima, não importa qual o valor
decimal. Então 8,57 arredondamos para 9.
3. Com as amplitudes (da tabela e de classes) definidas, podemos
prosseguir criando os intervalos de classe
Classes

10 |― 19

19 |― 28

28 |― 37

37 |― 46

46 |― 55

55 |― 64

64 |― 73
Obs: percebemos que o último valor da tabela é 73, tudo bem o último valor
não ser o limite superior da questão, que seria 70. Na última linha mesmo o
valor não coincidindo com o LS da questão não é errado fechar o intervalo
(|―|), porém pelo fato de não coincidir alguns preferem deixar aberto (|―).
Se o último valor coincidir com o LS da questão, obrigatoriamente temos que
fechar o intervalo (|―|).
❏ Regra de Sturges - k = 1 + 3,3 . log n.
Exemplo: ROL: 10, 10, 11, 14, 18, 19, 19, 20 ………….., 70 (n = 200)
Passos para resolução:
1. Achamos o valor da amplitude total da tabela
AT = 70 ー 10 = 60
2. Após isso para calcularmos o número de classes utilizaremos a regra
de sturges
k = 1 + 3,3 . log n
k = 1 + 3,3 . log200 ⇨ (o log resolvemos na calculadora cientifica,
k = 1 + 3,3 . 2,30 aqui procuramos o log do n, sabendo que
k = 8,59 n é o número de pessoas, então log200)
⇧ arredonda para 9
k = 9 - teremos 9 classes
3. E então definiremos a amplitude de classes utilizando a seguinte
fórmula
h = AT/k (k- número de classes)
h = 60/9 = 6,67 - arredonda para 7
4. Com as amplitudes (da tabela e de classes) definidas, podemos
prosseguir criando os intervalos de classe
Classes

10 |― 17

17 |― 24

24 |― 31

31 |― 38

38 |― 45

45 |― 52

52 |― 59

59 |― 66

66 |― 73

❏ Raiz Quadrada - k= 𝑛
Exemplo: ROL: 10, 10, 11, 14, 18, 19, 19, 20 ………….., 70 (n = 200)
n - número de pessoas
Passos para resolução:
1. Achamos o valor da amplitude total da tabela
AT = 70 ー 10 = 60
2. Após isso para calcularmos o número de classes utilizaremos a regra
de raiz quadrada
k= 𝑛
k = 200 = 14,14
k = 14 - nessa parte não precisa arredondar sempre para cima.
Teremos 14 classes
3. E então definiremos a amplitude de classes utilizando a seguinte
fórmula
h = AT/k (k- número de classes)
h = 60/14 = 4,29 - arredonda para 5
5. Com as amplitudes (da tabela e de classes) definidas, podemos
prosseguir criando os intervalos de classe. Teremos 14 classes
Classes

10 |― 15

15 |― 20

20 |― 25

25 |― 30

30 |― 45

45 |― 50

55 |― 60

65 |― 70

.
.
.
.
195 |― 200
❏ Critério da Desigualdade - 2k ≥ n (≥ - maior ou igual). Pouco usado.

Medidas de Tendência Central


Quando precisamos representar um conjunto de valores obtidos em uma pesquisa, em
um único valor, utilizamos as chamadas medidas de tendência central, pois indicam que os
dados tendem a se concentrar em torno dele. Essa convergência de dados ou condensação
dos dados facilita a compreensão das características essenciais de uma amostra ou
população.
❏ Média Aritmética Simples - soma dos valores de um conjunto de dados, divididos
pelo número de elementos.
𝑥1+𝑥2+𝑥3+𝑥4+....
𝑋= 𝑛
❏ Média Aritmética Ponderada - soma dos valores de um conjunto de dados, divididos
pelo número de elementos. Acrescenta o fator peso as categorias.
𝑥1.𝑝1+𝑥2.𝑝2+𝑥3.𝑝3+....
𝑋𝑝= 𝑝1+𝑝2+𝑝3….
❏ Mediana (Md) - valor intermediário do agrupamento do conjunto. Ocupa o centro da
lista.
2, 3, 3, 5, 6
2, 3, 3, 5, 6, 9
3+5
= 4 ⇨ Md = 4
2
❏ Moda (Mo) - valores de maior frequência em um conjunto de dados.
❏ Amodal - sem moda
Ex: {4, 7, 8, 9, 10, 16, 20}
❏ Unimodal - uma moda
Ex: {4, 7, 8, 9, 10, 16, 16, 16, 20}
❏ Bimodal - duas modas
Ex: {4, 4, 4, 4, 7, 8, 9, 10, 10, 10, 10, 16, 20}
❏ Polidal/Multimodal - várias modas
Ex: {4, 4, 7, 8, 9, 10, 10, 16, 20, 20, 21, 22, 22}
Resumo:

Medidas de Dispersão
Enquanto que as medidas de tendência central indicam se os dados tendem a
concentrar-se em torno dele, as medidas de dispersão indicam se aquelas possuem
distorções.
Elas indicam e quantificam o espalhamento dos valores da amostra ou da população em
torno da medida de centralidade.
As medidas de dispersão são parâmetros estatísticos usados para determinar o grau de
variabilidade dos dados de um conjunto de valores, isto é, utilizamos esses parâmetros para
tornar a análise de uma amostra mais confiável, visto que as variáveis de tendência central
(média, mediana, moda) muitas vezes escondem a homogeneidade ou não dos dados.
❏ Desvio Médio (Dm) - chamamos de desvio a diferença entre um valor e a média dos
dados, ou seja, a diferença entre cada elemento de uma série de dados e a média
aritmética dos elementos dessa série. O desvio médio avalia a variabilidade ou a
dispersão dos dados em torno da média aritmética, isto é, elas indicam a
representatividade da média.
|𝑥1−𝑥|+|𝑥2−𝑥|+|𝑥3−𝑥|+|𝑥4−𝑥|....
❏ Com os dados da população: Dm =
𝑛
|𝑥1−𝑥|+|𝑥2−𝑥|+|𝑥3−𝑥|+|𝑥4−𝑥|....
❏ Com os dados da amostra: Dm =
𝑛−1
Exemplo: Em um time, com três membros, apenas um irá competir na final
representando a equipe. Abaixo está apresentada a pontuação em cinco jogos da
temporada.
Jogos

Jogador 1° 2° 3° 4° 5°

Artur 870 848 855 845 852

Bento 866 850 847 845 847

Caio 867 851 843 849 855


Cálculo dos desvios médios das pontuações:
1. Primeiro calculamos a média de cada jogador
870+848+855+845+852
𝑥A= 5
= 854

866+850+847+845+847
𝑥b= 5
= 851

867+851+843+849+855
𝑥c= 5
= 853

2. E então com os resultados das médias, calculamos os desvios


|870−854|+|848−854|+|855−854|+|845−854|+|852−854|
DMA =
5
16+6+1+9+2 34
DMA = = =6,8 pontos
5 5

|866−851|+|850−851|+|847−851|+|845−851|+|847−851|
DMb =
5
15+1+4+6+4 30
DMb = = =6,0 pontos
5 5

|867−853|+|851−853|+|843−853|+|849−853|+|855−853|
DMc =
5
12+2+10+4+2 32
DMc = = =6,4 pontos
5 5
Com os respectivos desvios médios, temos que a Jogador B fol o que manteve a
pontuação mais próxima da média.
❏ Variância (V) - a variância de um conjunto de n valores é dada pela média aritmética
dos quadrados dos desvios médios de cada valor em relação à média.
❏ Com os dados da população: V =
2 2 2 2
(𝑥1−𝑥) +(𝑥2−𝑥) +(𝑥3−𝑥) +(𝑥4−𝑥) ....
𝑛
❏ Com os dados da amostra: V =
2 2 2 2
(𝑥1−𝑥) +(𝑥2−𝑥) +(𝑥3−𝑥) +(𝑥4−𝑥) ....
𝑛−1
VA =
2 2 2 2 2
(870−854) +(848−854) +(855−854) +(845−854) +(852−854)
5
2 2 2 2 2
16 +(−6) +1 +(−9) +(−2)
VA =
5
256+36+1+81+4 378
VA = = = 75,6
5 5

VB =
2 2 2 2 2
(866−851) +(850−851) +(847−851) +(845−851) +(847−851)
5
2 2 2 2
16+(−1)+(−4) +(−6) +4
VB =
5
225+1+16+36+16 294
VB = = = 58,8
5 5

VC =
2 2 2 2 2
(867−853) +(851−853) +(843−853) +(849−853) +(855−853)
5
2 2 2 2 2
14 +(−2)
+(−10) +(−4) +2
VC =
5
196+4+100+16+4 320
VC = = = 64,0
5 5
A partir dos valores da variância, podemos definir o desvio padrão, que nada mais é
que uma forma mais próxima da unidade de medida estudada que, neste caso, são
os pontos do jogo.
❏ Desvio Padrão (Dp) - o desvio padrão (Dp) de um conjunto de n valores é dado pela
raiz quadrada da variância.
Dp = 𝑉
Quanto mais próximo de zero estiver o desvio padrão, mais regular será o conjunto
de valores, ou seja, mais próximo da média estarão esses valores.
Dpa = 75, 6=±8,69 pontos
Dpb = 58, 8= ±7,67 pontos
DpC = 64, 8=± 8 pontos
Obs: uma raiz quadrada possui valores positivos e negativos, isto é, em volta da
média de pontos do jogador Arthur, o desvio da pontuação ficou em torno de 8,69
para mais ou para menos. Para o jogador Bento, a variação foi de 7,67 para mais ou
para menos em torno da média e para Caio, o desvio ficou em oito pontos para mais
ou para menos a partir de sua pontuação média. Desta forma, o desvio em torno da
média que apresentou menor variação ou maior regularidade foi no conjunto de
pontos do jogador B.
❏ Coeficiente de Variação (CV) - medida de dispersão definida como a razão entre o
desvio padrão e a média de um conjunto de dados. O coeficiente de variação
também permite comparar conjuntos totalmente distintos quanto à variabilidade dos
dados.
Resumo:

Estatística Inferencial
O objetivo da estatística inferencial é tirar conclusões com base em amostras (uma parte)
de tal modo que as informações possam ser expandidas para toda a população (o todo).
Outro objeto de estudo da estatística inferencial é o levantamento e o teste de hipóteses.
Nessa estatística estamos sempre interessados em utilizar as informações de uma amostra
para chegar a conclusões sobre um grupo maior, ao qual não temos acesso. Nesse sentido,
uma ferramenta muito utilizada na estatística inferencial é a probabilidade.

Análise Combinatória
A análise combinatória faz o estudo das possibilidades de um dado evento ocorrer sem
necessariamente descrever todas elas.
O princípio fundamental da contagem, também chamado de princípio multiplicativo,
postula que:
“quando um evento é composto por n etapas sucessivas e independentes, de tal modo
que as possibilidades da primeira etapa é x e as possibilidades da segunda etapa é y,
resulta no número total de possibilidades de o evento ocorrer, dado pelo produto (x) . (y)”.
Em resumo, no princípio fundamental da contagem, multiplica-se o número de opções
entre as escolhas que lhe são apresentadas.
Fatorial - ferramenta muito utilizada em problemas de contagem. Número multiplicado
pelos seus antecessores até chegar ao 1. O fatorial de um número natural é definido como
o produto deste número por todos os seus antecessores. Utilizamos o símbolo ! para indicar
o fatorial de um número. Define-se ainda que o fatorial de zero é igual a 1.
Exemplo de Fatorial:
O! = 1 3! = 3.2.1 = 6 10! = 10.9.8.7.6.5.4.3.2.1 = 3 628 800
1! = 1 5! = 5.4.3.2.1 = 120 7! = 7.6.5.4.3.2.1 = 5 040
Note que o valor do fatorial cresce rapidamente, conforme cresce o número. Então,
frequentemente usamos simplificações para efetuar os cálculos de análise combinatória.

Exemplo de Análise Combinatória: Uma lanchonete vende uma promoção de lanche a um


preço único. No lanche, estão incluídos um sanduíche, uma bebida e uma sobremesa. São
oferecidos três opções de sanduíches: hambúrguer especial, sanduíche vegetariano e
cachorro-quente completo. Como opção de bebida pode-se escolher 2 tipos: suco de maçã
ou guaraná. Para a sobremesa, existem quatro opções: cupcake de cereja, cupcake de
chocolate, cupcake de morango e cupcake de baunilha. Considerando todas as opções
oferecidas, de quantas maneiras um cliente pode escolher o seu lanche?
Solução: Podemos começar a resolução do problema apresentado, construindo uma árvore
de possibilidades, diagrama da árvore:

Acompanhando o diagrama, podemos diretamente contar quantos tipos diferentes de


lanches podemos escolher. Assim, identificamos que existem 24 combinações possíveis.
Podemos ainda resolver o problema usando o princípio multiplicativo. Para saber quais as
diferentes possibilidades de lanches, basta multiplicar o número de opções de sanduíches,
bebidas e sobremesa.
Total de possibilidades: 3.2.4 = 24
Portanto, temos 24 tipos diferentes de lanches para escolher na promoção.
O princípio fundamental da contagem pode ser usado em grande parte dos problemas
relacionados com contagem. Entretanto, em algumas situações seu uso torna a resolução
muito trabalhosa.
Desta maneira, usamos algumas técnicas para resolver problemas com determinadas
características. Basicamente há três tipos de agrupamentos: arranjos, combinações e
permutações.
❏ Arranjos Simples - nos arranjos, os agrupamentos dos elementos dependem da
ordem e da natureza dos mesmos. A ordem importa. Usa parte do universo.
𝑛!
An,p = - n = Quantidade total de elementos no conjunto.
(𝑛−𝑝)!
p = Quantidade de elementos por agrupamento.
Exemplo: Seja P um conjunto com elementos: P = {A,B,C,D}, tomando os
agrupamentos de dois em dois, quantos arranjos simples podemos obter no conjunto
P.
P = {A, B, C, D} n=4 p=2
𝑛!
An,p =
(𝑛−𝑝)!
4!
A4,2 =
(4−2)!
4.3.2.1
A4,2 = = 6 (corta o 2.1 de cima com o 2.1 de baixo)
2.1
Representação por extenso dos agrupamentos do arranjo simples:
A= {AB, AC, AD, BA, BC, BD, CA, CB, CD, DA, DB, DC}
❏ Arranjo com Repetição - A ordem importa. Usa parte do universo.
An,p = np - n = Quantidade total de elementos no conjunto.
p = Quantidade de elementos por agrupamento.
Exemplo: Seja P um conjunto com elementos: P = {A,B,C,D}, tomando os
agrupamentos de dois em dois, considerando o arranjo com repetição quantos
agrupamentos podemos obter em relação ao conjunto P.
P = {A, B, C, D} n=4 p=2
An,p = np
A(4,2) = 42 = 16
Representação por extenso dos agrupamentos do arranjo com repetição:
A= {AA, AB, AC, AD, BB, BA, BC, BD, CC, CA, CB, CD, DD, DA, DB, DC}
Observe que os agrupamentos com repetição de elementos do conjunto P são: AA,
BB, CC e DD. A existência desses elementos referente ao agrupamento faz com que
o arranjo seja do tipo com repetição.
❏ Combinação Simples - as combinações são subconjuntos em que a ordem dos
elementos não é importante, entretanto, são caracterizadas pela natureza dos
mesmos. A ordem não importa.
𝑛!
Cn,p =
𝑝! . (𝑛−𝑝)!
Exemplo: Utilizando a combinação simples e considerando o conjunto J ={A, B, C, D}
encontre quantos subconjuntos é possível formar tomando os elementos de 2 em 2.
J = {A, B, C, D} n=4 p=2
𝑛!
Cn,p =
𝑝! . (𝑛−𝑝)!
4!
C4,2 =
2! . (4−2)!
4.3.2.1
C4,2 = (corta o 2.1 de cima com um dos 2.1 de baixo)
2.1 . 2.1
4.3
C4,2 =
2.1
12
C4,2 = =6
2
Ou podemos também fazer essa equação sem cortar os 2.1, ficando:
J = {A, B, C, D} n=4 p=2
𝑛!
Cn,p =
𝑝! . (𝑛−𝑝)!
4!
C4,2 =
2! . (4−2)!
4.3.2.1
C4,2 =
2.1 . 2.1
24
C4,2 =
2.2
24
C4,2 = =6
4
❏ Permutações Simples - as permutações são agrupamentos ordenados, onde o
número de elementos (n) do agrupamento é igual ao número de elementos
disponíveis.
Note que a permutação é um caso especial de arranjo, quando o número de
elementos é igual ao número de agrupamentos. Desta maneira, o denominador na
fórmula do arranjo é igual a 1 na permutação.
A ordem importa. usa o universo todo.
Pn = n!
Exemplo: Em uma mesa há 5 cadeiras vazias. Em quantas sequências diferentes 5
pessoas podem ocupar as 5 cadeiras?
Como a quantidade de cadeiras é igual à quantidade de pessoas devemos usar a
fórmula da permutação:
Temos que n = 5
Pn = n!
P5 = 5!
P5 = 5 . 4 . 3 . 2 . 1
P5 = 120
Temos então que 5 pessoas podem se sentar em 120 sequências diferentes em 5
cadeiras.
❏ Permutação com Repetição - usa o universo todo.
𝑛!
Pn =
𝑟𝑒𝑝𝑒𝑡𝑖çõ𝑒𝑠!
Exemplo: Quantos são os anagramas da palavra MORANGO?
Temos n = 7 e 2 letras repetidas.
𝑛!
Pn =
𝑟𝑒𝑝𝑒𝑡𝑖çõ𝑒𝑠!
7!
P7 =
2!
7.6.5.4.3.2.1
P7 =
2.1
5040
P7 = = 2520 anagramas
2
(Um anagrama é uma espécie de jogo de palavras criado com a reorganização das
letras de uma palavra ou expressão para produzir outras palavras ou expressões,
utilizando todas as letras originais exatamente uma vez).
❏ Permutação Circular - para n objetos distintos.
PCn = (n-1)!
Exemplo: Uma família é composta por seis pessoas: o pai, a mãe e quatro filhos.
Num restaurante, essa família vai ocupar uma mesa redonda. Em quantas
disposições diferentes essas pessoas podem se sentar em torno da mesa de modo
que o pai e a mãe fiquem juntos?
Sabendo que pai e mãe devem ficar juntos, vamos amarrar os dois e tratá-los como
se fossem um único elemento.

Ao tratar o pai e mãe como um único elemento, passamos a ter somente 5


elementos. Portanto, utilizando a permutação circular de 5 elementos, calculamos o
número de possibilidades desta família sentar-se ao redor da mesa com pai e mãe
juntos sendo que o pai está à esquerda da mãe.
Permutação circular (Pc) de 5 elementos calcula-se:
PCn = (n-1)!
PC5 = (5-1)! = 4! = 4.3.2.1 = 24
Portanto, para o pai a esquerda da mãe, temos 24 posições diferentes. Mas o pai
pode estar a direita da mãe, como na figura 2, e então teremos mais 24 posições
diferentes para contar (novamente Pc5).
Portanto, o número total de disposições é 48.
Resumo:
Probabilidade
A probabilidade é um ramo da matemática que estuda os possíveis resultados de um
evento aleatório. Toda vez que não temos certeza sobre o resultado de algum evento,
estamos tratando sobre a probabilidade de certos resultados acontecerem ou quais as
chances de eles acontecerem. A análise de eventos determinados pela probabilidade é
chamada de estatística. (Khan Academy).
Vamos à fórmula básica para o cálculo da probabilidade. Observe que se, em um
fenômeno aleatório, as possibilidades são igualmente prováveis, então a probabilidade de
ocorrer um evento A é:
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 (𝑒𝑣𝑒𝑛𝑡𝑜𝑠) 𝑛 (𝐸)
P= ou P=
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 (𝑒𝑠𝑝𝑎ç𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙) 𝑛 (Ω)

Experimento - denominamos experimento todo e qualquer ato de experimentação (ou


experiência) e investigação de determinado fenômeno sob condições controladas, a fim de
observá-lo e classificá-lo.
Experimento Aleatório
Este tipo de experimento é aquele que, quando repetido em iguais condições, pode
fornecer resultados diferentes, ou seja, são resultados explicados ao acaso.
Desta forma, um evento aleatório acontece quando o fenômeno realizado tem resultados
imprevisíveis, entre os possíveis desfechos, e possuem condições iguais para todas as
possibilidades.
Segundo Alves (2014) para calcularmos uma probabilidade, é necessário que tenhamos
um experimento aleatório, que apresenta as seguintes características
1. Cada experimento pode ser repetido indefinidamente sob as mesmas condições (n);
2. Não se conhece a priori o resultado do experimento, mas podem-se descrever todos
os possíveis resultados;
3. Quando o experimento for repetido muitas vezes, surgirá uma regularidade do
resultado, isto é, haverá uma estabilidade da fração (frequência relativa) da
ocorrência de um particular resultado, onde r corresponde ao número de vezes que
um determinado resultado aconteceu.
Exemplo: Ao jogar um dado não viciado, garantimos que existem iguais condições para
os possíveis resultados: 1, 2 3, 4, 5 e 6.
Quando jogamos um dado e sai o 1 com a face para cima, chamamos este de ponto
amostral, que na teoria é basicamente o resultado de um experimento aleatório, isto é, pode
ser qualquer uma das possibilidades. Exemplo: ao jogar o mesmo dado, o resultado foi o 3,
então este foi o ponto amostral. Ao lançar pela segunda vez, a face superior foi o número 5,
que neste caso é o novo ponto amostral.

Espaço Amostral
O Espaço Amostral é o universo da probabilidade, é o todo do qual as partes serão
extraídas, em outras palavras, são todos os resultados de um experimento aleatório, ou
seja, conjunto de pontos amostrais. O Espaço amostral pode ser representado pela letra
grega ômega (Ω) ou por S (Space).
Exemplo: O lançamento de um dado com 6 faces só pode ter seis resultados (1, 2, 3, 4,
5, 6). Desta forma, a representação do espaço amostral pode ser feita das seguintes
maneiras Ω = {1, 2, 3, 4, 5, 6} ou S = {1, 2, 3, 4, 5, 6).

Evento Probabilístico
Evento probabilístico é um subconjunto do espaço amostral, ou seja, está contido no
espaço amostral. O evento pode ser nulo ou impossível quando não há ponto amostral do
evento no espaço amostral ou ser certo ou garantido, quando o evento é exatamente do
tamanho do espaço amostral. Representamos o evento pela letra E.
Exemplo: Ao lançar um dado de 6 faces, gostaríamos de calcular a probabilidade de o
número sorteado ser par, observe que neste caso o "número de casos favoráveis" (eventos
- E) é o conjunto E= {2, 4, 6), enquanto que "número de casos possíveis" (espaço amostral -
Ω), continua sendo o conjunto completo, o espaço amostral.
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠
P=
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠
4
P= = 0,666 = 66,66%
6

Obs: os resultados dessa divisão variam entre 0 e 1, ou seja, 0 ≤ P ≤ 1, mas estamos


mais acostumados com as porcentagens, concorda? Ficaria assim então variando 0% ≤ P ≤
100%. Ou pode-se ler assim também: Evento impossível < evento possível < evento certo.
Probabilidade de União de Eventos
União - representado pelo símbolo U (ou). A união de conjuntos nada mais é que a
junção dos conjuntos que representam os eventos de um mesmo espaço amostral, ou seja,
um evento somado ao outro evento. Deve-se tomar cuidado para não repetir os elementos
que aparecem nos dois eventos.
Exemplo: A= (1, 2, 3, 5, 7); B= (2, 4, 6, 8), logo AUB = (1, 2, 3, 4, 5, 6, 7, 8).
Intersecção - representada pelo símbolo ⋂ (e). Neste caso buscamos os elementos que
aparecem no evento A e no evento B ao mesmo tempo, isto é, os elementos que eles
possuem em comum.
Exemplo: A= (1, 2, 3, 5, 7); B= (2, 4, 6, 8), logo A⋂B= (2).

Probabilidade da união de eventos, para acontecimentos:


❏ Mutuamente Exclusivos - dizemos que dois eventos são mutuamente exclusivos
quando, na ocorrência de um, o outro não pode ocorrer. Exemplo, lançamento de
uma moeda: ou ela será cara ou coroa.
Exemplo: Na frente de emergência, criada para atender as vítimas da chuva de certa
cidade, trabalhavam 500 pessoas, das quais 150 eram menores de 20 anos, 400
eram casadas e nenhuma das pessoas maiores de 20 anos era solteira. Se uma das
pessoas da frente de emergência for escolhida ao acaso para supervisionar os
trabalhos, qual a probabilidade percentual de ela ser menor de 20 anos e casada?
Para este caso, estamos tratando de acontecimentos mutuamente exclusivos, pois
uma pessoa não pode ter mais e menos do que 20 anos ao mesmo tempo, nem
estar casada e solteira oficialmente ao mesmo tempo.
Mas quantas pessoas cumprem com a característica "ser menor de 20 anos e
casada"? Vamos pensar e separar os grupos:
1. Existem 500 pessoas, das quais: 150 são menores de 20 anos e não se sabe
ainda estado civil delas. Consequentemente, 350 são maiores de 20 anos.
2. Em relação ao estado Civil, sabe-se que 400 são casadas, porém foi
informado que ninguém acima de 20 anos é solteiro. Portanto, conclui-se que
todos maiores de 20 anos são casados. isto é, 350 pessoas e
consequentemente 50 pessoas casadas são menores de 20 anos.
3. Resumindo temos:
350 pessoas casadas e acima de 20 anos.
050 pessoas casadas abaixo de 20 anos.
100 pessoas solteiras abaixo de 20 anos.
000 pessoas solteiras acima de 20 anos.
4. O evento solicitado pelo exercício é composto por 50 elementos de um total
de 500.
Desta forma a probabilidade de ser casada e menor de 20 é de 10%, já que 50/500
= 10%.
❏ Não Mutuamente Exclusivos - dizemos que dois eventos NÃO são mutuamente
exclusivos quando podem ocorrer simultaneamente. Utilizamos a seguinte fórmula
para o cálculo da probabilidade:
P(AUB) = P(A) + P(B) – P(A⋂B).
Exemplo 1: Se existem pessoas que preferem alimentos doces, existem os que
preferem alimentos salgados, mas sabemos que existem aqueles que gostam dos
dois, sem problemas, esse último grupo representa o conceito de não mutuamente
exclusivos.
Exemplo 2: Um professor de Educação Física fez uma pesquisa rápida com uma
turma de terceiro ano do ensino médio, em que ele queria saber quantos alunos
gostam de futebol, quantos gostam de vôlei e quantos não gostam de nenhum dos
dois esportes. O resultado foi:
❏ 25 gostam de futebol;
❏ 20 gostam de vôlei;
❏ 15 gostam de futebol e vôlei;
❏ 10 não gostam de nenhum desses esportes;
O diretor da escola precisou indicar um aluno para representar a escola na abertura
do evento esportivo do bairro. Os Alunos que gostam de futebol são representados
por n(A) e os alunos que gostam de vôlei são representados por n(B). Ao escolher
um aluno ao acaso, qual a probabilidade de ele gostar de futebol ou vôlei?
Observe que os alunos que gostam de futebol ou vôlei são representados por AUB e
os alunos que gostam de futebol e vôlei por A⋂B. O estudo de conjuntos numéricos
nos ensina que: n(AUB) = n(A) + n(B) - n(A⋂B), logo, nesse caso temos n(AUB) = 25
+ 20 – 15 = 30 alunos que gostam de futebol ou vôlei ou ambos, não importa,
gostando de um já cumpre com requisito. Mas foi necessário retirar o
sombreamento, aqueles que apareciam duas vezes, no grupo que gosta de futebol e
no grupo que gosta de futebol e vôlei ou vive-versa.
Observe que o cálculo do espaço amostral é dado por:
N = n(AUB) + 10 = 40
Ou seja, 40 estudantes. Esses "10" são os alunos que não gostam de nenhum dos
dois esportes - obs: não é necessário colocar o grupo que gosta de futebol e vôlei,
pois eles já estão incluídos no grupo de futebol e no grupo de vôlei. Agora,
finalmente, calculando probabilidade de um aluno, escolhido ao acaso, gostar de
vôlei ou futebol é de:
𝑛 (𝐴𝑈𝐵)
P=
𝑛 (Ω)
30
P= = 75%
40
Exemplo 3: Em um aeroporto foi realizada uma pesquisa com 80 mulheres e 60
homens que iriam embarcar em um dos voos. Constatou-se que 30 mulheres e 20
homens iriam viajar de avião pela primeira vez e que os demais já haviam voado
antes. Escolhendo um desses passageiros aleatoriamente:
a) Qual a probabilidade de escolher uma mulher ou um passageiro que vai voar pela
primeira vez?
b) Qual é a probabilidade de escolher uma mulher que já voou antes ou um homem
que vai voar pela primeira vez?
Inicialmente vamos organizar os dados em uma tabela.
Mulheres Homens

Passageiros que vão viajar de avião pela primeira vez 30 20

Passageiros que já voaram antes 50 40

Total 80 60
Nosso espaço amostral é de 140 pessoas entrevistadas.
Resposta a) Sendo "A" o evento formado pelas mulheres entrevistadas, temos que
n(A)= 80; sendo "B" o evento dos passageiros que vão viajar pela primeira vez,
temos n(B)= 50. Sabe-se que n(A⋂B) = 30, calcula-se:
P(AUB) = P(A) + P(B) – P(A⋂B)
P(AUB) = 80 + 50 – 30
100
P(AUB) = = 0,7142 ou 71,42%
140
Resposta b) Sendo "C" o evento formado pelas mulheres que já voaram antes,
temos que n(C)= 50; sendo "D" o evento formado pelos homens que vão voar pela
primeira vez, temos n(D)= 20. Os eventos citados são mutuamente exclusivos e
concluímos que:
P(CUD) = P(C) + P(D)
P(CUD) = 50 + 20
70
P(CUD) = = 0,5 ou 50%
140

Probabilidade Condicional
"Probabilidade de acontecer A, considerando que B já aconteceu".

P ( )
𝑎
𝑏
=
𝑛 (𝐴⋂𝐵)
𝑛 (𝐴)
É um evento condicionado à ocorrência de outro, isto é, dados dois eventos A e B de um
espaço amostral S, a probabilidade do evento A ocorrer quando B já tiver ocorrido é
chamada de probabilidade condicional de A em relação à B.
Exemplo: Em uma sala estão reunidos 20 homens e 20 mulheres. Entre OS homens, 3
administradores, 8 são engenheiros e os demais economistas. Entre as mulheres, 7 são
administradoras, 8 são economistas e as demais engenheiras. Um desses profissionais, foi
escolhido ao acaso para ler a pauta da reunião, sabe-se que uma mulher foi escolhida, qual
a probabilidade de classe economista?
Primeiro vamos organizar os dados em uma tabela.
Homens Mulheres

Administradores (as) 3 7

Engenheiros (as) 8 5

Economistas 9 8
Inicialmente já percebemos que o espaço amostral foi alterado. Observe que antes eram 40
pessoas (homens e mulheres), mas com com a escolha de ser uma mulher sorteada, o
evento A foi criado, com um total de 20 mulheres. A questão solicita a probabilidade de uma
que uma economista ser sorteada, ou seja, n(B)= 17 (todos os economistas), sendo 8
mulheres neste grupo. Calculando:

P ( )
𝑎
𝑏
=
𝑛 (𝐴⋂𝐵)
𝑛 (𝐴)
P ( )
𝑎
𝑏
=
8
20
= 0,4 ou 40%

Probabilidades Independentes
Exemplo para a compreensão na prática: A probabilidade de um homem jovem ter
cálculo renal daqui a 30 anos é 19% e de sua mulher 5%. Qual é a probabilidade de que
daqui a 30 anos:
a) Ambos tenham cálculo renal?
Como a probabilidade de um não interfere na do outro, temos então a multiplicação
das probabilidades
19% . 5%
19 5 95
. = = 0,0095 = 0,95%
100 100 10000
b) Somente a mulher tenha cálculo renal?
Neste caso, precisaremos da probabilidade de o homem não ter cálculo renal, isto é
81%.
81% . 5%
81 5 405
. = = 0,0405 = 4,05%
100 100 10000
c) Ambos não tenham cálculo?
Neste caso, precisaremos da probabilidade de o homem não ter cálculo renal, isto é
81% e da mulher também não ter, 95%.
19% . 5%
81 95 7695
. = = 0,7695 = 76,95%
100 100 10000
d) Pelo menos 1 deles tenha cálculo renal?
Observe que neste caso é necessário considerar as três possibilidades:
I - Somente ele ter cálculo real. 18,05%
II - Somente ela ter cálculo real. 4,05%
III - Ambos terem cálculo renal. 0,95%
Desta forma, basta somar todas as probabilidades: 18,05% + 4,5% + 0,95% =
23,05%.
Para este tipo de probabilidade os eventos são totalmente independentes e para cada
probabilidade solicitada devemos analisar as condições, ou seja, multiplicando as
probabilidades individuais, para análises diretas ou somando as probabilidades individuais
para os casos em que demandam a probabilidade de acontecer "pelo menos um", "ao
menos dois", dos eventos avaliados.

Análise de Frequência
Estamos sempre buscando regularidades e padrões nos objetos de nossas pesquisas,
porém, mesmo não sendo fácil encontrá-los, quando conseguimos, podemos entender
melhor o fenômeno e até mesmo fazer previsões seguras a respeito do estudo. Como já
tratamos, coletar informações de populações inteiras geralmente é inviável, impossível ou
antiético, por isso, estimar um comportamento é suficiente para gerar embasamento nas
conclusões de pesquisa.
Quando conhecemos a probabilidade de um evento acontecer ou não acontecer, a partir
de uma amostra, estamos tratando de um evento aleatório com uma probabilidade
associada, entender que em experimentos aleatórios é natural que existam condições
extremas, ou seja, com eventos que são mais raros do que outros, isto é, enquanto uns
possuem alta probabilidade de acontecer outros possuem probabilidade baixíssima.
Histograma - são constituídos por um conjunto de retângulos com as bases assentadas
sobre um eixo horizontal, tendo o centro dela no ponto médio da classe que representa e
cuja altura é proporcional a frequência da classe.
Quando a distribuição da frequência seguir esse modelo, isto é, concentrando o que é
comum e dispersando o que é raro, temos a chamada distribuição normal. A distribuição
normal pode ser representada a partir de um modelo, uma curva que será chamada de
Curva Normal ou Curva Gaussiana.
❏ Curva Normal:

❏ Curva Gaussiana - também conhecida como "curva de sino", ela é a distribuição


contínua mais conhecida e usada de todas as distribuições de probabilidade, pois se
aproxima muito de muitos fenômenos naturais. A Curva Gaussiana se tornou um
padrão de referência para vários problemas de probabilidade. Já que vários
conjuntos de dados seguem a distribuição normal: por exemplo, as alturas dos
adultos, os pesos dos bebês, os resultados dos testes de inteligência, a sobrecarga
de bagagens em voos comerciais, os retornos do mercado de ações, entre outros
conjuntos.
A distribuição Gaussiana é a mais importante distribuição contínua por vários
motivos, dentre eles, o Teorema Central do Limite. Este Teorema é um resultado
fundamental em aplicações práticas e teóricas, pois ele garante que mesmo que um
conjunto de dados não seja normalmente distribuído, a sua média converge para
uma distribuição normal à medida que os dados aumentam. Segue um exemplo de
curva gerada por amostra de 100 elementos com média= 50 e Desvio Padrão=100.
Estatística e Probabilidade
A teoria da probabilidade é muito útil para fazer estimativas e previsões, pois estas
formam uma parte importante da ciência dos dados e com a ajuda dos métodos estatísticos
se torna possível realizar estimativas para uma análise mais aprofundada. Assim, os
métodos estatísticos são amplamente dependentes da teoria da probabilidade, e todas as
probabilidades e estatísticas dependem de dados, de acordo com Shetty (2018).
A probabilidade verifica a chance de ocorrer algo específico.
Quando tratamos de probabilidade, estamos quantificando as possibilidades de
acontecer um evento raro ou um evento comum. Então, vamos imaginar um evento A, no
qual realizamos n tentativas para alcançar o evento A. Observe que o número de vezes que
o evento A ocorreu nessas n tentativas é a conhecida frequência absoluta. Para sabermos
se esse evento é ou não raro, é necessário calcular sua frequência relativa.
Bom, a frequência relativa do evento A é o número de vezes em que este ocorreu k em
relação ao número total de tentativas n. A frequência relativa é sempre um número
compreendido entre 0 e 1, sendo o primeiro o evento impossível e o segundo o evento
certo, isto é, 100%.
A frequência de um mesmo evento varia com o número de tentativas. Diferentes séries,
compreendendo o mesmo número n de tentativas, nas mesmas condições, podem
apresentar diferentes frequências relativas. Pela experiência, sabe-se, no entanto, que a
frequência relativa para uma certa classe de fenômenos, em condições bem definidas,
tende a oscilar em torno de um certo número p que coincide com a probabilidade
matemática do evento estudado. Além disso, já se comprovou que quanto maior o número
de repetições, mais a frequência relativa aproxima-se da probabilidade matemática, limite
para o qual tende a frequência relativa em um número indefinido de repetições. A estatística
nos possibilita fazer inferências sobre as populações e suas características e essas análises
estão diretamente relacionadas com a probabilidade, já que um dos objetivos é fazer
previsões e quantificar o quão real é possível ocorrer ou não ocorrer algo com base no que
já aconteceu. Para isso, precisamos organizar os dados com um foco especial, isto é,
avaliando suas probabilidades e isso fazemos estudando a distribuição de probabilidade.
A distribuição de probabilidade é um modelo matemático ou uma função de
probabilidade/distribuição/densidade que relaciona um certo valor da variável em estudo
com a sua probabilidade de ocorrência. Também podemos chamá-la de função de
densidade de probabilidade e representá-la como:
P (X = xi) = P (A), i – 1,2…,n.

Modelos Probabilísticos
As distribuições de probabilidade podem ser distribuições de probabilidades contínuas ou
distribuições de probabilidade discretas, dependendo se eles definem probabilidades para
variáveis contínuas ou discretas.
A distribuição contínua que estudamos até agora foi a Normal - que descreve uma
variável que se distribui de forma simétrica a um valor central - entretanto, ela não é a única,
como por exemplo a Distribuição Exponencial.
Trataremos agora de outros três tipos de distribuição: Bernoulli, Binomial e Poisson, que
são discretas.
Obs: existem outras distribuições que não serão tratadas neste curso.
❏ Distribuição Ensaios de Bernoulli - baseia-se em experimentos conhecidos como
ensaios de Bernoulli e é característica de experimentos em que se pode observar a
presença ou não de algum resultado de interesse.
Este modelo se baseia num espaço amostral de apenas dois resultados que serão
denominados
❏ Sucesso (p) - aquilo que me interessa;
❏ Fracasso (1 – p) (alguns chama “1 – p” de “q” - “q = 1 – p”) - aquilo que não
me interessa (um sendo a negação do outro).
Para que os resultados tenham mais significado, a variável aleatória de uma
Bernoulli atribui apenas os valores 0 e 1. Uma única coisa, uma única peça, um
único indivíduo, etc. Com isso se analisa se ocorre sucesso ou fracasso; Mais de
uma coisa, uma peça, um indivíduo, etc, você estará repetindo esse Bernoulli mais
de uma vez, e repetir esse Bernoulli significa que se está trabalhando com a
Distribuição Binomial.
p(x) = px . (1 – p)1–x
Exemplo 1: Suponha que lançarei uma moeda com o intuito de efetuar uma aposta,
a básica cara ou coroa, eu escolhi cara e o meu oponente coroa, então do meu
ponto de vista, cara vai ser o meu sucesso (p) e coroa vai ser o meu fracasso (1 –
p).
Exemplo 2: Digamos que farei outra aposta, dessa vez usando um dado
convencional de 6 faces, se cair no 5 eu ganharei, então do meu ponto de vista, 5
vai ser o meu sucesso (p) e 1, 2, 3, 4 e 6 será o meu fracasso (1 – p).
Exemplo 3: Pensaremos em outra situação, estou em uma linha de produção e essa
faz algum tipo de equipamento, e eu faço parte do controle de qualidade dessa linha
de produção, digamos que o meu interesse seja constatar algum equipamento que
tenha saído com defeito. Então nesse caso, o defeito é o meu sucesso (p) e o
funcionando é o meu fracasso (1 – p).
Exemplo 4: Imagina que estou em uma UTI Neonatal, digamos que eu faça parte do
departamento de estatística desse hospital e eu estou analisando a taxa de
mortalidade nessa UTI Neonatal, então por exemplo, eu analiso um bebê o fato do
bebê morrer será o morrer será o meu sucesso (p) e o fato do bebê sobreviver será
o meu fracasso (1 – p).

Temos como observação aqui que sucesso é o que me interessa, podendo ser algo
bom ou ruim, então não podemos relacionar em Bernoulli sucesso como algo bom.

Se uma variável aleatória assume somente os valores zero e um, as probabilidades


podem ser apresentadas pela dupla 1 – p e p, respectivamente, ou seja, sua
distribuição é dada por:
x 0 1

P (X=x) 1–p p
Exemplo: Em uma prova, com uma questão objetiva de 5 alternativas, qual seria a
probabilidade de acertar e de errar esta questão chutando?
Sucesso (1) = 1/5 = 0,2
Fracasso (0) = 4/5 = 0,8
Montando a probabilidades acima, temos:
p(x) = px . (1 – p)1–x
p(x) = 0,2x . 0,81–x
❏ Distribuição Binomial - é útil para determinar a probabilidade de um certo número de
sucessos num conjunto de observações. A Distribuição Binomial descreve a
probabilidade num experimento que envolve certo número n de ensaios de Bernoulli.
Se em cada uma das n repetições de Ensaios de Bernoulli a probabilidade de
ocorrer um evento definido como sucesso é sempre p, a probabilidade de que esse
evento ocorra em apenas k das n repetições é dada por:

P (X = k) = . pk . (1 – p)n-k
⇧ Número binomial e não fração.

𝑛!
=
𝑘! (𝑛−𝑘)!
n = número de repetições dos Ensaios de Bernoulli.
X = variável aleatória que sempre representará o sucesso (p).
k = evento sobre o qual você deseja calcular a probabilidade.
Ela segue as seguintes determinações:
1. O experimento é repetido n vezes, onde cada tentativa é independente das
demais.
2. Há apenas dois resultados possíveis em cada tentativa: um de interesse,
associado à variável X, chamado de sucesso e o seu complementar que é o
fracasso.
3. A probabilidade de sucesso será denotada por p e é a mesma em cada
tentativa (entenda Ensaio de Bernoulli). Logo, a probabilidade de fracasso
será denotada por q = 1 – p.
Exemplo: Uma prova consta de 10 testes com 5 alternativas cada um, sendo apenas
uma delas correta. Um aluno que nada sabe a respeito da matéria avaliada, "chuta"
uma resposta para cada teste. Qual é a probabilidade dele acertar exatamente 6
testes?
Bernoulli - no Bernoulli estamos pensando sempre em 1, ou seja 1 teste. Na questão
eu estou analisando acertar o teste, então o Bernoulli tem a ver com acertar 1 teste,
mesmo sendo 10 testes, onde queremos acertar exatamente 6, vamos primeiro
pensar em 1. Então acertar 1 teste será o meu sucesso e eu associo a esse ensaio
uma probabilidade p de sucesso, a probabilidade de acertar um teste no chute,
então pensamos:
acertar 1 teste ⇨ se o teste tem 5 alternativas, você tem 5 possibilidades para
1
assinalar, porém apenas 1 é a correta, ficando p = = 0,2 ou 20%, ou seja, a
5
probabilidade de você acertar no chute 1 questão é de 20%.
Binomial - sairemos do Bernoulli e entraremos na Binomial, pois estão analisando 10
testes, ou seja, o Bernoulli analisa 1 teste, se eu repetir esse ensaio de analisar 1
teste 10 vezes, eu vou ter analisado os 10 testes.
n = 10
X = número de testes que acerta = p = 0,2
k (evento sobre o qual você deseja calcular a probabilidade) = 6

P (X = k) = . pk . (1 – p)n–k
10!
P (X = 6) = . 0,26. (1 – 0,2)10–6
6! (10−6)!
10 . 9 . 8 . 7 . 6! 10 . 9 . 8 . 7 5.040
P (X = 6) = - - = 210
6!4! 4.3.2.1 24
P (X = 6) = 210 . 0,000064 . (0,8)4
P (X = 6) = 210 . 0,000064 . 0,4096
P (X = 6) = 0,0055 ou 0,55%
❏ Distribuição de Poisson - a distribuição de Poisson (fala-se: "Poassom") é uma
distribuição de probabilidade discreta de uma variável aleatória X que satisfaz às
seguintes condições:
1. O experimento consiste em calcular o número de vezes, k, que um evento
ocorre em um dado intervalo. O intervalo pode ser de tempo, área, volume,
etc.
2. A probabilidade de o evento acontecer é a mesma para cada intervalo.
3. O número de ocorrências em um intervalo é independente do número de
ocorrências em outro intervalo.
A distribuição de Poisson possui um parâmetro λ (leia-se: "lâmbda") que chamamos
de taxa de ocorrência, que corresponde à freqüência média ou esperada de
ocorrências em um determinado intervalo. Além disso, sempre temos que λ>0.
A probabilidade é calculada da seguinte forma:
−λ 𝑘
𝑒 .λ
P (X = k) =
𝑘!
Onde:
❏ k = 0,1,2,3,...
❏ e = número irracional que vale aproximadamente 2,71828;
❏ λ= taxa de ocorrência (que é igual à média da distribuição)
Sendo X uma variável que segue o modelo Poisson com parâmetro λ, temos que:
❏ Média ou esperança (valor esperado): E(X) = λ
❏ Variância: Var(X) = λ
❏ Desvio padrão: DP(X) = λ
Importante: a Poisson, assim como a Geométrica, é uma distribuição que pode
assumir infinitos valores. Dessa forma, k assume valores em todo o conjunto dos
números naturais.

Obs: Todo o conteúdo apresentado neste arquivo é de suma importância e está resumindo
a matéria estudada, portanto será marcado apenas os títulos para uma melhor organização
e compreensão.

Você também pode gostar