Escolar Documentos
Profissional Documentos
Cultura Documentos
Função
Dado certo elemento (que pode ser um objeto, um número, uma pessoa, etc.), a função o
relaciona a outro, podendo este ser tão diverso quanto o primeiro.
Para compreender a ideia de função, primeiramente é necessário relembrar alguns
conceitos, conjunto, elemento e pertinência. Para uma melhor compreensão, observe os
seguintes exemplos:
❏ Conjunto das vogais: A = {a, e, i, o, u}.
❏ Conjunto dos planetas do sistema solar: B = {Mercúrio, Vênus, Terra, ..., Netuno}.
❏ Conjunto dos meses do ano: C = {janeiro, fevereiro, ..., dezembro}.
No primeiro exemplo, A é o símbolo utilizado para representar o conjunto das vogais;
cada vogal é um elemento do conjunto. Podemos dizer inclusive que a vogal u pertence ao
conjunto A, afirmação que pode ser expressa sinteticamente por 𝑢 ∈ 𝐴 (lê-se: u pertence a
A). A consoante m não pertence ao conjunto A e escrevemos 𝑚 ∉ 𝐴 (lê-se: m não pertence
a A). Os exemplos mais conhecidos de conjuntos são:
❏ Números naturais: N = { 1, 2, 3, 4, 5, 6, ..., 99, 100, 101,...};
❏ Números inteiros: Z = {..., -7, - 6, ..., -1, 0, 1, 2, ..., 5, 6, 7, ...};
❏ Números inteiros, sem o zero: {..., -7, - 6, ..., -1, 1, 2, ...,5, 6, 7, ...};
Função Afim
A função afim, por exemplo, é amplamente utilizada no comércio (para atualização de
preços e rateio de custos), na engenharia e na arquitetura (para construção de plantas
baixas), na área de saúde e indústria farmacêutica (para cálculo de dosagens de
medicamentos) etc.
Lei de Formação - f(x) = ax+b
Função Quadrática
A função quadrática também possui um leque de aplicações muito grande, sendo
utilizada principalmente em problemas envolvendo cálculos de área e em otimização, para
estudo de erros.
É uma função f:R⇨R ja lei de formação é f(x) = ax2 + bx + c, com a≠0. Os valores a,b e c
são denominados coeficientes e ax2 é o termo dominante.
Parábola - é o gráfico de uma função quadrática.
2 2
1 −𝑏 + 𝑏 − 4𝑎𝑐 2 −𝑏 − 𝑏 − 4𝑎𝑐
Zeros da Função Quadrática - 𝑥 = 2𝑎
e 𝑥 = 2𝑎
2
,caso existam. O valor ∆ = 𝑏 − 4𝑎𝑐 é denominado discriminante ou "delta".
Sinal, Mínimo e Máximo da Função Quadrática
❏ Extremo - maior ou menor valor atingido por uma função.
❏ Máximo - maior valor atingido por uma função.
❏ Mínimo - menor valor atingido por uma função.
Em uma função quadrática, o extremo geralmente está associado ao vértice de seu
gráfico. Este corresponderá a um máximo se a concavidade estiver voltada para baixo. E
será um mínimo, caso contrário.
Vértice
Interpretação de Gráficos
Os gráficos são utilizados para apresentar os dados estatísticos e o objetivo do uso deles
é produzir no investigador, ou no público em geral, uma impressão mais rápida e lúdica de
fenômeno em estudo.
Os meios de comunicação e as evoluções tecnológicas nos levam a uma exposição cada
vez maior de informações apresentadas com tratamento estatístico, como a utilização de
gráficos, tabelas e medidas estatísticas.
Ao nos depararmos com uma informação tratada estatisticamente, é muito importante
que tenhamos a capacidade de interpretar, compreender, estabelecer relações e realizar
previsões a partir dos dados expostos, já que a abordagem estatística é utilizada para
fortalecer as informações que estão sendo apresentadas, entretanto, a leitura crítica da
informação como um todo deve ser feita para evitarmos acreditar em fake news.
Tipos de Gráficos
Podemos representar os dados estatísticos por meio de gráficos e existem diversas
formas de fazer isso. Apresentaremos aqui apenas dois dos modelos de gráficos mais
utilizados: Diagramas e Pictogramas.
❏ Diagramas - gráficos geométricos de no máximo duas dimensões. Este grupo é
composto pelos seguintes tipos de gráficos:
❏ Gráfico em Linhas:
❏ Gráfico em Curvas:
❏ Gráfico em Colunas:
❏ Gráfico em Barras:
❏ Gráficos de Setores “Gráfico de Pizza”:
Métodos de Pesquisa
Método - é um conjunto de caminhos organizados para de chegar a um fim que se
deseja. Existem, dentro do método científico, dois importantes métodos para a realização de
uma pesquisa:
❏ Método Experimental - consiste em manter constantes todas as causas (fatores)
menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus
efeitos, caso existam. (CRESPO 2009).
❏ Método Estatístico - diante da impossibilidade de manter as causas constantes,
admitem todas essas causas presentes variando-as, registrando essas variações e
procurando determinar, no resultado final, que influências cabem a cada uma delas.
(CRESPO 2009).
Censo
Conjunto de dados estatísticos que informa diferentes características dos habitantes de
uma região (escola, bairro, cidade, estado, país, ou qualquer outra região). O censo nos
fornece informações, tais como: quantos somos, como somos, onde estamos e como
vivemos.
O censo demográfico é apenas uma das várias possibilidades de censo; existem outros
tipos de censo como, por exemplo, o censo agropecuário, o censo eleitoral, o censo escolar,
etc.
Recenseamento
Segundo Camargo (2019) a ONU define recenseamento da população como o conjunto
das operações que consistem em recolher, agrupar e publicar dados demográficos,
econômicos e sociais relativos a um momento determinado ou a certo períodos para todos
os habitantes de um país ou território e acontece de forma periódica. No Brasil, o
recenseamento acontece de dez em dez anos.
Variáveis Estatísticas
São as características da pesquisa, isto é, atributos mensuráveis que observamos para
então concluir algo. Pode-se avaliar uma variável ou um conjunto delas. Existem diferentes
tipos de variáveis e podemos classificá-las em qualitativas e quantitativas.
A identificação e o estudo das variáveis irão permitir a descrição da população e o
estabelecimento de comparações entre grupos ou até mesmo caracterizar um grupo
específico.
❏ Variáveis Quantitativas - representada por um ou mais números. Relacionada a
valores numéricos. Se divide em dois grupos:
❏ Variáveis Quantitativas Discretas - são representada por números inteiros.
Exemplo: A quantidade de colaboradores em uma empresa, etc.
❏ Variáveis Quantitativas Contínuas - os valores numéricos podem assumir
valores quebrados, isto é, decimais. Exemplo: A altura das pessoas em
metro (1,54), etc.
Exemplos:
Idade; Massa Corporal;
Técnicas de Amostragem
O estudo das técnicas de amostragem é necessário para garantir a representatividade de
todos os perfis.
Deve-se traçar um caminho composto de fases para fazer a estatística de forma correta.
No planejamento temos a definição dos objetivos, das características da amostra, do
método de aquisição e do processamento de dados.
A pesquisa científica, observacional ou experimental busca dados sobre a tese a ser
comprovada e estabelece comparações entre grupos com características distintas. A
primeira pergunta do pesquisador no início da pesquisa é: “Serão coletados os dados de
toda uma população ou de apenas uma parcela representativa dessa população?” Para
tanto, é necessário definir os conceitos de população e amostra.
❏ População - conjunto de elementos que têm em comum uma determinada
característica.
❏ Amostra - todo subconjunto não vazio e com número menor de elementos da
população.
Para Vieira (2008), definir qual deve ser o tamanho de uma amostra é uma das principais
dificuldades encontradas nos trabalhos de levantamento amostral; segunda a autora, o
tamanho da amostra é independente do tamanha da população; já que o tamanho da
amostra, por si só, não determina se ela é boa ou de má qualidade, o que mais importa em
uma amostra é o seu grau de similaridade com a população.
Para o cálculo do tamanho da amostra, deve-se levar em consideração os seguintes
fatores:
❏ O nível de confiança;
❏ A precisão desejada para os resultados obtidos;
❏ A variabilidade dos dados (o quanto estão dispersos em relação à característica em
estudo) e o custo.
Explicação sobre População e Amostra:
Coleta de Dados
❏ Coleta Indireta - é feita a partir dos dados já coletados anteriormente por meio da
coleta direta ou do conhecimento de fenômenos relacionados ao objeto de estudo
como, por exemplo, citando uma pesquisa já realizada.
❏ Coleta Direta - é aquela realizada pelo próprio pesquisador, utilizando os diferentes
meios disponíveis questionários, entrevistas, levantamento de registros
(nascimentos, óbitos, notas fiscais, impostos, etc.). A coleta direta pode ser
classificada de três formas: contínua,periódica ou ocasional.
❏ Coleta Direta Contínua - como o próprio nome já sugere, coleta direta é
classificada como contínua quando é feita de forma continuada, como
registros de casamentos nascimentos e óbitos, importação e exportação de
mercadorias, prontuários, frequência de alunos às aulas, etc.
❏ Coleta Direta Periódica - quando a coleta é feita em intervalos constantes de
tempo, ela é classificada como periódica, por exemplo, os censos (10 em 10
anos), avaliações bimestrais dos alunos, ENADE - Exame Nacional de
Desempenho dos Estudantes - com periodicidade máxima trienal para cada
área do conhecimento, etc.
❏ Coleta Direta Ocasional - quando a coleta é feita em determinada situação
pontual, para atender a um objetivo específico, essa coleta é classificada
como ocasional, por exemplo, uma pesquisa para traçar o perfil de
comunidade e suas demandas por formação profissional, superpopulação de
algas em praia, pesquisa de um produto no mercado, etc.
Resumo:
Tabelas Estatísticas
A Associação Brasileira de Normas Técnicas (ABNT), através da norma NBR
14724:2011. conceitua tabela como forma não discursiva de apresentar informações das
quais o dado numérico se destaca como informação central, em outras palavras, tabela é
um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de
maneira organizada (sistemática).
Segundo ALVES (2013), uma tabela deve apresentar a seguinte estrutura: cabeçalho,
corpo e rodapé.
Estrutura de uma Tabela:
Tipos de Tabelas
❏ Tabelas Primitivas - a primeira tabela que surge quando se organiza os dados,
também chamada tabela primitiva (ROL - organização dos dados por ordem de
valor), é simplesmente a tabela organizada, na qual os elementos são ordenados de
maneira crescente ou decrescente. Após a organização dos dados, é possível
identificar a frequência com que os dados aparecem e, a partir disso, gerar uma
tabela compacta.
❏ Série histórica - (também conhecida como temporais ou cronológicas) consiste em
que o elemento variável é o fator cronológico, como no exemplo ao lado, em que
este é representado em anos.
Tabela sobre o total de alunos do IFB do campus planaltinha entre 2009 e 2018.
Frequência
Frequência - A quantidade de vezes que um dado surge no conjunto de dados.
A organização facilita a visualização e a padronização, favorecendo o processo de
avaliação desses dados. Essa organização pode ocorrer por meio de agrupamento.
Em muitos casos, o agrupamento inadequado pode inviabilizar a análise dos dados. Por
essa razão, é muito importante conhecer as formas adequadas de organização dos dados
coletados para uma pesquisa.
❏ A nutricionista de uma escola fez a medição da massa (kg) de alguns alunos para
analisar o cardápio escolar e montou a seguinte tabela:
Tabela em ROL ⇧
Conceitos importantes:
❏
Exemplo: 16, 18, 18, 20, 20, 20, 22, 23, 23, 24, 25, 26, 26, 29, 30.
Tabela 1 Tabela 2
Classes Quantidade Classes Quantidade
15 |― 20 (15-19) 3 15 ―| 20 (15-20) 6
Total 15 Total 15
❏ LI - Limite Inferior
❏ LS - Limite Superior
❏ AT - Amplitude Total
❏ h - Amplitude de Classe ou do Intervalo
❏ k - Número de Classes
❏ n - Número da amostra (dados coletados; número de pessoas, etc.)
❏ log - função que possui na calculadora científica
10 |― 19
19 |― 28
28 |― 37
37 |― 46
46 |― 55
55 |― 64
64 |― 73
Obs: percebemos que o último valor da tabela é 73, tudo bem o último valor
não ser o limite superior da questão, que seria 70. Na última linha mesmo o
valor não coincidindo com o LS da questão não é errado fechar o intervalo
(|―|), porém pelo fato de não coincidir alguns preferem deixar aberto (|―).
Se o último valor coincidir com o LS da questão, obrigatoriamente temos que
fechar o intervalo (|―|).
❏ Regra de Sturges - k = 1 + 3,3 . log n.
Exemplo: ROL: 10, 10, 11, 14, 18, 19, 19, 20 ………….., 70 (n = 200)
Passos para resolução:
1. Achamos o valor da amplitude total da tabela
AT = 70 ー 10 = 60
2. Após isso para calcularmos o número de classes utilizaremos a regra
de sturges
k = 1 + 3,3 . log n
k = 1 + 3,3 . log200 ⇨ (o log resolvemos na calculadora cientifica,
k = 1 + 3,3 . 2,30 aqui procuramos o log do n, sabendo que
k = 8,59 n é o número de pessoas, então log200)
⇧ arredonda para 9
k = 9 - teremos 9 classes
3. E então definiremos a amplitude de classes utilizando a seguinte
fórmula
h = AT/k (k- número de classes)
h = 60/9 = 6,67 - arredonda para 7
4. Com as amplitudes (da tabela e de classes) definidas, podemos
prosseguir criando os intervalos de classe
Classes
10 |― 17
17 |― 24
24 |― 31
31 |― 38
38 |― 45
45 |― 52
52 |― 59
59 |― 66
66 |― 73
❏ Raiz Quadrada - k= 𝑛
Exemplo: ROL: 10, 10, 11, 14, 18, 19, 19, 20 ………….., 70 (n = 200)
n - número de pessoas
Passos para resolução:
1. Achamos o valor da amplitude total da tabela
AT = 70 ー 10 = 60
2. Após isso para calcularmos o número de classes utilizaremos a regra
de raiz quadrada
k= 𝑛
k = 200 = 14,14
k = 14 - nessa parte não precisa arredondar sempre para cima.
Teremos 14 classes
3. E então definiremos a amplitude de classes utilizando a seguinte
fórmula
h = AT/k (k- número de classes)
h = 60/14 = 4,29 - arredonda para 5
5. Com as amplitudes (da tabela e de classes) definidas, podemos
prosseguir criando os intervalos de classe. Teremos 14 classes
Classes
10 |― 15
15 |― 20
20 |― 25
25 |― 30
30 |― 45
45 |― 50
55 |― 60
65 |― 70
.
.
.
.
195 |― 200
❏ Critério da Desigualdade - 2k ≥ n (≥ - maior ou igual). Pouco usado.
Medidas de Dispersão
Enquanto que as medidas de tendência central indicam se os dados tendem a
concentrar-se em torno dele, as medidas de dispersão indicam se aquelas possuem
distorções.
Elas indicam e quantificam o espalhamento dos valores da amostra ou da população em
torno da medida de centralidade.
As medidas de dispersão são parâmetros estatísticos usados para determinar o grau de
variabilidade dos dados de um conjunto de valores, isto é, utilizamos esses parâmetros para
tornar a análise de uma amostra mais confiável, visto que as variáveis de tendência central
(média, mediana, moda) muitas vezes escondem a homogeneidade ou não dos dados.
❏ Desvio Médio (Dm) - chamamos de desvio a diferença entre um valor e a média dos
dados, ou seja, a diferença entre cada elemento de uma série de dados e a média
aritmética dos elementos dessa série. O desvio médio avalia a variabilidade ou a
dispersão dos dados em torno da média aritmética, isto é, elas indicam a
representatividade da média.
|𝑥1−𝑥|+|𝑥2−𝑥|+|𝑥3−𝑥|+|𝑥4−𝑥|....
❏ Com os dados da população: Dm =
𝑛
|𝑥1−𝑥|+|𝑥2−𝑥|+|𝑥3−𝑥|+|𝑥4−𝑥|....
❏ Com os dados da amostra: Dm =
𝑛−1
Exemplo: Em um time, com três membros, apenas um irá competir na final
representando a equipe. Abaixo está apresentada a pontuação em cinco jogos da
temporada.
Jogos
Jogador 1° 2° 3° 4° 5°
866+850+847+845+847
𝑥b= 5
= 851
867+851+843+849+855
𝑥c= 5
= 853
|866−851|+|850−851|+|847−851|+|845−851|+|847−851|
DMb =
5
15+1+4+6+4 30
DMb = = =6,0 pontos
5 5
|867−853|+|851−853|+|843−853|+|849−853|+|855−853|
DMc =
5
12+2+10+4+2 32
DMc = = =6,4 pontos
5 5
Com os respectivos desvios médios, temos que a Jogador B fol o que manteve a
pontuação mais próxima da média.
❏ Variância (V) - a variância de um conjunto de n valores é dada pela média aritmética
dos quadrados dos desvios médios de cada valor em relação à média.
❏ Com os dados da população: V =
2 2 2 2
(𝑥1−𝑥) +(𝑥2−𝑥) +(𝑥3−𝑥) +(𝑥4−𝑥) ....
𝑛
❏ Com os dados da amostra: V =
2 2 2 2
(𝑥1−𝑥) +(𝑥2−𝑥) +(𝑥3−𝑥) +(𝑥4−𝑥) ....
𝑛−1
VA =
2 2 2 2 2
(870−854) +(848−854) +(855−854) +(845−854) +(852−854)
5
2 2 2 2 2
16 +(−6) +1 +(−9) +(−2)
VA =
5
256+36+1+81+4 378
VA = = = 75,6
5 5
VB =
2 2 2 2 2
(866−851) +(850−851) +(847−851) +(845−851) +(847−851)
5
2 2 2 2
16+(−1)+(−4) +(−6) +4
VB =
5
225+1+16+36+16 294
VB = = = 58,8
5 5
VC =
2 2 2 2 2
(867−853) +(851−853) +(843−853) +(849−853) +(855−853)
5
2 2 2 2 2
14 +(−2)
+(−10) +(−4) +2
VC =
5
196+4+100+16+4 320
VC = = = 64,0
5 5
A partir dos valores da variância, podemos definir o desvio padrão, que nada mais é
que uma forma mais próxima da unidade de medida estudada que, neste caso, são
os pontos do jogo.
❏ Desvio Padrão (Dp) - o desvio padrão (Dp) de um conjunto de n valores é dado pela
raiz quadrada da variância.
Dp = 𝑉
Quanto mais próximo de zero estiver o desvio padrão, mais regular será o conjunto
de valores, ou seja, mais próximo da média estarão esses valores.
Dpa = 75, 6=±8,69 pontos
Dpb = 58, 8= ±7,67 pontos
DpC = 64, 8=± 8 pontos
Obs: uma raiz quadrada possui valores positivos e negativos, isto é, em volta da
média de pontos do jogador Arthur, o desvio da pontuação ficou em torno de 8,69
para mais ou para menos. Para o jogador Bento, a variação foi de 7,67 para mais ou
para menos em torno da média e para Caio, o desvio ficou em oito pontos para mais
ou para menos a partir de sua pontuação média. Desta forma, o desvio em torno da
média que apresentou menor variação ou maior regularidade foi no conjunto de
pontos do jogador B.
❏ Coeficiente de Variação (CV) - medida de dispersão definida como a razão entre o
desvio padrão e a média de um conjunto de dados. O coeficiente de variação
também permite comparar conjuntos totalmente distintos quanto à variabilidade dos
dados.
Resumo:
Estatística Inferencial
O objetivo da estatística inferencial é tirar conclusões com base em amostras (uma parte)
de tal modo que as informações possam ser expandidas para toda a população (o todo).
Outro objeto de estudo da estatística inferencial é o levantamento e o teste de hipóteses.
Nessa estatística estamos sempre interessados em utilizar as informações de uma amostra
para chegar a conclusões sobre um grupo maior, ao qual não temos acesso. Nesse sentido,
uma ferramenta muito utilizada na estatística inferencial é a probabilidade.
Análise Combinatória
A análise combinatória faz o estudo das possibilidades de um dado evento ocorrer sem
necessariamente descrever todas elas.
O princípio fundamental da contagem, também chamado de princípio multiplicativo,
postula que:
“quando um evento é composto por n etapas sucessivas e independentes, de tal modo
que as possibilidades da primeira etapa é x e as possibilidades da segunda etapa é y,
resulta no número total de possibilidades de o evento ocorrer, dado pelo produto (x) . (y)”.
Em resumo, no princípio fundamental da contagem, multiplica-se o número de opções
entre as escolhas que lhe são apresentadas.
Fatorial - ferramenta muito utilizada em problemas de contagem. Número multiplicado
pelos seus antecessores até chegar ao 1. O fatorial de um número natural é definido como
o produto deste número por todos os seus antecessores. Utilizamos o símbolo ! para indicar
o fatorial de um número. Define-se ainda que o fatorial de zero é igual a 1.
Exemplo de Fatorial:
O! = 1 3! = 3.2.1 = 6 10! = 10.9.8.7.6.5.4.3.2.1 = 3 628 800
1! = 1 5! = 5.4.3.2.1 = 120 7! = 7.6.5.4.3.2.1 = 5 040
Note que o valor do fatorial cresce rapidamente, conforme cresce o número. Então,
frequentemente usamos simplificações para efetuar os cálculos de análise combinatória.
Espaço Amostral
O Espaço Amostral é o universo da probabilidade, é o todo do qual as partes serão
extraídas, em outras palavras, são todos os resultados de um experimento aleatório, ou
seja, conjunto de pontos amostrais. O Espaço amostral pode ser representado pela letra
grega ômega (Ω) ou por S (Space).
Exemplo: O lançamento de um dado com 6 faces só pode ter seis resultados (1, 2, 3, 4,
5, 6). Desta forma, a representação do espaço amostral pode ser feita das seguintes
maneiras Ω = {1, 2, 3, 4, 5, 6} ou S = {1, 2, 3, 4, 5, 6).
Evento Probabilístico
Evento probabilístico é um subconjunto do espaço amostral, ou seja, está contido no
espaço amostral. O evento pode ser nulo ou impossível quando não há ponto amostral do
evento no espaço amostral ou ser certo ou garantido, quando o evento é exatamente do
tamanho do espaço amostral. Representamos o evento pela letra E.
Exemplo: Ao lançar um dado de 6 faces, gostaríamos de calcular a probabilidade de o
número sorteado ser par, observe que neste caso o "número de casos favoráveis" (eventos
- E) é o conjunto E= {2, 4, 6), enquanto que "número de casos possíveis" (espaço amostral -
Ω), continua sendo o conjunto completo, o espaço amostral.
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠
P=
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠
4
P= = 0,666 = 66,66%
6
Total 80 60
Nosso espaço amostral é de 140 pessoas entrevistadas.
Resposta a) Sendo "A" o evento formado pelas mulheres entrevistadas, temos que
n(A)= 80; sendo "B" o evento dos passageiros que vão viajar pela primeira vez,
temos n(B)= 50. Sabe-se que n(A⋂B) = 30, calcula-se:
P(AUB) = P(A) + P(B) – P(A⋂B)
P(AUB) = 80 + 50 – 30
100
P(AUB) = = 0,7142 ou 71,42%
140
Resposta b) Sendo "C" o evento formado pelas mulheres que já voaram antes,
temos que n(C)= 50; sendo "D" o evento formado pelos homens que vão voar pela
primeira vez, temos n(D)= 20. Os eventos citados são mutuamente exclusivos e
concluímos que:
P(CUD) = P(C) + P(D)
P(CUD) = 50 + 20
70
P(CUD) = = 0,5 ou 50%
140
Probabilidade Condicional
"Probabilidade de acontecer A, considerando que B já aconteceu".
P ( )
𝑎
𝑏
=
𝑛 (𝐴⋂𝐵)
𝑛 (𝐴)
É um evento condicionado à ocorrência de outro, isto é, dados dois eventos A e B de um
espaço amostral S, a probabilidade do evento A ocorrer quando B já tiver ocorrido é
chamada de probabilidade condicional de A em relação à B.
Exemplo: Em uma sala estão reunidos 20 homens e 20 mulheres. Entre OS homens, 3
administradores, 8 são engenheiros e os demais economistas. Entre as mulheres, 7 são
administradoras, 8 são economistas e as demais engenheiras. Um desses profissionais, foi
escolhido ao acaso para ler a pauta da reunião, sabe-se que uma mulher foi escolhida, qual
a probabilidade de classe economista?
Primeiro vamos organizar os dados em uma tabela.
Homens Mulheres
Administradores (as) 3 7
Engenheiros (as) 8 5
Economistas 9 8
Inicialmente já percebemos que o espaço amostral foi alterado. Observe que antes eram 40
pessoas (homens e mulheres), mas com com a escolha de ser uma mulher sorteada, o
evento A foi criado, com um total de 20 mulheres. A questão solicita a probabilidade de uma
que uma economista ser sorteada, ou seja, n(B)= 17 (todos os economistas), sendo 8
mulheres neste grupo. Calculando:
P ( )
𝑎
𝑏
=
𝑛 (𝐴⋂𝐵)
𝑛 (𝐴)
P ( )
𝑎
𝑏
=
8
20
= 0,4 ou 40%
Probabilidades Independentes
Exemplo para a compreensão na prática: A probabilidade de um homem jovem ter
cálculo renal daqui a 30 anos é 19% e de sua mulher 5%. Qual é a probabilidade de que
daqui a 30 anos:
a) Ambos tenham cálculo renal?
Como a probabilidade de um não interfere na do outro, temos então a multiplicação
das probabilidades
19% . 5%
19 5 95
. = = 0,0095 = 0,95%
100 100 10000
b) Somente a mulher tenha cálculo renal?
Neste caso, precisaremos da probabilidade de o homem não ter cálculo renal, isto é
81%.
81% . 5%
81 5 405
. = = 0,0405 = 4,05%
100 100 10000
c) Ambos não tenham cálculo?
Neste caso, precisaremos da probabilidade de o homem não ter cálculo renal, isto é
81% e da mulher também não ter, 95%.
19% . 5%
81 95 7695
. = = 0,7695 = 76,95%
100 100 10000
d) Pelo menos 1 deles tenha cálculo renal?
Observe que neste caso é necessário considerar as três possibilidades:
I - Somente ele ter cálculo real. 18,05%
II - Somente ela ter cálculo real. 4,05%
III - Ambos terem cálculo renal. 0,95%
Desta forma, basta somar todas as probabilidades: 18,05% + 4,5% + 0,95% =
23,05%.
Para este tipo de probabilidade os eventos são totalmente independentes e para cada
probabilidade solicitada devemos analisar as condições, ou seja, multiplicando as
probabilidades individuais, para análises diretas ou somando as probabilidades individuais
para os casos em que demandam a probabilidade de acontecer "pelo menos um", "ao
menos dois", dos eventos avaliados.
Análise de Frequência
Estamos sempre buscando regularidades e padrões nos objetos de nossas pesquisas,
porém, mesmo não sendo fácil encontrá-los, quando conseguimos, podemos entender
melhor o fenômeno e até mesmo fazer previsões seguras a respeito do estudo. Como já
tratamos, coletar informações de populações inteiras geralmente é inviável, impossível ou
antiético, por isso, estimar um comportamento é suficiente para gerar embasamento nas
conclusões de pesquisa.
Quando conhecemos a probabilidade de um evento acontecer ou não acontecer, a partir
de uma amostra, estamos tratando de um evento aleatório com uma probabilidade
associada, entender que em experimentos aleatórios é natural que existam condições
extremas, ou seja, com eventos que são mais raros do que outros, isto é, enquanto uns
possuem alta probabilidade de acontecer outros possuem probabilidade baixíssima.
Histograma - são constituídos por um conjunto de retângulos com as bases assentadas
sobre um eixo horizontal, tendo o centro dela no ponto médio da classe que representa e
cuja altura é proporcional a frequência da classe.
Quando a distribuição da frequência seguir esse modelo, isto é, concentrando o que é
comum e dispersando o que é raro, temos a chamada distribuição normal. A distribuição
normal pode ser representada a partir de um modelo, uma curva que será chamada de
Curva Normal ou Curva Gaussiana.
❏ Curva Normal:
Modelos Probabilísticos
As distribuições de probabilidade podem ser distribuições de probabilidades contínuas ou
distribuições de probabilidade discretas, dependendo se eles definem probabilidades para
variáveis contínuas ou discretas.
A distribuição contínua que estudamos até agora foi a Normal - que descreve uma
variável que se distribui de forma simétrica a um valor central - entretanto, ela não é a única,
como por exemplo a Distribuição Exponencial.
Trataremos agora de outros três tipos de distribuição: Bernoulli, Binomial e Poisson, que
são discretas.
Obs: existem outras distribuições que não serão tratadas neste curso.
❏ Distribuição Ensaios de Bernoulli - baseia-se em experimentos conhecidos como
ensaios de Bernoulli e é característica de experimentos em que se pode observar a
presença ou não de algum resultado de interesse.
Este modelo se baseia num espaço amostral de apenas dois resultados que serão
denominados
❏ Sucesso (p) - aquilo que me interessa;
❏ Fracasso (1 – p) (alguns chama “1 – p” de “q” - “q = 1 – p”) - aquilo que não
me interessa (um sendo a negação do outro).
Para que os resultados tenham mais significado, a variável aleatória de uma
Bernoulli atribui apenas os valores 0 e 1. Uma única coisa, uma única peça, um
único indivíduo, etc. Com isso se analisa se ocorre sucesso ou fracasso; Mais de
uma coisa, uma peça, um indivíduo, etc, você estará repetindo esse Bernoulli mais
de uma vez, e repetir esse Bernoulli significa que se está trabalhando com a
Distribuição Binomial.
p(x) = px . (1 – p)1–x
Exemplo 1: Suponha que lançarei uma moeda com o intuito de efetuar uma aposta,
a básica cara ou coroa, eu escolhi cara e o meu oponente coroa, então do meu
ponto de vista, cara vai ser o meu sucesso (p) e coroa vai ser o meu fracasso (1 –
p).
Exemplo 2: Digamos que farei outra aposta, dessa vez usando um dado
convencional de 6 faces, se cair no 5 eu ganharei, então do meu ponto de vista, 5
vai ser o meu sucesso (p) e 1, 2, 3, 4 e 6 será o meu fracasso (1 – p).
Exemplo 3: Pensaremos em outra situação, estou em uma linha de produção e essa
faz algum tipo de equipamento, e eu faço parte do controle de qualidade dessa linha
de produção, digamos que o meu interesse seja constatar algum equipamento que
tenha saído com defeito. Então nesse caso, o defeito é o meu sucesso (p) e o
funcionando é o meu fracasso (1 – p).
Exemplo 4: Imagina que estou em uma UTI Neonatal, digamos que eu faça parte do
departamento de estatística desse hospital e eu estou analisando a taxa de
mortalidade nessa UTI Neonatal, então por exemplo, eu analiso um bebê o fato do
bebê morrer será o morrer será o meu sucesso (p) e o fato do bebê sobreviver será
o meu fracasso (1 – p).
Temos como observação aqui que sucesso é o que me interessa, podendo ser algo
bom ou ruim, então não podemos relacionar em Bernoulli sucesso como algo bom.
P (X=x) 1–p p
Exemplo: Em uma prova, com uma questão objetiva de 5 alternativas, qual seria a
probabilidade de acertar e de errar esta questão chutando?
Sucesso (1) = 1/5 = 0,2
Fracasso (0) = 4/5 = 0,8
Montando a probabilidades acima, temos:
p(x) = px . (1 – p)1–x
p(x) = 0,2x . 0,81–x
❏ Distribuição Binomial - é útil para determinar a probabilidade de um certo número de
sucessos num conjunto de observações. A Distribuição Binomial descreve a
probabilidade num experimento que envolve certo número n de ensaios de Bernoulli.
Se em cada uma das n repetições de Ensaios de Bernoulli a probabilidade de
ocorrer um evento definido como sucesso é sempre p, a probabilidade de que esse
evento ocorra em apenas k das n repetições é dada por:
P (X = k) = . pk . (1 – p)n-k
⇧ Número binomial e não fração.
𝑛!
=
𝑘! (𝑛−𝑘)!
n = número de repetições dos Ensaios de Bernoulli.
X = variável aleatória que sempre representará o sucesso (p).
k = evento sobre o qual você deseja calcular a probabilidade.
Ela segue as seguintes determinações:
1. O experimento é repetido n vezes, onde cada tentativa é independente das
demais.
2. Há apenas dois resultados possíveis em cada tentativa: um de interesse,
associado à variável X, chamado de sucesso e o seu complementar que é o
fracasso.
3. A probabilidade de sucesso será denotada por p e é a mesma em cada
tentativa (entenda Ensaio de Bernoulli). Logo, a probabilidade de fracasso
será denotada por q = 1 – p.
Exemplo: Uma prova consta de 10 testes com 5 alternativas cada um, sendo apenas
uma delas correta. Um aluno que nada sabe a respeito da matéria avaliada, "chuta"
uma resposta para cada teste. Qual é a probabilidade dele acertar exatamente 6
testes?
Bernoulli - no Bernoulli estamos pensando sempre em 1, ou seja 1 teste. Na questão
eu estou analisando acertar o teste, então o Bernoulli tem a ver com acertar 1 teste,
mesmo sendo 10 testes, onde queremos acertar exatamente 6, vamos primeiro
pensar em 1. Então acertar 1 teste será o meu sucesso e eu associo a esse ensaio
uma probabilidade p de sucesso, a probabilidade de acertar um teste no chute,
então pensamos:
acertar 1 teste ⇨ se o teste tem 5 alternativas, você tem 5 possibilidades para
1
assinalar, porém apenas 1 é a correta, ficando p = = 0,2 ou 20%, ou seja, a
5
probabilidade de você acertar no chute 1 questão é de 20%.
Binomial - sairemos do Bernoulli e entraremos na Binomial, pois estão analisando 10
testes, ou seja, o Bernoulli analisa 1 teste, se eu repetir esse ensaio de analisar 1
teste 10 vezes, eu vou ter analisado os 10 testes.
n = 10
X = número de testes que acerta = p = 0,2
k (evento sobre o qual você deseja calcular a probabilidade) = 6
P (X = k) = . pk . (1 – p)n–k
10!
P (X = 6) = . 0,26. (1 – 0,2)10–6
6! (10−6)!
10 . 9 . 8 . 7 . 6! 10 . 9 . 8 . 7 5.040
P (X = 6) = - - = 210
6!4! 4.3.2.1 24
P (X = 6) = 210 . 0,000064 . (0,8)4
P (X = 6) = 210 . 0,000064 . 0,4096
P (X = 6) = 0,0055 ou 0,55%
❏ Distribuição de Poisson - a distribuição de Poisson (fala-se: "Poassom") é uma
distribuição de probabilidade discreta de uma variável aleatória X que satisfaz às
seguintes condições:
1. O experimento consiste em calcular o número de vezes, k, que um evento
ocorre em um dado intervalo. O intervalo pode ser de tempo, área, volume,
etc.
2. A probabilidade de o evento acontecer é a mesma para cada intervalo.
3. O número de ocorrências em um intervalo é independente do número de
ocorrências em outro intervalo.
A distribuição de Poisson possui um parâmetro λ (leia-se: "lâmbda") que chamamos
de taxa de ocorrência, que corresponde à freqüência média ou esperada de
ocorrências em um determinado intervalo. Além disso, sempre temos que λ>0.
A probabilidade é calculada da seguinte forma:
−λ 𝑘
𝑒 .λ
P (X = k) =
𝑘!
Onde:
❏ k = 0,1,2,3,...
❏ e = número irracional que vale aproximadamente 2,71828;
❏ λ= taxa de ocorrência (que é igual à média da distribuição)
Sendo X uma variável que segue o modelo Poisson com parâmetro λ, temos que:
❏ Média ou esperança (valor esperado): E(X) = λ
❏ Variância: Var(X) = λ
❏ Desvio padrão: DP(X) = λ
Importante: a Poisson, assim como a Geométrica, é uma distribuição que pode
assumir infinitos valores. Dessa forma, k assume valores em todo o conjunto dos
números naturais.
Obs: Todo o conteúdo apresentado neste arquivo é de suma importância e está resumindo
a matéria estudada, portanto será marcado apenas os títulos para uma melhor organização
e compreensão.