Você está na página 1de 42

Câmara Municipal de Guarulhos-SP

Comum aos Cargos de Ensino Superior

estatística
Séries Estatísticas...........................................................................................................................01
Distribuição de Frequências – Distribuição Normal........................................................................04
Medidas de Dispersão e Posição....................................................................................................09
Medidas de Variabilidade................................................................................................................18
Noções Básicas de Probabilidades.................................................................................................27
Amostragem – Principais Tipos de Amostras .................................................................................35
Exercícios........................................................................................................................................37
Gabarito...........................................................................................................................................41

estatística

1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO


Séries Estatísticas

A estatística torna-se a cada dia uma importante ferramenta de apoio à decisão. Resumindo: é um
conjunto de métodos e técnicas que auxiliam a tomada de decisão sob a presença de incerteza.

Estatística descritiva (Dedutiva)

O objetivo da Estatística Descritiva é resumir as principais características de um conjunto de dados


por meio de tabelas, gráficos e resumos numéricos. Fazemos uso de:

Tabelas de frequência - Ao dispor de uma lista volumosa de dados, as tabelas de frequência servem
para agrupar informações de modo que estas possam ser analisadas. As tabelas podem ser de frequên-
cia simples ou de frequência em faixa de valores.

Gráficos - O objetivo da representação gráfica é dirigir a atenção do analista para alguns aspectos
de um conjunto de dados. Alguns exemplos de gráficos são: diagrama de barras, diagrama em setores,
histograma, boxplot, ramo-e-folhas, diagrama de dispersão, gráfico sequencial.

Resumos numéricos - Por meio de medidas ou resumos numéricos podemos levantar importantes
informações sobre o conjunto de dados tais como: a tendência central, variabilidade, simetria, valores
extremos, valores discrepantes, etc.

Estatística inferencial (Indutiva)

Utiliza informações incompletas para tomar decisões e tirar conclusões satisfatórias. O alicerce das
técnicas de estatística inferencial está no cálculo de probabilidades. Fazemos uso de:

Estimação - A técnica de estimação consiste em utilizar um conjunto de dados incompletos, ao qual


iremos chamar de amostra, e nele calcular estimativas de quantidades de interesse. Estas estimativas
podem ser pontuais (representadas por um único valor) ou intervalares.

Teste de Hipóteses - O fundamento do teste estatístico de hipóteses é levantar suposições acerca de


uma quantidade não conhecida e utilizar, também, dados incompletos para criar uma regra de escolha.

População e amostra

População: é o conjunto de todas as unidades sobre as quais há o interesse de investigar uma ou


mais características.

Amostra: é um subconjunto das unidades que constituem a população. A caracterização da população


é feita em função de um problema a ser estudado.

Variáveis e suas classificações

1
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Qualitativas – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor da
pele, entre outros. Dizemos que estamos qualificando.

Variáveis nominais: são aquelas definidas por “nomes”, não podendo ser colocadas em uma ordem
crescente.

Variáveis ordinais: são aquelas que podem ser colocadas em uma ordem crescente, mas não é possí-
vel (ou não faz sentido) calcular a diferença entre um valor e o seguinte.

Quantitativas – quando seus valores são expressos em números (salários dos operários, idade dos
alunos, etc). Uma variável quantitativa que pode assumir qualquer valor entre dois limites recebe o nome
de variável contínua; e uma variável que só pode assumir valores pertencentes a um conjunto enumerá-
vel recebe o nome de variável discreta.

Variáveis intervalares: são aquelas que podem ser colocadas em uma ordem crescente, e é possível
calcular a diferença entre um valor e o seguinte.

SÉRIES ESTATÍSTICAS

Toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época,
do local ou da espécie.

Observamos três elementos:

- tempo;

- espaço;

- espécie.

Conforme varie um dos elementos da série, podemos classifica-la em:

- Histórica;

- Geográfica;

- Específica.

- Séries históricas, cronológicas, temporais ou marchas: Os valores da variável são descritos em, de-
terminado local, em intervalos de tempo.

2
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
- Séries geográficas, espaciais, territoriais ou de localização: valores da variável, em determinado ins-
tante, discriminados segundo regiões.

- Séries específicas ou categóricas: aquelas que descrevem valores da variável, em determinado tem-
po e local, segundo especificações ou categorias.

3
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
- Séries conjugadas – Tabela de dupla entrada: utilizamos quando temos a necessidade de apresen-
tar, em uma única tabela, variações de mais de uma variável. Com isso conjugamos duas séries em uma
única tabela, obtendo uma tabela de dupla entrada, na qual ficam criadas duas ordens de classificação:
uma horizontal e uma vertical.

Na tabela abaixo vamos a variável região e tempo.

Distribuição de Frequências – Distribuição Normal

DISTRIBUIÇÃO DE PROBABILIDADES

A distribuição da probabilidade é uma função que determina probabilidades para eventos ou proposi-
ções. Para qualquer conjunto de eventos ou proposições existem muitas maneiras de determinar proba-
bilidades, de forma que a escolha de uma ou outra distribuição é equivalente a criar diferentes hipóteses
sobre os eventos ou proposições em questão. Há várias formas equivalentes de se especificar uma dis-
tribuição de probabilidade. Talvez a mais comum é especificar uma função densidade da probabilidade.
Daí, a probabilidade de um evento ou proposição é obtida pela integração da função densidade.

A função distribuição pode ser também especificada diretamente. Em uma dimensão, a função distri-
buição é chamada de função distribuição cumulativa. As distribuições de probabilidade também podem
ser especificadas via momentos ou por funções características, ou por outras formas. Uma distribuição
é chamada de distribuição discreta se for definida em um conjunto contável e discreto, tal como o sub-
conjunto dos números inteiros; ou é chamada de distribuição contínua se tiver uma função distribuição
contínua, tal como uma função polinomial ou exponencial. A maior parte das distribuições de importância
prática são ou discretas ou contínuas, porém há exemplos de distribuições que não são de nenhum des-
ses tipos.

Dentre as distribuições discretas importantes, pode-se citar a distribuição uniforme discreta, a distri-
buição de Poisson, a distribuição binomial, a distribuição binomial negativa e a distribuição de Maxwell-
-Boltzmann. Dentre as distribuições contínuas, a distribuição normal, a distribuição gama, a distribuição t
de Student e a distribuição exponencial.

4
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Distribuição Binomial

Em teoria das probabilidades e estatística, a distribuição binomial é a distribuição de probabilidade dis-


creta do número de sucessos numa sequência de n tentativas tais que as tentativas são independentes;
cada tentativa resulta apenas em duas possibilidades, sucesso ou fracasso (a que se chama de tentativa
de Bernoulli); a probabilidade de cada tentativa, p, permanece constante.

FUNÇÃO DE PROBABILIDADE

Se a variável aleatória X que contém o número de tentativas que resultam em sucesso tem uma dis-
tribuição binomial com parâmetros n e p escrevemos X ~ B(n, p). A probabilidade de ter exatamente k
sucessos é dado pela função de probabilidade:

para k = 0,1,2,..., n e onde é uma combinação.

Através do desenvolvimento do binômio e algumas operações com expoentes e fatoriais, é possível


demonstrar que:

Exemplo: Três dados comuns e honestos serão lançados. A probabilidade de que o número 6 seja
obtido mais de uma vez é: A probabilidade de que seja obtido 2 vezes mais a probabilidade de que seja
obtido 3 vezes. Usando a distribuição binomial de probabilidade:

Acha-se a probabilidade de que seja obtido 2 vezes:

Agora a probabilidade de que seja obtido 3 vezes:

5
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Assim, a resposta é:

Valor esperado e variância: Se a X ~ B(n, p) (isto é, X é uma variável aleatória binomialmente distribui-
da), então o valor esperado de X é

e a variância é

Exemplo: Seja X uma variável aleatória que contém o número de caras saídas em 12 lançamentos de
uma moeda honesta. A probabilidade de sair 5 caras em 12 lançamentos, P(X=5), é dada por:

Distribuição Normal

A distribuição normal é uma das mais importantes distribuições da estatística, conhecida também
como Distribuição de Gauss ou Gaussiana. Foi primeiramente introduzida pelo matemático Abraham de
Moivre. Além de descrever uma série de fenômenos físicos e financeiros, possui grande uso na estatísti-
ca inferencial. É inteiramente descrita por seus parâmetros de média e desvio padrão, ou seja, conhecen-
do-se estes consegue-se determinar qualquer probabilidade em uma distribuição Normal.

6
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Um interessante uso da Distribuição Normal é que ela serve de aproximação para o cálculo de outras
distribuições quando o número de observações fica grande. Essa importante propriedade provém do
Teorema do Limite Central que diz que “toda soma de variáveis aleatórias independentes de média finita
e variância limitada é aproximadamente Normal, desde que o número de termos da soma seja suficiente-
mente grande” (ver o teorema para um enunciado mais preciso).

A distribuição normal foi introduzida pela primeira vez por Abraham de Moivre em um artigo no ano
1733, que foi reproduzido na segunda edição de seu The Doctrine of Chances (1738) no contexto da
aproximação de distribuições binomiais para grandes valores de n. Seu resultado foi estendido por Lapla-
ce, em seu livro Analytical Theory of Probabilities (1812), e agora é chamado o teorema de Moivre-Lapla-
ce.

Laplace usou a distribuição normal na análise de erros de experimentos. O importante método dos
mínimos quadrados foi introduzido por Legendre, em 1805. Gauss, que alegou ter usado o método des-
de 1794, justifica-o rigorosamente em 1809 assumindo uma distribuição normal para os erros. O fato de
muitas vezes esta distribuição ser chamado de distribuição gaussiana pode ser um exemplo de Stigler’s
Law.

O nome “curva em forma de sino” ou “curva de sino” remonta a Esprit Jouffret que primeiro utilizou o
termo “superfície de sino” em 1872 para um normal bivariada com componentes independentes (atentar
que nem toda curva de sino é uma gaussiana). O nome “distribuição normal”, foi inventado independente-
mente por Charles S. Peirce, Francis Galton e Wilhelm Lexis, por volta de 1875.

Relação entre as Distribuições Binomial e Normal

Com base na definição na Lei dos Grandes Números, pode-se considerar como verdadeira a aproxi-
mação da distribuição de probabilidade de variáveis discretas à distribuição de variáveis contínuas. Essa
aproximação torna-se mais concreta à medida que aumenta o número de observações da variável.

Assim, aceita-se que as duas distribuições se aproximam quando:

- O número de observações for grande, ou seja, n ≥ 30;

- As probabilidades de sucesso (p) e de fracasso (q) não forem muito próximas a zero;

- As médias de sucessos e de fracassos forem maiores do que cinco (n.p > 5 ou n.q > 5);

- A aproximação melhora com o crescimento do número de observações e no limite (infinito) as duas


distribuições coincidem.

Resumindo:

Na natureza, quando o número de dados do universo analisado é relativamente grande e principal-


mente quando for de uma variável contínua, a distribuição dos dados apresenta uma curva com formato
de um sino, com um ponto máximo no centro, em que as áreas, em ambos os lados da média, são idênti-
cas.

- A curva formada chama-se de curva normal, que é definida como sendo simétrica e unimodal, tendo
como característica a igualdade entre as medidas: média, moda e mediana.

- Quando as medidas, média, moda e mediana não são iguais, mas semelhantes, chama-se a distri-
buição de aproximadamente normal.

7
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
- Pela distribuição normal padronizada, que apresenta como características uma curva simétrica e me-
socúrtica, podem-se determinar valores de probabilidade e apresentá-los em tabelas que expressam os
valores da função densidade ou curva de probabilidade, com base na variável padronizada z.

- Os valores da função densidade localizam-se abaixo da curva da distribuição e seu valor total é de
100%, localizando-se 50% à direita da média e 50% à sua esquerda.

- Para determinar os valores de z, precisa-se dos valores da média, do desvio-padrão e do valor de Xi


de referência.

- Os valores de z, à direita da média, são positivos e os localizados à esquerda, negativos.

- Uma das alternativas é a determinação da probabilidade em função de Xi, sendo a média e o desvio-
-padrão conhecidos.

- No cálculo do valor de z devem ser usados dois dígitos após a vírgula.

- Os valores da probabilidade encontrados no Apêndice III referem-se sempre ao intervalo entre o


valor da média e o valor de Xi.

- Para a solução do problema, existem várias possibilidades: o próprio valor encontrado na tabela, a
soma ou subtração do valor da tabela de 0,5, a soma de 0,5 ao valor da tabela e subtração do valor me-
nor do valor maior, encontrados na tabela.

- Para facilitar a solução de problemas de probabilidade Normal, recomenda-se sempre fazer o dese-
nho da curva e indicar a área a ser conhecida.

- Outra alternativa é a determinação do valor de Xi em função da probabilidade desejada, conhecendo


a média e o desvio-padrão.

- Deve-se ter o cuidado para atribuir o sinal correto de z, pois os seus valores de z, à direita da média,
são positivos e os localizados à esquerda, negativos.

- Valores de variáveis discretas podem ser adaptados à distribuição normal, nas seguintes condições:
número de observações ≥ 30; probabilidades de sucesso (p) e de fracasso (q) não serem muito próximas
a zero e as médias de sucesso e de fracasso serem maiores do que cinco.

- Na aproximação da Binomial à Normal deve-se fazer a correção de continuidade, pela soma ou sub-
tração de 0,5 ao valor inteiro da variável discreta X (número de sucessos).

Essa correção é necessária e deve ser feita de forma equitativa, pois entre dois números consecutivos
da variável discreta há um espaço vazio de uma unidade.

- Os valores da média e do desvio-padrão são obtidos pelas fórmulas de cálculo das propriedades das
variáveis discretas.

8
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Medidas de Dispersão e Posição

MEDIDAS DESCRITIVAS (POSIÇÃO, DISPERSÃO, ASSIMETRIA E CURTOSE)

Por meio de medidas ou resumos numéricos podemos levantar importantes informações sobre o con-
junto de dados tais como: a tendência central, variabilidade, simetria, valores extremos, valores discre-
pantes, etc. Aqui serão apresentadas 3 classes de medidas:

• Tendência Central

• Dispersão (Variabilidade)

• Separatrizes

Tendência central

As medidas de tendência central indicam, em geral, um valor central em torno do qual os dados estão
distribuídos. Vejamos:

Média Aritmética

Ela se divide em:

- Simples: é a soma de todos os seus elementos, dividida pelo número de elementos n.

Para o cálculo: Se x for a média aritmética dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn},
então, por definição:

- Ponderada: é a soma dos produtos de cada elemento multiplicado pelo respectivo peso, dividida pela
soma dos pesos. Para o cálculo

9
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Vantagens: Desvantagem:

- No cálculo da média participam todos os valo- - É uma medida altamente influenciada por valo-
res observados. res discrepantes (não resistente).

- É uma medida de fácil interpretação e presta-


-se muito bem a tratamentos estatísticos adicio-
nais.

- É uma medida que sempre existe e é rígida e


unicamente determinada.

- É um valor típico de um conjunto de dados,


podendo substituir todos os valores de um con-
junto sem alterar o total.

- É o ponto de equilíbrio de uma distribuição,


sendo tão mais eficiente quanto mais simétrica
for a distribuição dos valores ao seu redor.

Atenção: Sempre que em uma questão vier pedindo média, ela está se referindo a média aritmética
simples. A ponderada é sempre mencionada na questão.

Mediana

A mediana observada mdobs é o valor central em um conjunto de dados ordenados. Pela mediana o
conjunto de dados é dividido em duas partes iguais sendo metade dos valores abaixo da mediana e, a
outra metade, acima.

Vamos denominar mdobs o valor da mediana observado em um conjunto de dados. Repare que para
encontrar um número que divida os n dados ordenados em duas partes iguais devem ser adotados dois
procedimentos:

1) Para um conjunto com um número n (ímpar) de observações, a mediana é o valor na posição


n+1/2.

2) Para um conjunto com um número n (par) de observações a mediana é a média aritmética dos valo-
res nas posições n/2 e

n/2 + 1.

10
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Vantagens: Desvantagem:

- Define exatamente o centro de uma distribui- - É uma medida que não se presta a cálculos
ção, mesmo quando os valores se distribuem matemáticos.
assimetricamente em torno da média.

- Pode ser determinada mesmo quando não se


conhece todos os valores do conjunto de da-
dos.

- É uma medida que sempre existe e é única.

- Esta medida pode ser utilizada para definir o


meio de um número de objetos, propriedades
ou qualidades que possam de alguma forma ser
ordenados.

- É uma medida resistente, ou seja, não sofre


influência de valores discrepantes.

Moda

A moda, é o valor que aparece com maior frequência, ou seja, podemos dizer que é o termo que está
na “moda”.

Vantagens: Desvantagens:

- É uma medida que têm existência real dentro - É uma medida que não se presta a cálculos
do conjunto de dados e em grande número de matemáticos.
vezes.
- Deixa sem representação todos os valores
- Não exige cálculo, apenas uma contagem. do conjunto de dados que não forem iguais a
ela.
- Pode ser determinada também para variáveis
qualitativas nominais.

Medidas de variação ou dispersão

As medidas de variação ou dispersão complementam as medidas de localização ou tendência central,


indicando quanto as observações diferem entre si ou o grau de afastamento das observações em relação
à média.

As medidas de variação mais utilizadas são: a amplitude total, a variância, o desvio padrão e o coefi-
ciente de variação.

Amplitude total

A amplitude total, denotada por at, fornece uma ideia de variação e consiste na diferença entre o maior
valor e o menor valor de um conjunto de dados. Assim, temos:

at = ES - EI

onde:

ES: extremo superior do conjunto de dados ordenado;

11
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
EI: extremo inferior do conjunto de dados ordenado.

A amplitude total é uma medida pouco precisa, uma vez que utiliza apenas os dois valores mais extre-
mos de um conjunto de dados. Também por esta razão é extremamente influenciada por valores discre-
pantes. É utilizada quando apenas uma ideia rudimentar da variabilidade dos dados é suficiente.

Variância

A variância, denotada por s² , é a medida de dispersão mais utilizada, seja pela sua facilidade de com-
preensão e cálculo, seja pela possibilidade de emprego na inferência estatística. A variância é definida
como sendo a média dos quadrados dos desvios em relação à média aritmética. Assim, temos:

onde:

n −1: é o número de graus de liberdade ou desvios independentes.

A utilização do denominador n −1, em vez de n, tem duas razões fundamentais:

Propriedades matemáticas da variância

1ª propriedade: A variância de um conjunto de dados que não varia, ou seja, cujos valores são uma
constante, é zero.

2ª propriedade: Se somarmos uma constante c a todos os valores de um conjunto de dados, a variân-


cia destes dados não se altera.

3ª propriedade: Se multiplicarmos todos os valores de um conjunto de dados por uma constante c, a


variância destes dados fica multiplicada pelo quadrado desta constante.

Desvantagens da variância:

− Como a variância é calculada a partir da média, é uma medida pouco resistente, ou seja, muito in-
fluenciada por valores discrepantes.

12
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
− Como a unidade de medida fica elevada ao quadrado, a interpretação da variância se torna mais
difícil.

Desvio Padrão

O desvio padrão, denotado por s, surge para solucionar o problema de interpretação da variância e é
definido como a raiz quadrada positiva da variância. Assim, temos:

Coeficiente de Variação

O coeficiente de variação, denotado por CV, é a medida mais utilizada quando existe interesse em
comparar variabilidades de diferentes conjuntos de dados. Embora esta comparação possa ser feita
através de outras medidas de variação, nas situações em que as médias dos conjuntos comparados são
muito desiguais ou as unidades de medida são diferentes, devemos utilizar o CV.

O coeficiente de variação é definido como a proporção da média representada pelo desvio padrão e
dado por:

Separatrizes

As medidas separatrizes delimitam proporções de observações de uma variável ordinal. Elas estabe-
lecem limites para uma determinada proporção 0 ≤ p ≤ 1 de observações. São medidas intuitivas, de fácil
compreensão e frequentemente resistentes.

Como a mediana divide o conjunto em duas metades, é razoável pensar numa medida separatriz que
efetue uma divisão adicional: dividir cada metade em duas metades. Essas medidas separatrizes são
denominadas quartis.

Quartis

Os quartis, representados por Qi, onde i = 1, 2 e 3, são três medidas que dividem um conjunto de da-
dos ordenado em quatro partes iguais. São elas:

− Primeiro quartil (Q1): 25% dos valores ficam abaixo e 75% ficam acima desta medida.

− Segundo quartil (Q2): 50% dos valores ficam abaixo e 50% ficam acima desta medida. O segundo
quartil de um conjunto de dados corresponde à mediana (Q2 = Md).

− Terceiro quartil (Q3): 75% dos valores ficam abaixo e 25% ficam acima desta medida.

Observa-se facilmente que o primeiro quartil é o percentil 0,25, a mediana é o percentil 0,5 e o tercei-
ro quartil é o percentil 0,75. O processo para obtenção dos quartis, da mesma forma que o da mediana,
consiste em, primeiramente, ordenar os dados e, em seguida, determinar a posição (p) do quartil no
conjunto de dados ordenado.

13
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Exemplos:

01. (TJ/SP – Estatístico Judiciário – VUNESP) Considere a tabela de distribuição de frequência se-
guinte, em que xi é a variável estudada e fi é a frequência absoluta dos dados.

xi fi
30-35 4
35-40 12
40-45 10
45-50 8
50-55 6
TOTAL 40

Assinale a alternativa em que o histograma é o que melhor representa a distribuição de frequência da


tabela.

(A)

(B)

(C)

(D)

(E)

Resposta: Letra A.

A menor deve ser a da primeira 30-35

Em seguida, a de 55

Depois de 45-50 na ordem 40-45 e 35-40

02. (AL/GO – Assistente Legislativo – Assistente Administrativo – CS/UFG) Em estatística, a variância


é um número que apresenta a unidade elevada ao quadrado em relação a variável que não está elevada
ao quadrado, o que pode ser um inconveniente para a interpretação do resultado. Por isso, é mais comu-
mente utilizada na estatística descritiva o desvio-padrão, que é definido como

(A) a raiz quadrada da mediana, representada por “s” ou “μ”.

14
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
(B) a raiz quadrada da variância, representada por “s” ou “α”.

(C) a raiz quadrada da variância, representada por “s” ou “α”.

(D) a raiz quadrada da média, representada por “s” ou “α”.

Resposta: Letra C.

Como visto, o desvio padrão é a raiz quadrada da variância.

Assimetria1

Mede o grau de afastamento de uma distribuição em relação ao eixo central, geralmente representado
pela média.

Sempre que a curva da distribuição se afastar do eixo central, no caso,da média,será considerada
como tendo um certo grau de afastamento, chamado de assimetria da distribuição. Este afastamento
pode acontecer do lado esquerdo ou do lado direito da distribuição, chamado de assimetria negativa ou
positiva, respectivamente.

Coeficiente de Assimetria (Coeficiente de Pearson)

O grau de assimetria de uma distribuição de freqüências pode ser calculado por meio do Coeficiente
de Pearson, abaixo:

1 Associação Educacional Dom Bosco - Estatística e probabilidade - Uanderson Rebula de Oliveira

15
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Exemplos:

A)

Interpretação: a distribuição é assimétrica positiva (à direita) e moderada, pois está entre 0,15 e 1.

Ao construir o histograma podemos comparar com uma distribuição simétrica. Perceba o quanto a
média desta distribuição se afasta do eixo central, simétrico.

B)

Interpretação: a distribuição é assimétrica negativa (à esquerda) e moderada, pois está entre ‐ 0,15 e
‐1.
Ao construir o histograma podemos comparar com uma distribuição simétrica. Perceba o quanto a
média desta distribuição se afasta do eixo central, simétrico.

16
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Interpretação da assimetria.

Quanto mais as se afasta de zero, mais assimétrica será a distribuição, podendo ser fraca (se situada
até |0,15|), moderada (se situada de |0,15| a |1|) ou forte (se maior que |1|). Forte, nesse caso, não é algo
necessariamente bom, pois indica que a distribuição está fortemente (muito) distante do eixo central, no
caso, da média. Portanto, para efeitos de inferência estatística, melhor é que a As se aproxime de zero,
no caso, de uma distribuição simétrica.

A barra | | indica, matematicamente, que o sinal negativo é desprezado.

Curtose2

A análise da Curtose também é importante, pois é a base do estudo de probabilidades e inferência es-
tatística. A curtose mede o grau de achatamento ou alongamento de uma distribuição, em relação a uma
distribuição padrão, denominada curva normal.

2 Associação Educacional Dom Bosco - Estatística e probabilidade - Uanderson Rebula de Oliveira

17
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Coeficiente de curtose

O grau de curtose de uma distribuição de frequências pode ser calculado por meio da equação.

Portanto, para encontrar o coeficiente de curtose é necessário conhecimento e aplicação das medidas
de ordenamento, no caso, do quartil e percentil.

Medidas de Variabilidade

ANÁLISE MULTIVARIADA

Em qualquer decisão que tomamos em nossas vidas, sempre levamos em conta um grande número de
fatores. Obviamente nem todos estes pesam da mesma maneira na hora de uma escolha. Às vezes, por
tomarmos uma decisão usando a intuição, não identificamos de maneira sistemática estes fatores. Ou
seja, não identificamos quais as variáveis que afetaram a nossa decisão.

Quando analisamos o mundo que nos cerca, identificamos que todos os acontecimentos, sejam eles
culturais ou naturais, envolvem um grande número de variáveis. As diversas ciências têm a pretensão,
de conhecer a realidade e de interpretar os acontecimentos (ciências humanas) e os fenômenos (ciên-
cias naturais), baseadas no conhecimento das variáveis intervenientes consideradas importantes nestes
eventos.

Estabelecer relações, encontrar ou propor leis explicativas é o papel próprio da ciência. Para isso é
necessário controlar, manipular, medir as variáveis que são consideradas relevantes ao entendimento do
fenômeno analisado. Muitas são as dificuldades em traduzir as informações obtidas em conhecimento.
A maior delas é de natureza epistemológica: a ciência não conhece a realidade, apenas a representa
através de modelos e teorias dos diversos ramos do conhecimento. Outra dificuldade é a aspiração de
universalidade das explicações científicas. Ora, isto implica e condiciona a pesquisa a uma “padroniza-
ção” metodológica. Um aspecto essencial desta padronização é a avaliação estatística das informações.
A maneira própria de fazer ciência, procurando reduzir a poucas variáveis, desenvolveu muito um ramo
da estatística que olha as variáveis de maneira isolada — a estatística univariada.

Análise Multivariada: análise simultânea de múltiplas variáveis em um único relacionamento ou con-


junto de relações.

- Auxilia na compreensão de comportamentos complexos no ambiente de trabalho;

- Acrescenta informações potencialmente úteis;

- Permite preservar as correlações naturais entre as múltiplas influências de comportamento sem iso-
lar qualquer indivíduo ou variável;

- Todas as variáveis devem ser aleatórias e inter-relacionadas;

- Diferentes efeitos das variáveis não podem ser interpretados de forma separada;

18
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
- Tem o propósito de medir, explicar e prever o grau de relacionamento entre combinações ponderadas
de variáveis;

- Consiste em combinações múltiplas de variáveis;

- Inclui técnicas de múltiplas variáveis.

Conceitos Básicos

A análise multivariada tem suas raízes na análise univariada e bivariada e a extensão para o domínio
multivariado introduz conceitos adicionais e questões que são particularmente relevantes.

Análise univariada: análise de distribuições de uma única variável.

Análise bivariada: classificação cruzada, correlação, análise de variância e regressão simples para
analisar duas variáveis

Tomada de decisão

- No meio educacional os indivíduos (diretores, professores, estudantes, entre outros) possuem carac-
terísticas sócio demográficas muito variadas;

- Somente pela análise multivariada as múltiplas relações podem ser analisadas;

- Todo pesquisador (profissional ou acadêmico) deve sustentar sua análise de dados em bases teóri-
cas e quantitativas.

Variável estatística

Combinação linear de variáveis, especificadas pelo pesquisador, com pesos empiricamente determina-
dos por técnicas multivariadas.

Valor da variável:

= w1X1 + w2 X 2 + w3 X 3 + ... + wn X n

Onde:

Xn é a variável observada

wn é o peso determinado pela técnica multivariada

É importante compreender a contribuição de cada variável representada no modelo.

-Variável estatística (VE)

V
E = w1X1 + w2 X 2 + w3 X 3 + ... + wn X n

A VE é um único valor determinado para atingir melhor um determinado objetivo, como em:

Regressão múltipla: melhor se correlacionar com a variável a ser predita

Análise discriminante: criar escores para cada observação que diferencie de forma máxima os grupos
de observações

Análise fatorial: VE’s que melhor representem a estrutura subjacente ou a dimensionalidade das variá-
veis representadas pelas suas intercorrelações.

19
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Escalas de medida

A análise de dados envolve a partição, identificação e medição das variações em um conjunto de


variáveis, tanto entre elas ou entre a variável dependente e uma ou mais variáveis independentes. A
palavra-chave é medição, porque o pesquisador não pode identificar uma variação a menos que ela seja
capaz de ser medida. A medida é importante para representar de forma acurada o conceito de interesse
e seu instrumental na seleção do método de análise multivariada apropriado.

Existem dois tipos básicos de dados: qualitativos (não-métricos) e quantitativos (métricos).

1) Não-métricos (qualitativos)

- Atributo

- Característica

- Propriedade categórica

2) Métricos (quantitativos)

- Quantia ou magnitude,

- Quantidade relativa

- Grau

TÉCNICAS DE ANÁLISE

Tipos de relação:

1) dependência

- Uma VD em uma única relação

- Diversas VD´s em uma única relação

- Múltiplas relações de VD´s e VI´s

2) Interdependência

- entre variáveis

- entre casos/respondentes

- entre objetos (mapeamento perceptual)

TIPOS DE TÉCNICA MULTIVARIADA

Regressão Múltipla

A regressão múltipla é o método de análise apropriado quando o problema envolve uma única variável
(métrica) dependente que se presume estar relacionada com uma ou mais (também métricas) variáveis
independentes. O objetivo da análise de regressão é prever as mudanças na variável dependente em
resposta às mudanças que ocorrem nas várias variáveis independentes. Este objetivo é quase sempre
alcançado através do método dos mínimos quadrados.

Y1 = X 1 + X 2 + X 3 + ... + X n
(métrico) (métrica, não métrica )

20
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Abordagem: método que relaciona uma única VD métrica a duas ou mais VI´s métricas ou não métri-
cas adequadamente transformadas em métricas.

Objetivo: examinar a relação entre uma VD e duas ou mais VI´s.

Passos:

- definir se o objetivo é de previsão ou de explicação

- selecionar VD e VI´s

- obter um tamanho de amostra adequado

- Verificar normalidade, linearidade, homoscedasticidade e independência dos termos de erro

- estimação do modelo de regressão

- avaliação do ajuste do modelo

- interpretação e validação dos resultados.

Análise Discriminante

Se a única variável dependente for dicotômica (por exemplo: homem-mulher) ou categórica (por exem-
plo: alto, médio, baixo) e desta forma qualitativa, a técnica multivariada apropriada é a análise discri-
minante. Assim como na regressão múltipla as variáveis independentes são por hipótese quantitativas.
A análise discriminante é útil em situações onde a amostra total pode ser dividida em grupos baseados
na variável dependente caracterizando várias classes conhecidas. O principal objetivo da análise dis-
criminante é entender diferenças entre grupos e prever a probabilidade de que uma entidade (indivíduo
ou objeto) pertença a uma classe em particular ou grupo baseado nas várias variáveis independentes.
Por exemplo, a análise discriminante pode ser usada para diferenciar inovadores de não-inovadores de
acordo com seus perfis demográficos e psicográficos. Uma outra aplicação inclui distinguir grande consu-
midores de pequenos consumidores de um determinado produto, homens de mulheres e créditos bons de
créditos ruins, etc. Até a receita federal americana utiliza a análise discriminante para comparar o paga-
mento de impostos de renda de locais selecionados com um contribuinte hipotético e para identificar os
retornos mais promissores e as áreas de auditoria.

Análise de variância multivariada

Análise de variância multivariada ou MANOVA (Multivariate Analysis of Variance) é uma técnica es-
tatística que pode ser utilizada para explorar simultaneamente o relacionamento entre várias variáveis
categóricas independentes (normalmente referenciadas como tratamentos) e duas ou mais variáveis de-
pendentes métricas. Como tal ela representa uma extensão da análise de variância univariada ou ANO-
VA (Analysis of Variance). A análise multivariada de covariância ou MANCOVA (Multivariate Analysis of
Covariance) também pode ser usada em conjunto com a MANOVA para remover, após o experimento, o
efeito de qualquer variável independente não controlável sobre as variáveis dependentes. O procedimen-
to é semelhante ao usado na avaliação do coeficiente de correlação parcial bivariado. A MANOVA é útil
quando o pesquisador projeta uma situação experimental (manipulação de várias variáveis não-métricas
ou tratamentos) para testar hipóteses com respeito a variância em grupos de resposta em duas ou mais
variáveis dependentes métricas.

21
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Correlação canônica

Análise canônica de correlação pode ser vista como uma extensão lógica da análise de regressão
múltipla. Lembre-se que análise de regressão múltipla envolve uma única variável dependente métrica
e várias variáveis independentes também métricas. Na correlação canônica o objetivo é correlacionar
simultaneamente várias variáveis dependentes métricas com várias variáveis independentes também
métricas. Enquanto a regressão múltipla envolve uma única variável dependente, a correlação canônica
envolve múltiplas variáveis dependentes. O princípio subjacente é desenvolver uma combinação linear
de cada conjunto de variáveis (tanto dependentes quanto independentes) para maximizar a correlação
entre os dois conjuntos. Em outras palavras, o procedimento envolve obter um conjunto de pesos para as
variáveis dependentes e independentes que forneçam a correlação simples máxima entre o conjunto das
variáveis dependentes e as independentes.

Modelos lineares de probabilidade (LOGIT)

A técnica do modelo linear de probabilidade também conhecida como análise de logit é uma combina-
ção de regressão múltipla e análise discriminante múltipla. Ela é semelhante a análise de regressão múl-
tipla no sentido de que uma ou mais variáveis independentes são utilizadas para prever uma única variá-
vel dependente. O que distingue o modelo linear de probabilidade da regressão múltipla é que a variável
dependente é não-métrica como na análise discriminante. A escala não-métrica da variável dependente
requer uma abordagem diferenciada na estimação e nas hipóteses sobre a distribuição subjacente, mas
em muitas outras características é semelhante à regressão múltipla. Desta forma, uma vez que a variável
dependente seja corretamente especificada e a técnica de estimação apropriada seja empregada, os fa-
tores básicos considerados na regressão múltipla serão utilizadas aqui da mesma forma. O modelo linear
de probabilidade se diferencia da análise discriminante primeiramente porque ele acomoda qualquer tipo
de variável independente (tanto métricas quanto não-métricas) e não necessita da hipótese de normali-
dade multivariada. No entanto, em muitas situações, particularmente com mais de dois níveis na variável
dependente a análise discriminante é uma técnica mais apropriada.

Modelagem de equações estruturais

A modelagem por equações estruturais muitas vezes denominada LISREL (que é o nome de um dos
pacotes de software mais populares), é uma técnica que permite separar relacionamentos para cada um
dos conjuntos de variáveis dependentes. Em termos simples, a técnica fornece um método de estimação
apropriado e eficiente para uma série de equações de regressões múltiplas separadas serem estimadas
simultaneamente. Ela é caracterizada por duas componentes básicas:

(1) O modelo estrutural e

(2) O modelo de medida.

O modelo estrutural é o caminho que relaciona as variáveis dependentes e independentes. Em tais


situações, teoria, experiência prévia e outros indicativos permitem que o analista distingue que variável
independente estima que variável dependente. Os modelos vistos anteriormente que acomodam múlti-
plas variáveis dependentes (análise de variância multivariada e correlação canônica) não são apropria-
dos nesta situação porque eles permitem uma única relação entre as variáveis dependentes e indepen-
dentes.

22
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Y1 = X 1 + X 12 + X 13 + ... + X 1n
Y2 = X 21 + X 2 + X 23 + ... + X 2 n
..................................................
Ym = X m1 + X m 2 + X m 3 + ... + X mn
(métrico) (métrica, não métrica )

Abordagem: método que permite separar relações para cada conjunto de VD’s. Fornece uma estima-
ção mais apropriada e mais eficiente para uma série de equações de regressão múltipla.

Objetivo: estimar simultaneamente um conjunto de relações entre duas ou mais VD´s e duas ou mais
VI´s.

Passos:

- especificar o modelo teórico (relações causais)

- construir um diagrama de caminhos

- traduzir o diagrama de caminhos em equações estruturais

- especificar o modelo de mensuração

- identificar correlações de construtos e indicadores

- Escolher o tipo de matriz de entrada de dados

- avaliar a identificação, estimativas e ajuste do modelo

- interpretação e validação dos resultados.

Análise Conjunta

A análise conjunta é uma técnica dependente emergente que criou novas formas de avaliação de
objetos, tanto se forem produtos quanto se forem serviços ou ideias. A aplicação mais direta é no desen-
volvimento de novos produtos e serviços, permitindo a avaliação de produtos complexos enquanto man-
tém um contexto realístico de decisão para o respondente. O analista de marketing é capaz de avaliar
a importância dos atributos bem como dos níveis de cada atributo enquanto que os consumidores ava-
liam somente uns poucos perfis de produtos, que são combinações de níveis de produtos. Por exemplo,
suponha um conceito de produto com três atributos (preço, qualidade e cor), cada um com três possíveis
níveis (por exemplo, vermelho, amarelo e azul). Ao invés de precisar avaliar todas as 27 (3.3.3) possíveis
combinações, um subconjunto (9 ou mais) pode ser avaliado pela sua atratividade para o consumidor e
o analista sabe, não somente quão importante é cada atributo, mas também a importância de cada nível
(a atração do vermelho versus amarelo versus azul). Além disso, quando a avaliação do consumidor é
completada, os resultados da análise conjunta podem também ser usados em simuladores de projetos
de produtos, que mostram a aceitação do consumidor para qualquer número de produtos formulados e
ajudam no projeto do produto ótimo.

Y1 = X 1 + X 2 + X 3 + ... + X n
(não métrica, métrica ) (não métrica )

23
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Abordagem: é uma técnica multivariada usada especificamente para entender como os respondentes
desenvolvem preferências por produtos, serviços ou ideias, combinando quantias separadas de valor
fornecidas por cada atributo.

Objetivo:

- examinar a relação entre uma VD e duas ou mais VI´s

- determinar a contribuição de VI´s

- estabelecer um modelo de julgamentos do consumidor

Passos:

- construir um conjunto de produtos ou serviços reais ou hipotéticos combinando níveis selecionados


de cada atributo

- apresentar as combinações a um conjunto de respondentes para avaliação geral (escolher entre um


conjunto de produtos

- verificar a adequação da forma do modelo e da representatividade da amostra

- selecionar técnica de estimação e avaliar o ajuste

- interpretar e validar os resultados.

TÉCNICAS DO TIPO CORRELAÇÃO

Análise Fatorial

Análise de fatores, incluindo as variações tais como a análise de componentes e a análise de fatores
comuns é uma abordagem estatística que pode ser utilizada para analisar interpelações entre um grande
grupo de variáveis e para explicar estas variáveis em termos de fatores subjacentes comuns. O objetivo é
encontrar uma forma de condensar a informação contida em um determinado número de variáveis origi-
nais em um conjunto menor de variates (fatores) com perda mínima de informação.

Abordagem: analisar a estrutura das intercorrelações entre um número de variáveis explicáveis em


termos de dimensões latentes comuns denominadas fatores.

Todas as variáveis são consideradas simultaneamente para análise.

Objetivo:

- resumir e reduzir dados

- identificar estrutura de relações entre variáveis

Passos:

- definir se a análise é exploratória ou confirmatória

- calcular a matriz de correlações para especificar o agrupamento de variáveis

- analisar a matriz de correlações

- analisar a adequação da amostra

- determinar os fatores e o ajuste geral pelo método de fatores comuns ou de componentes princi-
pais.

24
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Análise de Agrupamentos ou Conglomerados

A análise de conglomerados é uma técnica analítica para encontrar subgrupos significativos de in-
divíduos ou objetos. Especificamente, o objetivo é classificar uma amostra de entidades (indivíduos ou
objetos) em um número pequeno de grupos mutuamente exclusivos. Na análise de conglomerados, dife-
rentemente da análise discriminante, os grupos não são pré-definidos. Ao invés a técnica é usada para
identificar os grupos.

Abordagem: classificar uma amostra de indivíduos ou objetos em grupos mutuamente excludentes


com base na similaridade dos indivíduos ou objetos. É uma classificação de acordo com relações natu-
rais. Semelhante à análise fatorial que agrega variáveis, em análise de agrupamentos se agrega indiví-
duos ou objetos.

Objetivo:

- encontrar subgrupos significativos de indivíduos ou objetos

- estabelecer o perfil das pessoas ou variáveis

- Os grupos não são pré-definidos, são identificados na análise.

Passos:

- medir a similaridade ou associação entre sujeitos para determinar o número de grupos.

- agrupar os sujeitos ou objetos

- estabelecer o perfil das pessoas ou variáveis

Escalonamento multidimensional

Na redução multidimensional o objetivo é transformar julgamentos de semelhança ou preferência (por


exemplo, preferência por lojas ou marcas) em distâncias representadas no espaço multidimensional. Se
objetos A e B são julgados por respondentes como sendo os mais semelhantes comparados com todos
os demais pares de objetos, a técnica posicionará os objetos A e B de forma que a distância entre eles
no espaço multidimensional seja menor do que a distância entre quaisquer outros pares de objetos. O
mapa perceptivo resultante mostra a posição relativa de todos os objetos, mas análises adicionais serão
necessárias para descobrir que atributos foram usados para estabelecer a posição de cada objeto.

Abordagem: determinar a imagem relativa percebida de um conjunto de objetos (itens associados a


percepções comumente consideradas como produto, serviço, imagem, aroma). Transforma julgamentos
de consumidores quanto à similaridade ou preferência em distâncias representadas em espaço multidi-
mensional (mapa perceptual).

Objetivo:

- explorar e identificar dimensões não reconhecidas que afetam o comportamento.

- obter avaliações comparativas de objetos quando as bases específicas de comparação são desco-
nhecidas ou identificadas.

Passos:

- identificar todos os objetos relevantes

25
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
- escolher entre dados de similaridade ou de preferência

- selecionar uma análise agregada ou desagregada

Análise de Correspondência

A análise de correspondência é uma técnica interdependente recentemente desenvolvida para facilitar


tanto a redução dimensional da posição em uma escala (por exemplo, produtos, pessoas, etc.) em um
conjunto de atributos quanto o mapa perceptível destes objetos relativos a estes atributos. Os analistas
estão constantemente enfrentando o problema de “quantificar” os dados qualitativos encontrados em
variáveis nominais. A análise de correspondência difere de outras técnicas interdependentes discutidas
anteriormente na habilidade para acomodar tanto dados não-métricos quanto relacionamentos não-linea-
res.

Abordagem: É uma técnica multivariada de interdependência entre objetos, composicional baseada


na associação entre objetos e um conjunto de características descritivas ou atributos especificados pelo
pesquisador.

Objetivo:

- redução dimensional da classificação dos sujeitos ou objetos em conjunto de atributos.

- mapeamento perceptual desses sujeitos ou objetos relativo a um conjunto de atributos.

- Acomoda dados não métricos e relações não lineares.

Passos:

- organiza tabelas de contingência, isto é, tabelas cruzadas de duas variáveis categóricas

- transforma dados não métricos em métricos

- reduz dimensão

- faz mapeamento perceptual

26
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Noções Básicas de Probabilidades

Probabilidade

A teoria das probabilidades surgiu no século XVI, com o estudo dos jogos de azar, tais como jogos de
cartas e roleta. Atualmente ela está intimamente relacionada com a Estatística e com diversos ramos do
conhecimento.

Definições3:

A teoria da probabilidade é o ramo da Matemática que cria e desenvolve modelos matemáticos para
estudar os experimentos aleatórios. Alguns elementos são necessários para efetuarmos os cálculos pro-
babilísticos.

— Experimentos aleatórios: fenômenos que apresentam resultados imprevisíveis quando repetidos,


mesmo que as condições sejam semelhantes.

Exemplos:

a) lançamento de 3 moedas e a observação das suas faces voltadas para cima

3 FILHO, Begnino Barreto; SILVA,Claudio Xavier da – Matemática – Volume Único - FTD

IEZZI, Gelson – Matemática – Volume Único

BUCCHI, Paulo – Curso prático de Matemática – Volume 2 – 1ª edição - Editora Moderna

27
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
b) jogar 2 dados e observar o número das suas faces

c) abrir 1 livro ao acaso e observar o número das suas páginas.

— Espaço amostral: conjunto de todos os resultados possíveis de ocorrer em um determinado experi-


mento aleatório. Indicamos esse conjunto por uma letra maiúscula: U, S, A, Ω ... variando de acordo com
a bibliografia estudada.

Exemplo:

a) quando lançamos 3 moedas e observamos suas faces voltadas para cima, sendo as faces da moe-
da cara (c) e coroa (k), o espaço amostral deste experimento é:

S = {(c,c,c); (c,c,k); (c,k,k); (c,k,c); (k,k,k,); (k,c,k); (k,c,c); (k,k,c)}, onde o número de elementos do
espaço amostral n(A) = 8

— Evento: é qualquer subconjunto de um espaço amostral (S); muitas vezes um evento pode ser ca-
racterizado por um fato. Indicamos pela letra E.

Exemplo:

a) no lançamento de 3 moedas:

E1→ aparecer faces iguais

E1 = {(c,c,c);(k,k,k)}

O número de elementos deste evento E1 é n(E1) = 2

E2→ aparecer coroa em pelo menos 1 face

E2 = {(c,c,k); (c,k,k); (c,k,c); (k,k,k,); (k,c,k); (k,c,c); (k,k,c)}

Logo n(E2) = 7

Veremos agora alguns eventos particulares:

— Evento certo: que possui os mesmos elementos do espaço amostral (todo conjunto é subconjunto
de si mesmo); E = S.

E: a soma dos resultados nos 2 dados ser menor ou igual a 12.

— Evento impossível: evento igual ao conjunto vazio.

E: o número de uma das faces de um dado comum ser 7.

E: Ø

— Evento simples: evento que possui um único elemento.

E: a soma do resultado de dois dados ser igual a 12.

E: {(6,6)}

28
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
— Evento complementar: se E é um evento do espaço amostral S, o evento complementar de E indi-
cado por C tal que C = S - E. Ou seja, o evento complementar é quando E não ocorre.

E1: o primeiro número, no lançamento de 2 dados, ser menor ou igual a 2.

E2: o primeiro número, no lançamento de 2 dados, ser maior que 2.

S: espaço amostral é dado na tabela abaixo:

E: {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3) (2,4), (2,5), (2,6)}

Como, C = S - E

C = {(3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4),
(5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}

— Eventos mutuamente exclusivos: dois ou mais eventos são mutuamente exclusivos quando a ocor-
rência de um deles implica a não ocorrência do outro. Se A e B são eventos mutuamente exclusivos,
então: A ∩ B = Ø.

Sejam os eventos:

A: quando lançamos um dado, o número na face voltada para cima é par.

A = {2,4,6}

B: quando lançamos um dado, o número da face voltada para cima é divisível por 5.

B = {5}

Os eventos A e B são mutuamente exclusivos, pois A ∩ B = Ø.

Probabilidade em espaços equiprováveis

Considerando um espaço amostral S, não vazio, e um evento E, sendo E ⊂ S, a probabilidade de


ocorrer o evento E é o número real P (E), tal que:

Sendo 0 ≤ P(E) ≤ 1 e S um conjunto equiprovável, ou seja, todos os elementos têm a mesma “chance
de acontecer.

Onde:

n(E) = número de elementos do evento E.

n(S) = número de elementos do espaço amostral S.

29
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Exemplo:

Lançando-se um dado, a probabilidade de sair um número ímpar na face voltada para cima é obtida
da seguinte forma:

S = {1, 2, 3, 4, 5, 6} n(S) = 6

E = {1, 3, 5} n(E) = 3

Probabilidade da união de dois eventos

Vamos considerar A e B dois eventos contidos em um mesmo espaço amostral A, o número de ele-
mentos da reunião de A com B é igual ao número de elementos do evento A somado ao número de ele-
mentos do evento B, subtraindo o número de elementos da intersecção de A com B.

Sendo n(S) o número de elementos do espaço amostral, vamos dividir os dois membros da equação
por n(S) a fim de obter a probabilidade P (A U B).

P (A U B) = P(A) + P(B) - P (A ∩ B)

Para eventos mutuamente exclusivos, onde A ∩ B = Ø, a equação será:

P (A U B) = P(A) + P(B)

30
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Exemplo:

A probabilidade de que a população atual de um país seja de 110 milhões ou mais é de 95%. A proba-
bilidade de ser 110 milhões ou menos é de 8%. Calcule a probabilidade de ser 110 milhões.

Sendo P(A) a probabilidade de ser 110 milhões ou mais: P(A) = 95% = 0,95

Sendo P(B) a probabilidade de ser 110 milhões ou menos: P(B) = 8% = 0,08

P (A ∩ B) = a probabilidade de ser 110 milhões: P (A ∩ B) = ?

P (A U B) = 100% = 1

Utilizando a regra da união de dois eventos, temos:

P (A U B) = P(A) + P(B) - P (A ∩ B)

1 = 0,95 + 0,08 - P (A ∩ B)

P (A ∩ B) = 0,95 + 0,08 - 1

P (A ∩ B) = 0,03 = 3%

Probabilidade condicional

Vamos considerar os eventos A e B de um espaço amostral S, definimos como probabilidade condicional do


evento A, tendo ocorrido o evento B e indicado por P( ) ou , a razão:

Lemos P (A | B) como: a probabilidade de A “dado que” ou “sabendo que” a probabilidade de B.

Exemplo:

No lançamento de 2 dados, observando as faces de cima, para calcular a probabilidade de sair o nú-
mero 5 no primeiro dado, sabendo que a soma dos 2 números é maior que 7.

Montando temos:

S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4),
(3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3),
(6,4), (6,5), (6,6)}

Evento A: o número 5 no primeiro dado.

A = {(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)}

Evento B: a soma dos dois números é maior que 7.

B = {(2,6), (3,5), (3,6), (4,4), (4,5), (4,6), (5,3), (5,4), (5,5), (5,6), (6,2), (6,3), (6,4), (6,5), (6,6)}

A ∩ B = {(5,3), (5,4), (5,5), (5,6)}

P (A ∩ B) = 4/36

P(B) = 15/36

Logo:

31
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Probabilidade de dois eventos simultâneos (ou sucessivos)

A probabilidade de ocorrer P (A ∩ B) é igual ao produto de um deles pela probabilidade do outro em


relação ao primeiro. Isto significa que, para se avaliar a probabilidade de ocorrem dois eventos simul-
tâneos (ou sucessivos), que é P (A ∩ B), é preciso multiplicar a probabilidade de ocorrer um deles P(B)
pela probabilidade de ocorrer o outro, sabendo que o primeiro já ocorreu P (A | B).

Sendo:

— Eventos independentes: dois eventos A e B de um espaço amostral S são independentes quando


P(A|B) = P(A) ou P(B|A) = P(B). Sendo os eventos A e B independentes, temos:

P (A ∩ B) = P(A). P(B)

Exemplo:

Lançando-se simultaneamente um dado e uma moeda, determine a probabilidade de se obter 3 ou 5


na dado e cara na moeda.

Sendo, c = coroa e k = cara.

S = {(1,c), (1,k), (2,c), (2,k), (3,c), (3,k), (4,c), (4,k), (5,c), (5,k), (6,c), (6,k)}

Evento A: 3 ou 5 no dado

A = {(3,c), (3,k), (5,c), (5,k)}

Evento B: cara na moeda

B = {(1,k), (2,k), (3,k), (4,k), (5,k), (6,k)}

Os eventos são independentes, pois o fato de ocorrer o evento A não modifica a probabilidade de
ocorrer o evento B. Com isso temos:

P (A ∩ B) = P(A). P(B)

32
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Observamos que A ∩ B = {(3,k), (5,k)} e a P (A ∩ B) poder ser calculada também por:

No entanto nem sempre chegar ao n(A ∩ B) nem sempre é fácil dependendo do nosso espaço amos-
tral.

Lei Binomial de probabilidade

Vamos considerar um experimento que se repete n número de vezes. Em cada um deles temos:

P(E) = p, que chamamos de probabilidade de ocorrer o evento E com sucesso.

P( ) = 1 - p, probabilidade de ocorrer o evento E com insucesso (fracasso).

A probabilidade do evento E ocorrer k vezes, das n que o experimento se repete é dado por uma lei
binomial.

A probabilidade de ocorrer k vezes o evento e (n - k) vezes o evento é o produto: pk . (1 - p)n - k

As k vezes do evento E e as (n - k) vezes do evento podem ocupar qualquer ordem. Então, precisamos consi-
derar uma permutação de n elementos dos quais há repetição de k elementos e de (n - k) elementos, em outras
palavras isso significa:

logo a probabilidade de ocorrer k vezes o evento E no n experimentos é dada:

A lei binomial deve ser aplicada nas seguintes condições:

— O experimento deve ser repetido nas mesmas condições as n vezes.

— Em cada experimento devem ocorrer os eventos E e .

— A probabilidade do E deve ser constante em todas as n vezes.

— Cada experimento é independente dos demais.

33
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Exemplo:

Lançando-se uma moeda 4 vezes, qual a probabilidade de ocorrência 3 caras?

Está implícito que ocorrerem 3 caras deve ocorrer uma coroa. Umas das possíveis situações, que
satisfaz o problema, pode ser:

Temos que:

n=4

k=3

Logo a probabilidade de que essa situação ocorra é dada por:

, como essa não é a única situação de ocorre 3 caras e 1 coroa. Vejamos:

Podemos também resolver da seguinte forma: maneiras de ocorrer o produto , portanto:

34
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Amostragem – Principais Tipos de Amostras

Técnicas de amostragem

É uma técnica especial para recolher amostras, que garante, tanto quanto possível, o acaso na esco-
lha. Ela pode ser:

Amostragem Probabilística (aleatória): A probabilidade de um elemento da população ser escolhido é


conhecida. Cada elemento da população passa a ter a mesma chance de ser escolhido.

Amostragem casual ou aleatória simples: este tipo de amostragem se assemelha ao sorteio lotérico.
Ela pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dis-
positivo aleatório qualquer, k números dessa sequência, os quais serão pertentes à amostra.

Exemplo: 15% dos alunos de uma população de notas entre 8 e 10, serão sorteados para receber uma
bolsa de estudos de inglês.

Vantagens: Desvantagens:
- Facilidade de cálculo - Requer listagem da
estatístico; população;
- Probabilidade elevada de - Trabalhosa em
compatibilidade dos dados populações elevadas;
da amostra e da população - Custos elevados se a
dispersão da amostra for
elevada.

Amostragem sistemática: Assemelha-se à amostragem aleatória simples, porque inicialmente enume-


ram-se as unidades da população. Mas difere da aleatória porque a seleção da amostra é feita por um
processo periódico pré-ordenado.

Amostragem proporcional estratificada: muitas vezes a população se divide em subpopulações – es-


tratos, então classificamos a população em, ao menos dois estratos, e extraímos uma amostra de cada
um. Podemos determinar características como sexo, cor da pele, faixa etária, entre outros.

Vantagens: Desvantagens:
- Pressupõe um erro de - Necessita de maior
amostragem menor; informação sobre a
- Assegura uma boa população;
representatividade das - Cálculo estatístico mais
variáveis estratificadas; complexo.
- Podem empregar-se
metodologias diferentes
para cada estrato;
- Fácil organização do
trabalho de campo.

Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos


(conglomerados) na população.

35
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Vantagens: Desvantagens:
- Não existem listagem de - Maior erro de
toda a população; amostragem;
- Concentra os trabalhos - Cálculo estatístico mais
de campo num número complexo na estimação do
limitado de elementos da erro de amostragem.
população.

Amostragem Não-probabilística (não aleatória): Não se conhece a probabilidade de um elemento ser


escolhido para participar da amostra.

Amostragem por cotas: consiste em uma amostragem por julgamento que ocorre em suas etapas. Em
um primeiro momento, são criadas categorias de controle dos elementos da população e, a seguir, sele-
cionam-se os elementos da amostra com base em um julgamento.

Amostragem por julgamento: Essa amostragem é ideal quando o tamanho da população é pequeno e
suas características, bem conhecidas, pois baseia-se no julgamento pessoal.

Amostragem por conveniência: é uma amostra composta de indivíduos que atendem os critérios de
entrada e que são de fácil acesso do investigador. Para o critério de seleção arrolamos uma amostra con-
secutiva.

Vantagens: Desvantagens:
- Mais econômica; - Maior erro de amostragem
- Fácil administração; que em amostras
- Não necessita de listagem aleatórias;
da população. - Não existem metodologias
válidas para o cálculo do
erro de amostragem;
- Limitação representativa;
- Maior dificuldade de
controle de trabalho de
campo

36
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Exercícios

1. (Banco do Brasil – Escriturário - CESGRANRIO - 2018) Um professor elaborou 10 questões diferen-


tes para uma prova, das quais 2 são fáceis, 5 são de dificuldade média, e 3 são difíceis. No momento,
o professor está na fase de montagem da prova. A montagem da prova é a ordem segundo a qual as 10
questões serão apresentadas. O professor estabeleceu o seguinte critério de distribuição das dificulda-
des das questões, para ser seguido na montagem da prova:

De quantas formas diferentes o professor pode montar a prova seguindo o critério estabelecido?

(A) 2520

(B) 128

(C) 6

(D) 1440

(E) 252

2. (Banco do Brasil – Escriturário - CESGRANRIO - 2018) Numa amostra de 30 pares de observações


do tipo (xi , yi ), com i = 1, 2, ..., 30, a covariância obtida entre as variáveis X e Y foi -2. Os dados foram
transformados linearmente da forma (zi , wi ) = (-3xi + 1 , 2yi + 3), para i = 1, 2, ..., 30.

Qual o valor da covariância entre as variáveis Z e W transformadas?

(A) 41

(B) 36

(C) -7

(D) 12

(E) 17

3. (Banco do Brasil – Escriturário - CESPE – 2018) Um pesquisador utilizou-se de um modelo de


regressão linear simples para estudar a relação entre a variável dependente Y, expressa em reais, e a
variável independente X, expressa em dias.

37
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
Posteriormente, ele decidiu fazer uma transformação na variável dependente Y da seguinte forma:

Após a referida transformação, o coeficiente angular ficou

(A) aumentado da média e multiplicado pelo desvio padrão

(B) diminuído da média e dividido pelo desvio padrão

(C) inalterado

(D) diminuído da média

(E) dividido pelo desvio padrão

4. (TJ-PA - Analista Judiciário – Estatística - CESPE – 2020) A tabela a seguir apresenta dados refe-
rentes às idades dos funcionários de determinada empresa. Nessa tabela, a população da empresa está
dividida em 8 estratos, conforme determinados intervalos de idade.

A partir dessas informações, assinale a opção correta.

(A) A Uma amostra estratificada de 100 elementos que seja selecionada com base na alocação pro-
porcional será composta por menos de 15 homens com idade entre 20 e 30 anos.

(B) Considerando-se um erro amostral tolerável de 4%, o tamanho mínimo de uma amostra aleatória
simples deve ser inferior a 162.

(C) Se uma amostra estratificada de 120 elementos for selecionada com base na alocação proporcio-
nal, então mais da metade dos elementos dessa amostra serão homens.

(D) Uma amostra estratificada de 112 elementos que seja selecionada com base na alocação uniforme
será composta por 55 homens e 57 mulheres.

(E) Considerando-se um erro amostral tolerável de 5%, o tamanho mínimo de uma amostra aleatória
simples deve ser igual a 142.

5. (TJ-PA - Analista Judiciário – Estatística - CESPE – 2020) Uma pesquisa foi realizada em uma
população dividida em dois estratos, A e B. Uma amostra da população foi selecionada utilizando-se a
técnica de amostragem estratificada proporcional, em que cada estrato possui um sistema de referências
ordenadas. A seguir, são apresentadas as formas como as unidades populacionais de A e de B foram
selecionadas, respectivamente.

38
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
• A primeira unidade populacional selecionada do estrato A foi a terceira. Em seguida, cada unidade
populacional foi selecionada a partir da primeira, adicionando-se 5 unidades. Dessa forma, a segunda
unidade selecionada foi a oitava, e assim por diante, até a obtenção de 10 unidades populacionais.

• A primeira unidade populacional selecionada do estrato B foi a quarta. Após, cada unidade popula-
cional foi selecionada a partir da primeira, adicionando-se 6 unidades. Dessa forma, a segunda unidade
selecionada foi a décima, e assim por diante, até a obtenção de 7 unidades populacionais.

A partir dessas informações, é correto afirmar que

(A) a população possui, no mínimo, 88 elementos.

(B) a técnica de amostragem aleatória simples foi utilizada para selecionar a amostra de cada estra-
to.

(C) a amostra possui, no mínimo, 92 unidades populacionais.

(D) o estrato B possui mais unidades populacionais que o estrato A.

(E) o intervalo de amostragem no estrato A possui amplitude maior que o intervalo de amostragem no
estrato B.

6. (TJ-PA - Analista Judiciário – Estatística - CESPE – 2020) Ao analisar uma amostra aleatória sim-
ples composta de 324 elementos, um pesquisador obteve, para os parâmetros média amostral e variân-
cia amostral, os valores 175 e 81, respectivamente.

Nesse caso, um intervalo de 95% de confiança de μ é dado por

(A) (166,18; 183,82).

(B) (174,02; 175,98).

(C) (174,51; 175,49).

(D) (163,35; 186,65).

(E) (174,1775; 175,8225).

7. (TJ-PA - Analista Judiciário – Estatística - CESPE – 2020) Para realizar uma pesquisa a respeito
da qualidade do ensino de matemática nas escolas públicas de um estado, selecionaram aleatoriamente
uma escola de cada um dos municípios desse estado e aplicaram uma mesma prova de matemática a
todos os estudantes do nono ano do ensino fundamental de cada uma dessas escolas.

Nesse caso, foi utilizada a amostragem

(A) sistemática.

(B) aleatória simples.

(C) por conglomerados em um estágio.

(D) por conglomerados em dois estágios.

(E) estratificada.

8. (TJ-PA - Analista Judiciário – Estatística - CESPE – 2020) Uma fábrica de cerveja artesanal possui
uma máquina para envasamento regulada para encher garrafas de 800 mL. Esse mesmo valor é utilizado
como média µ, com desvio padrão fixo no valor de 40 mL. Com o objetivo de manter um padrão elevado
de qualidade, periodicamente, é retirada da produção uma amostra de 25 garrafas para se verificar se

39
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
o volume envazado está controlado, ou seja, com média µ = 800 mL. Para os testes, fixa-se o nível de
significância α = 1%, o que dá valores críticos de z de - 2,58 e 2,58.

Com base nessas informações, julgue os seguintes itens.

I É correto indicar como hipótese alternativa H1: µ # 800 mL, pois a máquina poderá estar desregulada
para mais ou para menos.

II Caso uma amostra apresente média de 778 mL, os técnicos poderão parar a produção para a reali-
zação de nova regulagem, pois tal valor está dentro da região crítica para o teste.

III A produção não precisaria ser paralisada caso uma amostra apresentasse média de 815 mL, pois
este valor está fora da região crítica para o teste.

Assinale a opção correta.

(A) Apenas o item I está certo.

(B) Apenas o item II está certo.

(C) Apenas os itens I e III estão certos.

(D) Apenas os itens II e III estão certos.

(E) Todos os itens estão certos.

9. (TJ-PA - Analista Judiciário – Estatística - CESPE – 2020) O teste de hipóteses se assemelha ao


julgamento de um crime. Em um julgamento, há um réu, que inicialmente se presume inocente. As provas
contra o réu são, então, apresentadas, e, se os jurados acham que são convincentes, sem dúvida algu-
ma, o réu é considerado culpado. A presunção de inocência é vencida.

Michael Barrow. Estatística para economia, contabilidade e

administração. São Paulo: Ática, 2007, p. 199 (com adaptações).

João foi julgado culpado pelo crime de assassinato e condenado a cumprir pena de 20 anos de re-
clusão. Após 10 anos de prisão, André, o verdadeiro culpado pelo delito pelo qual João fora condenado,
confessou o ilícito e apresentou provas irrefutáveis de que é o verdadeiro culpado, exclusivamente.

Considerando a situação hipotética apresentada e o fragmento de texto anterior, julgue os itens que se
seguem.

I Pode-se considerar que a culpa de João seja uma hipótese alternativa.

II No julgamento, ocorreu um erro conhecido nos testes de hipótese como erro do tipo I.

III Se a hipótese nula fosse admitida pelos jurados como verdadeira e fosse efetivamente João o cul-
pado pelo crime, o erro cometido teria sido o chamado erro do tipo II.

Assinale a opção correta.

(A) Apenas o item I está certo.

(B) Apenas o item II está certo.

(C) Apenas os itens I e III estão certos.

(D) Apenas os itens II e III estão certos.

(E) Todos os itens estão certos.

40
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO
10. (TJ-PA - Analista Judiciário – Estatística- CESPE – 2020) Para determinado experimento, uma
equipe de pesquisadores gerou 20 amostras de tamanho n = 25 de uma distribuição normal, com média
µ = 5 e desvio padrão σ = 3. Para cada amostra, foi montado um intervalo de confiança com coeficiente
de 0,95 (ou 95%). Com base nessas informações, julgue os itens que se seguem.

I Os intervalos de confiança terão a forma βi ± 1,176, em que βi é a média da amostra i.

II Para todos os intervalos de confiança, βi + µ βi - , sendo g a margem de erro do estimador.

III Se o tamanho da amostra fosse maior, mantendo-se fixos os valores do desvio padrão e do nível de confiança,
haveria uma redução da margem de erro .

Assinale a opção correta.

(A) Apenas o item II está certo.

(B) Apenas os itens I e II estão certos.

(C) Apenas os itens I e III estão certos.

(D) Apenas os itens II e III estão certos

(E) Todos os itens estão certos.

GABARITO

1 D
2 D
3 E
4 E
5 A
6 B
7 C
8 E
9 E
10 C

41
1742347 E-book gerado especialmente para RODRIGO DOS SANTOS FAUSTINO

Você também pode gostar