Você está na página 1de 83

ESTATÍSTICA

Professora Ma. Fernanda Silva Brandão


UNIDADE TEMÁTICA 1 –
Introdução à Estatística:
Conceitos e planejamentos
intrínsecos à Coleta de Dados

1. Conceitos fundamentais
da Estatística

2. Divisão da Estatística

3. Fases do método
Estatístico

Imagem do banco de imagem do sistema


do computador
Professora Fernanda Brandão
1. CONCEITOS FUNDAMENTAIS DA
ESTATÍSTICA

A Ciência Estatística
Inicialmente devemos entender
que a Ciência Estatística se utiliza
de uma linguagem numérica
matemática, na qual faz deduções
a partir das uma parte (amostra),
para o todo (população).

Professora Fernanda Brandão


Imagens do banco de dados do programa
PowerPoint
Aludimos ao conceito de
Estatística como:

• A ciência que se ocupa de


decisões num contexto de
“variabilidade e incerteza”

• A Estatística é o segmento da
ciência responsável pela coleta,
organização e interpretação de dados
experimentais e pela extrapolação dos
resultados da amostra para a
população.

Imagens do banco de dados do programa Professora Fernanda Brandão


PowerPoint
Podemos executar um estudo Estatístico
de dois modos:

a) Investigando todos elementos do conjunto


de dados, que é a População.

Ex: A produção completa de uma fábrica de


lâmpadas.
A este método, dá-se o nome de Censo.

b) Investigando um subconjunto do conjunto de


dados ou da População, ao qual
denominamos conjunto amostral.

Ex: Da produção completa de uma fábrica de


lâmpadas, investiga-se apenas um lote
produzido.

A este método dá-se o nome de pesquisa por


Amostragem.
Professora Fernanda Brandão Imagens do banco de dados do programa
PowerPoint
2. Divisão da Estatística
Podemos dividir a Estatística em:
Estatística Descritiva e Estatística Indutiva
• Estatística Descritiva

A estatística visa resumir e apresentar os DADOS


observados, através de quadros, gráficos ou índices
numéricos que possibilitem a sua interpretação.

Neste contexto, suas funções são:

a) coleta de dados;

b) organização e classificação destes dados;

c) apresentação através de gráficos e tabelas;

d) cálculo de coeficientes (estatísticos), que permitem


descrever resumidamente os fenômenos.

Imagens do banco de dados do programa


PowerPoint Professora Fernanda Brandão
• Estatística Indutiva

Na estatística indutiva, estudamos uma


AMOSTRA de uma POPULAÇÃO, e à
partir desta, fazemos generalizações para
a população, com fundamento na teoria
das probabilidades.

Professora Fernanda Brandão


Imagens do banco de dados do programa
PowerPoint
3. Fase do método estatístico
Quando você tiver em mente a realização de um trabalho estatístico, você
deve considerar as seguintes etapas:

Diagrama 1 – Fases do método estatístico

Definir o
Planejamento
problema e Organizar
e coleta dos
o público os dados
dados
alvo

Interpretar Criticar e
Tabelas e
e analisar
gráficos
apresentar os dados
os
resultados

Fonte: o autor

Professora Fernanda Brandão


• Definição do problema e o
público-alvo da pesquisa O que se
deseja
Algumas questões devem ser levantadas saber?
Quais
para nortear a recolha de dados: informações
colher?
a. O que se deseja saber?
b. Quais informações são necessárias?
A quem
c. Quais perguntas devem ser feitas? deve ser
perguntado?
d. Quais os objetivos para cada
questionamento?
e. A quem eu devo perguntar e como eu
devo perguntar?
Recolha de dados

Professora Fernanda Brandão


• Método de recolha de dados

O método de recolha é decidido de


acordo com o tipo de estudo que
você pretende desenvolver.

a) Para os estudos experimentais:

a recolha é feita a partir da


observação e registro dos dados,
quando estes resultaram da realização
de uma experiência.

Imagens do banco de dados do programa


PowerPoint

Professora Fernanda Brandão


b) Para os estudos observacionais:

a recolha pode ser feita de diversas


formas: registros já existentes (publicações
científicas, registros documentais, registros
em sites governamentais) ou através de
aplicação de inquéritos, que pode assumir
diversos modelos (questionário
autoadministrado ou entrevistas).

Imagens do banco de dados do programa Professora Fernanda Brandão


PowerPoint
• Apresentação, Caracterização e
Análise dos Resultados
A opção pelas diferentes técnicas estatísticas,
para a apresentação e caracterização dos dados,
está naturalmente associada, quer aos objetivos
do estudo, quer à natureza das variáveis.

Principais métodos de apresentação dos


dados:

a) Apresentação gráfica: representação gráfica


permite uma leitura mais rápida ainda que
global.

Imagens do banco de dados do programa


Professora Fernanda Brandão PowerPoint
b) Apresentação Tabular

Diagrama 2 – Importância da Apresentação Tabular

Nas tabelas poderão ser


A apresentação dos detectados valores
dados feita através anormais
de tabelas de correspondendo a erros
frequências no processo de recolha
ou de registro.
possibilita uma
leitura mais
pormenorizada.

Estes valores poderão pôr A detecção


em causa a destes erros é
representatividade da fundamental, pois
amostra, comprometendo a eles poderão
possibilidade de inferir o afetar
resultado para a população. profundamente a
análise posterior.

Fonte: o autor
Professora Fernanda Brandão
• Elaboração do Relatório de Estudo

A fase final consiste na redação de um


relatório no qual se apresentam:

a) os objetivos do estudo, a metodologia e


as principais conclusões;

b) as informações sobre as limitações e


insuficiências detectadas;

c) as recomendações para as contornar


limitações e insuficiências detectadas em
futuros estudos sobre a temática;

d) apresentar possíveis propostas para


continuação do trabalho desenvolvido .

Imagens do banco de dados do programa


PowerPoint
Referências

CUNHA, Gilda; MARTINS, M.ª do Rosário; SOUSA, Ricardo; OLIVEIRA, Felipa


Ferraz de. Estatística aplicada às ciências sociais. Lisboa: Lidel. 2007. 179
p.

CRESWELL, John W; CLARK, Vicki L. Plano. Pesquisa de métodos mistos.


2.ed. Porto Alegre: Penso, 2013. 288 p.

HILL, Manuela Magalhães; HILL, Andrew. Investigação por questionário.


2.ed. ver. e corr. Lisboa: Silabo. 2012. 377 p.

MELLO, Francisco Mercês de. Dicionário de estatística. 1.ed. Lisboa: Sílabo,


2014. 311 p.
UNIDADE TUNIDADE TEMÁTICA 2 – Conceitos e métodos aplicados à
Estatística descritiva 1. População ou Universo
EMÁTICA 2 – Conceitos e métodos aplicados à2. Estatística
Amostra descritiva.
3. Variável e atributo
• População ou Universo
• Amostra
• Variável e atributo
• Escala
• Dados
• Série Estatística
• Apresentação dos Dados
• Tabelas de Frequências para
Variáveis Qualitativas e
Quantitativas
• Construção de uma
distribuição de frequência
• Representações gráfica para
diferentes tipos de variáveis
• Apresentação dos Dados
Tabelas de Frequências para
Variáveis Qualitativas e
Quantitativas
imagens extraídas do banco de dados do
1. Construção de uma
Professora Fernanda Brandão programa PowerPoint distribuição de frequência
1. População ou Universo

Denominamos de População ou
Universo o conjunto finito ou
infinito de elementos, que
exibem particularidades comuns
(atributos),que sejam objetos de
um estudo estatístico.

Obs.: Note que o conceito de


população depende do objetivo
do estudo.

imagens do banco de dados do programa


PowerPoint
Professora Fernanda Brandão
• Exemplo de População ou
Universo:

• Ex.: Um biólogo que desenvolve um


estudo sobre uma espécie de abelha, a
População corresponde a todas as
abelhas da mesma espécie.

• Ex.: Uma fábrica deseja saber o


número de peças defeituosas em
determinado dia de produção, a
população corresponde a todas as
peças fabricadas neste dia.

Imagens do banco de dados do programa


PowerPoint
Professora Fernanda Brandão
2. Amostra

A amostra é um
subconjunto extraído da
População, e desta,
representa as
características em estudo.

Obs.: Quando se faz um


levantamento amostral,
existem algumas
características de
interesse na População
de onde a amostra é
coletada.

Imagens do banco de dados do programa


PowerPoint
Professora Fernanda Brandão
• Exemplo de Amostra

Ex.: Se em uma indústria de lâmpadas


deseja testar o tempo de durabilidade do
seu produto, não é conveniente que se
teste todos os lotes fabricados, pois a
lâmpadas seriam testadas até
queimarem, destruindo assim toda a
produção. Portanto, colhe-se uma
amostra destes lotes produzidos e testa-
se, a fim de inferir o resultado da amostra
testada para toda a produção
(População).

Por conseguinte, busca-se uma amostra


dessa população, significa coletar a
amostra somente peças dos lotes
produzidos.

Imagens do banco de dados do programa


PowerPoint

Professora Fernanda Brandão


3. Variável e atributo

• Atributo

Atributo é uma característica de uma


população.

Pode ser quantitativo, quando é


mensurável, e qualitativa se não
mensurável, isto é, não pode ser
expresso através de números

Sempre que a resposta for binária,


têm-se um resultado atributivo.

Ex.: quente-frio; cheio-vazio; sim-não;


pouco-muito; alto-baixo; claro-escuro.

Professora Fernanda Brandão Imagens do banco de dados do programa


PowerPoint
• Variável

É qualquer característica de
interesse de estudo que
apresenta valores não
constantes, e é medida em
cada elemento da amostra ou
população.

Obs.: As variáveis podem ter


valores numéricos ou não
numéricos.

Imagens do bancoFernanda
Professora de dados do programa
Brandão
PowerPoint
Classificação das variáveis
De acordo com os valores que um variável pode assumir, ela pode
ser classificada como quantitativa ou qualitativa.

Diagrama 1 – Classificação das variáveis

CLASSIFICAÇÃO
DAS VARIÁVEIS

Quantitativas Qualitativas

Discreta Contínua Nominal Ordinal

Fonte: o autor

Professora Fernanda Brandão


• Variável quantitativa

Chamamos de variável quantitativa,


quando essa assume valores
numéricos.

Subdividem-se em dois grupos:

a. variável quantitativa
Imagens do banco de dados do programa
PowerPoint
contínua: é uma variável que
assume todos os números
infinitos não numeráveis de
valores, pois tomam todos os
valores num certo intervalo, ou
numa união de intervalos.

Ex. precipitação atmosférica;


temperatura; peso; altura; velocidade;
deslocamento de um corpo.
Imagens do banco de dados do programa
Professora Fernanda Brandão PowerPoint
b. variável quantitativa
discreta: é a que expressa o
valor de uma contagem

Chamamos a variável aleatória de


discreta, quando o número de
valores possíveis para esta variável
for finito, ou infinito, numerável.

Ex.: número de peças com defeito


em uma linha de produção; número
de faces voltadas para cima em
quatro lançamentos de uma moeda;
número de gols em uma partida de
futebol.

Imagens do banco de dados do programa Professora Fernanda Brandão


PowerPoint
• Variável qualitativa

Dizemos que a variável é


qualitativa, quando os seus
valores descritos correspondem
a classes de nomes.

São as variáveis que medem a


qualidade do indivíduo, e pode
ser separada por categorias de
nomes.

Ex: cor de olhos; grau de


satisfação (baixa, média, alta);
profissão; religião.

Imagens do banco de dados do programa


Professora Fernanda Brandão PowerPoint
Quanto às classes das variáveis,
temos qualitativas ordinais e
qualitativas nominais.

a. Variável qualitativa ordinal: é a


que separa os indivíduos em
classes com uma determinada
ordem.

Ex.: nível de escolaridade


(fundamental, médio e superior);
hierarquia dos Oficiais superiores da
Polícia Militar( Coronel, Tenente e
Major)

Obs.: Percebe-se um encadeamento


de ordem nessas classes.

Imagens do banco de dados do programa


PowerPoint
Professora Fernanda Brandão
b. variável qualitativa nominal:
é a variável que discrimina os
indivíduos em classes, porém
não é possível estabelecer
uma ordem.

Ex.: sexo (masculino e feminino);


nacionalidade (brasileira,
argentina, chilena…); estado civil
(casado, divorciado, solteiro...)

Obs.: Para se classificar


adequadamente as variáveis, é
fundamental escolher
acertadamente a escala de

Imagens do banco de dados do programa medição para cada variável a tratar.


PowerPoint

Professora Fernanda Brandão


.
4. Escala
As diversas escalas de medidas diferem muito no que diz respeito às operações
matemáticas que, com elas, são possíveis realizar.

TIPOS DE ESCALAS DE MEDIÇÃO


É uma escala categórica, o que significa que uma
Escala
variável medida nesta escala, só poderá assumir
nominal
valores que correspondam a categorias de nomes
É a uma variável que assume igualmente categorias
Escala
de nomes, no entanto, entre elas se estabelece uma
ordinal
ordenação.
Com as mesmas características das escalas
Escala
nominal e ordinal, esta acrescenta a possibilidade
intervalar
de se determinar a distância, os diferentes pontos
da escala.
Difere das demais na medida em que acrescenta às
Escala de
suas características, o zero absoluto. Nesta escala,
razão
o zero corresponde ausência da característica a
medir.
Fonte: o autor

Professora Fernanda Brandão


.
• Aplicações das escalas de medição
Para escolhermos a escala adequada, devemos usar de critérios, devido à sua
utilidade em face ao objetivo da análise, e também, considerarmos as suas
principais limitações.
EXEMPLOS DE APLICAÇÕES

Escala Escala Escala


ordinal intervalar Escala de
nominal
razão

Nível de
Gênero: pluviosidade: Temperatura:
masculino baixo, normal, escala Celsius Peso de dois
feminino elevado. escala indivíduos
Fahrenheit

Resultado de Razão entre peso e


Escala de Likert: altura para medir o
um teste: onde as respostas Pressão
aprovado índice de massa corporal
são definidas pelos atmosférica (IMC)
reprovado números 1 a 5

Fonte: o autor

Professora Fernanda Brandão


5. Dados

Quem pretende tomar decisões ou efetuar estudos, começa normalmente por recolher as
informações que lhes parecem relevantes. Estes elementos recolhidos são compilados de
forma organizada (Rol), e chamam-se dados.

Portanto, à obtenção, reunião e registro sistemático deste elemento, com um propósito


definido, com a escolha da fonte de obtenção destas informações, que está diretamente
relacionado ao tipo do problema, escala de execução e disponibilidade de tempo e recursos,
denominamos coleta de dados. Imagem do banco de dados do programa
Professora Fernanda Brandão PowerPoint
.

CLASSIFICAÇÃO DOS DADOS

quando o número de elementos é elevado, estabelecer a


Dados
distribuição de frequências de variáveis contínuas implica em definir
agrupados
as classes para a variável em estudo.
Dados são dados quantitativos que podem tomar um número finito ou
discretos infinito numerável de valores.
Dados
designação referente a dados de natureza quantitativa.
numéricos
Dados são dados de observações que se referem a uma mesma entidade,
temporais para vários momentos ou período.
Dados são dados quantitativos que podem tomar um número infinito não
contínuos numerável de valores.
são dados que ocorrem quando, por exemplo, se procuram
Dados
determinar valores laboratoriais com métodos que só detenham
censurados
níveis acima de determinado valor.
Dados são dados de observações que dizem respeito a determinadas
seccionais entidades em certo momento ou período.
Dados de são que se referem a várias entidades e a vários momentos ou
painel período temporal.

Fonte: o autor

Professora Fernanda Brandão


• Planejamento para coleta de dados

Para coletarmos uma amostra representativa da população,


devemos fazer o planejamento, assim evitamos erros que
possam provocar prejuízos à investigação.

Portanto, faz-se necessário o levantamento de algumas


questões objetivas:

a. Qual o questionamento a ser respondido?


b. Qual a melhor forma de comunicar a resposta obtida?
c. Qual ferramenta de análise utilizar, que seja mais
apropriada na análise do dado?
d. Como levantar os dados com o mínimo de esforço e
erro?
e. Como e onde levantar os dados?
f. Quem pode fornecer as informações desejadas?
g. Qual o período temporal em que os dados serão
Imagem do banco de dados do programa
coletados? PowerPoint
Professora Fernanda Brandão
Após termos as respostas destes
questionamentos, devemos:

a. Construir uma metodologia que


assegure que todas as questões estão
definidas;

b. Coletar os dados de forma consistente e


honesta;

c. Asseverar de que existe tempo hábil


para a coleta dos dados;

d. Definir quais informações adicionais


serão necessárias para estudos futuros,
referências ou reconhecimento.

Imagem extraída do banco de dados do


programa PowerPoint
Professora Fernanda Brandão
Portanto, neste processo há uma retroalimentação de informações, e
todas as pesquisas descortinam horizontes para novas investigações.

Levantamento de Planejamento e
Hipótese coleta de dados
Descrição do Coleta qualificada
problema; de dados relevantes
para testar a
Pergunta e hipótese
hipótese.
levantada.

HIPÓTESES DADOS

COMUNICAÇÃO ANÁLISES

Resultados Análise de dados


obtidos
Descrição e análise
Exposição e de dados coletados.
avaliação dos
resultados.
Fonte: o autor
Professora Fernanda Brandão
A coleta de dados

Coleta de dados busca reunir dados após o planejamento do trabalho


pretendido.

A coleta de dados numéricos pode ser direta ou indireta.


Professora Fernanda Brandão

Instrumento da coleta direta de dados:

a. Pode ser feita sobre elementos informativos de registro obrigatório:


nascimentos e óbitos, censos demográficos e escolares;

b. ou utilizando como instrumento de recolha: observações, inquéritos


e questionários.
A coleta direta de dados
• pode ser classificada relativamente ao fator tempo ou
periodicidade em:
a. ocasional

quando feita eventualmente, a fim de atender a uma conjuntura,


uma emergência social, como no caso das epidemias.
Professora Fernanda Brandão

b. contínua

quando feita continuamente, tal como a de nascimentos e


óbitos e registro de presença dos funcionários de uma empresa.

c. periódica

quando feita em intervalos constantes de tempo, como os


censos que acontece a cada 10 anos, e as avaliações
periódicas dos discentes.

Imagem do banco de dados do programa


PowerPoint
Coleta indireta de dados

Chamamos de coleta indireta quando a

recolhemos de fontes secundárias de

informações, quando os dados já foram


Professora Fernanda Brandão

coletados, apresentados e também

publicados por alguma instituição

fidedigna.

Ex.: pode-se elencar o índice de violência

urbana, as pesquisas que se utilizam de

dados socioeconômicos, extraídos de

sites oficiais.

Imagem extraídos do banco de dados do


programa PowerPoint
• Crítica dos Dados
Os dados coletados devem ser criticados
com muito cuidado, à procura de
inconsistências, evitando erros que
possam afetar os resultados.
• Apuração dos Dados
A apuração dos dados é o processamento
dos dados colhidos, e sua ordenação
mediante seus parâmetros de
Professora Fernanda Brandão

classificação. Pode ser executado


manualmente, ou com recursos
tecnológicos.
• Exposição ou Apresentação dos
Dados
Os dados devem ser apresentados de
acordo com a sua pertinência técnica, por
meio de tabelas ou gráficos,
proporcionando clareza de compreensão
dos resultados das medidas estatísticas
auferidas.

Imagem extraídos do banco de dados do


programa PowerPoint
Análise dos resultados

Após procedermos com todas as


etapas metodológicas de recolha e
tabulação dos dados, analisamos os
resultados obtidos, por meio dos
métodos da estatística indutiva ou
inferencial, que tem por base a
lógica ou dedução, para a partir da
amostra, formularmos as conclusões
ou previsões para a população.

Professora Fernanda Brandão Imagem extraídos do banco de dados do


programa PowerPoint
6. Série Estatística

Série estatística é toda tabela que apresenta a distribuição de um conjunto de


dados quantitativos em função do tempo, do lugar, ou da categoria (fenômeno).

• Classificação das séries:

 Série temporal ou cronológica, sucessão cronológica ou de marca:


caracterizam os valores do estudo da variável em determinado espaço,
época, agrupados segundo os intervalos de tempos variáveis. Ou seja, o
tempo é variável e o lugar e o fato são fixos.

Professora Fernanda Brandão


Ex.: Série temporal ou cronológica, sucessão cronológica ou de
marca: o tempo é variável e o lugar e o fato são fixos.

Fonte: Canal Rural (2020)

Professora Fernanda Brandão


 Séries específicas ou categóricas: os valores da variável, em determinado
tempo e local, são classificados segundo especificações ou categorias.

Ex.: Séries específicas ou categóricas: fato variável, tempo e local fixos.

Fonte: CNA Brasil.org (2019)

Professora Fernanda Brandão


 Série Geográfica: apresenta como elemento variável o elemento
geográfico. O tempo e a categoria são variáveis fixas. Também é chamada
de espacial, territorial ou de localização. Descrevem os valores de
variáveis que acontecem em local, região e tempo específicos,
discriminados segundo regiões.

Ex.: Série Geográfica: o lugar varia, o tempo e o fato são fixos

Fonte: Instituto Braudel (2015)


Professora Fernanda Brandão
8. Tabelas de Frequências para Variáveis Qualitativas e Quantitativas

A distribuição de frequências constitui o método de organização de informação mais utilizado em


estatística. As tabelas descrevem a distribuição de frequências, e permitem agregar e sintetizar
grandes quantidades de informação sem perda das suas características fundamentais.

Considera-se uma amostra, de dimensão 𝑛 , constituída por indivíduos que apresentam uma
determinada característica, com 𝑘 modalidades observadas 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑘 .

Ex.: Suponha que uma pesquisa foi feita, a classificação dos alunos na disciplina de Estatística do Curso
de Física EaD na Universidade Estadual do Maranhão (UEMA) e o seguinte conjunto de dados foi
obtido: 𝑛 = 50

Dados Brutos: 24-23-22-28-35-21-23-33-34-24-21-25-36-26-22-30-32-25-26-33-34-21-31-25-31-26-25-


35-33-31.

Professora Fernanda Brandão


a. A primeira coisa que fazemos é ordenar os dados do menor para o maior, formando o rol de
dados: 21-21-21-22-22-23-23-24-25-25-25-25-26-26-26-28-30-31-31-31-32-33-33-33-34-34-34-
35-35-36.

b. Em seguida, calculamos a amplitude total ou ranger é a diferença entre o maior e o menor valor
de dados observados:

At = 𝑥𝑚á𝑥 − 𝑥𝑚𝑖𝑛

Onde:

At = Amplitude total

𝑥𝑚á𝑥 = valor máximo da amostra

𝑥𝑚𝑖𝑛 = valor mínimo da amostra

Portanto: At = 87 – 27 = 60
c. Posteriormente determine número de classes (k)

• Pela regra da Raiz Quadrada (este método é aplicado para n ≤ 100)

Para usar uma dessas fórmulas, faça 𝑛 indicar o número de dados.

O número de classes será o inteiro próximo de 𝐾, obtido pela fórmula: 𝐾 = 𝑛

𝐾= 𝑛 = 50 = 7,07 ≅ 7

Ou seja, poderiam ter sido organizados 7 classes.

• Pela Regra de Sturges (Regra do Logaritmo)

𝐾 = 1 + 3,3 log 𝑛

Aplicando ao exemplo 𝐾 = 1 + 3,3 log 50 = 6,74 ≅ 7

Os valores de 𝐾 podem ser acrescidos ou diminuídos a critério dos propósitos e méritos do


pesquisador, no geral são acrescidos ou reduzido em dois valores, acordo com o valor de 𝐾 calculado.

Professora Fernanda Brandão


d. Em seguida determina-se o tamanho do Intervalo de Classe (h)

𝑹 60
𝒉 = 𝑲 aplicando os valores já calculado na fórmula ℎ = = 8, 57 ≅ 9
7

Como colocado anteriormente, para facilitar os cálculos, é melhor arredondar esse valor. Então o
intervalo de classe terá a amplitude de 9.

e. E finalmente define-se os Limites das Classes

Os limites das classes, inferior (𝑙) e superior (L), para amplitudes de classes constantes e iguais a
𝑎𝑖 , podem ser obtidos de acordo o que se apresenta na Tabela 1.

Tabela 2.1. Determinação dos Limites de Classes


Nº da Classe Limite inferior da classe Limite Superior da Classes
Classe
1 𝑥𝑚𝑖𝑛 𝑥𝑚𝑖𝑛 + 𝑎 [𝑥𝑚𝑖𝑛 ; 𝑥𝑚𝑖𝑛 + 𝑎[

2 𝑥𝑚𝑖𝑛 + 𝑎 𝑥𝑚𝑖𝑛 + 2𝑎 [𝑥𝑚𝑖𝑛 + 𝑎; 𝑥𝑚𝑖𝑛 + 2𝑎[

3 𝑥𝑚𝑖𝑛 + 2𝑎 𝑥𝑚𝑖𝑛 + 3𝑎 [𝑥𝑚𝑖𝑛 + 2𝑎; 𝑥𝑚𝑖𝑛 + 3𝑎[

… … … …
𝑘 𝑥𝑚𝑖𝑛 + (𝑘 − 1)𝑎 𝑥𝑚𝑖𝑛 + 𝑘𝑎 [𝑥𝑚𝑖𝑛 + 𝑘 − 𝑙 𝑎; 𝑥𝑚𝑖𝑛 + 𝑘𝑎[

Fonte: adaptado de Cunha et al. (2007)

Professora Fernanda Brandão


Considerar-se-ão classes abertas à direita e fechadas à esquerda, com exceção da última
classe, na qual se poderá integrar o máximo da amostra, correspondendo ao seu limite
superior.

Limite inferior (𝑙) da primeira classe: 𝑥𝑚𝑖𝑛 = 27, e, “a ou k = 9”, como já calculado
previamente. Portanto, limite superior (L) da primeira classe 𝑥𝑚𝑖𝑛 + 𝑎, aplicando aos
dados apresentados:

27 + 9 = 36. Onde: 27 é o limite Inferior e 36 será o limite superior da primeira classe.

Depois constrói-se a segunda classe, que será de e: 36 + 9 = 45.


Onde: 36 será o limite inferior e 45 será o limite superior da segunda classe.
E assim sucessivamente, até que todos os valores amostrais sejam distribuídos em suas
respectivas classes.

Professora Fernanda Brandão


Continue o procedimento, sempre somando, ao exemplo superior que você calculou, o
intervalo de classe, como mostra a Tabela 2.
Tabela 2.2. – Determinação dos Limites de Classes para a classificação na disciplina de
estatística EaD Física (UEMA).

Nº da Classe Limite inferior da Limite superior da


Classe Classe

l𝑖 𝐿𝑖
1 [27 36 [
2 [36 45 [
3 [45 54 [
4 [54 63 [
5 [63 72 [
6 [72 81 [
7 [81 90 [
Fonte: o autor

Professora Fernanda Brandão


f. Centro de Classes ou Ponto Médio: Designa-se por 𝑐𝑖 , o centro da classe 𝑖. Este
é obtido a partir da seguinte expressão:

𝑙𝑖 + 𝐿𝑖
𝑐𝑖 =
2

Centro de Classe

𝑐𝑖
(27 + 36) / 2 = 31,50
(36 + 45) / 2 = 40,50
(45 + 54) / 2 = 49,50
(54 + 63) / 2 = 58,5
(63 + 72) / 2 = 67,50
(72 + 81) / 2 = 76,5
(81 + 90) / 2 = 85,5
-

Professora Fernanda Brandão


9. Construção de uma distribuição de frequência: a tabela de frequências para
dados classificados é análoga à construção da tabela de frequências para
dados simples.
Tabela 2.3 - Distribuição de Frequências para Variáveis Contínuas
Classes Freq. Freq. Frequências Absolutas Frequências Relativas
Absoluta Relativa Acumuladas Acumuladas
𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖

[𝑥𝑚𝑖𝑛 ; 𝑥𝑚𝑖𝑛 + 𝑎[ 𝑛1 𝑛𝑖 𝑁1 = 𝑛1 𝐹1 = 𝑓1
𝑓𝑖 =
𝑛

[𝑥𝑚𝑖𝑛 + 𝑛2 𝑛2 𝑁2 = 𝑛1 + 𝑛2 𝐹2 = 𝑓1 + 𝑓2
𝑓2 =
𝑛
𝑎; 𝑥𝑚𝑖𝑛 + 2𝑎[
[𝑥𝑚𝑖𝑛 + 𝑛3 𝑛3 𝑁3 = 𝑛1 + 𝑛2 + 𝑛3 𝐹3 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4
𝑓3 =
𝑛
2𝑎; 𝑥𝑚𝑖𝑛 + 3𝑎[
… … … … …

𝑘-ésima classe 𝑛𝑘 𝑛𝑘 𝑁𝐾 𝐹𝑘 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 +
𝑓𝑘 =
𝑛 = 𝑛1 + 𝑛2 + 𝑛3 + ⋯ + 𝑛𝐾 𝑓𝑘 =1
=𝑛

𝑘 𝑘

𝑛𝑖 = 𝑛 𝑓𝑖 = 1 - -
Total
𝑖−1 𝑖−1
Fonte: adaptado de Cunha et al. (2007)
Professora Fernanda Brandão
Ex.: Aplicação
Tabela 2.3 - Distribuição da frequência da classificação dos alunos na disciplina de
Estatística do Curso de Física EaD na Universidade Estadual do Maranhão (UEMA).
Classes Frequência Frequência Frequências relativas Frequência absoluta
absoluta relativa
acumulada Acumulada

𝑛𝑖 𝑓𝑖 𝐹𝑖 𝑁𝑖
[27, 36 [ 3 3/50 = 0,06 3/50=0,06 3
[36, 45 [ 7 7/50 = 0,14 (3+7) /50=0,2 3+7= 10
[45, 54 [ 11 11/50 = 0,22 (3+7+11) /50=0,42 3+7+11= 21
[54, 62 [ 12 12/50 = 0,24 (3+7+11+12) /50=0,46 3+7+11+12=33
[63, 72 [ 7 7/50 = 0,14 (3+7+11+12+7) /50=14,8 3+7+11+12+7=40
9/50 = 0,18 (3+7+11+12+7+9) 3+7+11+12+7+9=49
[72, 81 [ 9 /50=0,98
[81, 90 [ 1 1/50 = 0,02 (3+7+11+12+7+9+1) /50=1 3+7+11+12+7+9+1=50
7 7 - -
TOTAL 𝑛𝑖 = 50 𝑓𝑖 = 1
𝑖=1 𝑖−1
Fonte: o autor

Professora Fernanda Brandão


10. Representações gráfica para diferentes tipos de variáveis
A representação gráfica da distribuição de uma variável tem a vantagem de rápida e
concisamente, informar sobre sua variabilidade. Entretanto, na escolha da representação
gráfica, deve-se considerar os seguintes aspectos:

a) Natureza e escala de medição da variável;

b) Objetivo da representação gráfica (o que se pretende evidenciar).

• Representações gráfica para variáveis qualitativas ou quantitativas discretas:


Gráficos de coluna
Juntamente aos gráficos em barra, são os mais utilizados. Indicam, geralmente, um dado
quantitativo sobre diferentes variáveis, lugares ou setores e não dependem de proporções.
Os dados são indicados na posição vertical, enquanto as divisões qualitativas apresentam-se
na posição horizontal.
Ranking (RUF) 2019, dos cursos de
graduação em Física mais bem
colocados em IES Públicos, em 23
unidades da Federação.
15

10
11
5
5 2 3 1 1
0
1 2 3 4 5 6

Fonte: o autor

Professora Fernanda Brandão


Gráficos de barra horizontais
Possuem basicamente a mesma função dos gráficos em colunas, com os dados na posição
horizontal e as informações e divisões na posição vertical.
Ran ki n g (RUF) 2019, d o s cu r so s d e
graduação em Física mais bem
colocados em IESuperior Públicos, em
23 unidades da Federação.

5
3
1
0 0,1 0,2 0,3 0,4 0,5 0,6

Fonte: o autor

Gráficos circulares ou de setores


Esta representação gráfica é particularmente utilizada na representação da distribuição de
frequências de variáveis qualitativas.
Distribuição de Frequência da Variável
Desempenho no Desporto

30% Baixo
50% Regular
Alto
20%

Fonte: o autor
Professora Fernanda Brandão
Histograma
O Histograma permite representar graficamente a distribuição de frequência de uma variável
contínua. No eixo horizontal representam-se as classes e no eixo vertical as frequências absolutas
ou relativas.
Classificação na disciplina de
estatística do curso de Física
EaD (UEMA)
15 150,00%

FREQUÊNCIA
10 100,00%
5 50,00%
0 0,00%
65 55 45 75 85 35 Mais 25
BLOCO

Frequência % acumulada

Fonte: o autor
Polígono de Frequências
Os Polígonos de Frequências são gráficos de linha que são obtidos unindo sucessivamente, por
segmentos de reta, os pontos médios dos topos dos retângulos do histograma que representa as
frequências relativas.

Classificação na disciplina de
estatística do curso de Física EaD
(UEMA)
15 150,00%
FREQUÊNCIA

10 100,00%
5 50,00%
0 0,00%
25 35 45 55 65 75 85 Mais
BLOCO

Frequência % acumulada
Professora Fernanda Brandão
Fonte: o autor
Referências
BUSSAB, Wilton de O; MORETTIN, Pedro A. Estatística Básica. 8.ed. São Paulo: Saraiva,
2013. 484 p.
CRESWELL, John W. CLARK, Vicki L. Plano. Pesquisa de métodos mistos. 2.ed. Porto Alegre:
Penso, 2013. 288p.
CUNHA, Gilda; MARTINS, M.ª do Rosário; SOUSA, Ricardo; OLIVEIRA, Felipa Ferraz de.
Estatística aplicada às ciências sociais. Lisboa: Lidel. 2007. 179 p.
MELLO, Francisco Mercês de. Dicionário de estatística. 1.ed. Lisboa: Sílabo, 2014. 311 p.
HILL, Manuela Magalhães; HILL, Andrew. Investigação por questionário. 2.ed. ver. e corr.
Lisboa: Silabo. 2012. 377 p.
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa. Estatística aplicada. V. 2.
4.ed. rev. Lisboa: Sílabo. 2008. 322 p.
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa. Exercícios: Estatística
aplicada. V. 2. 1.ed. Lisboa: Sílabo. 2008. 275 p.
VIEIRA, Sonia. Estatística básica. 1.ed. São Paulo: Cengage Learning, 2015. 176 p.

Professora Fernanda Brandão


UNIDADE 3 - Caracterização dos
dados estatísticos

1. Medidas de localização ou
tendência central

2. Medidas de posição

3. Medidas de Dispersão

Imagem extraídos do banco de dados do


programa PowerPoint Professora Fernanda Brandão
Medidas-Resumo

O resumo de dados por meio de tabelas de frequências oferece muito mais informações
sobre o comportamento de uma variável do que a própria tabela original de dados.
Entretanto, muitas vezes importa resumir ainda mais estes dados, apresentando um ou
alguns valores que sejam representativos da série toda.

1. Medidas de localização ou tendência central

Apresentam-se algumas das mais utilizadas medidas de localização referindo a forma de


cálculo e seu significado no contexto do conjunto de dados: média, mediana ou moda.

a. Média Aritmética

A medida de tendência central mais utilizada e de mais fácil interpretação é a média


aritmética simples, que é o ponto de equilíbrio das observações e, por conseguinte, a
localização central mais precisa.
• Média aritmética simples

Se x1, x2, …, xn são os n valores (distintos ou não) da variável X, a média aritmética, ou


simplesmente média, de X pode ser escrita:

𝑛
𝒳𝑖 +⋯+ 𝒳𝑛 𝑖=1 𝑥𝑖 1 𝑛
𝒳= = = 𝑖=1 𝑥𝑖 onde: xi – Valores observados; n – Dimensão da
𝓃 𝑛 𝑛

amostra.

No cálculo da média aritmética (simples) todas as observações têm igual peso.

 Assim, a média aritmética de: 3, 4, 7, 8, 8:

3+4+7+8+8
𝒳= =6
5
 No entanto, caso existam observações repetidas, pode-se atribuir a cada observação um peso
correspondente à frequência absoluta ou frequência relativa da referida observação. Neste
caso a média é usualmente designada por média aritmética ponderada:

Ex.: Tabela 3.1 - Distribuição de frequência e percentagem dos Professores da UEMA


segundo o número de filhos.

Nº de Filhos 𝒙𝒊 Frequência 𝒏𝒊 Percentagem 𝟏𝟎𝟎𝒇𝒊 %


0 4 20
1 5 25
2 7 35
3 3 15
5 1 5
Total 20 100
Fonte: o autor
E o seu cálculo far-se-á através das expressões que a seguir se apresentam.

𝑘
𝑖=1 𝑛𝑖𝑥𝑖 𝑘
𝒳= ou 𝒳 = 𝑖=1 𝑥𝑖𝑓𝑖
𝓃

Onde:
𝑛𝑖
𝑓𝑖 = - Frequência relativa;
𝑛

n - Dimensão da amostra;
ni - Frequência absoluta;
k – Número de observações distintas na amostra.

 Aplicando a fórmula da média ponderada temos para o exemplo da Tabela 3.1, temos:

𝑘
𝑖=1 𝑛𝑖𝑥𝑖
𝒳= = (4 × 0) + (5 × 1) + (7 × 2) + (3 × 3) + (5 × 1) = 33 = 1,65.
𝓃
20 20
b. Mediana (𝒙)

Com os dados ordenados, a mediana é a terceira medida de tendência central e pode ser definida
como o valor que divide um conjunto de valores em dua partes iguais. É o valor da variável que ocupa
a posição central na sucessão de observações ou na distribuição de frequência.

• Mediana para dados não classificados.

O cálculo da mediana ( 𝑥 ) de um conjunto de informações (𝑥1 , 𝑥3 , … , 𝑥𝑛 ) requer a ordenação prévia


das mesmas.

A determinação da mediana depende do número de observações da amostra.

Se a amostra for construída por um número ímpar de observações, a mediana coincide com o valor
central do conjunto de dados ordenados.

Se a amostra for constituída por um número ímpar de observações, a mediana é a média dos dois
valores centrais.
Pode-se considerar a seguinte definição da mediana.

Dado um conjunto de dados de 𝑛 observações, a mediana é dada por:

𝑥= 𝑥 𝑛+1 se 𝑛 ímpar
2

Assim, se as cinco observações de uma variável forem:

 3, 4, 7, 8, 8 a mediana é o valor 7, correspondendo à terceira observação.

Quando o número de observações for par, usa-se como mediana a média aritmética das duas
observações centrais.

𝑥 𝑛 +𝑥 𝑛
+1
 𝑥= 2 2
se 𝑛 par
2

 Portanto: Acrescentando-se o valor 9 à série acima:

(7+8)
3, 4, 7, 8, 8, 9 a mediana será 𝑥 = = 7,5.
2
 Cálculo da Mediana para dados Agrupados:

Portanto:

Mediana é o valor localizado a 𝐿𝑥 = 𝑛 2

Após cálculo de 𝐿𝑥 , determina-se o valor da mediana por:

ℎ. (𝐿𝑥 − 𝐹𝑎𝑛𝑡)
𝑋 = 𝐿𝑖𝑚𝑖𝑛𝑓 +
𝑓𝑖
Onde:
𝐿𝑥 : localização da (posição) da Mediana (𝑥)
𝐹𝑎𝑛𝑡 : frequência acumulada até a classe anterior à classe da mediana
𝑓𝑖 : frequência absoluta da classe da mediana
ℎ: amplitude de classe
𝐿𝑖𝑚𝑖𝑛𝑓 : Limite inferior da classe mediana
c. Moda

A moda é outra medida de localização ou tendência central que corresponde ao


valor de frequência máxima do conjunto de valores observados, ou seja, é o valor
que ocorreu um maior número de vezes.

Nem todo conjunto de dados possui um valor modal, e também quando possui, este
valor pode não der único.

Ex.: Considera-se a variável Y o número de filhos de cada empregado na


Companhia Lux Ltda., por departamento, resumida na Tabela 3.2
Tabela 3.2 - Número de filhos de cada empregado por departamento na
Companhia Lux Ltda.
Departamento Departamento Departamento Departamento Departamento Departamento
de Pessoal Jurídico Financeiro Manutenção Informática
Nº de filhos 1 2 3 4 5
Frequência 2 3 2 1 1

Fonte: o autor
Variáveis ordenadas 1 1 2 2 2 3 3 4 5

 O valor da moda corresponde ao valor da variável que se repete mais vezes na amostra, é
correspondente à realização com maior frequência.

Neste caso, o valor que mais se repete é o 2, portanto é o valor modal, e significa que no
departamento Jurídico, 3 funcionários têm 2 filhos.

 Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição dos valores pode ser
bimodal, quando existe duas modas, trimodal, quando existe três modas ou polimodal ou
multimodal quando existe mais de três modas.

 Um conjunto de dados pode não ter moda, portanto ser amodal.

Ex.: não tem moda o conjunto de dados: 0, 1, 4, 6, 9, 10, 11, 15

 Cálculo da Moda para dados Agrupados: Método de Pearson


𝑀𝑜 = 3 𝑀𝑑 − 2𝑋
Onde:
𝑀𝑑 : 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 e 𝑋: 𝑀é𝑑𝑖𝑎
2. Medidas de posição
a. Quantis (𝑄𝑖 )

Quantis são estatísticas que nos permitem caracterizar conjuntos de dados dividindo-os em partes
iguais.

Os quantis mais utilizados são os percentis, os decis e os quartis. Os percentis dividem um conjunto de
dados em 100 partes iguais, os decis em 10 partes, e os quartis em quatro.

 Quartil

O primeiro Quartil (𝑥0,25 = 𝑄1 ) tem aproximadamente 25% de observações inferiores a 𝑥0,25,


o segundo quartil (𝑥0,5 = 𝑄2 ≅ 𝑥 ) tem cerca de 50% e o terceiro quartil (𝑥0,75 = 𝑄3 ) tem
cerca de 75% de observações a sua esquerda.

A mediana é um dos quantis e corresponde ao percentil 50, ao decil 5 e ao quartil 2.


 Cálculo dos Percentis para Dados Agrupados por Classes

O percentil é o valor localizado a 𝐿𝑃𝑥 = 𝐾 x 𝑛, onde 𝑘 é o percentil desejado


100

Ex.: 𝑃45 então 𝑘

Após cálculo de 𝐿𝑃𝑥 , determina-se o valor do percentil

ℎ. (𝐿𝑃𝑥 − 𝐹𝑎𝑛𝑡)
Onde: 𝑃 = 𝐿𝑖𝑚𝑖𝑛𝑓 +
𝑓𝑖
𝐿𝑃𝑥 : Localização (posição) do Percentil

𝐹𝑎𝑛𝑡 : frequência acumulada até a classe anterior à classe do percentil

𝑓𝑖 : frequência absoluta da classe do percentil

ℎ : amplitude de classe

𝐿𝑖𝑚𝑖𝑛𝑓 : Limite inferior da classe do percentil


3. Medidas de Dispersão
O resumo de um conjunto de dados por uma única medida representativa de posição
central esconde toda a informação sobre a variabilidade do conjunto de observações. Por
exemplo, suponhamos que cinco grupos de alunos se submeteram a um teste, obtendo-se
as seguintes notas:
• grupo A (variável X ): 3, 4, 5, 6, 7
• grupo B (variável Y ): 1, 3, 5, 7, 9
• grupo C (variável Z ): 5, 5, 5, 5, 5
• grupo D (variável W): 3, 5, 5, 7
• grupo E (variável V): 3, 5, 5, 6, 6
Calculando-se a média nestes conjuntos de dados, concluímos que as mesmas são iguais:
𝑋= 𝑌= 𝑍= 𝑊= 𝑉=5
 A identificação de cada uma destas séries por sua média (5, em todos os casos) nada informa sobre
suas diferentes variabilidades.

 Notamos então, a conveniência de serem criadas medidas que sumarizem a variabilidade de um


conjunto de observações, e que nos permita, por exemplo, comparar conjuntos diferentes de
valores, segundo algum critério estabelecido.

 Quando descrevemos coleções de dados ou distribuições de frequências importa conhecermos a


variabilidade dos dados, ou seja, a sua dispersão significa o contrário de concentração, indicando a
forma como os dados estão mais ou menos afastados de um parâmetro de tendência central.

 Entre as diferentes medidas de dispersão citam-se: intervalo de variação ou amplitude total,


intervalo interquartis, desvio absoluto médio, variância, desvio padrão e coeficiente de variação.
Referências
BUSSAB, Wilton de O; MORETTIN, Pedro A. Estatística Básica. 8.ed. São Paulo:
Saraiva, 2013. 484 p.
CRESWELL, John W. CLARK, Vicki L. Plano. Pesquisa de métodos mistos. 2.ed.
Porto Alegre: Penso, 2013. 288p.
CUNHA, Gilda; MARTINS, M.ª do Rosário; SOUSA, Ricardo; OLIVEIRA, Felipa
Ferraz de. Estatística aplicada às ciências sociais. Lisboa: Lidel. 2007. 179 p.
MELLO, Francisco Mercês de. Dicionário de estatística. 1.ed. Lisboa: Sílabo,
2014. 311 p.
HILL, Manuela Magalhães; HILL, Andrew. Investigação por questionário. 2.ed.
ver. e corr. Lisboa: Silabo. 2012. 377 p.
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa. Estatística
aplicada. V. 2. 4.ed. rev. Lisboa: Sílabo. 2008. 322 p.
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa. Exercícios:
Estatística aplicada. V. 2. 1.ed. Lisboa: Sílabo. 2008. 275 p.
VIEIRA, Sonia. Estatística básica. 1.ed. São Paulo: Cengage Learning, 2015. 176 p.
UNIDADE 4 – Noções de
Probabilidade

1. Introdução à probabilidade
2. Experimento Aleatório
3. Espaço Amostral
4. Evento
5. Definições de
Probabilidades

Imagem extraída do banco de dados do


programa PowerPoint
1. Introdução a Teoria da Probabilidade

Para conhecermos a teoria de probabilidade, vamos utilizar o princípio básico do


aprendizado humano que é a ideia de experimento.

Podemos classificar os experimentos em dois tipos: aleatórios (casuais) e não aleatórios


(determinísticos).

• Os experimentos determinísticos são fenômenos em que o resultado é sabido antes


mesmo em que ele ocorra e desta forma, nada pode ser feito.

Ex.: O valor da velocidade do som (340 m/s) é conhecido mesmo antes de realizada a
experiência. O mesmo acontece com a medição da temperatura de entrada em ebulição
da água, cujo resultado (1000 𝐶) é conhecido a priori.

Os experimentos que iremos estudar são os aleatórios, dos quais não sabemos o
resultado, ou seja, são acontecimentos influenciados pelo acaso, e cujo os resultados não
podem ser previstos.
2. Experimento Aleatório:
Um experimento aleatório tem como características:

a. a possibilidade de repetição da experiência em condições similares;

b. não se poder dizer a partida qual o resultado (fenômeno aleatório) da experiência a


realizar, mas poder descrever-se o conjunto de todos os resultados possíveis;

c. a existência de regularidade quando a experiência é repetida muitas vezes.

É com base nesta última característica que se desenvolve toda uma teoria e um conjunto de
modelos probabilísticos tendentes a explicar os fenômenos aleatórios e dar uma indicação da
maior ou menor probabilidade da sua ocorrência.

Ex.: Não se pode prever o resultado ao lançarmos um dado, pois quando lançamos um dado e
observamos o número inscrito na face voltada pra cima, podemos descrever o conjunto de
todos os resultado possíveis (1, 2, 3, 4, 5 e 6), mas é impossível, antes efetuarmos o
lançamento, afirmar qual a face que irá sair.
 Ex.: Não se pode prever o resultado ao lançarmos um
dado, pois quando lançamos um dado e observamos o
número inscrito na face voltada pra cima, podemos
descrever o conjunto de todos os resultado possíveis (1,
2, 3, 4, 5 e 6), mas é impossível, antes efetuarmos o
lançamento, afirmar qual a face que irá sair;

 Ex.: ao observarmos o resultado de um exame de um


estudante escolhido ao acaso, embora se possa dizer, no
caso do exame, que o estudante irá obter ente 0 a 10
pontos, não podemos precisar o valor da nota;

 Ex.: Quando medimos a duração do tempo útil de uma


lâmpada, podemos dizer que ela poderá durar ente 0 e
100 horas, mas não podemos afirmar em que momento a
lâmpada vai queimar.

Imagem extraída do banco de dados do


programa PowerPoint
3. Espaço Amostral
O primeiro elemento na modelagem de um experimento é o espaço amostral, que consiste no conjunto de
todos os possíveis resultados do experimento.
Ao estudarmos uma característica da qualidade de um processo (ou produto), o espaço amostral consiste de
todos os resultados possíveis que a característica da qualidade pode assumir. Geralmente, representaremos
esse conjunto por S ou pela letra grega .
No exemplo do lançamento do dado,  = 1, 2, 3, 4, 5, 6 .
• A maior parte das vezes, não se descrevem em detalhe as condições e as circunstâncias que
caracterizam uma experiência aleatória. Sendo esta a maior dificuldade de fundo do cálculo das
probabilidades: descrição das condições uniformes em que um acontecimento aleatório se verifica ou
não.
• Se o número de elementos do espaço de resultados for finito ou infinito numerável, trata-se de um
resultado discreto.
• Havendo um número infinito não numerável de elementos, dispõe-se de um espaço de resultados
contínuo.
• Um espaço de resultado pode inda ser quantitativo ou qualitativo, conforme a natureza dos elementos
que o compõem.
 A indicação dos elementos do espaço de resultados pode-se fazer, quer pela
enumeração de todos os elementos que o compõem, quando são em número finito)
(definição por extensão), quer pela descrição abreviada desses elementos (definição
por compreensão).

Ex.: Definição por compreensão:


Uma loja abra às 9 horas e encerra às 19. Um cliente, tomado ao acaso, entra na loja no
momento X e sai no momento Y (tanto o momento X, quanto o momento Y são expressos
em horas, com origem na 9h). Pretende-se observar os momentos de entrada e saída do
cliente.
Resposta:
Como a chegada e saída de um cliente se processa ao acaso, logicamente que poderá
ocorrer em qualquer momento no tempo, entre 9 e às 19 horas, pelo que X e Y são
variáveis contínuas com X  Y. Portanto, o espaço de resultados de  é infinito não
numerável, podendo descrever-se da seguinte forma:

 = (𝑋, 𝑌) ∶ 9 < 𝑋  Y  19} (Definição de  por compreensão)


Ex.: Definição por extensão:

Considere a experiência aleatória que consiste no lançamento de um lado e observação do número


inscrito na face voltada pra cima.

Resposta:

O espaço do resultado é  = { 1, 2, 3, 4, 5, 6} (Definição de  por extensão)

4. Evento ou acontecimento

Retomando o exemplo da experiência aleatória que consiste no lançamento de um dado, e cujo espaço
de resultados de  = { 1, 2, 3, 4, 5, 6} .

Sendo o espaço de resultados em conjunto, é possível formar subconjuntos dos seus elementos, como
por exemplo:

A={2}

B = { 1, 3, 5 }

C = { 3, 6 }
 Cujo significado é, respectivamente:

A : saída de face 2

B : saída de face ímpar

C : saída de face divisível por 3

A, B e C, sendo subconjuntos de , são simultaneamente conjuntos de resultados possíveis da


experiência aleatória. Designam-se por acontecimentos ou eventos

Um acontecimento ou evento é um conjunto de resultados de uma experiência aleatória ou, de modo


equivalente, qualquer subconjunto do espaço de resultados é um acontecimento definido em 
(eventualmente o próprio  ou conjunto ).

 Um acontecimento A relativo a um determinado espaço de resultados , e associado a uma


experiência aleatória é simplesmente um conjunto de resultados possíveis. Diz-se que A se realizou,
se o resultado da experiência aleatória, , é um elemento de A, isto é, se   A.

 Não se deve confundir acontecimento com resultado. Enquanto acontecimento significa algo que a
experiência aleatória pode produzir, mas não se realiza necessariamente, um resultado indica algo
que a experiência aleatória produziu.
5. Definições de Probabilidades

De acordo com a definição e o método de cálculo, podemos definir três conceitos de probabilidades: clássica,
empírica ou frequencista e subjetiva.
 As que probabilidades que se baseiam nas características intrínsecas dos acontecimentos são definidas segundo
o conceito clássico.
 Aquelas que se baseiam numa quantidade razoável de evidências objetivas, são empíricas ou frequencista.
 As probabilidades definidas com base em crenças ou opiniões individuais são denominadas subjetivas.
• Conceito clássico de probabilidade (a priori).

Se a uma experiência aleatória se pode associar N resultados possíveis, mutuamente exclusivos e igualmente
𝑛𝐴
prováveis, e se 𝑛𝐴 desses resultados tiverem atributo A, então a probabilidade de A é a fração ,
𝑁

𝑛𝐴
P [A] =
𝑁

Onde:

𝑛𝐴 : número de resultados favoráveis de A

N : número de resultados possíveis

Observe que, para o conceito clássico de probabilidade, os resultados possíveis são todos igualmente prováveis, isto
é, todos têm igual probabilidade de se realizarem.
Ex.: Na experiência aleatória que consiste no lançamento de um dado e observação do número inscrito
na face voltada pra cima, seja A o acontecimento: saída da face 3. O espaço de resultados é definido
pelos seguintes elementos  = { 1, 2, 3, 4, 5, 6}. A probabilidade de se realizar o acontecimento A é:
𝑛 1
P [A] = 𝑁𝐴 = 6
Com:
𝑛𝐴 : número de resultados favoráveis ao acontecimento A
N : número de resultados possíveis
Ex.: Considere a experiência aleatória que consiste no lançamento de uma moeda equilibrada ao ar.
Seja A o acontecimento: saída da face. O espaço de resultados será constituído por  = { cara, coroa}. A
probabilidade de A será:
𝑛𝐴 1
P [A] = =2
𝑁

• Conceito frequencista de probabilidade (a posteriori)


Se em N realizações de uma experiência, o acontecimento A se verificou n vezes, diz-se que a
frequência relativa da A nas N realizações é:
𝑛
𝑓𝐴 = 𝑁
Sendo:
𝑓𝐴 a frequência relativa do acontecimento A
• Conceito subjetivo ou personalista de probabilidade
Utilizando este conceito, a probabilidade de um acontecimento é dada
pelo grau de credibilidade ou de confiança que cada pessoa dá à
realização de um acontecimento. Baseia-se na informação quantitativa
(ex: frequência de ocorrência de um acontecimento) e/ou qualitativa
(ex: informação sobre experiência passada em situações semelhantes)
que o decisor possui sobre o acontecimento em causa.

Referências
BUSSAB, Wilton de O; MORETTIN, Pedro A. Estatística Básica. 8.ed. São
Paulo: Saraiva, 2013. 484 p.
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa.
Estatística aplicada. V. 1. 5.ed. rev. Lisboa: Sílabo. 2007.

Você também pode gostar