Você está na página 1de 138

ESTATÍSTICA APLICADA ÀS

ANÁLISES CONTÁBEIS
AULA 1

Profª Aline Purcote Quinsler


CONVERSA INICIAL

A estatística está presente no nosso cotidiano, e muitas vezes, sem


perceber, recorremos a ela para tomar decisões, mas o que é estatística e onde
podemos utilizá-la? Como ela pode auxiliar na tomada de decisão dentro e fora
de uma organização?
Nesta aula estudaremos os principais conceitos da estatística, os diferentes
tipos de variáveis, como elaborar uma distribuição de frequência e uma
distribuição de frequência por classe, além de conhecer os tipos de gráficos
utilizados na apresentação de dados.

CONTEXTUALIZANDO

No dia a dia, sempre avaliamos a probabilidade de chover para saber qual


roupa vestir, avaliamos o consumo do carro para decidir se ele é econômico ou
não, realizamos pesquisa de preço para decidir o que comprar e onde comprar,
entre outras situações em que buscamos dados para tomar decisões. Logo,
somos constantemente desafiados a tomar decisões, e dessa forma precisamos
estar preparados para ler, interpretar os dados disponíveis e gerar informações
úteis e confiáveis. Assim, obter e saber processar dados, transformar em
informações e utilizar na tomada de decisão é o nosso grande desafio.
Utilizar os dados armazenados na empresa para entender melhor o que
acontece em seus negócios, avaliar o comportamento das vendas de produtos
ou serviços, entender o comportamento dos clientes e realizar análises
financeiras são algumas das aplicações da estatística. Assim, a estatística surge
como uma ferramenta que auxilia o gestor na procura de respostas para
problemas cotidianos, auxiliando nos processos decisórios.
Segundo Pereira (2014), o bom uso da estatística nas organizações,
principalmente pela contabilidade, pode facilitar a mensuração de dados para o
planejamento estratégico. Desta forma, a empresa pode se antecipar aos seus
concorrentes, prever o mercado consumidor, projetar e simular decisões. Pereira
(2014) comenta que, ao considerar que a função da contabilidade é disponibilizar
aos usuários do sistema contábil uma gama de informações ajustadas e
convenientes ao processo decisório estratégico das organizações, é fácil
entender por que a utilização de modelos contábeis com base na estatística (que

2
também são métodos quantitativos) tem se tornando uma ferramenta cada vez
mais solicitada.

TEMA 1 – INTRODUÇÃO À ESTATÍSTICA

A estatística pode ser pensada como a ciência de aprendizagem a partir


de dados que fornece métodos para coleta, organização, análise, interpretação
e apresentação de dados. É objetivo da estatística extrair informações para obter
uma melhor compreensão das situações, o que permite tomar assim decisões
mais assertivas. Na figura a seguir, temos a representação da estatística como
meio entre os dados e a geração das informações.

Figura 1 – Representação da estatística

Estatística

Organização
Análise
Dados Informação
Interpretação
Apresentação

A estatística divide-se basicamente em duas áreas: estatística descritiva


e estatística indutiva.
A estatística descritiva se preocupa em organizar e descrever um conjunto
de observações. De acordo com Castanheira (2010), a estatística descritiva é
um número que, sozinho, descreve uma característica de um conjunto de dados,
ou seja, é um número resumo que possibilita reduzir os dados a proporções mais
facilmente interpretáveis.
Segundo Castanheira (2010), a estatística indutiva, ou inferência
estatística, é a parte da estatística que, baseando-se em resultados obtidos da
análise de uma amostra da população, procura inferir, induzir ou estimar as leis
de comportamento da população da qual a amostra foi retirada.

3
A população, utilizada na estatística indutiva, é um conjunto de dados que
possui certa característica comum; já a amostra é uma pequena parte da
população. Por exemplo, quando temos uma pesquisa eleitoral, a população é
formada por todos os eleitores, e a amostra pode ser um grupo de eleitores de
uma determinada região, cidade ou bairro. Dentro de uma empresa podemos
realizar uma pesquisa com a carteira de clientes, mas dos 1.000 clientes
cadastrados realizamos a pesquisa apenas com 100, ou seja, a população é
igual a 1.000, e a amostra é de 100 clientes. Na figura a seguir, temos a
representação de população e amostra:

Figura 2 – Relação entre população e amostra

População

Amostra

Castanheira (2010) indica que o processo de generalização, que é


característico da estatística indutiva, está associado a uma margem de incerteza.
A incerteza ocorre pois não analisamos toda a população, e sim parte dela, uma
amostra. Por exemplo, nas pesquisas eleitorais, se temos dois candidatos,
candidato A e B, e analisando a amostra, temos a resposta de que o candidato
A é favorito, então chegamos à conclusão de que o candidato A é favorito para
vencer as eleições, ou seja, é favorito para toda população.
A estatística descritiva e a estatística indutiva podem ser utilizadas juntas
para chegarmos a conclusões que vão auxiliar na tomada de decisão. Essa
utilização pode ser observada na figura a seguir:

4
Figura 3 – Utilização conjunta das estatísticas descritiva e indutiva

População Amostra
Estatística
descritiva

Características Estudo da
populacionais amostra
• Tabelas
• Gráficos
• Medidas
Estatística
indutiva Características
amostrais

Castanheira (2010) comenta que, quando pretendemos realizar um


estudo estatístico em determinada população ou amostra, o trabalho que
realizamos deve passar por várias fases, que são desenvolvidas até chegarmos
aos resultados finais que procurávamos. Para realizar um estudo estatístico e
tratar dados numéricos, utilizamos o método estatístico, o qual fornece
conclusões que servirão de base para tomada de decisão e é dividido nas
seguintes fases:

• Definição do problema: definir com clareza o que pretendemos pesquisar,


o objetivo de estudo que desejamos alcançar.
• Delimitação do problema: responder às seguintes perguntas “Onde será
realizada a pesquisa? Com que tipo de pessoas? Em que dias e/ou
horários?”
• Planejamento: como resolver o problema? Que dados serão necessários?
Como obtê-los? Será utilizado questionário? Amostragem? Qual é o
tamanho da amostra? Qual é o cronograma das atividades? Quanto
gastará para realizar a pesquisa?
• Coleta dos dados: fase operacional. Colocar o que foi planejando em
prática, obtenção dos dados.
• Apuração dos dados: criticar os dados coletados, excluindo os dados
incompletos ou com erros. Realizar um resumo dos dados por meio de

5
uma contagem, separação por tipo de resposta e de agrupamento de
dados semelhantes, tabulação de dados.
• Apresentação dos dados: representação dos dados em tabelas e/ou
gráficos.
• Análise dos dados: ligada ao cálculo de medidas para descrever o
fenômeno analisado.
• Interpretação dos dados: encontrar as conclusões para o problema.

TEMA 2 – VARIÁVEIS

Na descrição ou análise de um conjunto de dados estatísticos, podemos


associar certos tipos de variáveis que podem assumir diferentes valores
numéricos ou não numéricos. Essas variáveis podem ser classificadas em
variáveis qualitativas e variáveis quantitativas.
As variáveis qualitativas estão associadas a uma característica que
denota qualidade ou atributo, uma característica não numérica. Exemplos:

• Sexo: masculino e feminino;


• Cor dos olhos: castanhos, verdes etc.;
• Desempenho de funcionários: ótimo, bom, ruim;
• Qualidade dos produtos: defeituoso, perfeito;
• Grau de instrução;
• Estado civil.

Quando uma variável qualitativa apresentar uma ordenação natural com


intensidades crescentes de realização, chamamos de qualitativas ordinais. Por
exemplo:

• Classe social: baixa, média ou alta;


• Grau de instrução: ensino fundamental, ensino médio, ensino superior,
pós-graduação.

As variáveis que não apresentam uma ordem natural entre seus valores
são classificadas como qualitativas nominais. Exemplos:

• Sexo: masculino ou feminino;


• Cor dos olhos: castanhos, verdes, ...

As variáveis associadas a valores numéricos que representam contagens


ou medidas são chamadas de variáveis quantitativas. Exemplos:
6
• Altura;
• Peso;
• Idade;
• Número de filhos;
• Número de carros.

As variáveis quantitativas podem ser classificadas em discretas, quando


se trata de contagem, números inteiros. Exemplo:

• Número de filhos;
• Número de carros (0, 1, 2, ...).

Quando a variável trata de medidas, temos as variáveis quantitativas


contínuas, ou seja:

• Altura (1,55m, 1,80m, 1,73m, ...);


• Peso.

Logo, as variáveis podem receber as seguintes classificações:

Figura 4 – Classificação das variáveis

Nominal

Qualitativas

Ordinal

Variáveis

Discreta

Quantitativas

Contínua

TEMA 3 – DISTRIBUIÇÃO DE FREQUÊNCIA

Vimos que para realizar um estudo estatístico passamos por várias fases,
que são desenvolvidas até chegarmos aos resultados finais, sendo a coleta e
apuração dos dados duas dessas fases. Após a fase de coleta dos dados,
7
obtemos os dados originais que precisam ser organizados para realização de
análises, chamados dados brutos. Segundo Castanheira (2010), dados brutos
são a relação dos resultados obtidos em uma pesquisa e que foram transcritos
aleatoriamente, ou seja, fora de qualquer ordem.
Vamos supor que uma pesquisa foi realizada em uma turma em relação
à idade de cada aluno. O primeiro aluno pesquisado possui 14 anos, o segundo,
15 anos, e assim sucessivamente até o último aluno da turma, obtendo os
seguintes resultados:

14 15 16 17 18 19 14 15 16 17 14 15 16 14 15 16 15 16 15 15

Com os dados brutos, temos interesse em saber qual é a idade que mais
aparece nesta turma, e então organizamos os dados para facilitar a
interpretação. A organização dos dados em ordem numérica, crescente ou
decrescente recebe o nome de rol.
Colocando os dados brutos em ordem crescente, temos o seguinte rol:

14 14 14 14 15 15 15 15 15 15 15 16 16 16 16 16 17 17 18 19

Agora ficou mais fácil verificar a idade que mais aparece nessa turma,
utilizando o Rol, mas podemos melhorar ainda mais agrupando os valores.
Denominamos de frequência ou frequência absoluta (f) o número de vezes que
um mesmo número se repete.
No nosso exemplo, 14 anos se repetem 4 vezes, isso significa que essa
idade possui frequência igual a 4. Isso também ocorre com a idade 15 anos, que
possui frequência igual a 7, 16 anos possui frequência igual a 5, 17 anos tem
frequência igual a 2, e as idades 18 e 19 anos aparecem uma única vez com
frequência igual a 1. Ou seja, 4 alunos possuem idade igual a 14 anos, 7 alunos
possuem idade igual a 15 anos e assim sucessivamente para as demais idades
apresentadas na pesquisa.
Voltando à nossa pergunta inicial, qual é a idade que mais aparece nessa
turma? Verificando a frequência, temos que a idade 15 anos possui frequência
igual a 7, ou seja, 7 alunos possuem 15 anos, desta forma é a idade que mais
aparece na turma pesquisada.
Para facilitar ainda mais a interpretação, a frequência pode ser organizada
em uma tabela chamada de distribuição de frequência. Uma distribuição de

8
frequência é a apresentação dos resultados de uma pesquisa por meio de uma
tabela que mostra a frequência de ocorrência de cada resultado.
Voltando à pesquisa em relação à idade de cada aluno, já encontramos a
frequência de cada idade e agora vamos organizar os dados e as frequências na
tabela de distribuição de frequência. Essa tabela contém duas colunas: a
primeira, com os dados apresentados na pesquisa, e a segunda, com a
frequência com que cada dado aparece. Em nossa pesquisa, os dados referem-
se às idades, desta forma temos a seguinte tabela de distribuição de frequência:

Tabela 1 – Distribuição de frequência

Idade Frequência (f)


14 4
15 7
16 5
17 2
18 1
19 1

Além das frequências simples, podemos incluir na tabela de distribuição


a frequência acumulada e a frequência relativa. A frequência absoluta
acumulada ou apenas frequência acumulada (fa) é o somatório das frequências.
Para calcular, repetimos o primeiro valor e somamos com o próximo até a última
frequência. Vamos verificar na tabela a seguir o cálculo da frequência acumulada
com base no nosso exemplo:

Tabela 2 – Frequência acumulada

Idade Frequência (f) fa


14 4 4
15 7 11
16 5 16
17 2 18
18 1 19
19 1 20

Observe que o valor encontrado na frequência acumulada sempre é igual


à quantidade de dados que temos na pesquisa. Se contarmos a quantidade de
valores fornecidos no dado bruto, temos 20 dados, que é exatamente o valor
final que encontramos.

9
Atrelado ao conceito de frequência absoluta temos o conceito de frequência
relativa (fr) de uma variável, que é a divisão entre a frequência absoluta (f) e o
número de elementos (N) da amostra, ou seja:
f
fr =
N
em que N = ∑ f , isto é, N é igual a soma das frequências.
A frequência relativa frequentemente é representada na forma de
porcentagem, facilitando a interpretação e gerando informações importantes que
facilitam a análise dos dados.
No nosso exemplo, temos N = 20, e assim calculamos a frequência relativa
dividindo cada frequência por 20 e depois multiplicando o valor por 100 para
encontrarmos o resultado em porcentagem. Se somarmos as porcentagens
encontradas, o valor final será sempre 100%.

Tabela 3 – Frequência relativa

Idade Frequência (f) Fr


14 4 4/20 = 0,20 x 100 = 20%
15 7 7/20 = 0,35 x 100 = 35%
16 5 5/20 = 0,25 x 100 = 25%
17 2 2/20 = 0,10 x 100 = 10%
18 1 1/20 = 0,05 x 100 = 5%
19 1 1/20 = 0,05 x 100 = 5%
Total 20 100%

Com a tabela de distribuição de frequência com frequência acumulada e


relativa, podemos realizar várias análises que ajudam em nossa tomada de
decisão. No nosso exemplo, podemos ter as seguintes perguntas:

• Quantos alunos possuem idade menor ou igual a 16 anos?


• Qual é a porcentagem de alunos que possuem idade menor ou igual a 16
anos?
• Qual é a idade que aparece com maior porcentagem?

Para responder às perguntas, vamos analisar a tabela de frequência


acumulada e relativa que elaboramos anteriormente.

• Quantos alunos possuem idade menor ou igual a 16 anos?

Para responder a esta pergunta, analisamos a tabela da fa. Se queremos


alunos que possuem idade menor ou igual a 16 anos, significa que os alunos

10
podem ter 14, 15 e 16 anos. Verificando a frequência acumulada, temos um total
de 16 alunos (4+7+5 =16), conforme tabela a seguir:

Tabela 4 – Frequência acumulada

Idade Frequência (f) Fa


14 4 4
15 7 11
16 5 16
17 2 18
18 1 19
19 1 20

• Qual é a porcentagem de alunos que possuem idade menor ou igual a 16


anos?

Como a pergunta solicita porcentagem, vamos utilizar a tabela de


frequência relativa. Se queremos alunos que possuem idade menor ou igual a
16 anos, significa que os alunos podem ter 14, 15 e 16 anos. Somando a
frequência relativa temos um total de 80% (20%+35%+25% = 80%), ou seja,
80% da turma possui idade menor ou igual a 16 anos, conforme a próxima tabela:

Tabela 5 – Frequência acumulada

Idade Frequência (f) Fr


14 4 4/20 = 0,20 x 100 = 20%
15 7 7/20 = 0,35 x 100 = 35%
16 5 5/20 = 0,25 x 100 = 25%
17 2 2/20 = 0,10 x 100 = 10%
18 1 1/20 = 0,05 x 100 = 5%
19 1 1/20 = 0,05 x 100 = 5%
100%

• Qual é a idade que aparece com maior porcentagem?

Novamente, utilizamos a frequência relativa, pois foi solicitada a


porcentagem de alunos que aparecem com maior frequência. Para encontrar o
resultado, verificamos qual é a idade que apresenta maior porcentagem, que
neste caso é 15 anos, que representa 35% dos alunos:

11
Tabela 6 – Frequência acumulada

Idade Frequência (f) fr


14 4 4/20 = 0,20 x 100 = 20%
15 7 7/20 = 0,35 x 100 = 35%
16 5 5/20 = 0,25 x 100 = 25%
17 2 2/20 = 0,10 x 100 = 10%
18 1 1/20 = 0,05 x 100 = 5%
19 1 1/20 = 0,05 x 100 = 5%
100%

A apresentação de dados pela distribuição de frequência auxilia na geração


de informações para uma tomada de decisão mais precisa. Desta forma,
podemos utilizá-la nas diferentes pesquisas realizadas tanto com dados
quantitativos como qualitativos. Os cálculos de frequência, frequência
acumulada e frequência relativa auxiliam na geração das informações, dando
base para diferentes análises e tomada de decisão, conforme exemplo do site
Brasil Escola, disponível em:
<http://brasilescola.uol.com.br/matematica/aplicacao-estatistica-frequencia-
absoluta-frequencia-.htm>.

TEMA 4 – DISTRIBUIÇÃO DE FREQUÊNCIA POR CLASSE

Você já respondeu a alguma pesquisa em que não era perguntada a sua


idade, mas sim a faixa de idade na qual você se encontra? Por exemplo, não
respondemos que temos 25 anos, e sim que temos entre 20 e 30 anos de idade.
A mesma situação pode ocorrer quando a pesquisa pergunta em relação ao
salário: não respondemos o salário que recebemos, e sim a faixa salarial, ou
seja, recebemos entre 1 a 3 salários mínimos ou de 4 a 6 salários mínimos.
Imagine realizarmos uma pesquisa em relação à idade de um grupo de
1.000 pessoas. Quantas idades diferentes podem aparecer? Neste caso, se
utilizarmos a tabela de distribuição de frequência, teremos muitas linhas que
equivalem às idades diferentes que aparecerão na pesquisa. Segundo
Castanheira (2010), quando o número de resultados obtidos em uma pesquisa
é demasiadamente grande, é comum agruparmos esses resultados em faixas de
valores, denominadas de classes ou intervalos.

12
Suponha que a tabela a seguir demonstre a distribuição de frequência da
idade de um grupo de 100 pessoas:

Tabela 7 – Distribuição de frequência por classes

Classe 𝑓𝑓𝑖𝑖
0 |–––– 10 20
10 |–––– 20 30
20 |–––– 30 40
30 |–––– 40 10

Verificamos que essa tabela possui na primeira coluna faixas de valores,


e não apenas um valor, como a distribuição de frequência. Quando isso ocorre,
chamamos de distribuição de frequência por classes ou intervalos. Nessa
distribuição, temos:

• Classe – é o intervalo do grupo. A tabela indica que 20 pessoas têm entre


0 e 10 anos, e 40 pessoas têm entre 20 e 30 anos. O primeiro grupo é a
primeira classe (de zero a 10), a segunda linha é a segunda classe (10 a
20) e assim por diante. Essa tabela é formada por 4 classes.
• Os limites de um intervalo ou classe são os números extremos de cada
intervalo ou classe. Aos valores à esquerda de cada classe, damos o
nome de limite inferior (Li), e os valores à direita, chamamos de limite
superior (Ls). Na primeira classe temos:

0 – Limite Inferior
10 – Limite Superior

• O símbolo ├ representa que a classe ou intervalo é fechada à esquerda,


ou seja, significa que o limite inferior pertence ao intervalo; aberto à direita,
representa que o limite superior não pertence ao intervalo. Analisando a
segunda classe, 10|--- 20, temos que 10 faz parte da segunda classe, e
não da primeira, já o 20 não faz parte da segunda classe, mas está sendo
considerado na terceira. Qualquer que seja a idade, ela se encaixa em
apenas um dos intervalos.
• Ao subtrair o limite superior do limite inferior de determinada classe ou
intervalo, temos a amplitude do intervalo ou classe (A):
13
A = Ls –Li

Na segunda classe, temos uma amplitude igual a 10, ou seja, A = 20 – 10


= 10. Se calcularmos a amplitude para as demais classes, observamos que todas
as classes têm a mesma amplitude; então, na distribuição de frequência
apresentada, as classes têm amplitude igual a 10, ou seja, A = 10.
Quando trabalhamos com uma distribuição de frequência por classe ou
intervalo, assumimos que para todo intervalo o resultado é um valor único igual
ao ponto médio da classe ou intervalo (Pm), que é a soma do limite superior (Ls)
com o limite inferior (Li) dividido por 2, ou seja, o ponto médio é o valor que está
no meio do intervalo:

Ls + Li
Pm =
2

Considerando a primeira classe do nosso exemplo, temos o seguinte


ponto médio:

Ls + Li 10 + 0
Pm = = =5
2 2

Utilizando a mesma fórmula, encontramos o ponto médio das demais


classes:

Tabela 8 – Ponto médio

Classe 𝑓𝑓𝑖𝑖 PM
0 |–––– 10 20 5
10 |–––– 20 30 15
20 |–––– 30 40 25
30 |–––– 40 10 35
N=100

A distribuição de frequência por classe ou intervalos facilita a


representação de uma grande quantidade de dados, mas vale lembrar que

14
quando agrupamos os dados em faixa de valores não conseguimos ter a
frequência exata do dado, apenas da faixa de valores.
Já estudamos os principais conceitos de uma distribuição de frequência
por classe ou intervalos, mas como construir uma distribuição de frequência por
classe?
Para construção de uma distribuição de frequência por classes ou
intervalos, seguimos algumas etapas que vão auxiliar na geração da tabela e na
apresentação dos resultados:

1. Colocar os valores obtidos em rol;


2. Calcular a amplitude total = maior valor – menor valor;
3. Determinar número de classes: não há uma fórmula exata, mas podemos
utilizar os seguintes métodos:
Número de Classes = Amostra
• Método de Sturges: i = 1+3,3.log n , em que n é o número total de
observações.
4. Determinar a amplitude da classe:

5. Construir a distribuição de frequência por intervalo de classe.

Recomenda-se que o número mínimo de intervalos seja igual a 5 e o


número máximo, igual a 20, o que facilita a construção da tabela com um mínimo
de precisão e de informação. Lembrando que todos os intervalos precisam ter o
mesmo tamanho, ou seja, a mesma amplitude.
Vamos considerar os seguintes dados coletados em uma pesquisa
referente à idade de um grupo de funcionários de uma determinada empresa e
construir uma tabela de distribuição por classe:
Dados brutos:
24 23 22 28 35 21 23 23 33 34
24 21 25 36 26 22 30 32 25 26
33 34 21 31 25 31 26 25 35 33

1. Colocar os valores obtidos em ROL.

21 21 21 22 22 23 23 23 24 24
25 25 25 25 26 26 26 28 30 31

15
31 32 33 33 33 34 34 35 35 36

2. Calcular a amplitude total = maior valor – menor valor.

Verificamos no rol qual é o maior e o menor valor encontrado nesta


pesquisa e depois subtraímos para encontrar a amplitude total:
Maior valor = 36
Menor valor = 21
Amplitude total = 36 – 21 = 15

3. Determinar número de classes: temos dois métodos e podemos escolher


um deles para aplicação. No nosso exemplo, vamos resolver das duas
formas para verificar as diferenças no cálculo:
• Número de Classes = Amostra

No exemplo, a amostra é igual a 30, que é a quantidade de dados


apresentado nos dados brutos.
Número de Classes = 30 = 5,47723 = 6

• Método de Sturges: i = 1+3,3.log n, em que n é o número total de


observações.

No exemplo, temos n = 30, e assim aplicamos a fórmula:

i = 1+3,3.log n
i = 1+3,3.log 30
i = 1+3,3.1,47712
i = 1+ 4,87450
i = 5,87450 = 6

Nos dois métodos, arredondamos o valor obtido para o inteiro mais


próximo ao maior e obtemos o mesmo número de classe, assim nossa
distribuição vai conter 6 classes.

4. Determinar a amplitude da classe: para o cálculo, precisamos da


amplitude total e do número de classe já calculados nos passos 2 e 3:

Amplitude total = 15
Número de Classes = 6
15
A= = 2,5 = 3
6

16
Sempre que a divisão resultar em um número não inteiro, arredondamos
para o inteiro mais próximo, maior que o encontrado na divisão. Desta forma,
nossa distribuição terá uma amplitude de classe igual a 3.

5. Construir a distribuição de frequência por intervalo de classe: para


construção da distribuição, utilizaremos o rol e a amplitude da classe.

Rol
21 21 21 22 22 23 23 23 24 24
25 25 25 25 26 26 26 28 30 31
31 32 33 33 33 34 34 35 35 36
Amplitude das classes = 3

Como nossa amplitude de classes é igual a 3, significa que precisamos


agrupar os valores de 3 em 3, e assim formaremos nossas classes para
construção da distribuição. Para construção da primeira classe, consideramos o
primeiro valor, que é 21, ou seja, nosso limite inferior; para encontrar o limite
superior, somamos 3 e temos 24. Na segunda, seguimos o mesmo raciocínio,
mas agora começando em 24 mais 3: o limite superior será 27. Seguimos esse
procedimento até chegarmos em 6 classes, que é o número de classes que
precisamos encontrar.
Para encontrar a frequência de cada classe, verificamos quantas vezes o
os números daquela classe aparece. Por exemplo, na primeira classe, o limite
inferior é 21 fechado, ou seja, contamos o 21, mas o superior é 24 aberto, não
sendo considerado no cálculo da frequência assim contamos apenas os valores
21, 22 e 23. Verificamos quantas vezes estes valores aparecem, ou seja, a
frequência desses valores é igual a 8. Fazemos esse procedimento para todos
os valores do rol e em seguida, formamos a nossa tabela de distribuição de
frequência:

Tabela 9 – Distribuição de frequência


Classe 𝐹𝐹𝑖𝑖
21 |– 24 8
24 |– 27 9
27 |– 30 1
30 |– 33 4
33 |– 36 7
36 |– 39 1
TOTAL 30

17
TEMA 5 – GRÁFICOS

Uma das fases do método estatístico é a apresentação de dados em que


podemos utilizar tabelas e gráficos para auxiliar na obtenção das conclusões que
servirão de base para tomada de decisão. Os gráficos têm como finalidade
representar os resultados de forma simples, permitindo uma leitura rápida e
global dos fenômenos estudados. Demonstra a evolução do fenômeno em
estudo e permite observar a relação dos valores da série.
O gráfico deve conter título e escala e exibir no rodapé a fonte que
forneceu os dados. Esses elementos são importantes, pois auxiliam na
interpretação dos dados sem a necessidade de inúmeras explicações.
Existem várias maneiras de representar graficamente os dados
estatísticos de acordo com o tipo de série. Para diferenciar uma série estatística
da outra, temos que levar em consideração três fatores: tempo, local e espécie.
Assim, as séries estatísticas são classificadas em:

• Séries temporais, históricas ou cronológicas: os dados são apresentados


em uma faixa de tempo e são produzidos ou observados ao longo do
tempo. Exemplo: produção anual, faturamento mensal.
• Séries geográficas, espaciais, territoriais ou de localização: os dados são
apresentados em uma ou mais regiões. Exemplo: produção por região,
venda por cidade, faturamento por estado.
• Séries categóricas ou específicas: os dados são agrupados segundo a
modalidade de ocorrência. Têm como característica a variação do fato.
Exemplo: vendas por produto, faturamento por marca, oferta de trabalho
por área.
• Séries mistas, conjugadas ou tabelas de dupla entrada: combinação entre
as séries temporais, geográficas e específicas. Exemplo: faturamento
mensal dividido por estados, veículos vendidos por regiões nos últimos
anos.
• Tabelas de distribuição de frequências: é a apresentação dos resultados
de uma pesquisa por meio de uma tabela que mostra a frequência de
ocorrência de cada resultado.

Com base nos diferentes tipos de série, podemos indicar a utilização de


cada tipo de gráficos. Os principais tipos são:

18
• Linhas: representa observações feitas ao longo do tempo utilizadas nas
chamadas séries históricas ou temporais.

Figura 5 – Exemplo de gráfico de linhas

• Setores: dividem em setores os termos da série. É mais utilizado para


séries específicas ou geográficas com pequeno número de termos e
quando se quer salientar a proporção de cada termo em relação ao todo.

Figura 6 – Exemplo de gráfico de setores

Produção de máquinas e equipamentos no Brasil

17,40%

São Paulo
7,90% Rio Grande do Sul
49,30% Santa Catarina
Paraná
10,10%
Outros

15,30%

Fonte: IBGE – 2011

• Colunas: representação de uma série por retângulos verticalmente, ou


seja, representamos a série em colunas. Pode ser utilizado nas diferentes
séries.

19
Figura 7 – Exemplo de gráfico de colunas

• Barras: representação de uma série por retângulos horizontalmente, ou


seja, representamos a série em barras. Pode ser utilizado nas diferentes
séries.

Figura 8 – Exemplo de gráfico de barras

• Histograma: representação utilizada nas distribuições de frequências,


cujos dados foram agrupados em classes ou intervalos de mesma
amplitude. Cada classe é representada por um retângulo, cuja base é
igual à amplitude da classe, e a área é proporcional à frequência da
classe.

20
Figura 9 – Exemplo de histograma

Para construir um histograma, temos os seguintes passos:

• Marcar no eixo x (horizontal) as classes;


• Marcar no eixo y (vertical) as frequências;
• Para cada classe, levantar as colunas de acordo com cada frequência.

Considere as idades de 50 funcionários de uma empresa, agrupados


conforme a tabela a seguir. Utilizando os passos anteriores, vamos elaborar o
histograma da distribuição (Professor Guru, S.d.).

Tabela 10 – Intervalos de classes

Fonte: Professor Guru, [S.d.].

No eixo x (horizontal), identificamos as classes, e no y (vertical), as


frequências. Note que no eixo x começamos em 18 e identificamos todos os
valores das classes finalizando em 66; já no eixo y iniciamos com 2, que é a
nossa menor frequência, e vamos até 13, que é a maior frequência.

21
Figura 10 – Exemplo de gráfico de distribuição

Com os eixos prontos, vamos levantar as colunas e finalizar o histograma.


Iniciamos com a primeira classe, de 18 a 25, na qual devemos levantar a coluna
até a frequência 6. Seguimos a mesma orientação para as demais classes e
obtemos o seguinte histograma:

Figura 11 – Exemplo de histograma de distribuição

TROCANDO IDEIAS

Vimos que a estatística está presente no nosso cotidiano, e muitas vezes


sem perceber recorremos a ela para tomar decisões. Após os temas
apresentados, você se recorda de alguma situação e que utilizou a estatística
como base para tomar alguma decisão em casa ou dentro de uma empresa? Ou
já participou de alguma pesquisa que utilizou variáveis quantitativas e
qualitativas? Que pesquisa era essa? Você teve acesso aos resultados da
pesquisa? Comente a sua experiência.

22
NA PRÁTICA

Com base nos assuntos trabalhados, considere a seguinte situação-


problema:
Uma empresa do ramo de educação precisa realizar uma pesquisa de
mercado na localidade onde você reside, a qual servirá como subsídio para a
elaboração de uma estratégia de implantação de uma nova unidade de ensino.
Os gerentes querem conhecer sua clientela: idade, grau de instrução, desejo de
cada um em fazer um curso superior e quais são os cursos pretendidos.
Como resolver este problema de pesquisa utilizando as fases do método
estatístico? Quais tipos de variáveis e gráficos podemos utilizar para apresentar
os dados solicitados?

FINALIZANDO
Nesta aula verificamos que a estatística é dividida em estatística descritiva
e estatística indutiva. Para gerar informações, auxiliando na tomada de decisão,
podemos utilizar o método estatístico, composto de diversas fases para facilitar
o tratamento de dados numéricos e, após a coleta dos dados, podemos
apresentá-los utilizando gráficos que facilitam a compreensão, tornando as
informações e decisões cada vez mais precisas.
Conhecemos, também, os tipos de variáveis que podem aparecer em uma
pesquisa, como organizar um dado bruto, elaborar uma distribuição de
frequência, calcular frequência acumulada e relativa, além da interpretação dos
resultados obtidos. Observamos, ainda, a construção de uma distribuição de
frequência e distribuição de frequência por classe ou intervalos e as diferenças
entre elas.

23
REFERÊNCIAS

CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba:


InterSaberes, 2010.

ESTAT_WP. A importância da estatística em diferentes campos. Estat


Consultoria Estatística. Disponível em: <http://www.estatconsultoria.org/2017/
06/14/a-importancia-da-estatistica-em-diferentes-campo/>. Acesso em: 29 abr.
2019.

GONÇALVES, G. Estatística no mundo empresarial. Administradores.


Disponível em: <http://www.administradores.com.br/artigos/marketing/estatistic
a-no-mundo-empresarial/66653/>. Acesso em: 29 abr. 2019.

LARSON, R.; FARBER, B. Estatística aplicada. 2. ed. São Paulo: Pearson,


2004.

MARTINS, G. de A. Estatística geral e aplicada. 3. ed. São Paulo: Atlas, 2010.

PEREIRA, A. T. Métodos quantitativos aplicados à contabilidade. Curitiba:


InterSaberes, 2014.

PROFESSOR GURU. Exemplo de histograma e polígono de frequências.


Disponível em: <http://professorguru.com.br/estatistica/gr%C3%A1ficos%20est
at%C3%ADsticos/exemplo%20de%20histograma%20e%20pol%C3%ADgono%
20de%20frequ%C3%AAncias.html>. Acesso em: 29 abr. 2019.

RAMOS, R. Por que estatística é tão importante? Estatístico. Disponível em:


<https://oestatistico.com.br/por-que-estatistica-importante/>. Acesso em: 29 abr.
2019.

24
ESTATÍSTICA APLICADA ÀS
ANÁLISES CONTÁBEIS
AULA 2

Profª Aline Purcote


CONVERSA INICIAL

Podemos apresentar os dados por meio de um valor único com a


finalidade de descrever ou resumir um fenômeno. Assim surge a utilização de
medidas como as Medidas de Posição, que são altamente aplicáveis nas
organizações, pois proporcionam a compreensão e interpretação das
informações que servirão como base para tomadas de decisão.

CONTEXTUALIZANDO

Constantemente utilizamos a média para realizar análises em casa ou


dentro das organizações. Verificamos a média de consumo realizada por um
automóvel para comparar modelos e até para tomar a decisão de comprar ou
vender determinado veículo. Verificamos a média de consumo de energia, média
de preço e média de vendas de um determinado produto. Logo, utilizamos a
média em diversas situações. Mas como calcular essa medida?
Além da média, temos outras medidas que podemos utilizar, como a
mediana, a moda e as separatrizes. Nesta aula vamos estudar como calcular
essas medidas e como interpretar os resultados obtidos.

TEMA 1 – MEDIDAS DE POSIÇÃO

Uma forma mais sintética de descrever um conjunto de dados pode ser


feita por meio de um valor único, que representa em termos “médios” todo o
conjunto. Esse valor tende a se localizar no centro do conjunto de dados, em
torno do qual os dados tendem a se agrupar facilitando a interpretação e geração
de informações em uma pesquisa.
Segundo Pereira (2014), as medidas de posição são as medidas de
tendência central e as separatrizes, as quais determinam o posicionamento dos
valores em uma distribuição de frequência, que permitem analisar o fenômeno
estudado com mais exatidão. As medidas de tendência central dividem-se em
média, mediana e a moda. Já as separatrizes se dividem em quartis, decis e
percentis.
As medidas de posição podem ser aplicadas em três situações: dados
não agrupados, distribuição de frequência e distribuição de frequência por classe
ou intervalo.

2
Tabela 1 – Dados não agrupados

15 13 10 14 15 15 14 14 12 13

Saiba mais
Significa que os dados não estão dispostos em uma distribuição de
frequência. Observe que nem toda tabela é uma distribuição. A tabela
apresentada não é uma distribuição de frequência, pois não possui a informação
de frequência, e sim os meses e o valor em R$.

Tabela 2 – Dados agrupados em uma distribuição de frequência

Veículos Número de
Negociados Vendedores
1 1
2 3
3 5
4 1
Total 10

Tabela 3 – Dados agrupados em uma distribuição de frequência por classe

Salário Nº Funcionários
1000|--- 2000 20
2000|--- 3000 18
3000|--- 4000 9
4000|--- 5000 3

TEMA 2 – MÉDIA

2.1 Média ou média aritmética

De acordo com Pereira (2014), a média aritmética é uma medida


estatística que representa o grau de concentração dos valores em uma
distribuição, ou seja, é onde a maioria dos valores está posicionada.

3
A média aritmética ou apenas média é a medida de centralidade mais

comum e representada pelo símbolo X . É a soma dos resultados obtidos


dividido pela quantidade de resultados, ou seja, somamos todos os valores e
dividimos pela quantidade de dados que temos.
Para calcular a média, em dados não agrupados, utilizamos a fórmula:

X 
X
N

em que, X são os dados, N a quantidade de observações, e o símbolo 


representa o somatório, ou seja, a soma de todos os valores.

2.1.1 Exemplo 1

Uma empresa apresentou durante o ano os seguintes volumes de vendas,


em reais: 2.500; 2.600; 3.100; 15.100; 4.600; 4.000; 4.100; 3.700; 3.400; 3.600;
3.900; 4.200. Qual a média anual de vendas dessa empresa?
Para encontrar a média, precisamos somar os valores fornecidos e dividi-
los por 12, pois temos 12 valores apresentados.

2500  2600  3100  15100  4600  4000  4100  3700  3400  3600  3900  4200
X 
12
54800
X   4.566,67
12

Logo, a média anual de vendas dessa empresa é de R$ 4.566,67.

2.1.2 Exemplo 2

As exportações de determinado porto brasileiro registraram o seguinte


movimento, em bilhões de reais, durante um ano. Qual foi a média mensal de
exportações, em bilhões de reais? (Castanheira, 2010).

4
Para encontrar a média, precisamos somar os valores mensais de
exportações – segunda coluna (R$) – e depois dividir por 12, pois temos 12
meses.

36
X  3
12

Desse modo, a média mensal de exportações é de 3 bilhões de reais.

2.2 Média Aritmética Ponderada ou Média Ponderada

Além da Média Aritmética, temos a Média Aritmética Ponderada ou


apenas Média Ponderada, que é utilizada quando os dados estão agrupados em
uma distribuição de frequências. Usamos a média dos valores ponderados pelas
suas respectivas frequências, pois cada grandeza envolvida no cálculo tem
diferente importância, ou seja, acontece um número diferente de vezes. Para
calcular a média ponderada, utilizamos a fórmula a seguir e os seguintes passos.

X
 (X .f ) , em que N = f
N

1. Multiplica-se os dados (X) pela frequência (f) para cada um dos valores
da distribuição, ou seja, para todas as linhas da tabela.
2. Soma-se os valores obtidos na multiplicação X.f.
3. Encontra-se o valor de N, que é o número de observações, somando a
coluna de frequências.
4. Divide-se o valor encontrado na soma de X.f pelo valor de N.

5
2.2.1 Exemplo 1

Calcule a média das idades representadas na seguinte distribuição de


frequências.

1. Multiplica-se os dados (X) – nesse caso, X são as idades que estão


representadas na primeira coluna – pela frequência (f), que estão
representadas na segunda coluna para cada um dos valores da
distribuição.

2. Soma-se os valores obtidos na multiplicação X.f.

Idade Freqüência x.f


4 4 16
5 6 30
6 6 36
7 4 28
110

3. Encontra-se o valor de N somando-se a coluna de frequências: N= 20.

Idade Frequência x.f

4 4 16

5 6 30

6 6 36

7 4 28

20 110

6
4. Divide-se o valor encontrado na soma de x.f pelo valor de N.

Idade Frequência x.f

4 4 16

5 6 30

6 6 36

7 4 28

20 110

110
X   5,5
20

A idade média desse grupo é de 5,5 anos.

2.2.2 Exemplo 2

Foram inspecionados 30 aparelhos fabricados por certa indústria,


obtendo-se os seguintes números de defeitos por aparelhos:

Número de f
defeitos
0 12
1 8
2 7
3 1
4 2

Qual o número médio de defeitos?


Para calcular a média, vamos multiplicar X.f, somar os valores obtidos,
encontrar o valor de N e por último realizar a divisão.

Número de defeitos f X.f

0 12 0

1 8 8

2 7 14

3 1 3

4 2 8

30 33
33
X   1,1
30

Em média, os aparelhos inspecionados apresentaram 1,1 defeitos.

7
2.3 Distribuição de frequências representada em intervalos ou classes em
média ponderada

Quando temos uma distribuição de frequências representada em


intervalos ou classes, os valores de X, na fórmula da média ponderada, são
representados pelos pontos médios (PM) desses intervalos. Assim:

X =
 (PM.f )
N

Dessa forma, sempre que for necessário calcular a média em uma


Distribuição de Frequência por classe, o primeiro passo será calcular o ponto
médio de cada classe para, depois, seguir com os passos para calcular a média.

Ls  Li
1. Calcula-se o ponto médio de cada classe: Pm  .
2
2. Multiplica-se o ponto médio (PM) pela frequência (f) para cada um dos
valores da distribuição, ou seja, para todas as classes da tabela.
3. Soma-se os valores obtidos na multiplicação PM.f.
4. Encontra-se o valor de N somando-se a coluna de frequências.
5. Divide-se o valor encontrado na soma de PM.f pelo valor de N.

2.3.1 Exemplo 1

Foram medidas as alturas dos funcionários de uma determinada empresa,


obtendo os dados apresentados na tabela a seguir. Qual é a média das alturas?

Para calcular a média, vamos seguir os passos apresentados.

1. Calcula-se o ponto médio de cada classe.

Primeira classe:

Ls  Li 154  150 304


PM     152
2 2 2

Seguindo o cálculo para todas as classes, temos:


8
2. Multiplica-se o ponto médio (PM) pela frequência (f) para todas as classes.

3. Soma-se os valores obtidos na multiplicação PM.f.

4. Encontra-se o valor de N somando-se a coluna de frequências.

5. Divide-se o valor encontrado na soma de PM.f pelo valor de N.

6440
X   161
40

9
Em média, os funcionários dessa empresa possuem alturas iguais a
161 cm.

2.3.2 Exemplo 2

Considere a seguinte tabela, que representa o salário (R$) de uma


amostra de 50 funcionários de uma determinada empresa. Qual o salário médio
desses funcionários?
Salário Nº Funcionários
1000|--- 2000 20
2000|--- 3000 18
3000|--- 4000 9
4000|--- 5000 3

Para encontrar a média, calculamos o ponto médio, depois multiplicamos


o ponto médio pela frequência, somamos os resultados obtidos na multiplicação
e, por último, dividimos por N.
Salário Nº Funcionários PM PM . F
1000|--- 2000 20 1.500 30.000
2000|--- 3000 18 2.500 45.000
3000|--- 4000 9 3.500 31.500
4000|--- 5000 3 4.500 13.500
50 120.000

120000
X   2.400
50

Portanto, o salário médio é R$ 2.400.

TEMA 3 – MEDIANA

A mediana é representada por Md e seu valor indica o elemento que


ocupa a posição central, dividindo a distribuição em 50%, ou seja, é o valor que
divide o conjunto de dados em duas partes iguais, sendo que 50% dos valores
ficam abaixo e 50% ficam acima da mediana.

Figura 1 – Mediana

A mediana para dados não agrupados é o valor que divide a série


ordenada em dois conjuntos com o mesmo número de valores. Segundo
10
Castanheira (2010), é necessário observar que a quantidade de dados pode ser
par ou ímpar. Sendo ímpar, o valor da mediana é o valor que está no centro da
série; sendo par, a mediana será a média aritmética dos dois valores que estão
no centro da série.
Para dados não agrupados, os passos para o cálculo da mediana são os
seguintes.

1. Ordena-se a série.
2. Encontra-se a quantidade de dados N que é igual ao número de
observações.
3. Verifica-se se N é ímpar ou par.

N
4. Calcula-se a posição da mediana. Posição = .
2
6. Calcula-se a mediana: ímpar = valor central; par = Média dos valores
centrais.

3.1 Exemplo 1

Considere a série 2,5,6,8,10,13,15,16,18 e calcule a mediana.

1. Ordena-se a série (neste exemplo, a série já está ordenada).


2. Encontra-se o número de observações (N), isto é, conta-se quantos dados
temos na série. Nesse caso, N = 9.
3. Verifica-se se N é ímpar ou par. N = 9 é ímpar.
4. Calcula-se a Posição.

N 9
Posição =   4,5  5
2 2

Sempre que a posição apresentar número com vírgula, arredonda-se para


o inteiro mais próximo.

5. Calcula-se a mediana. Como o N é ímpar, vamos procurar na série


ordenada o número que está na posição 5. Para isso, contamos as
posições, ou seja, o número 2 está na primeira posição, o número 5 na
segunda. Seguindo esse processo, temos o número 10 na quinta posição.

2,5,6,8,10,13,15,16,18

11
A mediana é igual a 10, pois abaixo de 10 temos 4 números (2,5,6,8) e
acima de 10 também 4 (13, 15, 16, 18).

3.2 Exemplo 2

Considere a série 1,6,3,10,9,8 e calcule a mediana.

1. Ordena-se a série.
1, 3, 6, 8, 9, 10

2. Encontra-se o número de observações (N), isto é, conta-se quantos dados


temos na série. Assim, N = 6.
3. Verifica-se se N é ímpar ou par. N = 6 é par.
4. Calcula-se a Posição.

N

6 3
2 2

5. Calcula-se a mediana. Como o N é par, precisamos encontrar os dois


valores que estão no meio da série. Assim, vamos procurar na série
ordenada o número que está na posição 3; a próxima posição que é a
posição 4.

1,3,6,8,9,10

Na posição 3, temos o número 6, e na posição 4, o número 8. Dessa


forma, devemos encontrar a média entre os dois valores, ou seja, somar e dividir
por 2. Logo, a mediana será:
6  8 14
Md =  7
2 2

Podemos também calcular a mediana em uma distribuição de frequências


realizando os seguintes passos.

1. Encontra-se o valor de N, que é igual à soma das frequências.


2. Determina-se se N é par ou ímpar.
3. Calcula-se a Frequência Acumulada (fa).
𝑁
4. Calcula-se a Posição = 2 .

5. Identifica-se na Frequência Acumulada a posição calculada no passo 4.


Sempre buscar um valor igual ou maior que a posição calculada.
6. Calcula-se a mediana.

12
Ímpar = valor central

Par = Média dos valores centrais

3.3 Exemplo 3

Foram inspecionados 30 aparelhos fabricados por certa indústria,


obtendo-se os seguintes números de defeitos por aparelhos.

Qual a mediana dessa distribuição?


Para determinar a mediana, seguimos os passos indicados anteriormente.

1. Encontra-se o valor de N. Para encontrá-lo, somamos as frequências;


temos N = 30.

2. Determina-se se N é par ou ímpar. Nesse caso, N = 30, então N é par.


3. Calcula-se a Frequência Acumulada. Para calcular a Frequência
Acumulada, repetimos a primeira frequência e a somamos com a
frequência seguinte.

Número de defeitos f fa

0 12 12
1 8 20
2 7 27
3 1 28
4 2 30

4. Calcula-se a Posição.

13
N 30
Posição =   15
2 2

5. Identifica-se, por meio da Frequência Acumulada, a posição. Como N é


par, precisamos de dois valores centrais, assim consideramos o valor que
está na posição 15 e posição 16. Procuramos na coluna da Frequência
Acumulada valor igual ou maior a 15 e 16. Esse número está na
Frequência Acumulada igual a 20 que possui dado igual a 1.

Número de defeitos f fa

0 12 12
1 8 20
2 7 27
3 1 28
4 2 30

Posição 15 = 1
Posição 16 = 1

6. Calcula-se a mediana. Soma-se os dados encontrados nas posições.

11 2
Md =  1
2 2

Logo, a mediana dessa distribuição é igual a 1, ou seja 50% dos aparelhos


verificamos possuem até 1 defeito.

3.4 Exemplo 4

Uma pesquisa foi realizada para avaliar o preço de determinado produto


em diferentes supermercados, obtendo a seguinte distribuição. Com base nos
dados coletados, calcule a mediana.
Preço Frequência
73 2
75 10
77 12
79 5
81 2

1. Encontra-se o valor de N. Soma-se as frequências.

14
Preço Frequência
73 2
75 10
77 12
79 5
81 2
31
2. Determina-se se N é par ou ímpar. N = 31, então N é ímpar.
3. Calcula-se a Frequência Acumulada.

Preço Frequência fa
73 2 2
75 10 12
77 12 24
79 5 29
81 2 31
31
4. Calcula-se a Posição.

Posição = N  31  15,5  16
2 2

5. Identifica-se, por meio da Frequência Acumulada, a posição. Procuramos


na coluna da Frequência Acumulada valor igual ou maior que 16. Esse
número está na Frequência Acumulada igual a 24 que possui dado igual
a 77.
6. Calcula-se a mediana: como N é um número ímpar, a mediana é o valor
encontrado na posição 16, ou seja, a mediana é igual a 77.

Logo, a mediana dessa distribuição é igual a 77, ou seja, 50% dos locais
comercializam o produto por até R$ 77.
Para calcular a mediana em uma distribuição de frequências com os
dados agrupados por classes, seguimos os seguintes passos.

1. Encontra-se o valor de N, que é igual à soma das frequências.


N
2. Calcula-se a Posição = .
2
3. Calcula-se a Frequência Acumulada (fa).
4. Identifica-se na Frequência Acumulada a posição calculada no passo 2
(sempre buscar um valor igual ou maior que a posição calculada).
5. Calcula-se a mediana, utilizando a fórmula:

15
Md = Li + (N / 2   f )
ant
.A
fMd

Em que:

 Li = limite inferior da classe que contém a mediana.


 N = número de observações, ou seja, soma das frequências.
 f ant = soma das frequências anteriores à classe que contém a mediana.

 A = amplitude das classes: A = Ls – Li.


 f Md = frequência da classe que contém a mediana.

3.5 Exemplo 5

A tabela a seguir representa as notas obtidas por um grupo de 58 alunos


matriculados em uma determinada disciplina. Calcule a mediana (adaptado de
Shiguti; Shiguti, 2006).

Para calcular a mediana, seguimos os passos mencionados


anteriormente.

1. Encontra-se o valor de N que é igual à soma das frequências.

2. Calcula-se a Posição

N 58
Posição =   29
2 2

3. Calcula-se a Frequência Acumulada (fa).

16
4. Identifica-se na Frequência Acumulada a posição calculada no passo 2.

Posição = 29, identificada na terceira classe.

5. Calcula-se a mediana, utilizando a fórmula:

Md = Li + (N / 2   f )
.A
ant

fMd

Como a posição foi identificada na terceira classe, essa classe será


utilizada como base para os cálculos, em que:
Li = 55

N 58
  29
2 2

 f ant = soma das frequências anteriores à classe que contém a mediana

= 17.
 f Md = frequência da classe que contém a mediana = 18.

f ant

17
A = Ls – Li = 65 – 55 = 10

Conhecido todos os valores, aplicamos a fórmula e encontramos a


mediana.

A mediana é igual a 61,67, ou seja, 50% dos alunos obtiveram nota até
61,67 pontos.

TEMA 4 – MODA

A moda (Mo) é representada pelo valor que ocorre o maior número de


vezes, ou seja, que mais se repete em uma série de dados, que possui a maior
frequência. A moda pode ter três diferentes situações:

1. Distribuição modal: quando temos apenas um valor para moda;


2. Distribuição bimodal: quando temos dois ou mais valores para moda;
3. Distribuição amodal: quando não existe moda, ou seja, não há repetição
de valores.

Nos dados não agrupados, obtemos a moda pela observação da série, ou


seja, verificamos o valor que mais se repete.

4.1 Distribuição modal

4.1.1 Exemplo

Na série 7, 10, 9, 8, 12, 10, 11, 10, a moda é igual a 10, pois o número 10
aparece 3 vezes.

4.2 Distribuição bimodal

4.2.1 Exemplo

A série 4, 3, 2, 4, 5, 7, 6, 4, 7, 9, 8, 7 apresenta duas modas: 4 e 7, logo a


série é bimodal. Tanto o número 4 como 7 aparecem 3 vezes na série.

18
4.3 Distribuição amodal

4.3.1 Exemplo

A série 3, 5, 8, 10, 12 não apresenta moda, isto é, a série é amodal.

4.4 Distribuição de frequência sem o agrupamento em intervalos ou


classes

Na distribuição de frequência sem o agrupamento em intervalos ou


classes, a moda é o valor que possui a maior frequência. Verificamos na coluna
de frequência o maior valor e a moda será o valor de X que está na primeira
coluna.

4.4.1 Exemplo

Encontre a moda da seguinte distribuição.


Verificando a coluna de frequência, a maior frequência é 12. Assim, a
moda é identificada pelo dado da primeira coluna, ou seja, a moda é igual à zero
(Mo = 0).
Número de defeitos F

0 12
1 8
2 7
3 1
4 2

4.5 Distribuição de frequência com dados agrupados em classes

Quando temos uma distribuição de frequências com dados agrupados em


classes, precisamos dos seguintes passos para calcular a moda.

1. Identifica-se em que classe se encontra a moda, ou seja, a classe que


apresenta a maior frequência.
2. Determina-se o valor da moda utilizando a fórmula:

f post .A
Mo = Li +
f ant  f post

19
Em que:

 Li = limite inferior da classe que contém a moda.


 f post = frequência da classe posterior à classe que contém a moda.

 f ant = frequência da classe anterior à classe que contém a moda.

 A = amplitude das classes: A = Ls – Li.

4.5.1 Exemplo

A tabela a seguir representa as notas obtidas por um grupo de 58 alunos


matriculados em uma determinada disciplina. Calcule a moda. (Adaptação:
Shiguti, Wanderley Akira; Shiguti, Valéria da S. C. Apostila De Estatística)

Passos para determinação da moda:

1. Identifica-se em que classe se encontra a moda, ou seja, a classe que


apresenta a maior frequência de ocorrência. A maior frequência é 18,
assim, a moda está localizada na classe: 55|---- 65.
2. Determina-se o valor da moda utilizando a fórmula:

Li = 55

Em que:

 f post = frequência da classe posterior à classe que contém a moda = 14.

 f ant = frequência da classe anterior à classe que contém a moda = 12.

f ant

f post

20
A = Ls – Li = 65 – 55 = 10
14.10
Mo  55 
12  14
140
Mo  55 
26
Mo  55  5,38  60,38
A moda é igual a 60,38, ou seja, a nota que aparece com mais frequência
ou que mais se repete é 60,38.

TEMA 5 – SEPARATRIZES

As separatrizes são números que dividem uma distribuição em partes


iguais e determinam o posicionamento de certo valor na distribuição. Podemos
determinar qual o valor que separa a distribuição em 4, 10 ou 100 partes iguais,
ao qual chamamos de quartis, decis e percentis, respectivamente.
Os quartis permitem dividir a distribuição em quatro partes iguais e são
representados por Qi, em que i representa a ordem do quartil. No diagrama
abaixo, o 1.º quartil representa 25% dos dados, o 2.º quartil representa 50% e o
terceiro representa 75% dos dados. Isso ocorre porque dividimos 100% dos
dados por 4, obtendo 25%. Assim, a cada quartil acumulamos 25%.

Figura 2 – Quartis

Quando temos dados não agrupados, encontramos o quartil colocando os


dados em ordem e depois aplicando regra de três, que indicará o posicionamento
do elemento no conjunto de dados. Considerando o seguinte conjunto de dados,
vamos determinar o primeiro quartil:
6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
Primeiramente precisamos ordenar o conjunto de dados:
6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
Sabemos que o primeiro quartil corresponde a 25% dos dados e, no total,
(100%) temos 11 dados. Assim, montamos a regra de três:
100% --------> 11
25% ---------> X

21
Multiplicando cruzado, temos:
100% X = 25% . 11
100X = 275
X = 275 / 100
X = 2,75
O valor encontrado é a posição do primeiro quartil. Como temos um
número decimal, arredondamos para o imediatamente superior, ou seja, vamos
procurar o número da série ordenada que ocupe a posição 3:
6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

Logo, o primeiro quartil é o número 15, que representa 25% do conjunto


de dados. Se aplicarmos a mesma lógica para encontrar o segundo e terceiro
quartil, precisamos alterar o 25% por 50% ou 75%, dependendo do quartil a ser
calculado, e encontramos Q2 = 40 e Q3 = 43.
Para uma distribuição de frequência por classe e intervalos, o cálculo é
muito próximo ao realizado na mediana por classe. A diferença está no cálculo
da posição, que dividimos por 4, e precisamos indicar o quartil a ser calculado
conforme passos a seguir.

1. Encontra-se o valor de N que é igual a soma das frequências.


N
2. Calcula-se a Posição = .i , em que i representa o quartil a ser calculado,
4
assim, i = 1, 2 ou 3.
3. Calcula-se Frequência Acumulada (fa).
4. Identifica-se na Frequência Acumulada a posição calculada no passo 2
(sempre buscar um valor igual ou maior que a posição calculada).
5. Calcula-se o quartil, utilizando a fórmula:

N
( .i   f ant )
Qi  Li  4 .A
f Di

5.1 Exemplo 1

Uma empresa realizou um levantamento para conhecer a distribuição dos


salários de um determinado departamento e obteve a distribuição de frequência
relativa ao salário mínimo indicada na tabela a seguir. Calcule o primeiro quartil.

22
Salários f
0|---- 2 8
2|---- 4 12
4|---- 6 22
6|---- 8 26
8|---- 10 18
10|---- 12 15

Vamos somar as frequências para encontrar N. Calcula-se a posição


considerando-se i=1, pois queremos o 1.º quartil, e calcula-se a Frequência
Acumulada.
N = 101
N 101
Posição = .i = .1  25,25
4 4
Salários f fa
0|---- 2 8 8
2|---- 4 12 20
4|---- 6 22 42
6|---- 8 26 68
8|---- 10 18 86
10|----12 15 101
101
Agora, precisamos identificar na Frequência Acumulada a posição 25,25,
que está na classe 4|---- 6, e aplicamos a fórmula.
N
.i   f ant )
(
Qi  Li  4 .A
f Di

( 25,25  20)
Q1  4  .2
22

(5,25)
Q1  4  .2  4  0,48  4,48
22

Observa-se que 25% dos funcionários desse departamento recebem até


4,48 salários mínimos.
Os decis permitem dividir a distribuição em dez partes iguais e são
representados por Di, em que i representa a ordem do decil (1, 2, 3, ..., 9). No
diagrama a seguir, verificamos que cada decil corresponde a 10% do conjunto
de dados, pois dividimos 100% dos dados por 10, obtendo 10%. Assim, a cada
decil, acumulamos 10%.

23
Já os percentis permitem dividir a distribuição em cem partes iguais e são
representados por Pi, em que i representa a ordem do percentil (1, 2, 3,...., 99).
No diagrama a seguir, verificamos que cada percentil corresponde a 1% do
conjunto de dados, pois dividimos 100% dos dados por 100. Assim, a cada
percentil, acumulamos 1%.

A estrutura de cálculo para os decis e percentis é exatamente igual à dos


quartis, porém temos uma modificação no cálculo da posição, pois estamos
falando de 10 partes ou 100 partes iguais.

N
 Decis: Posição = .i , em que i representa o decil a ser calculado. Assim,
10
i = 1, 2,..., 9.

N
( .i   f ant )
Di  Li  10 .A
f Di

N
 Percentis: Posição = .i , em que i representa o percentil a ser
100
calculado. Assim, i = 1, 2,..., 99.

N
( .i   f ant )
Pi  Li  100 .A
f Pi

Voltando ao exercício 1, vamos utilizar a distribuição de frequência para


calcular o 8.º decil e o percentil 90.
Salários f Fa
0|---- 2 8 8
2|---- 4 12 20
4|---- 6 22 42
6|---- 8 26 68
8|---- 10 18 86
10|----12 15 101
101

24
N 101
 8º decil: Posição = .i = .8  80,80
10 10
Classe: 8|---- 10
(80,80  68)
D8  8  .2
18

D8  8  1,42  9,42

Ou seja, 80% dos funcionários desse departamento recebem até 9,42


salários mínimos.

N 101
 Percentil 90: Posição = .i = .90  90,90
100 100
Classe: 10|----12
(90,90  86)
P90  10  .2
15

P90  10  0,65  10,65

Ou seja, 90% dos funcionários desse departamento recebem até 10,65


salários mínimos.

TROCANDO IDEIAS

Aqui estudamos as principais medidas de posição: média, mediana, moda


e separatrizes. Verificamos que essas medidas estão presentes em diversas
situações do nosso cotidiano.
Você já utilizou algumas das medidas citadas em seu dia a dia, em casa
ou dentro de uma empresa? Como foi essa utilização? Essa medida foi utilizada
para tomadas de decisão?

NA PRÁTICA

Frequentemente utilizamos as medidas para auxiliar na tomada de


decisão. Verificamos o preço médio de um produto, o consumo médio, o tempo
médio de entrega e, assim, geramos informações úteis no nosso cotidiano dentro
e fora das organizações.
As medidas podem ser utilizadas dentro das organizações nas pesquisas.
Por exemplo, uma loja está interessada em conhecer o perfil de seus clientes,
assim coleta as idades de uma amostra de consumidores para estimar qual é a
25
idade média desse grupo. Com essa informação, a empresa pode embasar os
seus anúncios adequando-os para a faixa etária do seu público, ou ainda,
adequando o layout da loja, garantindo assim mais assertividade e conquistando
o seu público principal. Podemos também observar os custos para produção de
certo item chegar a um valor que indica o custo médio de produção para realizar
controle de custos ou comparar com os concorrentes.
Se observarmos, as medidas são utilizadas em diversas áreas, sempre
auxiliando nas análises e decisões. Por meio dessas medidas, podemos também
verificar o número de investimentos que ocorrem em determinada instituição,
qual é o investimento mais procurado, quanto, em média, é investido em cada
situação e conhecer o perfil de investidores em determinada instituição
financeira.

FINALIZANDO

Nesta aula apresentamos as principais Medidas de Posição, seus


cálculos, aplicações e interpretações dos resultados obtidos. Definimos e
calculamos média, mediana, moda, quartil, decil e percentil.

26
REFERÊNCIAS

CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba:


InterSaberes, 2012.

PEREIRA, A. T. Métodos quantitativos aplicados à contabilidade. Curitiba:


InterSaberes, 2014.

SHIGUTI, W. A.; SHIGUTI, V. da S. C. Apostila de estatística. Brasília, 2006.


Disponível em: <http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5
_INE5102_Quimica.pdf>. Acesso em: 22 set. 2019.

27
ESTATÍSTICA APLICADA ÀS
ANÁLISES CONTÁBEIS
AULA 3

Prof.ª Aline Purcote


CONVERSA INICIAL

Já estudamos algumas situações em que as medidas de posição podem


ser utilizadas, mas nem sempre apenas o cálculo dessas medidas nos fornece
a melhor base para tomada de decisão. Ao calcular as medidas de posição,
chegamos a um único número que apresenta uma ideia de todo o conjunto, mas
essas medidas não descrevem detalhadamente o comportamento dos dados.
Dessa forma, podemos utilizar as medidas de dispersão para complementar
nossas análises e tomar decisões mais assertivas.
Segundo Castanheira (2010, p. 78), as chamadas medidas de dispersão
são medidas utilizadas para verificar o quanto os valores encontrados em uma
pesquisa estão dispersos ou afastados em relação à média.

CONTEXTUALIZANDO

Com as medidas de dispersão, verificamos o grau de variação existente


entre os dados, ou seja, se os valores apresentados estão dispersos ou
afastados, isto é, se os valores estão próximos ou separados um dos outros.
Por exemplo, vamos considerar o valor do imposto pago por uma empresa
nos últimos cinco meses, conforme a Tabela 1.

Tabela 1 – Imposto pago por uma empresa nos últimos cinco meses

Mês Imposto
1 500
2 1.500
3 1.800
4 2.200
5 2.500

Se calcularmos a média do imposto pago nos últimos cinco meses,


teremos a média igual a R$ 1.700. No entanto, analisando os valores
apresentados na tabela, percebemos que há valores diferentes abaixo e acima
da média calculada, ou seja, existe uma dispersão do imposto pago por essa
empresa. Mas qual é essa variação? Para responder a essa questão, será
necessário utilizar as medidas de dispersão, pois só as medidas de posição não
são conclusivas.
Outro exemplo ocorre quando verificamos qual o tempo médio de entrega
das compras efetuadas pela internet. Ao analisarmos apenas a média, não
2
conseguimos concluir se a empresa realiza as entregas conforme o informado.
No entanto, com a análise das medidas de dispersão, conseguimos concluir se
as entregas são realizadas conforme informações dadas no ato da compra. Se
a medida de dispersão fornece um valor pequeno, significa que a empresa é
mais confiável quanto a manter o tempo médio das entregas; caso contrário, ela
não é tão confiável, por vezes é muito rápida e por outra demora muito. Dessa
forma, se analisarmos uma medida de dispersão, conseguimos concluir quão
confiável é a empresa e se vale a pena realizar a compra.
Com base nos exemplos trabalhados, vamos verificar quais são as
medidas de dispersão, como calculá-las e como interpretar os resultados
obtidos.

TEMA 1 – MEDIDAS DE DISPERSÃO

A análise realizada pelas medidas de posição pode ser complementada


com a utilização das medidas de dispersão. Segundo Castanheira (2010), as
medidas de dispersão servem para verificar com que confiança as medidas de
posição resumem as informações fornecidas pelos dados obtidos em uma
pesquisa.
As medidas de dispersão indicam se os dados estão afastados da região
central, medindo o grau de variação existente entre os valores, e serve para
medir a representatividade da média.

Figura 1 – Dispersão

Considere a seguinte pesquisa, que representa o preço de dois produtos


(A e B) em diferentes pontos de venda:
A: 20, 20, 20
B: 15, 10, 20, 25, 30
Ao calcular a média de preço de cada produto, obtemos R$ 20,00 para os
dois produtos, ou seja, os dois produtos possuem médias iguais. No produto A,
não temos variação entre os preços; já no produto B, temos preços diferentes,
ou seja, a média é de R$ 20,00 e encontramos o produto com preço de R$10,00

3
e de R$30,00. Desse modo, para o mesmo produto encontramos diferença entre
os preços e precisamos saber qual é essa variação, pois os valores
apresentados na pesquisa apresentam dispersão em torno da média.
Dentre as medidas de dispersão, podemos citar a amplitude total, o desvio
médio, a variância, o desvio padrão e o coeficiente de variação.

TEMA 2 – AMPLITUDE TOTAL

A amplitude total é considerada a medida de dispersão mais simples e


calculada pela diferença entre o maior e o menor valor de uma série de dados.

A = maior – menor

Se o resultado encontrado para amplitude for um número elevado,


significa que os valores da série estão afastados uns dos outros. Caso o valor
encontrado seja baixo, os valores da série estão próximos uns dos outros. Dessa
forma, quanto maior a amplitude, maior será a dispersão dos valores.

2.1 Exemplo 1

Considere os valores 40, 45, 48, 62 e 70 e calcule a amplitude total.


Solução: para encontrar a amplitude, precisamos do maior e menor valor
para depois realizar a diferença.
Maior valor = 70
Menor valor = 40
Amplitude = 70 – 40 = 30

2.1 Exemplo 2

Qual a amplitude do imposto pago nos últimos cinco meses?

Tabela 2 – Imposto pago nos últimos cinco meses

Mês Imposto
1 500
2 1.500
3 1.800
4 2.200
5 2.500
Maior valor = 2.500

4
Menor valor = 500
Amplitude = 2.500 – 500 = 2.000
Solução: segundo Castanheira (2010), para o caso de os dados estarem
agrupados em classes, o cálculo da amplitude total pode ser realizado das duas
formas a seguir.

1. Pelos pontos médios das classes: nesse caso, a amplitude total é igual
ao ponto médio da última classe menos o ponto médio da primeira classe.
2. Pelos limites das classes: nesse caso, a amplitude total é igual ao limite
superior da última classe menos o limite inferior da primeira classe.

2.3 Exemplo 3

Qual a amplitude da seguinte distribuição?

Tabela 3 – Distribuição estaturas x frequências

Solução: vamos calcular a amplitude considerando as duas formas


citadas anteriormente.

 Ponto médio das classes: nesse caso, para calcular a amplitude total
precisamos encontrar o ponto médio da última classe e o ponto médio da
primeira classe, para, depois, realizar a diferença. Lembrando que o ponto
médio é calculado pela fórmula:

Ls  Li
Pm 
2

 Ponto médio da última classe:

174  170 344


Pm    172
2 2

 Ponto médio da primeira classe:


5
154  150 304
Pm    152
2 2

 Amplitude:
172 – 152 = 20 cm
 Limites das classes: para calcular a amplitude total, precisamos encontrar
o limite superior da última classe e o limite inferior da primeira classe para
depois realizar a diferença:
 Limite superior da última classe = 174
 Limite inferior da primeira classe = 150
 Amplitude = 174 – 150 = 24 cm

A amplitude total apresenta algumas restrições, pois considera apenas os


valores extremos da série, desprezando os valores intermediários. Segundo
Martins (2010, p. 52), a utilização da amplitude total como medida de dispersão
é limitada, pois, sendo uma medida que depende apenas dos valores extremos,
não capta possíveis variações entre seus limites.

TEMA 3 – DESVIO MÉDIO

O desvio médio é uma medida de dispersão que analisa a média dos


desvios em torno da média de cada um dos valores da série e é calculado pela
média dos valores absolutos dos desvios. Representa a média das distâncias
entre cada elemento da amostra e seu valor médio.
Chamamos Dm de desvio médio e calculamos pela fórmula:

Dm =
 x  x .f
N

em que o módulo de cada desvio em relação à média e N é igual à soma das


frequências. O módulo (| |) utilizado no cálculo do desvio médio possui a função
de tornar o número positivo: se a diferença entre o dado e a média resultar em
um número positivo, ao se retirar o módulo, ele continua positivo; se for negativo,
vira positivo.
Como o desvio médio verifica o afastamento em relação à média, o
primeiro passo é calcular a média; depois, aplicamos a fórmula para encontrar o
desvio médio.

6
3.1 Exemplo 1

Suponha os seguintes dados que representam a quantidade de anos de


permanência de alguns funcionários em uma empresa e determine o desvio
médio desse conjunto de dados:
3 7 8 10 11

Solução: para calcular o desvio médio, vamos calcular primeiramente a


média. Lembrando que, para calcular a média em dados não agrupados,
somamos todos os valores e dividimos pelo número de observações.

X 
X
N

3  7  8  10  11 39
X    7,8
5 5

O segundo passo é aplicar a fórmula do desvio médio:

Dm =
 x  x .f
N

Primeiramente, calculamos o desvio de cada valor em relação à média,


ou seja, cada valor menos a média, que é 7,8. Multiplicamos os valores
encontrados pela frequência, que é o número de vezes que o valor aparece. Por
exemplo, se considerarmos o primeiro valor, que é 3, temos |3 – 7,8|·1, ou seja,
o número 3 menos a média que é 7,8 vezes 1, pois o número 3 aparece apenas
uma vez. Repetimos esse processo para cada valor da série e, após, dividimos
por 5, que é o número de observações, ou seja, a quantidade de dados
apresentados.

3  7,81  7  7,81  8  7,81  10  7,81  11  7,81


Dm 
5

Resolvendo a subtração dentro de cada módulo, temos:

 4,81   0,81  0,2 1  2,2 1  3,2 1


Dm 
5

Agora, precisamos retirar os valores do módulo, lembrando que, se o


número for positivo, continua positivo e se for negativo, torna-se positivo. Assim:

7 4,8.1  0,8.1  0,2.1  2,2.1  3,2.1


Dm 
5
Multiplicamos os valores pela frequência, somamos e dividimos por 5:

4,8  0,8  0,2  2,2  3,2


Dm 
5

11,2
Dm   2,24
5

Esse resultado indica que, em média, o tempo de permanência desses


funcionários se desvia em 2,24 anos em torno do tempo médio de permanência,
que é de 7,8 anos.

3.2 Exemplo 2

Em um determinado dia, foi registrado o número de veículos negociados


por uma amostra de 10 vendedores de uma agência de automóveis, como
mostra a tabela a seguir. Calcule o desvio médio (Adaptado de Shiguti; Shiguti,
2019).

Tabela 4 – Veículos negociados X número de vendedores

Solução: o primeiro passo é o cálculo da média, lembrando que, nesse


exemplo, temos uma distribuição de frequência e que a média é calculada pela
fórmula:

X 
 X. f
N

8
Tabela 5 – Veículos negociados X número de vendedores X xiFi

26
X   2,6
10

Agora, vamos calcular o desvio em relação à média. Para facilitar, vamos


incluir uma nova coluna na tabela, identificando o cálculo |x – média|. Assim,
para o primeiro valor da tabela, temos: |1 – 2,6| = |-1,6| = 1,6. Seguimos esse
mesmo processo para os demais valores da tabela.

Tabela 6 – Veículos negociados X número de vendedores X |xi-média|

Encontrado os valores dos desvios, devemos multiplicá-los pelas suas


respectivas frequências. Assim, vamos incluir mais uma coluna chamada |x –
média|*Fi. Para o primeiro valor, temos: 1,60 * 1 = 1,60. Seguimos esse processo
para os demais valores da tabela e após somamos todos os valores encontrados.

9
Tabela 7 – Veículos negociados X número de vendedores X |xi média| X |xi-
média|*Fi

Para finalizar, aplicamos a fórmula do desvio médio:

Dm =
 x  x .f
N

6,80
Dm   0,68
10

A quantidade de veículos negociados por cada vendedor possui um


desvio médio de 0,68 em torno dos 2,6 veículos comercializados em média.
Para dados agrupados em classes ou intervalos, substituímos o X na
fórmula do desvio médio pelo ponto médio de cada classe (Pm).

Dm   x  x.f Dm 
 Pm  x . f
N N

Dessa forma, para calcular o desvio médio em uma distribuição de


frequência por classe, temos os seguintes passos.

1. Calcular o ponto médio de cada classe.


2. Calcular a média.
3. Calcular o desvio em relação à média:  Pm  x . f .
4. Calcular o desvio médio.

3.3 Exemplo 3

A tabela a seguir representa as notas obtidas por um grupo de 58 alunos


matriculados em uma determinada disciplina. Calcule o desvio médio (Adaptado
de Shiguti; Shiguti, 2019).

10
Solução: o primeiro passo é calcular o ponto médio de cada classe.
Lembrando que, para calcular o ponto médio, utilizamos a fórmula:
Ls  Li
Pm 
2

Considerando a primeira classe, temos:


45  35
Pm   40
2

Seguindo o mesmo processo para as demais classes, obtemos:

Tabela 8 – Notas obtidas pelos 58 alunos X ponto médio

No próximo passo, calculamos a média da distribuição de frequência


utilizando a fórmula:

X 
 Pm. f
N

Tabela 9 – Notas obtidas pelos 58 alunos X ponto médio X média da distribuição


de frequência

3610
X   62,24
58

Encontrada a média, precisamos calcular os desvios em relação a esse


valor:  Pm  x . f . Para primeira classe, temos:
11
|40 – 62,24|*5

| -22,24|*5 = 22,24*5 = 111.

Fazendo-se esse cálculo para as demais classes e após somando os


valores obtidos, temos:

Tabela 10 – Notas obtidas pelos 58 alunos X ponto médio X média da distribuição


de frequência X desvios

Por fim, aplicamos a fórmula do desvio médio:

Dm 
 Pm  x . f
N
597
Dm   10,29
58

A nota de cada aluno possui uma distância de 10,29 pontos em torno do


desempenho médio, que foi de 62,24 pontos.

TEMA 4 – VARIÂNCIA

A dispersão dos dados também pode ser calculada considerando os


quadrados dos desvios médios. Segundo Castanheira (2010), à média aritmética
dos quadrados dos desvios damos o nome de variância, que pode ser calculada
de duas formas, considerando uma população ou uma amostra.
Sua fórmula, quando se trata de uma população, é:

S 2

 (x  x) .f
2

Já no cálculo da variância de uma amostra, o denominador deverá ser (N-


1), ou seja:

S 2

 (x  x) .f
2

N 1

12
em que x representa os dados, x é a média dos conjunto de dados, f é a
frequência com que o dados aparecem e N é o número de observações.
A utilização de uma ou outra fórmula depende se os dados representam
uma população ou amostra. Como a variância utiliza o quadrado dos desvios
médios, o primeiro passo é calcular a média para depois aplicar as fórmulas
indicadas.
Ao analisar o resultado da variância, quanto maior for o seu valor, mais
distante da média estarão os dados, e, quanto menor, mais próximos os valores
estarão da média. Se os desvios forem baixos, teremos pouca dispersão, ao
contrário, se os desvios forem altos, teremos elevada dispersão.

4.1 Exemplo 1

Suponha o conjunto de tempo de serviço de cinco funcionários e


determine a variância desse conjunto de dados considerando uma amostra.
3 7 8 10 11

Solução: o primeiro passo é calcular a média. Lembrando que, para dados


não agrupados, somamos os dados e dividimos pela quantidade de
observações.

X 
X
N

3  7  8  10  11 39
X    7,8
5 5

Depois de encontrada a média, vamos calcular a variância, verificando


que o enunciado solicita a variância considerando uma amostra. Assim,
utilizamos a seguinte fórmula:

S 2

 (x  x) .f2

N 1
(3  7,8) 2 .1  (7  7,8) 2 .1  (8  7,8) 2 .1  (10  7,8) 2 .1  (11  7,8) 2 .1
S2 
5 1
(4,8) 2 .1  (0,8) 2 .1  (0,2) 2 .1  (2,2) 2 .1  (3,2) 2 .1
S2 
4
23,04.1  0,64.1  0,04.1  4,84.1  10,24.1
S2 
4

13
23,04  0,64  0,04  4,84  10,24
S2 
4
38,80
S2   9,7
4

4.2 Exemplo 2

Considere os seguintes dados e calcule a variância, considerando uma


população.
40 45 48 52 54 62 70

Solução: vamos calcular a média desse conjunto de dados:

40  45  48  52  54  62  70 371
X    53
7 7

Depois de encontrada a média, vamos calcular a variância conforme


solicita o enunciado, considerando uma população. Assim, utilizamos a seguinte
fórmula:

S2 
 (x  x) .f2

(40  53)².1  (45  53)².1  (48  53)².1  (52  53)².1  (54  53)².1  (62  53)².1  (70  53)².1
S2 
7
169  64  25  1  1  81  289
S2 
7

630
S2   90
7

4.3 Exemplo 3

Em um determinado dia, foi registrado o número de veículos negociados


por uma amostra de 10 vendedores de uma agência de automóveis, como
mostra a tabela a seguir. Calcule a variância (Adaptado de Shiguti; Shiguti,
2019).

14
Tabela 11 – Veículos negociados X número de vendedores

Solução: nesse exemplo, temos uma distribuição de frequência e


precisamos calcular a variância. Logo, o primeiro passo é o cálculo da média.
Lembrando que a média em uma distribuição de frequência é calculada pela
fórmula:

X 
 X. f
N

Tabela 12 – Veículos negociados X número de vendedores X xiFi

26
X   2,6
10

Após o cálculo da média, calculamos o quadrado dos desvios em relação


à média e multiplicamos o valor encontrado por sua respectiva frequência. Para
o primeiro valor, temos:

(1 – 2,6)². 1 = (-1,6)² . 1 = 2,56 . 1 = 2,56

Seguindo esse cálculo, para os demais valores da distribuição, temos os


resultados mostrados na Tabela 13 a seguir.

15
Tabela 13 – Veículos negociados X número de vendedores X xiFi X (xi-média)²*Fi

Somamos o valor encontrado em (x – x )².f e aplicamos a fórmula da


variância para uma amostra, encontrando o seguinte valor.

S2 
 (x  x) .f
2

N 1

6,4 6,4
S2    0,71
10  1 9

Para uma distribuição de frequência por classe ou intervalos, substituímos


na fórmula da variância o valor de x pelo ponto médio (Pm) de cada classe.
Dessa forma, o primeiro passo será o cálculo do ponto médio, para depois
calcular a média e a variância.

 População: S 2 
 ( Pm  x ) 2
.f
N

 Amostra: S 2

 ( Pm  x ) 2
.f
N 1

4.4 Exemplo 4

A Tabela 14 a seguir representa as notas obtidas por um grupo de 58


alunos matriculados em uma determinada disciplina. Calcule a variância da
amostra (Adaptado Shiguti; Shiguti, 2019).

16
Tabela 14 – Escores X alunos Fi

Solução: nesse exemplo, temos uma distribuição de frequência por


classe. Iniciamos calculando o ponto médio (Pm) e a média da distribuição.

Tabela 15 – Escores X alunos Fi X Pm X Pm ·ƒ

X 
 Pm. f
N
3610
X   62,24
58

Agora, calculamos os desvios: (Pm – x )². O resultado, multiplicamos pela


frequência. Para a primeira classe, temos:

(40 – 62,24) ² = (-22,24) ² = 495

495 . 5 = 2.473

Seguindo o mesmo processo para as demais classes e somando os


valores obtidos, temos os resultados apresentados na Tabela 16 a seguir.

17
Tabela 16 – Escores X alunos Fi X Pm X (Pm-média)² X (Pm-média)²·f

O último passo é calcular a variância solicitada da amostra.

S 2

 ( Pm  x ) 2
.f
N 1

9409
S2 
58  1

9409
S2   165,1
57

TEMA 5 – DESVIO PADRÃO

Segundo Martins (2010), para melhor interpretar a dispersão de uma


variável, calcula-se a raiz quadrada da variância, obtendo-se o desvio padrão.
Logo, o cálculo da variância é considerado um passo intermediário para o cálculo
do desvio padrão, que pode considerar os dados de uma população ou de uma
amostra.
Para o cálculo do desvio padrão de uma população, temos:

S 
 (x  x) .f 2

A fórmula para o cálculo de desvio padrão de uma amostra é:

S 
 (x  x) .f 2

N 1

Podemos utilizar as fórmulas anteriores ou calcular a variância e, após,


tirar a raiz quadrada. Assim:

S  S²

18
Para o cálculo do desvio padrão, temos os seguintes passos.

1. Calcular a média.
2. Calcular a variância.
3. Extrair a raiz quadrada da variância.

5.1 Exemplo 1

Suponha o conjunto de tempo de serviço de cinco funcionários e


determine o desvio padrão desse conjunto de dados, considerando uma amostra
(Adaptado de Shiguti; Shiguti, 2019).

3 7 8 10 11

Solução:

1. Calcular a média.

3  7  8  10  11 39
X    7,8
5 5

2. Calcular a variância.

(3  7,8) 2 .1  (7  7,8) 2 .1  (8  7,8) 2 .1  (10  7,8) 2 .1  (11  7,8) 2 .1


S2 
5 1

38,80
S2   9,7
4

3. Extrair a raiz quadrada da variância.

S  S  9,7  3,11
2

5.2 Exemplo 2

Em um determinado dia, foi registrado o número de veículos negociados


por uma amostra de 10 vendedores de uma agência de automóveis, como
mostra a Tabela 17 a seguir. Calcule o desvio padrão (Adaptado de Shiguti;
Shiguti, 2019).

19
Tabela 17 – Veículos negociados X número de vendedores

Solução:

1. Calcular a média.

26
X   2,6
10

Tabela 18 – Veículos negociados X número de vendedores X xiFi

2. Calcular a variância.

6,4 6,4
S2    0,71
10  1 9

Tabela 19 – Veículos negociados X número de vendedores X xiFi X (xi-média)²*Fi

3. Extrair a raiz quadrada da variância.

S  S 2  0,71  0,84

20
5.3 Exemplo 3

A Tabela 20 a seguir representa as notas obtidas por um grupo de


58 alunos matriculados em uma determinada disciplina. Calcule o desvio padrão
(Adaptado de Shiguti; Shiguti, 2019).

Tabela 20 – Escores X alunos Fi

Solução:

1. Calcular a média.

3610
X   62,24
58
Tabela 21 – Escores X alunos Fi X Pm X Pm ·ƒ

2. Calcular a variância.

9409
S2   165,1
57

21
Tabela 22 – Escores X alunos Fi X Pm X (Pm-média)² X (Pm-média)².f

3. Extrair a raiz quadrada da variância.

S  S 2  165,1  12,85

No desvio padrão, obtemos valores altos sempre que ocorrem mudanças


consideráveis nos dados analisados e valores baixos quando os dados são mais
estáveis. Segundo Martins (2010), quanto maior o desvio padrão, maiores serão
a dispersão e a amplitude total da distribuição.
Ao analisar o resultado do desvio padrão, podemos considerar o valor
pequeno para uma média e para outra extremamente grande. Se encontrarmos
um desvio-padrão de 40, esse valor pode ser considerado pequeno para uma
média de 30, mas se a média for 4, o desvio se torna muito grande. Para reduzir
essa limitação encontrada no cálculo do desvio padrão, podemos utilizar o
coeficiente de variação.
Segundo Martins (2010, p. 57), o coeficiente de variação trata-se de uma
medida relativa de dispersão. É definido como o quociente entre desvio padrão
e a média, multiplicado por 100, ou seja, o coeficiente de variação é o desvio
padrão em porcentagem da média.
S
CV  .100
x
Utilizamos algumas regras empíricas para interpretar o coeficiente de
variação:

 CV < 15% = há baixa dispersão;


 15%  CV < 30% = há média dispersão;
 CV  30% = há elevada dispersão.

Segundo Prates, podemos classificar as distribuições em homogêneas ou


heterogêneas. A distribuição homogênea tem coeficiente de variação com baixa
ou média dispersão (até 30% de variação); já a distribuição heterogênea possui

22
coeficiente de variação com elevada dispersão (acima de 30% de variação). Uma
distribuição é dita homogênea quando seus valores são parecidos, mais
próximos; já em uma distribuição heterogênea, os valores apresentando são
bem diferentes.

5.4 Exemplo 4

Em uma determinada empresa, o departamento A possui salário médio


de R$ 4.000, com desvio padrão de R$ 1.500. Já o departamento B possui
salário médio de R$ 3.000, com desvio padrão de R$ 1.200. Calcule o coeficiente
de variação.
Solução:

 Departamento A:

S
CV  .100
x

1500
CV  .100  0,375.100  37,5%
4000

 Departamento B:

1200
CV  .100  0,4  40%
3000

Os salários do departamento B possuem dispersão relativa maior do que


o departamento A e os dois departamentos apresentam elevada dispersão,
sendo uma distribuição heterogênea, ou seja, há grande diferença entre os
salários praticados em cada departamento.

TROCANDO IDEIAS

Nesta aula, trabalhamos as medidas de dispersão e podemos utilizá-las


em várias situações, dentro e fora das organizações. Você se recorda de alguma
situação em que tenha ouvido falar ou tenha de fato utilizado algumas das
medidas citadas nesta aula? Nas organizações, em quais situações poderíamos
utilizar essas medidas?

23
NA PRÁTICA

As medidas de dispersão possuem vasta aplicação, pois servem para


avaliar o grau de variabilidade do fenômeno estudado. Quando o desvio é
pequeno, a amostra é homogênea, ou seja, mais parecidos são os valores da
série, e quando o valor é alto, a amostra é heterogênea, apresentando valores
diferentes. Com essa informação, podemos definir indicadores, estratégias,
comparar valores e realizar análises que geram informações para tomada de
decisão dentro das organizações.

Leitura complementar
Vamos ler os seguintes artigos e analisar situações em que a utilização
das medidas de dispersão fornece informações para tomada de decisão.

NOGUEIRA, N. Ferramentas básicas de análise financeira: o desvio-


padrão. Portal Gestão, 2 jan. 2014. Disponível em: <https://www.portal-
gestao.com/artigos/7343-ferramentas-b%C3%A1sicas-de-an%C3%A1lise-
financeira-o-desvio-padr%C3%A3o.html>. Acesso em: 1.º out. 2019.

QUEIRÓZ, M. Variância e desvio padrão. Matemágica, 24 out. 2015.


Disponível em: <http://matemagica10.blogspot.com.br/2015_10_01_archive.ht
ml>. Acesso em: 1.º out. 2019.

RISCO e volatilidade: conceitos fundamentais na hora de investir.


Infomoney, 7 maio 2007. Disponível em:
<http://www.infomoney.com.br/educacao/guias/noticia/480519/risco-volatilidade
-conceitos-fundamentais-hora-investir>. Acesso em: 1.º out. 2019.

STRINGHINI, L. F. Análise de risco e retorno de investimento uso das


medidas de dispersão. Contabilidade em pauta, Curitiba. Disponível em:
<https://docplayer.com.br/27885423-Analise-de-risco-e-retorno-de-investimento
-uso-das-medidas-de-dispersao.html>. Acesso em: 1.º out. 2019.

FINALIZANDO

Nesta aula, apresentamos as principais medidas de dispersão, seus


cálculos, aplicações e interpretações dos resultados obtidos.

24
REFERÊNCIAS

CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba:


InterSaberes, 2010.

MARTINS, G. de A. Estatística geral e aplicada. 3. ed. São Paulo: Atlas, 2010.

PRATES, W. O. Estatísticas para as Ciências Sociais Aplicadas Salvador:


UFBA, Faculdade de Ciências Contábeis, Superintendência de Educação a
Distância, 2017. Disponível em: <https://repositorio.ufba.br/ri/bitstream/ri/24557
/1/eBook_Estatisticas_para_Ciencias_Sociais_Aplicadas_I-Ciencias_Contabeis_U
FBA.pdf>. Acesso em: 1.º out. 2019.

SHIGUTI, W. A.; SHIGUTI, V. da S. C. Apostila de estatística. Brasília, 2006.


Disponível em: <http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5_INE
5102_Quimica.pdf>. Acesso em: 1.º out. 2019.

25
ESTATÍSTICA APLICADA ÀS
ANÁLISES CONTÁBEIS
AULA 4

Profª Aline Purcote


CONVERSA INICIAL

A probabilidade é utilizada por qualquer pessoa que precisa tomar uma decisão
em uma situação de incerteza ou em situações em que precisamos conhecer a
possibilidade de determinado evento ocorrer no futuro.
Frequentemente usamos expressões como "Improvável”, “Impossível” ou
“provavelmente”, o que demonstra que em alguns momentos não sabemos qual o
resultado de uma situação, mas conseguimos ter a noção da sua ocorrência. Você se
recorda de algum fato ou momento do seu cotidiano que utilizou algumas destas
expressões?

CONTEXTUALIZANDO

“A ideia de probabilidade ocorre sempre que nos deparamos com situações nas
quais não sabemos exatamente o que pode ocorrer, mas temos uma ideia dos possíveis
resultados” (Aula 5, S.d.). Por exemplo, verificamos a probabilidade de chover em um
determinado dia, a probabilidade de ganhar na loteria, probabilidade do nosso time
favorito ganhar o jogo, probabilidade de certo candidato ganhar ou não uma eleição,
probabilidade de um produto ser vendido, probabilidade de um investimento ser mais
lucrativo do que outro e a probabilidade de bons lucros em uma determinada operação
ou compra de ações.
Segundo Castanheira (2010), o termo Probabilidade é usado de modo muito
amplo na conversação diária para sugerir certo grau de incerteza sobre o que ocorreu
no passado, o que ocorrerá no futuro e o que está ocorrendo no presente. Martins (2010)
comenta que a probabilidade é usada por qualquer indivíduo que toma decisões em
situações de incerteza e que ela nos indicará uma medida de quão provável é a
ocorrência de determinado evento.
Pelos exemplos e pelas definições, percebemos que são inúmeras as situações
nas quais a probabilidade está presente, mas como calcular a probabilidade e quais os
seus principais conceitos?

TEMA 1 – PROBABILIDADE

Probabilidade é a possibilidade, chance de ocorrência ou medida de


ocorrência, de um evento definido sobre um espaço amostral, que por sua vez
está relacionado a algum experimento aleatório.
Experimento Aleatório (E) é aquele que podemos repetir sob as mesmas
condições indefinidamente e antes do experimento não podemos dizer qual será
o resultado, mas somos capazes de relatar os possíveis resultados. Por
2
exemplo, no lançamento de uma moeda ou um dado podemos realizar o
lançamento quantas vezes julgarmos necessário e antes do lançamento
conhecemos os possíveis resultados:
Resultados possíveis da moeda = cara ou coroa
Resultados possíveis de um dado = 1,2,3,4,5 e 6
O conjunto de todos os possíveis resultados de um experimento
chamamos de Espaço Amostral (S). Em um espaço amostral, quando os pontos
amostrais têm a mesma probabilidade de ocorrerem, eles são considerados
equiprováveis. No exemplo da moeda e do dado temos:
Lançamento de uma moeda: espaço amostral S = {cara, coroa}.
Lançamento de um dado: espaço amostral S = {1, 2, 3, 4, 5,6}.
Outro elemento que utilizamos no cálculo da probabilidade é o evento,
definido como qualquer conjunto de resultados de um experimento. É um
subconjunto do espaço amostral e indicado por qualquer letra maiúscula do
alfabeto. No lançamento de um dado temos que o espaço amostral é S =
{1,2,3,4,5,6} e podemos ter vários eventos, como:
A = {sair número maior que 5} = {6}
B = {sair número par} = {2,4,6}
C = {sair número ímpar} = {1,3,5}
D = {ocorrência de valor par ou ímpar} = {1,2,3,4,5,6}
E = {ocorrência de valor par e ímpar} = { }
F = {ocorrência de valor maior que 6} = { }
Obs.: { } representa um conjunto vazio, sem elementos e também pode
ser representado por Ø.
Observando os eventos anteriores, verificamos que o evento A é formado
por apenas um elemento e os eventos B e C são formados por três elementos.
Quando o evento possui apenas um elemento recebe o nome de evento simples
e quando possui mais de um elemento são denominados de evento composto.
O evento D possui todos os elementos do espaço amostral logo é chamado de
evento certo. Os eventos E e F não possuem elementos, pois não temos
números que sejam ao mesmo tempo par e ímpar e também em um dado não
temos elementos maiores que seis, desta forma os dois eventos são chamados
de evento impossível.
Segundo Catanheira (2010), a probabilidade de um acontecimento é a
relação entre o número de casos favoráveis e o número de casos possíveis.

3
Designamos por S o número de casos possíveis e por A o número de casos
favoráveis, temos a probabilidade P, definida por:

ou seja,

Para calcular a probabilidade precisamos primeiro conhecer o espaço


amostral e o evento para depois aplicarmos a fórmula. O valor de P(A) é sempre
uma fração compreendida entre 0 (zero) e 1 (um) ou podemos multiplicar o
resultado por 100 e obter o valor do percentual que será entre 0% (zero) e
100%.Quando temos uma probabilidade igual a zero (P(A)=0) temos um evento
impossível e quando ocorrer P(A) = 1 ou P(A) = 100% temos um evento certo.
Exemplo 1: Em um lançamento de um dado, calcular a probabilidade de
sair:

a) O número 5.
b) Um número par.
c) Um número menor que 5.

Para encontrar a probabilidade precisamos encontrar o espaço amostral


e o evento. Como o experimento é o lançamento de um dado o espaço amostral
é S = {1,2,3,4,5,6}, espaço amostral formado por 6 elementos.
Agora vamos encontrar os eventos:

a) O número 5:

O exercício solicita o número 5, então este é o nosso evento que vamos


chamar de evento A:

A = {5}

Verificamos que o evento é formado apenas por 1 elemento, pois só temos


o número 5 e o espaço amostral formado por 6 elementos S = {1,2,3,4,5,6}. Com
estas informações conseguimos calcular a probabilidade:

4
P(A) = 0,16667 x 100 = 16,66667 = 17%

b) Um número par:

Como queremos um número par o nosso evento, que chamaremos de B,


será formado pelos elementos pares que podem ocorrer quando lançamos o
dado:
B = {2,4,6}
Verificamos “a quantidade de elementos que temos no evento B, neste
caso, há 3 elementos” (Aula 5, S.d.). Com estas informações conseguimos
calcular a probabilidade:

P(B) = 0,5 x 100 = 50%

c) Um número menor que 5:

O exercício solicita um número menor que 5, então este é o nosso evento


que vamos chamar de evento C:
C = {1,2,3,4}
O evento C é formado por 4 elementos, assim a probabilidade será:

P(C) = 0,66667 x 100 = 66,66667% = 67%

Exemplo 2: Escolhendo número, ao acaso, entre 1 e 7. Calcule as seguintes


probabilidades:

a) Saída do número 3;
b) Saída de um número par;
c) Saída de um número ímpar;
d) Saída de um número menor que 6.

5
Inicialmente encontramos o espaço amostral. Como temos que
escolher número entre 1 e 7, nosso espaço amostral é igual a:

S= {1, 2, 3, 4, 5, 6, 7}
Agora definimos os eventos e calculamos a probabilidade de
ocorrência:

a) Saída do número 3:

A = {3}

Número de algarismos 3 existentes 1


P(A) = =
Total dos algarismos 7

P(A) = 0,14286 x 100 = 14,28571%

b) Saída de um número par:

A = {2,4,6}
Número de algarismos pares 3
P(A) = =
Total dos algarismos 7
P(A) = 0,42857 x 100 = 42,85714%

c) Saída de um número ímpar:

A = {1, 3, 5, 7}
Número de algarismos impares 4
P(A) = =
Total dos algarismos 7

P(A) = 0,57143 x 100 = 57,14286%

d) Número menor que 6:

A = {1, 2, 3, 4, 5}

número de algarismos menores que 6 5


P(A) = =
Total dos algarismos 7

6
P(A) = 0,71429 x 100 = 71,42857%

Exemplo 3: Uma urna possui 6 bolas azuis, 10 bolas vermelhas e 4 bolas


amarelas. Tirando-se uma bola, calcule as seguintes probabilidades:

a) sair bola azul


b) sair bola vermelha
c) sair bola amarela

O primeiro passo é encontrar o espaço amostral, que neste caso é o total


de bolas que temos. Assim, devemos somar a quantidade de bolas azuis,
vermelhas e amarelas.
Azuis + Vermelhas + Amarelas = 6+10+4 = 20
Após encontramos o evento calculamos as probabilidades:
a) sair bola azul:
O evento é o total de bolas que temos da cor azul, neste caso são 6 bolas.

6
P(A) = = 0,30 x 100 = 30%
20

b) sair bola vermelha:

10
P(A) = = 0,50 x 100 = 50%
20

c) sair bola amarela:

4
P(A) = = 0,20 x 100 = 20%
20

Exemplo 4: Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma


peça, calcule:

a) a probabilidade de essa peça ser defeituosa;


b) a probabilidade de essa peça não ser defeituosa;

O nosso espaço amostral é o total de peças, ou seja, 12 peças. Agora


encontramos os eventos e calculamos a probabilidade:

a) a probabilidade de essa peça ser defeituosa:

7
Sabemos pelo enunciamos que do total de 12 peças temos 4 defeituosas,
assim:

4
P(A) = = 0,33333 x 100 = 33,333%
12

b) a probabilidade de essa peça não ser defeituosa:

Como temos de um total de 12 peças 4 peças defeituosas, conseguimos saber


quais não são defeituosas, ou seja, 12 – 4 = 8 peças não defeituosas. Logo a
probabilidade será:

8
P(A) = = 0,66667 x 100 = 66,66667%
12

TEMA 2 – EVENTOS EXCLUSIVOS

Dois eventos são considerados mutuamente exclusivos quando a


ocorrência de um exclui a realização do outro, isso significa que os eventos não
podem ocorrer simultaneamente. Quando lançamos uma moeda temos os
eventos "cara" e "coroa" que são mutuamente exclusivos, já que, ao se realizar
um deles, o outro não se realiza. O mesmo ocorre no lançamento de um dado,
se temos os eventos sair número 5 e sair o número 6, quando retiramos o número
5 automaticamente o número 6 não pode ocorrer.
Considerando dois eventos exclusivos, a probabilidade de que um ou
outro se realize é igual a soma das probabilidades individuais, ou seja:
P ( A  B )  P ( A)  P ( B )

Exemplo 1: No lançamento de um dado qual a probabilidade de tirar o número


3 ou o número 4?

Ao lançar o dado se sair o número 3 automaticamente o número 4 não vai


ocorrer, desta forma temos eventos exclusivos. Para calcular a probabilidade
precisamos encontrar a probabilidade de cada evento ocorrer separadamente:

Espaço Amostral S = {1,2,3,4,5,6}

Sair número 3:

1
P(A) =  0,16667 x100  16,66667%
6

8
Sair número 4:

1
P(B) =  0,16667 x100  16,66667%
6

Agora aplicamos a fórmula:

P( A  B)  P( A)  P( B)

P( A  B)  16,66667% + 16,66667% = 33,33334%

Exemplo 2: Uma caixa contém 5 bolas verdes, 3 pretas e 4 brancas.


Retira-se, ao acaso, uma bola da caixa. Qual é a probabilidade de sair uma bola
verde ou uma bola preta?
Os dois eventos são mutuamente exclusivos, pois não conseguimos
retirar uma bola que ao mesmo tempo seja verde e preta, ou seja, não temos
uma bola que tenha duas cores ao mesmo tempo. Calculando as probabilidades
de cada evento temos:
Bola Verde:

5
P(A) =  0,41667 x100  41,66667%
12

Bola Preta:

3
P(B) =  0,25 x100  25%
12

P ( A  B )  P ( A)  P ( B )

P( A  B)  41,66667% + 25% = 66,66667% = 67%

TEMA 3 – EVENTOS NÃO EXCLUSIVOS

São eventos que podem ocorrer simultaneamente. Quando A e B são


eventos não mutuamente exclusivos temos:

P A  B   P A  PB   P A  B 

9
em que, P A  B  é a interseção, ou seja, a probabilidade dos eventos ocorreram
simultaneamente e é calculado por:

P A  B   P A.PB 

Se considerarmos o lançamento de dois dados e os eventos sair número


2 e número 5 teremos eventos não exclusivos, pois temos dois dados e pode
sair o número 2 no primeiro dado e número 5 no segundo, ou seja, os dois
eventos podem ocorrer ao mesmo tempo. O mesmo ocorre com a venda de dois
produtos, se a venda de um não impede a venda do outro temos eventos não
exclusivos.
Exemplo 1: Se dois dados forem lançados, qual a probabilidade de sair o
nº 5 no 1º dado e o nº 3 no 2º dado?
Como temos dois dados os eventos são não exclusivos e para calcular a
probabilidade precisamos encontrar a probabilidade de cada evento
separadamente:

 Sair número 5:

S= {1,2,3,4,5,6}

A={5}

1
P(A) =  0,1667
6

 Sair número 3:

B={3}

1
P(B) =  0,1667
6

Agora calculamos a probabilidade simultânea, ou seja, P A  B  :

P A  B   P A.PB 

P A  B  0,1667.0,1667  0,0278

10
Já temos todos os valores necessários e vamos calcular a probabilidade
dos eventos ocorrem:

P( A  B)  0,1667  0,1667  0,0278  0,3056  30,56%

Exemplo2: Em uma disputa, a probabilidade do jogador 1 atingir o alvo é


de ½ e do jogador 2 atingir 3/5. Qual a probabilidade do alvo ser atingido, se
ambos atirarem?
Temos dois eventos o jogador 1 e o jogador 2 e o exercício já fornece a
probabilidade do alvo ser atingido por cada jogador, assim:

 Jogador 1:

1
P (A) =  0,5
2

 Jogador 2:

3
P (B) =  0,6
5

Não temos P A  B  , desta forma calculamos pela fórmula:

P A  B   P A.PB 

P A  B   0,5.0,6  0,3

Agora calculamos a probabilidade de ocorrência dos eventos:

P A  B  P A  PB  P A  B

P A  B  0,5  0,6  0,3

P A  B  0,80 x100  80%

Exemplo3: Uma pesquisa indicou que as probabilidades de que uma


pessoa selecionada ao acaso tenha um celular, um notebook ou ambos são
respectivamente 0,92, 0,53 e 0,48. Qual a probabilidade de selecionar uma
pessoa e essa possuir um celular, um notebook, ou ambos?

11
Neste exemplo temos 3 valores:

 Probabilidade Celular = 0,92


 Probabilidade Notebook = 0,53
 Probabilidade Ambos = 0,48

A probabilidade de ambos significa a probabilidade simultânea, ou seja,


P A  B  .

Como o enunciado nos fornece as três informações necessárias para o


cálculo, aplicamos a fórmula da probabilidade direta:

P A  B  P A  PB  P A  B

P A  B   0,92  0,53  0,48

P A  B   0,97 x100  97%

TEMA 4 – PROBABILIDADE CONDICIONAL

Na Probabilidade Condicional temos dois eventos, nos quais calculamos


a probabilidade do segundo evento ocorrer depois que o primeiro evento tiver
ocorrido. Dados dois eventos podemos calcular a probabilidade condicionada de
ocorrer o evento A quando o evento B já tiver ocorrido, ou seja, estamos
interessados no cálculo da probabilidade do evento A sabendo que o evento B
já ocorreu.
Segundo Castanheira (2010), dois eventos, A e B, de um espaço amostral
S, denota-se por P (A/B) a probabilidade condicionada de ocorrer o evento A
quando o evento B já tiver ocorrido. P (A/B) é igual à probabilidade do evento A,
sabendo que B ocorreu, ou probabilidade condicional de A em relação a B e
calculada pela fórmula:

P( A  B)
P( A / B) 
P( B)

ou seja,

12
Lembrando que A  B é a ocorrência simultânea, ou seja, dois eventos
ocorrendo ao mesmo tempo.
Exemplo 1: Considere o lançamento de um dado e os seguintes eventos:

 A={sair o número 2}
 B={sair um número par}

Calcule a probabilidade de que ocorra A, condicionada à ocorrência do


evento B.
Para resolver o exercício precisamos encontrar os eventos A e B após a
interseção dos eventos, pois o enunciado solicita a probabilidade de ocorrer A
condicionada a B.

A={sair o número 2} = {2}

B={sair um número par} = {2,4,6}

A  B  2, ou seja, o número que aparece nos dois conjuntos ao mesmo


tempo.

Após encontrar os três valores aplicamos a fórmula:

P(A/B) = 0,3333 x 100 = 33,33%

Exemplo 2: De uma urna que contém 20 bolas numeradas de 1 a 20,


retira-se uma bola ao acaso. Qual a probabilidade de ocorrer um número par,
dado que ocorreu um número maior que 10?
Como no enunciado solicita um número par dado que ocorreu um número
maior que 10 temos um exemplo de probabilidade condicional, pois algo já
ocorreu, neste caso o número maior que 10.

13
Para resolver precisamos encontrar os eventos A,B e a interseção, sendo
que o B é o evento que já ocorreu.

A = {sair par} = {2,4,6,8,10,12, 14, 16, 18, 20}

B={sair número maior que 10} = {11,12,13,14,15,16,17,18,19,20}

A  B  12,14,16,18,20

P(A/B) = 0,5 x 100 = 50%

TEMA 5 – REGRA DA MULTIPLICAÇÃO

Como consequência da definição de Probabilidade Condicional, podemos


calcular a probabilidade da ocorrência conjunta de dois eventos, ou seja, cálculo
da ocorrência simultânea de dois eventos (). P A  B 
A probabilidade de ocorrência simultânea de dois eventos A e B são iguais
ao produto da probabilidade de um deles pela probabilidade condicional do outro,
ou seja,

P A  B   PB .P A / B 
[Ao] analisar um experimento e calcular a probabilidade da ocorrência
simultânea podemos ter experimentos com reposição ou sem
reposição. Em experimentos em que ocorre reposição, o elemento
retirado é devolvido à população, podendo ser escolhido novamente,
ou seja, não há redução de elementos no espaço amostral e/ou evento.
Se não houver reposição, o elemento, uma vez escolhido, não é
devolvido à população, não podendo, assim, ser escolhido novamente.
No caso do experimento ocorrer sem reposição realizamos o desconto
do item no espaço amostral e em alguns momentos no evento (Aula 5,
S.d.).

Exemplo 1: Retiram-se sem reposição duas peças de um lote de 10


peças, no qual apenas 4 são boas. Qual a probabilidade de que ambas sejam
defeituosas?
Como temos 4 peças boas em 10, conseguimos calcular o número de
peças defeituosas: 10 – 4 = 6 peças defeituosas.

14
A = {1ª Defeituosa} = 6 = 0,6
10
Agora vamos calcular a probabilidade de a segunda peça ser defeituosa,
lembrando que o experimento ocorre sem reposição. Tínhamos 6 peças
defeituosas, mas já retiramos uma sem reposição, assim sobraram 5 peças
defeituosas e no total tínhamos 10 peças, mas retiramos uma sem reposição
sobrando 9 peças. Com estes dados calculamos a probabilidade de a segunda
ser defeituosa:

B = {2ª Defeituosa} = 5 = 0,5556


9
Com as probabilidades individuais calculadas vamos calcular a
probabilidade simultânea, ou seja, aplicar a regra da multiplicação:

P A  B   PB .P A / B 

P A  B   0,6.0,5556  0,3334 x100  33,34%

Exemplo 2: Considere que temos 9 lâmpadas, 3 defeituosas e 6 boas. Do


conjunto das nove foram escolhidas 2 lâmpadas ao acaso sucessivamente sem
reposição. Calcular a probabilidade de ambas serem boas.

A = {1ª Boa} = 6 = 0,6667


9

B = {2ª Boa} = 5 =0,6250


8
“Descontamos uma peça na segunda retirada, pois o enunciado considerar
o experimento sem reposição” (Aula 5, S.d.).

P A  B   PB .P A / B 

P A  B   0,6667.0,6250  0,4167 x100  41,67%

15
Exemplo 3:

Retirar, sem reposição, 3 bolas de uma caixa com 10 bolas brancas e


5 pretas. Calcular a probabilidade de tirar 1ª branca, 2ª preta e 3ª
branca.
Primeiro encontramos a probabilidade da retirada de cada bola
separada lembrando que o experimento ocorre sem reposição. Após
calcular a probabilidade de ocorrência simultânea.

1ª branca 10
  0,6667
15
5  0,6667 x0,3571x0,6923  0,1648x100  16,48%
2ª preta   0,3571
14
9
3ª branca   0,6923
13

TROCANDO IDEIAS

Vimos que a probabilidade pode ocorrer em pequenos detalhes do nosso


dia-a-dia desde que levantamos e verificamos a probabilidade de chover ou sair
sol até em situações mais complexas. A probabilidade é sempre utilizada para
tomada de decisão em situações de incerteza. Você se recorda de alguma
situação em que utilizou os conceitos de probabilidade ou se recorda de alguma
aplicação que tenha visto dentro de uma empresa?

NA PRÁTICA

A Probabilidade é usada por qualquer indivíduo que toma decisão em


situações de incerteza, desta forma podemos citar várias aplicações como a
utilização da probabilidade na tomada de decisão e em análise de investimento.
Uma área em que a Teoria das Probabilidades é muito utilizada é a área
de seguros. Quando fazemos um contrato com uma seguradora, o prêmio a
pagar à companhia foi determinado em função da maior ou menor probabilidade
de sinistro com o veículo. Vamos verificar alguns exemplos da aplicação de
probabilidade:

16
 ESTADÃO. Saiba como é calculado o valor do seguro de veículos, 8
abr. 2003. Disponível em:
<http://economia.estadao.com.br/noticias/geral,saiba-como-e-calculado-
o-valor-do-seguro-de-veiculos,20030408p15592>. Acesso em: 30 set.
2019.
 INFOMONEY. Preço do seguro empresarial depende dos riscos e
probabilidades de lesões, 24 abr. 2014. Disponível em:
<http://www.infomoney.com.br/minhas-
financas/seguros/noticia/3307636/preco-seguro-empresarial-depende-
dos-riscos-probabilidades-lesoes>. Acesso em: 30 set. 2019.

Dentro das empresas ou em investimento, a análise de risco pode utilizar


informações referentes à probabilidade para auxiliar na tomada de decisão.
Vamos verificar alguns exemplos da probabilidade na análise de risco:

 QUANTIFICAÇÃO da análise de riscos em investimentos usando


medidas de dispersão. Abepro, S.d. Disponível em:
<http://www.abepro.org.br/biblioteca/ENEGEP2001_TR34_0667.pdf>.
Acesso em: 30 set. 2019.
 DICIONÁRIO FINANCEIRO. Análise de riscos financeiros. Disponível
em: <https://www.dicionariofinanceiro.com/analise-de-riscos-
financeiros/>. Acesso em: 30 set. 2019.

FINALIZANDO

Nesta aula apresentamos os principais conceitos da Probabilidade como


espaço amostral, evento e a fórmula para calcular a probabilidade de um evento
ocorrer. Vimos também a diferença entre Evento Exclusivo e Não exclusivo, as
definições e cálculo da Probabilidade Condicional, encerrando com as definições
e cálculo da Regra da Multiplicação.

17
REFERÊNCIAS

AULA 5: Estatística. Passei Direto, S.d. Disponível em:


<https://www.passeidireto.com/arquivo/40616712/aula-5>. Acesso em: 7 out.
2019.

CASTANHEIRA, N. P. Estatística Aplicada a Todos os Níveis. Curitiba:


InterSaberes, 2012.

LARSON, R.; FARBER, B. Estatística Aplicada. 2. edição. São Paulo: Pearson,


2004.

MARTINS, G. de A. Estatística geral e aplicada. 3. ed. São Paulo: Atlas, 2010.

MORETTIN, L. G. Estatística Básica: probabilidade e inferência. São Paulo,


Pearson, 2010.

18
ESTATÍSTICA APLICADA ÀS
ANÁLISES CONTÁBEIS
AULA 5

Profª Aline Purcote Quinsler


CONVERSA INICIAL

Segundo Castanheira (2010), na maioria dos problemas estatísticos, a


amostra não é suficientemente grande para determinar a distribuição da
população de maneira muito precisa. Assim, surge a distribuição de
probabilidade, modelo matemático para a distribuição real das frequências que
relaciona certo valor da variável em estudo com a sua probabilidade de
ocorrência.
Martins (2010) comenta que as análises das distribuições de
probabilidades possibilitam a construção de modelos que nos auxiliam no
entendimento de fenômenos do mundo real. Muitas vezes, não estamos
interessados propriamente no resultado de um experimento aleatório, mas em
características numéricas chamadas de Variáveis Aleatórias, classificadas em
variável discreta ou contínua.
Variável aleatória discreta é aquela que assume valores inteiros e finitos.
Já a variável aleatória contínua pode assumir inúmeros valores em um intervalo
de números reais e é medida em uma escala contínua. Os modelos discretos de
probabilidade são as distribuições de probabilidade Binomial e de Poisson e,
para as variáveis aleatórias contínuas, temos a distribuição normal de
probabilidade.
Com base na Distribuição Normal, podemos estruturar e definir os
intervalos de confiança e os testes de hipóteses. Mas o que significa um
intervalo de confiança e para que serve? Vimos que a Estatística é dividida em
duas partes, Estatística Descritiva e Inferência Estatística. A Inferência
Estatística obtém informações sobre a população com base nos elementos da
amostra, e sempre que trabalhamos com amostragem temos um erro envolvido,
surgindo, assim, o intervalo de confiança. Na Inferência, também temos os
testes de hipóteses, nos quais admitimos um valor hipotético para um parâmetro
da população e, com base na amostra, realizamos um teste para aceitar ou
rejeitar este valor. Tanto o teste de hipótese como os intervalos de confiança são
ferramentas que dão credibilidade aos resultados estatísticos.

CONTEXTUALIZANDO

Provavelmente você já ouviu o resultado de uma pesquisa eleitoral e,


neste caso, ouviu falar de intervalo de confiança, nível de confiança e margem
de erro dessa pesquisa. Mas o que isso significa? Como funciona uma pesquisa
eleitoral? Vamos entender como isso ocorre assistindo ao seguinte vídeo:
Como funciona uma pesquisa eleitoral:
<https://www.youtube.com/watch?v=igi7E1OY7gs>
Para calcular e interpretar os conceitos apresentados, estudaremos
Distribuições de Probabilidade, Intervalo de Confiança e Testes de Hipóteses.

TEMA 1 – DISTRIBUIÇÃO BINOMIAL

A Distribuição Binomial é um modelo que fornece a probabilidade do


número de sucessos quando um experimento é repetido, assim, é a
probabilidade de um evento ocorrer X vezes em N tentativas. Por exemplo, a
probabilidade de ocorrerem três vezes o número 6 em cinco lançamentos de um
dado, ou seja, três vezes (X=3) em 5 tentativas (N=5).
Para Distribuição Binominal, considera-se um número fixo de tentativas, a
probabilidade de sucesso (p) é a mesma em todas as tentativas e as tentativas
são todas independentes.
Segundo Castanheira (2010), se p é a probabilidade de um evento
acontecer em uma tentativa única, denominada probabilidade de sucesso, e qé
a probabilidade de o evento não ocorrerem qualquer tentativa, denominada
probabilidade de insucesso, então a probabilidade de o evento ocorrer
exatamente X vezes em N tentativas é dada por:
N!
P(X) = p X .q N  X
X !( N  X )!

Em que:

 N = tentativas
 X = vezes
 p = probabilidade de sucesso
 q = 1 –p= probabilidade de insucesso

Observação: N! ou X! é igual ao fatorial. O fatorial de um número N é


dado pela fórmula:
N! = N · (N – 1) · (N – 2) · (N – 3) ·... · 1
Ou seja, multiplicamos o número N por seus antecessores até chegar ao
número 1.

3
Exemplo 1:
5! = 5· 4· 3· 2· 1 = 120
9! = 9· 8· 7· 6· 5· 4· 3· 2· 1 = 362.880
Ao calcular uma distribuição binomial, os problemas podem fornecer ou
não o valor da probabilidade (p). Caso não seja informado, utilizar a fórmula do
cálculo da probabilidade:

Exemplo 2: Determinar a probabilidade de ocorrer 3 vezes o número 2


em 5 jogadas de um dado.
O primeiro passo para calcular a distribuição binomial é encontrar os
seguintes valores:

 N = tentativas = 5
 X = vezes = 3
 p = probabilidade de sucesso.

Verificamos que o exercício não fornece a probabilidade. Dessa forma,


precisamos encontrar este valor. Para encontrar a probabilidade, precisamos
conhecer o espaço amostral e o evento. Como o experimento é o lançamento de
um dado, o espaço amostral é:

S = {1,2,3,4,5,6}
O evento é a saída do número 2, ou seja:
A = {2}
Com estas informações, calculamos a probabilidade:
1
P ( A)   0,1667
6
Com o valor de p, calculamos o valor da probabilidade do insucesso (q):
Q=1 – p =1 – 0,1667=0,8333
Conhecido todos os valores, aplicamos a fórmula da distribuição binomial:
N=5
X=3
p=0,1667
q=0,8333

p xq N  X
N!
P( x) 
X !( N  X )!
0,166730,83335  3
5!
P( x) 
4 3!(5  3)!
120
P( x)  0,0046.0,6944
6 (
120 2)!
P( x)  0,0032
12
P( x)  10.0,0032  0,032.100  3,2%

Exemplo 3:Sabe-se que 5% dos parafusos fabricados por certa indústria


são defeituosos. Em um lote de 10 parafusos, calculea probabilidade de
exatamente 2 serem defeituosos.
Analisando o enunciado, temos os seguintes valores:
N = 10
X=2
p = 5% = 5/100 = 0,05
q = 1 –p = 1 – 0,05 = 0,95
Conhecidos todos os valores, aplicamos a fórmula da distribuição
binomial:
10!
P( X )  0,052.0,9510 2
2!(10  2)!
3.628.800
P( X )  0,0025.0,6634
2(8)!
3628800
P( X )  0,0017
2.40320
3628800
P( X )  0,0017
80640
P( X )  45.0,0017
P( X )  0,0765

P( X )  7,65%
Exemplo 4: Um varejista de computadores vende PCs on-line, tanto
desktops quanto laptops. Sabendo que 80% dos PCs que o varejista vende
sejam desktop e 20% laptop, encontre a probabilidade de que três dos próximos
quatro PCs comprados sejam laptops.
Analisando o enunciado, temos os seguintes valores:
N=4
X=3
P= 20% = 20/100 = 0,20
q = 1 – p = 1 – 0,20 = 0,80

5
Com base nos dados, aplicamos a fórmula da distribuição normal:
4!
P( X )  0,2030,80 4  3
3!(4  3)!

24
P( X )  0,008.0,80
6.1!
24
P( X )  0,0064
6

P( X )  4.0,0064  0,0256  2,56%

TEMA 2 – DISTRIBUIÇÃO POISSON

A Distribuição de Poisson é utilizada para encontrar a probabilidade de


um número designado de sucessos por unidade de tempo. Segundo Martins
(2010), essa distribuição representa um modelo probabilístico adequado para o
estudo de grande número de fenômenos observáveis. Por exemplo, chamadas
telefônicas por minuto, acidentes por unidade de tempo ou clientes chegando ao
caixa por hora.
A probabilidade de um número designado de sucessos por unidade de
intervalo, P(X), pode ser encontrada por:

Em que:
X: número designado de sucessos;
λ(lambda): é o número médio de sucessos em um intervalo específico, ou
seja, a média.
e: base do logaritmo natural, ou 2,71828.
Observação: o valor de e pode ser calculado utilizando a calculadora
científica, HP, pela substituição do valor por 2,71828, ou utilizando uma tabela

que fornece os valor de e  .


 Calculadora científica:procureo símbolo ex.
Exemplo: e-5 = SHIFT ex e digitar –5 = 0,00674

 Calculadora HP: procure o símbolo ex no botão 1/x.

Exemplo: e-5 = digitar 5 CHS g 1/x = 0,00674


O comando CHStorna o número negativo.

6
 Substituição do valor de e:

Exemplo: para calcular e-5, vamos substituir e por 2,71828.


e-5 = 2,71828-5
Como o expoente é negativo, devemos inverter a fração para torná-lo
positivo:
1 1
2,71828-5 = 5
  0,00674
2,71828 148,412660

Tabela 1 – Identificação do valor direto na tabela utilizando o valor da média (λ)

Exemplo: e-5 = 0,00674


λ e-λ λ e-λ
0,0 1,00000 2,5 0,08208
0,1 0,90484 2,6 0,07427
0,2 0,81873 2,7 0,06721
0,3 0,74082 2,8 0,06081
0,4 0,67032 2,9 0,05502
0,5 0,60653 3,0 0,04979
0,6 0,54881 3,2 0,04076
0,7 0,49659 3,4 0,03337
0,8 0,44933 3,6 0,02732
0,9 0,40657 3,8 0,02237
1,0 0,36788 4,0 0,01832
1,1 0,33287 4,2 0,01500
1,2 0,30119 4,4 0,01228
1,3 0,27253 4,6 0,01005
1,4 0,24660 4,8 0,00823
1,5 0,22313 5,0 0,00674
Fonte: Castanheira, 2010.

Caso o valor da média não seja fornecido, antes de aplicar a distribuição


de Poisson, precisamos calculá-la utilizando: λ = N · p, em que N é o número de
tentativas e p a probabilidade de sucesso. Essa fórmula é utilizada quando o
número N de tentativas é muito grande e a probabilidade p de sucesso é muito
pequena.
Exemplo 1: Um departamento recebe em média cinco solicitações por
hora. Qual é a probabilidade de receber duas solicitações em uma hora
selecionada aleatoriamente?
Vamos encontrar os valores de X e λ:
X=2
λ=5
Agora, aplicamos a fórmula para encontrar a probabilidade:

x e  
P( x) 
X!
7
52 e 5 25.0,00674
P( x )  
2! 2

0,16845
P( x)   0,08422  8,422%
2

Há uma probabilidade de 8,422% de ocorrerem duas solicitações em uma


hora selecionada.
Exemplo 2: Uma pesquisa indica que, em média, seis clientes param em
um caixa por hora. Qual é a probabilidade de três clientes pararem por hora?
O enunciado fornece os seguintes dados:
X=3
λ=6

Temos 8,928% de chance de três clientes pararem por hora nesse caixa.

TEMA 3 – DISTRIBUIÇÃO NORMAL

A Distribuição Normal é uma das distribuições mais empregadas e


constitui a base teórica de toda inferência estatística. Utiliza dois parâmetros, a
média e o desvio padrão, e seu principal interesse é obter a probabilidade de
uma variável assumir um valor em determinado intervalo.
A representação gráfica da distribuição normal é uma curva em forma de
sino, simétrica em torno da média, que recebe o nome de Curva Normal ou
Curva de Gauss, conforme Figura 1.

8
Figura 1 – Curva normal

A área total limitada pela curva é igual a 1, que corresponde a 100%, já


que essa área corresponde à probabilidade da variável aleatória X assumir
qualquer valor real. Como a curva é simétrica em torno da média, a
probabilidade de ocorrer valor maior que a média é igual à probabilidade de
ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais
a 0,5 ou 50%, conforme a Figura 2:

Figura 2 – Curva simétrica em torno da média

50% 50%

Segundo Castanheira (2010), qualquer conjunto de valores X,


normalmente distribuídos, pode ser convertido em valores normais padronizados
Z pela fórmula:

X 
Z
s
Em que  corresponde à média e S ao desvio padrão.
Esta é a fórmula reduzida da distribuição normal com média igual a zero e
desvio padrão igual a um. Ao calcular Z, encontramos a probabilidade entre a
média e o valor de X, conforme a Figura 3:

9
Figura 3 – Cálculo de Z

Z
Para encontrarmos o valor da distribuição normal, utilizamos o valor de Z
que é tabelado, conforme tabela 1. A tabela indica as proporções de área para
vários intervalos de valores para a distribuição de probabilidade normal
padronizada, com a fronteira inferior do intervalo começando sempre na média.

Tabela 2 – Áreas de uma distribuição normal padrão

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
(continua)

10
(continuação da Tabela 2)

2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Obs.: as áreas para os valores de z negativos são obtidos por simetria.
Fonte: Adaptada de Costa Neto.

Para calcular a Distribuição Normal, precisamos dos valores da média,


desvio padrão e X, calcular o parâmetro Z, encontrar o valor de Z na tabela e,
após interpretar o intervalo solicitado, encontramos a probabilidade. A avaliação
da curva normal ajuda na interpretação, auxiliando no cálculo final para obter a
probabilidade desejada, conforme veremos nos exemplos seguintes.
Exemplo 1: Uma máquina produz parafusos cujo diâmetro tem
distribuição normal com média de 2 cm e desvio padrão de 0,04 cm. Qual é a
probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm?
No nosso problema, queremos calcular a probabilidade de o diâmetro
apresentar valor entre 2 e 2,05, considerando uma distribuição normal. Para
encontrara probabilidade, calculamos o valor de Z, desta forma, precisamos dos

valores de X,  e S.
Para encontrar o valor de X, analisamos a faixa de valores solicitada no
enunciado, queremos calcular diâmetro entre 2 e 2,05. Verificamos que 2 é a
nossa média, assim, 2,05 será o valor de X. Por meio do enunciado, temos o
valor da média e desvio padrão, conforme abaixo:
X = 2,05

=2
S = 0,04
Conhecidos os valores, vamos encontrar Z aplicando a fórmula:
X 
Z
s
2,05  2
Z  1,25
0,04
Agora, verificamos na tabela o valor de Z = 1,25. Na primeira coluna,
procuramos o valor até a primeira casa decimal = 1,2. Em seguida,
encontramos, na primeira linha, o valor 0,05, que corresponde ao último
11
algarismo do número 1,25. Na intersecção da linha e coluna correspondentes,
encontramos o valor 0,3944, este valor é a probabilidade que procuramos:

Tabela 3 – Áreas de uma distribuição normal padrão

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

Fonte: Adaptado de Costa Neto.

P(X) = 0,3944 x 100 = 39,44%. Logo, a probabilidade de certo parafuso


apresentar um diâmetro entre 2e 2,05 cm é de 39,44%.
Exemplo 2: Em determinada empresa, a remuneração média por semana
dos trabalhadores do setor de produção foi de R$ 441,84. Suponha que os
dados disponíveis indiquem que os salários estejam normalmente distribuídos
12
com um desvio padrão de R$90,00. Escolhendo aleatoriamente um trabalhador,
qual é a probabilidade de eleter ganhado menos de R$ 250,00 por semana?
O enunciado fornece os seguintes valores:
  441,84
X = 250
S  90
Com base nos dados, calculamos o valor de Z utilizando a fórmula e
buscamos este valor na tabela de distribuição normal:
X 
Z
s
250  441,84
z  2,13
90
Verificamos que o valor de Z é negativo e não temos valores negativos na
tabela, mas os valores negativos são obtidos por simetria. Logo, o valor
procurado é 0,4834, considerando 2,1 na vertical e 0,03 na horizontal.

Tabela 4 – Áreas de uma distribuição normal padrão

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

13
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Fonte: Adaptado de Costa Neto.

O exercício solicita a probabilidade para ganho menor que R$ 250,00,


conforme área azul do gráfico:

Figura 4 – Probabilidade de ganho

Como o parâmetro Z calcula a probabilidade entre a média até o Xe


queremos encontrar ganho menor que R$ 250,00, precisamos diminuir 0,50 do
valor da tabela, pois cada metade da curva representa 50% de probabilidade.
Assim:
0,50 – 0,4834 = 0,01660 x 100= 1,66%
Logo, a probabilidade de um trabalhador ter ganhado menos de R$
250,00 por semana é de 1,66%.
Exemplo 3: Uma empresa realizou um estudo indicando que o salário
semanal dos seus operários é distribuído normalmente em torno de uma média
de R$ 80,00 com desvio padrão de R$ 5,00. O diretor da empresa está
interessado em saber qual é a probabilidade de um operário ter um salário
semanal acima de R$ 85,00.

14
Para encontrar a probabilidade, calculamos o valor de Z com os seguintes
dados:
  80
X = 85
S 5
85  80
Z  1
5
Procurando Z na tabela, temos uma probabilidade de 0,3413, mas como
queremos identificar a porcentagem acima de R$ 85, conforme gráfico abaixo,
precisamos diminuir a probabilidade encontrada de 50% ou 0,5.

Figura 5 – Diminuição da probabilidade

0,5–0,3413 = 0,1587 x 100 = 15,87%


Logo, a probabilidade de um operário ter um salário semanal acima de R$
85,00 é de 15,87%.
Exemplo 4: As idades de um grupo apresentaram média igual a 20 anos
e desvio padrão de 2 anos. Determine o percentual desse grupo que tem idade
entre 17 e 22 anos.
Neste exercício, estamos interessados em encontrar o percentual de
idade entre 17 e 22 anos sabendo que   20 e S = 2. Neste caso, qual é o valor
de X? Vamos analisar o gráfico da distribuição:

Figura 6 – Gráfico da distribuição

15
Como o intervalo procurado apresenta um número menor e outro maior
que a média, precisamos calcular dois valores para Z utilizando dois valores de
X, sendo X = 17 e X = 22:
X = 17:
17  20
z  1,5
2
Verificando na tabela, temos 0,4332.
X = 22
22  20
z 1
2

Verificando na tabela, temos 0,3413.


Para encontrar o valor da probabilidade, devemos somar os valores
encontrados:
0,4332 +0,3413 = 0,7745 = 77,45%
Assim, o percentual desse grupo que tem idade entre 17 e 22 anos é de
77,45%.

TEMA 4 – INTERVALO DE CONFIANÇA

A Inferência Estatística é um processo para obter informações sobre uma


população com base em resultados obtidos na amostra. Segundo Castanheira
(2010), para realizar uma inferência, precisamos trabalhar com temas que
envolvem amostragem, estimação e intervalo de confiança.
A amostragem consiste em selecionar parte de uma população para
observar, de modo que seja possível estimar alguma coisa sobre toda a
população. Essa estimativa pode ocorrer por ponto ou por intervalo.
A estimativa por ponto é um valor único obtido por meio de cálculos
efetuados com a amostra, que serve como uma aproximação do parâmetro.
Vamos considerar uma amostra de 1.000 clientes realizando uma pesquisa
referente à satisfação em relação ao atendimento da empresa. Suponha que
700 clientes respondam que estão satisfeitos, desta forma, pela estimativa por
ponto, temos que 70% dos clientes estão satisfeitos com o atendimento dessa
empresa, ou seja:
700
 0,7 x100  70%
1000

16
Segundo Castanheira (2010), a estimativa por intervalo, também
denominada intervalo de confiança, para um parâmetro é uma faixa de valores
possíveis e aceitos como verdadeiro, na qual se estima encontrar o parâmetro.
Permite diminuir o tamanho do erro que estamos cometendo, e quanto menor for
o comprimento do intervalo, maior a precisão dos cálculos.
O intervalo de confiança é um intervalo de valores com probabilidade de
conter o valor desconhecido e associado a um nível de confiança, um número
que exprime o grau de confiança deste intervalo:

O valor de c é chamado de erro amostral e obtido pela fórmula:


cZ
n
Em que:
Z = distribuição normal padronizada
 = desvio padrão da população
n = tamanho da amostra
Após calcular o valor de c, determinamos o intervalo de confiança:

X  c X  c
Em que:
X = média da amostra
  média da população
Exemplo 1: Determine o intervalo de confiança para um grupo que tem
peso médio de 68 kg com desvio padrão de 3 kg. Supor nível de confiança igual
a 90% e uma amostra de 64 pessoas.
O primeiro passo para encontrar o intervalo de confiança é calcular o
valor de c, mas precisamos ter o valor de Z. Para encontrar Z,levamos em conta
o nível de confiança que, neste exemplo, é igual a 90%. Dividimos o nível de
confiança por 2 e, depois, por 100, assim procuramos o valor obtido na tabela de
distribuição normal para termos o valor de Z.
90% 45%
  0,45
2 100

17
Na tabela, buscamos o valor no centro e, ao encontrar, verificamos o seu
correspondente na vertical e horizontal conforme abaixo:

Tabela 5 – Áreas de uma distribuição normal padrão

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Fonte: Adaptado de Costa Neto, S.d.

Observação: Dividimos o nível de confiança por dois e isso sempre vai


ocorrer, pois a tabela indicada acima mostra a metade da área sob a curva
normal.
Logo, para 0,45, temos um Z = 1,65. Agora, precisamos encontrar os
demais valores para calcular c:
 = 3 kg
18
n= 64
X= 68 kg


cZ
n 3 3
c  1,65  1,65  1,65.0,375  0,6188
64 8

Com o valor de c, determinamos o intervalo de confiança:

X  c X  c
68  0,6188 68  0,6188
67,3812 68,6188

Como vimos, quando trabalhamos com amostra, não representamos


perfeitamente a população, logo sempre teremos o erro amostral. Não podemos
evitar este erro, mas sim reduzi-lo, escolhendo uma amostra de tamanho
adequado, pois quanto maior o tamanho da amostra, menor será o erro, e
quanto menor a amostra, maior o erro.
Com afórmula para calcular o erro amostral (c), podemos obter o tamanho
da amostra isolando o n, obtendo:
2
  z. 
cZ n 
n  c 
Exemplo 2: Uma pesquisa deseja estimar a renda média para o primeiro
ano de trabalho de um contador. Que tamanho de amostra se deve ter para que,
com uma probabilidade de 95% de confiança, sua estimativa não esteja a menos
de R$ 500,00 da verdadeira média populacional? Suponha que o desvio padrão
seja de R$ 6.250.
O enunciado fornece os seguintes dados:
 = 6.250
c = 500
O primeiro passo é encontrar o valor de Z dividindo o nível de confiança
por 2 e avaliando o valor encontrado na tabela:
95% 47,5%
  0,475
2 100
Z = 1,96
Com os dados, aplicamos a fórmula para encontrar o tamanho da
2
 z. 
amostra:
n 
19  c 
2
 1,96.6250 
n 
 500 
2
 12250 
n   24,52  600,25
 500 
Desta forma, precisamos obter uma amostra de, ao menos, 600,25
entrevistados para termos 95% de confiança.

TEMA 5 – TESTES DE HIPÓTESES

De acordo com Pereira (2014), os testes de hipóteses têm a função de


comparar as medidas obtidas de uma amostra com os dados da população.
Essa comparação é importante para aferir se o valor amostral é correto ou não.
Segundo Castanheira (2010), o teste de hipótese é uma técnica para se
fazer inferência estatística. Por meio de um teste realizado com os dados de
uma amostra, é possível inferir sobre a população a que essa amostra pertende.
Esta técnica permite aceitar ou rejeitar a hipótese estatística, de modo que a
hipótese estatística é uma suposição quanto ao valor de um parâmetro
populacional.
Temos dois tipos de hipóteses, a hipótese nula (H0), que é a hipótese a
ser testada, e a hipótese alternativa (H1), que é qualquer hipótese diferente da
hipótese nula ou qualquer hipótese que afirmeque a hipótese nula é falsa.O
teste de hipótese coloca a hipótese nula em contraposição à hipótese
alternativa. De acordo com Martins (2010), a hipótese nula expressa uma
igualdade, enquanto a hipótese alternativa é dado por uma desigualdade.
Exemplo 1:
Hipótese Nula (H0)
H0= 50
Hipótese Alternativa (H1)
H1 > 50
Podemos considerar outras hipóteses alternativas, como, H1 <50 e H1 ≠
50.
Quando realizamos um teste de hipótese, há dois tipos de erros.
Podemos rejeitar a hipótese nula sendo ela verdadeira e, assim, temos o erro

20
tipo I, ou aceitar a hipótese nula sendo ela falsa, cometendo o erro tipo II. No
quadro abaixo, avaliamos os possíveis erros e acertos de uma decisão com
base em um teste de hipótese.

Quadro 1 – Erros e acertos em teste de hipótese

Aceita-se a hipótese nula (H0) Rejeita-se a hipótese nula (H0)


H0 é verdadeira Decisão foi correta Erro do tipo 1
H0 é falsa Erro do tipo 2 Decisão foi correta
Fonte: Castanheira, 2010.

A probabilidade de cometermos o erro do tipo I é designada por α (alfa) e


chamamos de nível de significância do teste. Já a probabilidade de cometer o
erro do tipo II é designada β (beta).
Além das hipóteses e dos tipos de erros, temos as regiões de
aceitação,nas quais a hipótese nula é aceita, e a região de rejeição, em que se
rejeita a hipótese nula.
De acordo com Castanheira (2010), para qualquer teste de hipóteses,
devemos observar as seguintes etapas:

1. Enunciar a hipótese nula (H0) e a hipótese alternativa (H1);


2. Por meio de H1, definir o tipo de teste que será usado para testar H0;
3. Fixar o limite de erro (α);
4. Determinar a região de rejeição (RR) e a região de aceitação (RA), esta
análise pode ocorrer em três situações:

Figura 8 – Teste de hipótese (I)

21
Figura 9 – Teste de hipótese (II)

Figura 10 – Teste de hipótese (III)

5. Calcular o estimador e verificar se ele se encontra na região de rejeição


ou aceitação. Para realizar um teste para médias, podemos utilizar como
estimador da média populacional a média amostral e calcular o teste Z de
uma amostra dado por:

Ou seja:

sendo n o tamanho da amostra.


6. Decidir, se o estimador estiver na região de aceitação, aceitar H0; se o
estimador estiver na região de rejeição, rejeitar H0.
Exemplo 2:Uma população tem desvio padrão igual a 5 mm. Se uma
amostra de 50 elementos, obtida dessa população, tem média igual a 46 mm,

22
podemos afirmar que a média dessa população é superior a 43 mm, ao nível de
significância de 1%?
Precisamos encontrar as hipótese nula (H0) e alternativa (H1), ou seja:
H0= 43 mm
H1 > 43 mm
Precisamos fixar o limite de erro (α) que, no nosso exemplo, é de 1% =
0,01, ou seja:
0,50 – 0,01 = 0,49
Buscamos o valor encontrado na tabela de distribuição normal para
encontrar o parâmetro z, conforme abaixo:

Tabela 6 – Áreas de uma distribuição normal padrão

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

23
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Fonte: Adaptado de Costa Neto.

Logo, z = 2,33.
Agora, definimos as regiões de aceitação (R.A) e rejeição (R.R):

Figura 11 – Regiões de aceitação e rejeição

Calcular o estimador e verificar se ele se encontra na região de rejeição


ou aceitação:
X  46
µ = 43
σ=5
n = 50
46  43
z
5
50
3
z
5
7,07
3
z  4,24
0,707
Para finalizar, comparamos o resultado encontrado com o valor de Z,
assim, temos que 4,24 > 2,33. Dessa forma, rejeitamos H0, ou seja, a média é
superior a 43 mm no nível e significância considerado.

TROCANDO IDEIAS

Você já participou de alguma pesquisa eleitoral? Após a participação, teve


acesso aos resultados? Analisando os resultados, conseguimos identificar o

24
tamanho da amostra utilizada, o nível de confiança de tal pesquisa e o intervalo
de confiança dos resultados apresentados.
Vimos também as diferentes distribuições de probabilidade e suas
aplicações, você se recorda de alguma aplicação utilizando as distribuições?

NA PRÁTICA

As Distribuições de Probabilidades podem ser utilizadas em várias


situações. A Distribuição Binomial pode ser utilizada na escolha entre um
produto bom ou defeituoso. A Distribuição de Poisson pode ser utilizada em
chamadas telefônicas por unidade de tempo ou clientes chegando a uma fila
para atendimento por minuto. Já a Distribuição Normal é uma das distribuições
mais utilizadas e importantes, constituindo a base teórica de toda inferência
estatística e pode ser utilizada em diferentes áreas.
Vamos verificar alguns exemplos da utilização da Distribuição Normal na
área financeira:

 Finanças e investimentos: <http://walterforte.blogspot.com.br/2010/04/dist


ribuicao-normal-tambem-conhecida.html>;
 Análise de risco: <http://www.palisade-br.com/risk/risk_analysis.asp>.
Também estudamos os conceitos de intervalo de confiança e teste de
hipótese, que podemos utilizar em diferentes áreas e resolução de problemas.
Vamos verificar uma aplicação que utiliza os intervalos de confiança:

 Case Seis Sigma: intervalos de confiança para avaliar variações


<https://www.fm2s.com.br/case-seis-sigma-intervalos-confianca>.

FINALIZANDO

Nesta aula apresentamos as principais Distribuições de Probabilidades:


Binomial, Poisson e Normal, os principais conceitos envolvendo Intervalo de
Confiança e Teste de Hipóteses.

25
REFERÊNCIAS

CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba:


InterSaberes, 2012.

LARSON, R.; FARBER, B. Estatística aplicada. 2.ed. São Paulo: Pearson,


2004.

MARTINS, G. de A. Estatística geral e aplicada. 3. ed. São Paulo: Atlas, 2010.

MORETTIN, L. G. Estatística básica: probabilidade e inferência. São Paulo:


Pearson, 2010.

PEREIRA, A. T. Métodos quantitativos aplicados à contabilidade. Curitiba:


InterSaberes, 2014.

26
ESTATÍSTICA APLICADA ÀS
ANÁLISES CONTÁBEIS
AULA 6

Prof. Aline Purcote


CONVERSA INICIAL

Quando analisamos situações do dia a dia, podemos estar interessados


em conhecer como uma variável impacta no comportamento de outra. Assim,
surge a correlação, que está ligada ao grau de relação existente entre duas ou
mais variáveis. A força dessa relação pode ser calculada pelo coeficiente de
correlação linear de Pearson indicando se há uma relação positiva, negativa ou
nula. A relação existente entre variáveis orienta análises e ajuda na tomada de
decisões em várias situações do cotidiano.
Outra análise que podemos realizar é a análise de regressão, que tem
como objetivo determinar o modelo que expressa a relação entre as variáveis,
encontrando uma equação que descreve esse relacionamento. Quando o
problema envolve apenas duas variáveis, temos uma regressão simples e mais
de duas trabalhamos com uma regressão múltipla.
Portanto, a correlação fornece um número que indica o grau de
relacionamento entre as variáveis, já a regressão apresenta como resultado uma
equação matemática que descreve esse relacionamento.

CONTEXTUALIZANDO

Em algumas situações, trabalhamos com diferentes variáveis e


precisamos entender como elas se relacionam. Podemos estar interessados em
saber se há alguma relação entre o volume de vendas e o preço de um produto,
se o clima altera o consumo de uma determinada mercadoria, se o número de
peças produzidas interfere no número de peças defeituosas, se a média de
tempo de atraso de pagamento tem relação com o número de erros de fatura, se
a venda de uma empresa se relaciona com os gastos promocionais ou se há
relação entre a demanda de um determinado produto com o seu preço.
Logo, pensamos em várias situações em que o estudo da correlação e
regressão pode auxiliar na tomada de decisão. Trabalhamos com diferentes
variáveis e podemos encontrar a relação e o grau desse relacionamento,
podendo aplicar e estudar as variáveis em diferentes situações e áreas do
conhecimento, por exemplo, a relação entre a idade e altura das crianças, tempo
de prática de esportes e ritmo cardíaco, tempo de estudo e a nota na prova, taxa
de desemprego e a taxa de analfabetismo.

2
Para entender como ocorrem essas análises, veremos os conceitos
referentes à correlação, cálculo e interpretação do coeficiente de correlação de
Pearson, regressão linear e regressão múltipla.

TEMA 1 – CORRELAÇÃO

O problema da correlação está ligado ao grau de relação existente entre


duas ou mais variáveis e desejamos determinar até que ponto essa relação pode
ser considerada.
A representação gráfica de duas variáveis é chamada de Diagrama de
Dispersão, que indica a forma da relação entre as variáveis estudadas. Segundo
Castanheira (2016), por intermédio da análise, inicialmente visual, do diagrama,
podemos imediatamente constatar se existe alguma relação entre as variáveis
envolvidas e, em caso positivo, se pode ser tratada como aproximadamente
linear.
Quando os valores das duas variáveis estão próximos a uma reta, temos
uma correlação linear. Os aspectos da correlação linear podem ser analisados
pelo diagrama de dispersão que ilustra as variações, podendo ocorrer uma
correlação linear positiva e perfeita, negativa e perfeita, positiva, negativa ou
nula.

 Correlação linear positiva e perfeita: valor alto em uma variável


corresponde a valor alto na outra variável, ou seja, se uma variável
aumenta, a outra também aumenta. É considerada perfeita sempre que
os pontos estiverem perfeitamente alinhados.

 Correlação linear negativa e perfeita: valor alto em uma variável


corresponde a valor baixo na outra variável, ou seja, se uma variável
aumenta, a outra diminui. É considerada perfeita sempre que os pontos
estiverem perfeitamente alinhados.

3
 Correlação linear positiva: quando as variáveis crescem no mesmo
sentido, ou seja, se uma variável aumenta, a outra também aumenta.

 Correlação linear negativa: quando as variáveis crescem em sentido


contrário, ou seja, se uma variável aumenta, a outra diminui.

 Correlação linear nula: não existe correlação, ou seja, os valores estão


totalmente dispersos.

4
TEMA 2 – COEFICIENTE DE CORRELAÇÃO DE PEARSON

Vimos que a correlação pode ser avaliada pelo Diagrama de Dispersão,


mas, além da forma gráfica, também existem outras formas de verificar se a
correlação entre variáveis é forte ou não. Uma delas é o cálculo do coeficiente
de correlação linear de Pearson, que indica a força da relação entre duas
variáveis. Esse coeficiente varia entre -1 e 1 e quanto mais próximo estiver
destes valores, melhor é o grau de correlação linear entre as variáveis.
Quando o coeficiente de correlação se aproxima de 1, há uma relação
linear positiva e quando se aproxima de -1 temos a correlação negativa. O
coeficiente igual a 1 ou -1, indica correlação linear positiva perfeita e negativa
perfeita. Um coeficiente igual a zero demonstra que não há relação entre as duas
variáveis, ou seja, a correlação linear é nula.

Figura 1 – Coeficiente de relação

Fonte: Elaborado pela autora.

O coeficiente de correlação de Pearson (r) e é dado pela fórmula:

Exemplo: uma empresa realizou uma pesquisa para estudar como varia a
procura de determinado produto em função do preço de venda, obtendo os
seguintes resultados. Calcule o coeficiente de correlação linear.

5
Tabela 1 – Variação de um determinado produto (1)

Preço de Venda Venda Mensal


162 248
167 242
173 215
176 220
180 205

Fonte: Elaborado pela autora.

O primeiro passo será multiplicar os valores (X.Y), encontrar as potências


X² e Y² para depois somar X, Y, X.Y, X² e Y². Faremos as operações diretas na
tabela, conforme abaixo:
Para a primeira linha temos:

X. Y = 162 . 248 = 40.176


X² = 162² = 26.244
Y² = 248² = 61.504

Seguimos o mesmo processo para as demais linhas e, após, somamos


cada valor, ou seja, cada coluna:

Tabela 2 – Variação de um determinado produto (2)

Preço de Venda Venda Mensal X.Y X² Y²


162 248 40.176 26.244 61.504
167 242 40.414 27.889 58.564
173 215 37.195 29.929 46.225
176 220 38.720 30.976 48.400
180 205 36.900 32.400 42.025
858 1130 193.405 147.438 256.718

Fonte: Elaborado pela autora.

Com os dados aplicamos a fórmula, sendo que o n é igual à quantidade


de dados fornecidos, ou seja, n = 5.

6
(5.193405)  (858.1130)
r
5.147438  858 .5.256718  1130 
2 2

967025  969540
r
737190  736164. 1283590  1276900

 2515
r
1026.6690

 2515
r
6863940

 2515
r
2619,91221

r  0,95996

Obtemos um coeficiente igual a -0,95996, assim temos uma correlação


linear negativa, conforme observamos no gráfico de dispersão:

Figura 2 – Gráfico de dispersão

Venda Mensal
300

250

200

150

100

50

0
160 165 170 175 180 185

Fonte: Elaborado pela autora.

TEMA 3 – REGRESSÃO

O objetivo da regressão está em determinar a função que exprime a


relação entre duas ou mais variáveis e tem como resultado uma equação que
descreve o relacionamento entre elas. Quando estudamos apenas duas
variáveis, temos uma regressão simples e mais de uma regressão múltipla.

7
Na regressão, y é chamado de variável dependente ou variável não
controlada, já o x é a variável independente, que é a variável que pode ser
controlada em um experimento.
Segundo Castanheira (2016), em termos da complexidade das funções
ajustantes, a regressão é chamada de linear quando o ajustamento é feito por
uma função do primeiro grau, ou seja, pela equação de uma reta e não linear
quando o ajustamento é feito por uma função de grau superior a um, ou seja, por
uma função exponencial, geométrica, parabólica etc. Para que a regressão
possa ser útil, é necessário saber construir um modelo, estimar seus parâmetros
com base nos dados relativos às variáveis e interpretar os resultados.

TEMA 4 – REGRESSÃO LINEAR

Uma regressão é dita linear quando o ajustamento dos dados é feito por
uma função do primeiro grau, tendo como representação uma reta. O nosso
principal objetivo será aproximar por uma linha reta um conjunto de valores,
determinando a equação de regressão linear simples que melhor se ajuste aos
dados, ou seja, precisamos encontrar os coeficientes da equação da reta:

y = a + bx

Um dos métodos utilizados para encontrar as estimativas de a e b é o


Método dos Mínimos Quadrados, que consiste em tomar como estimativas os
valores que minimizam a soma dos quadrados dos desvios. O coeficiente a é
chamado de coeficiente angular e b de coeficiente linear, cujos valores serão
calculados utilizando as seguintes fórmulas:

n x. y   x. y
b
n x 2   x
2

a      b  
 y  x
 n   n 
ou a  y  bx
Exemplo: Considere a seguinte tabela, que indica as quantidades
produzidas de determinado produto e seus respectivos custos totais de
produção. Pela análise de regressão, encontre a reta que melhor se ajuste ao
conjunto de dados.

8
Tabela 3 – Relação entre a quantidade e custo de um produto (1)

Quantidades Produzidas Custo Total (R$)


10 150
25 290
50 540
80 840
90 900

Fonte: Elaborado pela autora.

Para encontrar a reta de regressão, precisamos primeiro encontrar: x.y, x²


e os somatórios, cálculos que apresentamos diretamente na tabela.
Para a primeira linha temos:
x.y = 10 . 150 = 1500
x² = 10² = 100
Seguir o mesmo processo para as demais linhas e, após, somar cada
coluna:

Tabela 4 – Relação entre a quantidade e custo de um produto (2)

Quantidades Produzidas Custo Total (R$) x.y x²


10 150 1.500 100
25 290 7.250 625
50 540 27.000 2.500
80 840 67.200 6.400
90 900 81.000 8.100
255 2.720 183.950 17.725

Fonte: Elaborado pela autora.

Com os cálculos realizados aplicamos as fórmulas para encontrar os


coeficientes a e b onde n é igual a 5, que é a quantidade de dados fornecidos:
n x. y   x. y
b
n x 2   x 2

5.183950  255.2720
b
5.17725  255
2

9
919750  693600
b
88625  65025

226150
b  9,5826
23600

a      b  
 y  x
 n   n 

 2720   255 
a   9,5826 
 5   5 

a  544  9,582651

a  544  488,7126  55,2874

Utilizando os coeficientes a e b, encontramos a equação da reta de


regressão:
y = a + bx

y = 55,2874 + 9,5826 x

O diagrama de dispersão mostra os pontos e a reta de regressão obtida:

Figura 3 – Diagrama de dispersão (2)

Custo Total (R$)


1000
900
800
700
600
500
400
300
200
100
0
0 20 40 60 80 100

Fonte: Elaborado pela autora.

10
Segundo Castanheira (2016), a regressão linear simples é normalmente
utilizada para estudar a relação existente entre variáveis, com o propósito de
fazer previsões com base nos resultados obtidos nelas.
Considerando o exemplo, qual seria o valor estimado do custo para uma
produção de 180 unidades? Utilizaremos a equação encontrada para prever qual
será o custo na produção de 180 unidades, ou seja, substituímos o x da equação
por 180:

y = 55,2874 + 9,5826 x

y = 55,2874 + 9,5826 . 180

y = 55,1874 + 1724,8680

y = 1780,0554 = 1.780

Assim, para produzir 180 unidades, temos um custo previsto de R$ 1.780.

TEMA 5 – REGRESSÃO LINEAR MÚLTIPLA

Determinadas aplicações exigem modelos mais complexos do que o


utilizado na regressão linear simples. Nas aplicações que precisamos trabalhar
com mais de uma variável independente, utilizamos a regressão linear múltipla,
proporcionando uma conclusão mais precisa sobre a variável em estudo. Por
exemplo, queremos verificar o consumo de determinado produto levando em
consideração a renda dos clientes e preço do produto, logo temos duas variáveis
independentes: a renda e o preço.
De acordo com Castanheira (2016), quando uma variável dependente
está simultaneamente correlacionada a mais de uma variável independente, a
análise será efetuada pela fórmula:

onde:
y = variável dependente
M1,2,...n = coeficientes de regressão
x1,2,...,n = variáveis independentes
B = múltiplo intercepto
Quando temos duas variáveis, os parâmetros são determinados utilizando
as seguintes fórmulas:

11
onde:

Exemplo: a seguinte tabela relaciona o consumo de matéria-prima (em


toneladas) para produção de dois produtos A e B, sendo x1 e x2 as quantidades
produzidas de cada produto respectivamente. Determine a equação de
regressão linear múltipla.

12
Tabela 5 – Consumo de matéria-prima (1)

Consumo X1 X2
3,5 10 8
4 12 9
5,4 15 11
6,1 17 13
7 20 15
7,5 23 16
8 25 18

Fonte: Elaborado pela autora.

Para aplicação da fórmula, precisamos encontrar alguns dados que


calculamos direto na tabela:

Tabela 6 – Consumo de matéria-prima (1)

Consumo X1 X2 Y.X1 Y.X2 X1.X2 X 1² X 2²


3,5 10 8 35 28 80 100 64
4 12 9 48 36 108 144 81
5,4 15 11 81 59,4 165 225 121
6,1 17 13 103,7 79,3 221 289 169
7 20 15 140 105 300 400 225
7,5 23 16 172,5 120 368 529 256
8 25 18 200 144 450 625 324
41,5 122 90 780,2 571,7 1.692 2.312 1.240

Fonte: Elaborado pela autora.

Com os dados calculados aplicamos as fórmulas, considerando n = 7 que


é o número de dados que temos:

41,5.122
S y1  780,2 
7

5063
S y1  780,2   780,2  723,285714  56,914286
7

13
41,5.90
S y 2  571,7 
7

3735
S y 2  571,7   571,7  533,571429  38,128571
7

122.90
S12  1692 
7

10980
S12  1692   1692  1568,571429  123,428571
7

S11  2312 
1222
7

14884
S11  2312   2312  2126,285714  185,714286
7

S 22  1240 
90
2

8100
S 22  1240   1240  1157,142857  82,857143
7

14
38,128571 56,914286

123,428571 185,714286
M2 
82,857143 123,428571

123,428571 185,714286

0,308912  0,306462
M2 
0,671296  0,664615

0,002450
M2   0,366712
0,006681

38,128571 82,857143
M1   .0,366712
123,428571 123,428571

M1  0,308912  0,671296.0,366712

M1  0,308912  0,246172  0,06274

41,5 122 90
B  0,06274.  0,366712.
7 7 7

B  5,928571429  0,06274.17,42857143  0,366712.12,85714286

B  5,928571429  1,093468572  4,714868572  0,120234285

A equação procurada é:

y  M1.x1 M 2.x2  B

y  0,06274.x1  0,366712.x2  0,120234285

Segundo Castanheira (2016), a regressão linear múltipla nos fornece


dados mais precisos que a regressão linear simples, no entanto exige o
conhecimento de funções mais complexas e, consequentemente, mais
trabalhosas. Sua aplicação, na prática, requer que recorremos a computadores.

15
TROCANDO IDEIAS

Vimos que a correlação e a regressão são duas técnicas relacionadas. A


correlação fornece um número que resume o grau de relacionamento entre as
variáveis, e a regressão tem como resultado uma equação que descreve esse
relacionamento. Você se recorda de alguma situação em que podemos aplicar a
correlação e a regressão? Qual situação do nosso dia a dia poderia aplicar o
estudo de correlação?

NA PRÁTICA

A correlação e a regressão estudam a relação existente entre variáveis e,


com base nos resultados obtidos, podemos tomar decisões. Vamos verificar
alguns exemplos onde podemos aplicar os assuntos estudados.

Saiba mais

1. POR QUE é importante entender correlação entre variáveis. Escola


EDTI, 8 set. 2016. Disponível em:
<https://www.escolaedti.com.br/entender-correlacao-entre-variaveis>.
Acesso em: 11 out. 2019.
2. O USO da regressão linear na logística reversa no Brasil. Kroton –
Portal Stricto Sensu, S.d. Disponível em: <https://pgsskroton.com.br/>.
Acesso em: 11 out. 2019.
3. OLIVEIRA FILHO, M. L. A utilização da regressão linear como
ferramenta estratégica para a projeção dos custos de produção. IX
Congresso Brasileiro de Custos. São Paulo, 13 a 15 out. 2002.
Disponível em:
<https://anaiscbc.emnuvens.com.br/anais/article/viewFile/2762/2762>.
Acesso em: 11 out. 2019.
4. ELIAS, Z. S. et al. Rateio dos custos indiretos: aplicação da análise de
correlação e de regressão. Revista de Contabilidade do Mestrado em
Ciências Contábeis da UERJ, Rio de Janeiro, v. 14, n. 2, p. 50 - p. 66,
maio/ago, 2009. Disponível em: <http://atena.org.br/revista/ojs-2.2.3-
08/index.php/UERJ/article/viewFile/597/593>. Acesso em: 11 out. 2019.

16
FINALIZANDO

Nesta aula, estudamos os principais conceitos de correlação e regressão


além da análise dos resultados obtidos. Vimos a aplicação do coeficiente de
correlação de Pearson e a diferença entre a regressão linear simples e múltipla.

17
REFERÊNCIAS

CASTANHEIRA, N. P. Cálculo aplicado à gestão e aos negócios. Curitiba:


InterSaberes, 2016.

18

Você também pode gostar