Você está na página 1de 17

Probabilidade e

Estatística

UNIDADE 4
PROBABILIDADE E ESTATÍSTICA
UNIDADE 4

Para início de conversa

Chegamos a última unidade da disciplina. Vamos agora ao estudo de variáveis aleatórias contínuas. Da
mesma forma que as variáveis aleatórias discretas, estamos interessados em variáveis quantitativas.
Mas a grande diferença é que no presente caso de variáveis aleatórias contínuas, as variáveis que
estudaremos podem assumir qualquer valor real. Geralmente precisamos de um instrumento de medição
e uma escala para medir o resultado de um experimento aleatório com variável aleatória contínua.

Vamos lá!

VARIÁVEIS ALEATÓRIAS CONTINUAS


Alguns exemplos de variáveis aleatórias contínuas são:
a) O tempo de resposta de um sistema computacional;
b) O tempo de vida de um componente eletrônico;

c) O volume de líquido em uma garrafa de refrigerante.

Além da forma de medição das variáveis, existe outra grande diferença entre as variáveis aleatórias
discretas e contínuas. Essa diferença é no modo de calcular as probabilidades. Numa variável aleatória
discreta, a função de probabilidade f(x) nos permite calcular a probabilidade dessa variável em assumir
certo valor específico. Podemos calcular, por exemplo, o valor de p(x = 2).

Esse caso, no presente, não é mais possível. Como a variável pode assumir qualquer valor real, a
probabilidade de x ser igual a algum valor específico não pode ser avaliada. Mas podemos calcular
a probabilidade de nossa variável aleatória assumir um valor dentro de um determinado intervalo de
valores. Para isso, nossa grande aliada é a chamada função densidade de probabilidade, que também
expressamos por f(x).

Essa função não produz probabilidades diretamente. Mas, se construirmos um gráfico de f(x), a área
abaixo desse gráfico entre dois pontos a e b nos dará a probabilidade de nossa variável aleatória x estar
entre esses dois valores.

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

1
Podemos também calcular a probabilidade de nossa variável aleatória ser menor ou igual a certo valor
específico usando a função de distribuição de probabilidade acumulada. Essa função é expressa da
seguinte forma:

Vamos ver como se usa essa função no seguinte exemplo:

Vamos considerar a seguinte função densidade de probabilidade: ao lado da função podemos ver o gráfico
que representa essa função densidade de probabilidade.

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Essa função pode representar o tempo de vida de um componente eletrônico, por exemplo.

a) Vamos calcular a probabilidade do tempo de operação desse componente ser maior que 3
horas.

É essa probabilidade que está representada no gráfico ao lado da expressão de nossa função.

b) vamos agora encontrar a expressão para a distribuição de probabilidade acumulada dessa


função probabilidade:

No cálculo de nossa integral precisamos trocar a variável de integração de t para s por uma questão de
formalismo. Isso acontece porque a mesma variável não pode aparecer no integrando e em um dos limites
de integração ao mesmo tempo.

Essa função que acabamos de encontrar é usada para calcular a área abaixo da curva que representa a
função de probabilidade de nossa variável aleatória contínua.

A função f(x) nos mostra o contorno, a forma da distribuição de probabilidade. A função de distribuição
acumulada F(x) nos mostra a área abaixo da curva.

2
VALOR ESPERADO E VARIÂNCIA
Da mesma forma que podemos calcular o valor esperado e a variância de uma variável aleatória discreta,
podemos calcular valor esperado e variância para uma variável aleatória contínua. Mas agora não
usaremos um somatório e sim uma integral para fazer esse cálculo.

Se uma variável aleatória contínua X possui função densidade de probabilidade f(x), calculamos seu valor
esperado e sua variância pelas expressões:

A interpretação dessas medidas é mesma que temos para as variáveis aleatórias discretas.

Vamos retornar ao exemplo da função densidade de probabilidade que trata do tempo de vida de um
componente eletrônico e vamos usar as expressões acima para calcular o valor esperado do tempo de uso
desse componente e a variância desse tempo de uso.

O cálculo da variância é deixado como exercício para você. Além disso, a última integral acima é calculada
pelo método de integração por partes. Você encontrará como resultado para a variância V(x) = 0,25.

MODELOS CONTÍNUOS
Vamos agora passar a falar um pouco dos principais modelos de distribuições de probabilidades contínuas
que são usados em estudos de experimentos aleatórios.

Distribuição Uniforme (subtítulo)

Dizemos que uma variável aleatória X tem distribuição uniforme se a sua função densidade de probabilidade
f(x) é dada pela expressão abaixo:

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

3
Os valores de α e β são constantes e são chamados de parâmetros da distribuição. O gráfico dessa
distribuição tem a seguinte forma:

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Vale lembrar que a área abaixo da curva representada por f(x) deve sempre ser igual a um.

Vamos encontrar a função distribuição acumulada e o valor esperado dessa distribuição de probabilidade:

A função de probabilidade acumulada é encontrada pela integral da função densidade de probabilidade e


encontramos os seguintes resultados para essa função:

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

O cálculo da variância é deixado como exercício para você.

Se olharmos com atenção o valor esperado dessa distribuição de probabilidades, podemos notar que o
seu valor é exatamente o ponto médio do intervalo de definição da distribuição. Isso nos ajuda a confirmar
a ideia de que o valor esperado representa o centro de gravidade de nossa massa de dados.

Distribuição Exponencial

Alguns modelos contínuos têm uma estreita relação com modelos discretos. No final de nossa unidade
sobre distribuições discretas, falamos da distribuição de Poisson e que ela modela variáveis aleatórias
em que o número de ocorrências de um determinado evento acontece em certo período de tempo. A
distribuição exponencial é usada para modelar justamente o tempo entre cada uma dessas ocorrências
estudadas pela distribuição de Poisson.

4
Assim, sempre que há as suposições para o uso da distribuição de Poisson , também poderemos usar a
distribuição exponencial.

A função densidade de probabilidade para uma variável aleatória com distribuição exponencial é dada
pela expressão:

Essa distribuição possui apenas um parâmetro que é o valor de λ. O primeiro exemplo de cálculo de
probabilidades usando as distribuições contínuas foi uma aplicação da distribuição exponencial com
λ = 2.

Guarde essa ideia! Como já dissemos, essa distribuição é muito usada para modelar o tempo
entre ocorrências de um determinado evento. Por isso, é muito usada na área de engenharia de
manutenção para podermos determinar o melhor momento para efetuarmos a manutenção de
um equipamento cujo tempo de vida seja modelado por essa distribuição.

Deixamos os cálculos de valor esperado e variância dessa distribuição como exercício para o leitor.
Lembrando que não são difíceis de serem encontrados por integração.

Voltando ao nosso exemplo inicial, vamos usar a distribuição exponencial para calcular a probabilidade de
nosso componente operar sem problemas no intervalo de tempo 2 ≤ t ≤ 3.

Distribuição Normal

De todas as distribuições de probabilidade que estudamos, seja contínua ou discreta, a mais importante
de todas é a distribuição normal. Essa importância é devida a variedade de diferentes situações e modelos
naturais em que essa distribuição aparece. Além disso, podemos modelar processos que seguem outras
distribuições de probabilidades usando a distribuição normal, desde que exista o devido cuidado na hora
de efetuar a transformação de variáveis.

Essa distribuição é caracterizada pela seguinte função densidade de probabilidade:

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Nessa função densidade temos dois parâmetros importantes: µ = valor esperado da distribuição e σ =
desvio padrão da distribuição. O gráfico da distribuição normal possui a seguinte forma:

5
(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Por causa de sua forma, essa curva também é chamada de curva do sino. Outro nome comum é curva
gaussiana e é devido ao matemático alemão Carl_Gauss criador da distribuição de probabilidade normal.

Podemos comparar diferentes distribuições normais apenas olhando seus gráficos e retirar algumas
informações importantes sobre os processos que estamos estudando. Vejamos os gráficos abaixo, eles
podem ser usados para representar, por exemplo, a resistência mecânica de algum material usado na
indústria.

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Nesse caso, o gráfico 2 pode representar que o processo passou por alguma melhoria de qualidade, uma
vez que a média do segundo gráfico foi deslocada em relação a do primeiro. Outro ponto que podemos
observar é que a variância dos dois gráficos é a mesma. Isso reforça ainda mais a ideia de melhoria de
qualidade ocorrida no processo. Melhoramos a média sem mudar a variabilidade do processo.

Agora vamos estudar o gráfico abaixo. Podemos ver nesse gráfico que a média das duas distribuições
é a mesma, porém a variância é bem diferente. É possível ver isso, pois o gráfico 4 tem seus dados
distribuídos de modo mais afastado do valor esperado da distribuição. Em uma indústria, esse tipo de
situação poderia indicar que o processo que antes estava sob rígido controle de qualidade (gráfico 3),
passou a ter alguma causa externa atuando sobre ele e provocando um aumento em sua variabilidade. Em
aplicações industriais, quanto menor a variabilidade do processo, melhor é nossa produção.

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

6
Nossa distribuição normal possui algumas propriedades interessantes:

1) A curva gaussiana é simétrica em relação a média µ. A primeira consequência dessa propriedade é que
os valores da média e da mediana de nossa variável aleatória são iguais. Outra consequência é que
em que α é um número real qualquer. Isso quer dizer que deslocamentos
iguais em relação a média tem a mesma área abaixo da curva normal.

2) A área total sob a curva normal é igual a 1. . Essa é uma prova difícil de fazermos por
integração, mas existe uma forma. Essa prova está fora do que pretendemos fazer nessa disciplina.
Apenas usamos esse resultado como verdade.

3) Podemos combinar diferentes distribuições normais. Qualquer combinação linear de variáveis aleatórias
normais também é uma distribuição normal. Assim, se temos X1 seguindo uma distribuição normal com
parâmetros µ1 e σ1 e outra distribuição normal X2 com parâmetros µ2 e σ2. Podemos definir uma nova
distribuição normal Y = aX1 + bX2. Essa nova distribuição terá

Distribuição Normal Padronizada

Como já vimos, a distribuição normal é uma das mais importantes entre todas as distribuições de
probabilidades que conhecemos. Ela possui as mesmas propriedades das demais distribuições para o
cálculo de probabilidades usando sua função densidade de probabilidade. Contudo, temos um pequeno
problema associado ao cálculo das probabilidades como a área abaixo da curva da função densidade de
probabilidade.

Se você voltar a olhar a função densidade, podemos notar que a sua integral é muito difícil de ser
calculada. Seria necessário um grande esforço para encontrar qualquer probabilidade usando a integral
dessa função densidade. Por isso, devido à importância da distribuição normal, foi desenvolvido um
método mais prático para calcular essas probabilidades.

Guarde essa ideia! Quando uma variável aleatória X possui distribuição normal com valor
esperado µ e desvio padrão σ, usamos o seguinte símbolo para representar essa relação X →
N(µ, σ). Esses valores de µ e σ são os parâmetros de nossa distribuição normal.

A distribuição normal possui um caso especial chamado de Distribuição Normal Padronizada. Essa
normal padronizada é caracterizada pelos seguintes parâmetros: µ = 0 e σ = 1. Uma variável aleatória que
siga uma distribuição normal padronizada é chamada de Z → N(0, 1). Essa distribuição normal padrão
tem uma grande e importante vantagem, todos os seus resultados são tabelados. Isso quer dizer que
podemos, a partir do valor de z, encontrar o valor da probabilidade associada a esse valor olhando uma
tabela de valores.

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)


7
Na figura acima, vemos uma pequena parte da tabela normal padrão que você pode encontrar em sua
versão completa no livro texto de nossa disciplina. Para encontrarmos alguma probabilidade usando essa
tabela, precisamos determinar qual linha e qual coluna da tabela queremos usar. Fazemos isso usando
o valor da variável aleatória z. Para escolher a linha, tomamos o valor de z até o primeiro número depois
da vírgula, em nossa figura é o 0,2. Já para escolher a coluna, tomamos o restante do valor de z, ou seja,
o segundo algarismo depois da vírgula, em nossa figura, é o 0,01. Assim, queremos, em nosso exemplo,
encontrar a probabilidade de um número z = 0,21.

Existem diferentes tabelas que podem ser usadas. Em nosso exemplo a tabela nos dá a área à direita do
ponto z que queremos encontrar:

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Pela tabela, o valor da probabilidade é P(z ≥ 0,21) = 0, 4168. Existem tabelas que nos fornecem os valores
de probabilidades à esquerda do ponto z que queremos. As duas podem ser utilizadas sem nenhum
problema, pois aproveitamos o fato da distribuição normal ser simétrica em relação à média.

No caso de nosso exemplo, se quiséssemos encontrar a probabilidade P(z ≤ 0,21), poderíamos fazer isso
sem usar uma tabela que traga os valores das áreas à esquerda do ponto z = 0,21. Uma das propriedades
que vimos da distribuição normal seja quais forem os valores de seu valor esperado e seu desvio padrão,
é que a área total abaixo da curva densidade de probabilidade é sempre igual a 1. Temos que essa
probabilidade é calculada:

P(z ≤ 0,21) = 1 – P(z ≥ 0,21) = 1 – 0,4168 = 0,5832

Exemplo 1: Seja Z uma variável aleatória com distribuição normal padrão. Vamos calcular as probabilidades
(exemplo presente no livro Estatística para curso de Engenharia e Informática, Barbetta ET AL. Editora
Atlas, 3ª edição. Adaptado):

a) P(Z < 0,42): se olharmos para a figura que representa a distribuição normal, podemos perceber
que essa probabilidade é a área abaixo:

(Adaptação: Livro Estatística para Cursos de Engenharia e Informática)

8
Podemos notar também, que essa área descrita pelo problema pode ser encontrada usando a tabela da
normal padronizada pelo seguinte procedimento:

- =

(Adaptação: Livro Estatístico para cursos de engenharia e informática)

A área total abaixo da curva normal é igual a 1, em nossa tabela estão registradas as áreas à esquerda do
valor z que estamos estudando. Se fizermos a diferença entre essas duas áreas, iremos encontrar o valor
da probabilidade que queremos: P(Z < 0,42) = 1 – P(Z > 0,42).

P(Z < 0,42) = 1 – P(Z > 0,42) = 1 – 0, 3372 = 0, 6628

Esse procedimento se chama probabilidade pelo complementar e é muito usado para encontrar
probabilidades em regiões diferentes das que são tabeladas.

b) P(Z < - 0,42): mais uma vez temos uma situação em que a simetria da distribuição normal em
volta da sua média será muito útil para calcularmos essa probabilidade:

(Adaptação: Livro Estatística para Cursos de Engenharia e Informática)

Como a distribuição normal é simétrica em relação à média, a mesma área que temos à direita de z é a
que encontramos à esquerda de – z. Assim,

P(Z < - 0,42) = P(Z > 0,42) = 0, 3372

c) P(-0,42 < Z < 0,42): outro caso que podemos nos deparar em nossos estudos de probabilidades,
usando distribuição normal, é a necessidade de se calcular probabilidades entre dois pontos específicos.

9
A figura abaixo ilustra essa possibilidade de situação:

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Novamente vamos usar as probabilidades complementares para nos ajudar a encontrar essa área.

- =

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Já sabemos como encontrar as áreas nas caudas de nossa distribuição normal, usando esse fato e que
a área total abaixo da curva é igual a 1, podemos usar a diferença entre essas áreas para encontrar a
probabilidade pedida na questão:

P(-0,42 < Z < 0,42) = 1 – P(Z < - 0,42) – P(Z > 0,42) = 1 – 0, 3372 – 0, 3372 = 0, 3256

Agora que já sabemos calcular probabilidades de uma variável aleatória contínua que siga uma distribuição
normal padrão, podemos usar outra grande vantagem dessa distribuição. Conseguimos usar uma mudança
de variável e transformar uma variável aleatória X que siga uma distribuição normal N(µ, σ) em uma nova
variável aleatória Z que segue uma distribuição normal padrão, ou seja, Z → N(0, 1), e usar a tabela para
calcular probabilidades. A mudança que fazemos para relacionar as nossas variáveis aleatórias é:

Esse valor de Z que calculamos com essa mudança de variáveis é chamado de escore z. Com essa relação,
podemos transformar qualquer variável aleatória X que siga uma distribuição normal com parâmetros µ e
σ em uma variável aleatória Z com N(0, 1). Vamos a mais um exemplo:

10
(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Em nossa figura temos do lado esquerdo uma variável aleatória X que segue N(170, 10) e queremos
calcular a probabilidade P(x ≥ 180). Para podermos usar a tabela da normal padronizada, fazemos a
mudança de variável para encontrar o escore z apropriado, depois disso basta procurar na tabela o valor
da probabilidade associado ao escore z = 1.

Exemplo 2: suponha que a absorção de água, em porcentual, em certo tipo de piso cerâmico tenha
distribuição normal com média 2,5 e desvio padrão 0,6. Selecionando, ao acaso, uma unidade desse piso,
qual a probabilidade de ele acusar uma absorção de água entre 2% e 3,5%? (Exemplo do livro Estatística
para curso de Engenharia e Informática, Barbetta ET AL. Editora Atlas, 3ª edição).

Antes de qualquer coisa, precisamos definir uma variável aleatória para o nosso problema. Aqui podemos
usar X = porcentual de absorção de água por um piso cerâmico. É dito no problema que essa variável
aleatória segue uma distribuição normal com parâmetros valor esperado µ = 2,5 e desvio padrão σ = 0,6.

Depois de definirmos uma variável aleatória, determinarmos sua distribuição de probabilidades como
normal e identificarmos corretamente seus parâmetros, precisamos apenas efetuar a transformação dos
valores que nos foram passados para a normal padronizada para assim usarmos a tabela e calcularmos
os valores da probabilidade pedida.

Calculando z para os valores que foram passados no problema, temos:

Para x = 2:

E para x = 3,5:

Agora que encontramos os valores de z, basta usar a tabela para encontrar a probabilidade pedida:

P(2 < X < 3,5) = P(-0,83 < Z < 1,67) = 1 – 0, 2033 – 0, 0475 = 0, 7492

11
Qualquer dúvida sobre como calculamos essas probabilidades, é só olhar o exemplo acima.

Dica! Também podemos fazer uso da tabela normal em sentido contrário ao que fizemos até
agora. Podemos, dada uma probabilidade qualquer, encontrar o valor de z correspondente a
essa probabilidade. Isso ocorre em situações que já conhecemos a probabilidade e precisamos
determinar qual escore z está associado àquela área.

Para facilitar essa tarefa é sempre bom desenhar a área que se que tem para determinar o valor do escore
z.

(Adaptação: Livro Estatística para Cursos de Engenharia e Informática)

Se já conhecemos a probabilidade α, precisamos determinar o valor zα correspondente a essa probabilidade


na tabela:

Podemos fazer isso usando a probabilidade acumulada à direita de zα. Essa probabilidade será α e iremos
procurar o valor dessa probabilidade no corpo da tabela.

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Na verdade, o que estamos fazendo é o procedimento inverso do que fizemos até agora para calcular
probabilidades usando a tabela normal. Mas não podemos esquecer que vamos procurar a probabilidade
no corpo da tabela e a partir daí encontraremos o valor de z que corresponde em suas bordas.

A Normal como aproximação para a distribuição Binomial

Vamos lembrar um pouco de uma das distribuições discretas que estudamos na unidade anterior. A
Distribuição Binomial é usada quando temos vários ensaios cujos resultados só podem assumir dois
valores a que nomeamos como sucesso e fracasso. A cada um desses resultados nós associamos uma
probabilidade.

12
(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

O gráfico acima representa uma distribuição binomial com n = 10 e p = 0,5. Cada uma das probabilidades
pode ser calculada usando a fórmula da binomial que vimos na unidade anterior. Se olharmos mais
atentamente para essa figura, podemos notar algumas semelhanças entre a forma dessa distribuição e a
forma da distribuição normal que estamos estudando nessa unidade.

Vejamos a figura abaixo:

(Fonte: Livro Estatística para Cursos de Engenharia e Informática)

Nessa figura, colocamos no mesmo gráfico as duas distribuições de probabilidade, a binomial e a normal.
A semelhança fica ainda mais evidente. Também podemos perceber que se aumentamos o valor n, ou
seja, se houver mais divisões em nosso gráfico da binomial, maior será a semelhança entre ele e a
distribuição normal, contanto que a probabilidade de sucesso p não fique próxima nem de 0 nem de 1.

Dica! Se a nossa probabilidade de sucesso p estiver próxima de 0 ou de 1, o que irá ocorrer


com nossa distribuição binomial é que seus resultados estarão bem concentrados ou no início
ou no fim de seus dados. Aí perderemos uma das características mais importantes da normal
que é sua simetria em relação à média. Então, tomando o devido cuidado para n ser um valor grande e p
não estar próximo nem de 0 nem de 1, podemos usar a aproximação entre distribuição normal e binomial.

Sabemos que para caracterizar uma distribuição de probabilidade, precisamos especificar seu valor
esperado µ e seu desvio padrão σ. Para garantir que exista mesmo essa relação de aproximação entre
normal e binomial, é necessário que esses parâmetros de nossas duas distribuições estejam relacionados
também.

Da unidade 3, sabemos como calcular o valor esperado e o desvio padrão de uma distribuição binomial:

Seja X uma variável aleatória com distribuição binomial com parâmetros n e p: E(X) = np e V(X) = np(1 – p).

13
Se vamos fazer a aproximação da binomial pela distribuição normal, precisamos que seu valor esperado
e sua variância (e por consequência, seu desvio padrão) possuam os mesmos valores. Assim, temos Y =
variável aleatória com distribuição normal: µ = np e σ2 = np(1 – p).

Na literatura sobre estatística existem algumas regras para podermos usar essa aproximação entre
normal e binomial. Uma das regras mais utilizadas para determinar se essa mudança é válida é se as
inequações abaixo forem satisfeitas:

Exemplo: Historicamente, 10% dos pisos cerâmicos que saem de uma linha de produção têm algum tipo
de defeito. Se a produção diária é de 1000 unidades, qual a probabilidade de ocorrer mais de 120 itens
defeituosos (Exemplo presente no livro Estatística para curso de Engenharia e Informática, Barbetta ET
AL. Editora Atlas, 3ª edição)?

Podemos começar definindo uma variável aleatória X = número de defeituosos em nossa amostra. Se
tomarmos um dia de operação de nossa fábrica como uma amostra de seu trabalho teremos que X segue
uma distribuição binomial com n = 1000 e p = 0,1. Uma de nossas condições foi satisfeita, pois o valor
de n é bem alto. Nossa probabilidade p está próxima de 0, mas vamos determinar se as condições acima
também são satisfeitas:

Como essas condições foram satisfeitas, podemos usar uma aproximação entre a distribuição binomial e a
distribuição normal. Agora precisamos definir uma nova variável aleatória Y = número de itens defeituosos
na amostra. Essa nova variável Y irá seguir uma distribuição normal com
e

A probabilidade que queremos calcular é dada pela relação:

O símbolo entre as duas probabilidades indica que nossos dois resultados são aproximadamente iguais.
Já que definimos nossa distribuição normal e já temos seus parâmetros, para podermos resolver o nosso
problema precisamos transformar essa distribuição em uma distribuição normal padrão pela mudança de
variável do escore z e efetuar os cálculos:

Para y = 120:

Assim,

Esse é um resultado muito próximo da probabilidade que encontraríamos usando a distribuição binomial.
Mas o processo para encontrar esse valor seria muito mais trabalhoso, uma vez que teríamos de calcular
todas as probabilidades da binomial para x = 0, x = 1, x = 2, ... x = 120 e depois íamos precisar fazer a
probabilidade do complementar.

14
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Uma das mais importantes aplicações da estatística que estudamos até agora é que podemos usá-la
para extrair informações a partir dos dados que temos disponíveis. É muito comum, no dia a dia de uma
indústria, serem produzidos milhares de dados sobre a produção. Um dos grandes desafios do pessoal
que trabalha no controle de produção e na produção diretamente é transformar todos esses dados em
informações que possam ser utilizadas em busca de melhorias do processo produtivo.

Muitas vezes não temos a nossa disposição informações sobre os parâmetros das distribuições de
probabilidade que os nossos processos de produção estão sujeitos. Nem em qual distribuição esses dados
se encaixam. Contudo, existe um ramo da estatística responsável por estudar esse tipo de situação, é a
chamada Inferência Estatística. Esse ramo é o responsável por técnicas que nos permitem tirar informações
de uma grande população a partir de um conjunto limitado de dados que chamamos de amostra.

Guarde essa ideia! Esse é, por exemplo, o processo estatístico usado na hora de se fazer uma
pesquisa eleitoral para saber a proporção de eleitores que têm a intenção de votar em cada
candidato. É o meio que usamos para determinar a proporção de itens defeituosos que nosso
processo terá como valor esperado.

Como não conhecemos os parâmetros de nossas distribuições, precisamos de um método que nos ajude
a estimar esses valores. Nesse processo lançamos mão de algumas características da distribuição dos
dados. Uma delas é que uma grande massa de dados tende a seguir uma distribuição normal ou uma
aproximação da distribuição normal. Esse resultado é o chamado Teorema do Limite Central.

Se uma variável aleatória x possui distribuição de probabilidades com média µ e desvio padrão σ e
amostras aleatórias simples de tamanho n são selecionadas dessa amostra:

1. a distribuição das médias amostrais x irá se aproximar de uma distribuição normal e medida
que n aumentar;

2. a média de todas as médias amostrais é a média µ da população.

3. o desvio padrão de todas as médias amostrais é .

Essas três condições compõem o teorema do limite central e são de grande importância para o uso da
inferência estatística.

Palavras do Professor
Chegamos ao final da quarta unidade e assim concluímos nossa disciplina. Não deixe de
realizar as atividades propostas e leia o livro texto. Consulte o tutor em caso de dúvidas.
Bom estudo e sucesso!

15
Referência Bibliográfica

BARBETTA, P. A. et al. Estatística para Cursos de Engenharia e Informática. São Paulo: Atlas, 2010.

16

Você também pode gostar