Você está na página 1de 13

1

Curso: Engenharia Química - 3º ano 2017 Disciplina: Probabilidade e Estatística Prof. Katia C S Paulo

Apostila de Estatística - I

A Estatística é uma parte da matemática aplicada que fornece métodos para a coleta,

organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.

A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva,

enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou

Inferencial.

Fenômenos Estatísticos

O fenômeno em estatística relaciona-se com qualquer evento que se pretenda analisar,

cujo estudo seja passível da aplicação da técnica estatística.

A Estatística dedica-se ao estudo dos fenômenos de massa, que são resultantes do

concurso de um grande número de causas, total ou parcialmente desconhecidas, que serão

chamadas de “fenômenos estatísticos”.

Os fenômenos classificam-se em três tipos:

Ø Fenômenos Coletivos ou Fenômenos de massa: São aqueles que não podem ser definidos por uma simples observação. A natalidade, a mortalidade, a nupcialidade, o preço médio de veículos usados, vendidos diariamente em uma grande cidade, são fenômenos coletivos.

Ø Fenômenos Individuais ou Particulares: São aqueles que irão compor os fenômenos coletivos. Cada nascimento, cada indivíduo que morre, cada casamento que ocorre, cada veículo usado que se vende diariamente em uma grande cidade, são fenômenos individuais.

Ø Fenômenos de Multidão: Os fenômenos de multidão distinguem-se dos fenômenos coletivos pelo fato de as características observadas para a massa não se verificarem para o particular, para o indivíduo isoladamente.

Fases do Método Estatístico

v Coleta de dados:

Após saber o que se quer pesquisar, damos início à coleta de dados numéricos necessários à sua descrição.

A coleta pode ser direta ou indireta.

2

A coleta è direta quando feita sobre elementos informativos de registro obrigatório

(nascimento, casamento e óbitos, importação e exportação de mercadoria), elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionário, etc. A coleta direta de dados pode ser classificada relativamente ao fator tempo em :

a) contínua: quando feita continuamente, tal como a de nascimento e óbitos e a de freqüência dos alunos às aulas;

b) periódica: quando feita em intervalos constante de tempo, como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos;

c) ocasional: quando feita extemporaneamente, a fim de atender a uma emergência, como caso de epidemias.

A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou

do conhecimento de outros A cada fenômenos relacionados com o A cada fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita

através de dados colhidos por uma coleta direta.

v Crítica dos dados:

Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certos vulto, que possam influir sensivelmente nos resultados.

v Apuração dos dados:

È a soma e o processamento dos dados obtidos e a disposição mediante critérios de

classificação.

v Exposição ou apresentação dos dados:

Os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.

v Análise dos resultados:

O objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de

informações fornecidas por parte representativa do todo (amostra).

Exercícios

1-

O que é Estatística?

2-

Cite as fases do método estatístico

3-

Para você, o que é coletar dados?

4-

Para que serve a crítica dos dados?

5-

O que é apurar dados?

6-

Como podem ser apresentados ou expostos os dados?

7-

As conclusões, as inferências pertencem a que parte da Estatística?

3

População e amostra.

1- Variáveis

A cada fenômeno correspondente um número de resultados possíveis. Assim, por

exemplo:

- para o fenômeno “sexo” são dois os resultados possíveis: sexo feminino e sexo masculino;

- para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números naturais;

0, 1, 2, 3,

,

n;

- para o fenômeno “estatura” temos uma situação diferente, pois os resultados

podem tomar um número infinito de valores numéricos dentro de um determinado intervalo.

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.
Variável
é,
convencionalmente,
o
conjunto
de
resultados
possíveis
de
um
fenômeno.

Os exemplos acima nos dizem que uma variável pode ser:

a. qualitativa – quando seus valores são expressos por atributos: sexo (masculino – feminino), cor de pele (branca, preta, amarela, vermelha), etc

b. quantitativa – quando seus valores são expressos um números (salários dos operários, idade dos alunos de uma escola, etc). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta.

Assim, o conjunto de alunos de uma escola pode assumir qualquer um dos valores do

, variável discreta. Já o peso desses alunos é uma variável contínua, pois um dos alunos tanto pode pesar 72Kg, como 72,5Kg etc, dependendo esse valor da precisão da medida.

conjunto

mas nunca valores como 2,5 ou 3,78 etc. Logo, é uma

mas nunca valores como 2,5 ou 3,78 etc. Logo, é uma N = {1, 2, 3,

N = {1, 2, 3,

58,

},

Exercícios

I. classifique as variáveis em qualitativas ou quantitativas (contínuas ou discretas):

a) Universo: aluno de uma escola. Variável: cor dos cabelos.

b) Universo: casais residentes em uma cidade. Variável: número de filhos.

c) Universo: as jogadas de um dado. Variável: o ponto obtido em cada jogada.

d) Universo: peças produzidas por certa máquina. Variável: número de peças produzidas por hora.

e) Universo: peças produzidas por certa máquina. Variável: diâmetro externo.

4

II.

Diga quais das variáveis abaixo são discretas e quais são contínuas:

 

a) População: alunos de uma cidade. Variável: cor dos olhos.

 

b) P.: Bolsa de valores de São Paulo. V.: número de ações negociadas.

c) P.: funcionários de uma empresa. V.: salários.

 

d) P.: pregos produzidos por uma máquina. V.: comprimento.

 

e) P.: casais residentes em uma cidade. V.: sexo dos filhos.

 

f) P.: propriedades agrícolas do Brasil. V.: produção de algodão.

g) P.: segmento de reta. V.: comprimento.

 

h) P.: bibliotecas da cidade de São Paulo. V.: número de volumes.

 

2-

População e Amostra

 

Ao

conjunto

de

entes

portadores

de,

pelo

menos,

uma

característica

comum

denominamos população estatística ou universo estatístico.

Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos uma característica comum: são os que estudam. Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte proveniente da população em estudo denominamos amostra.

Uma amostra é um subconjunto finito de uma população.

2.1- Técnicas de amostragem

Definida a população é necessário escolher a técnica de amostragem a ser utilizada para a escolha dos elementos que irão compor a amostra. Depois da amostra definida é que podemos estudar a variável que se quer (estatura, renda familiar, peso, etc

5

Ø Principais técnicas de amostragem:

5 Ø Principais técnicas de amostragem: Amostragem Aleatória Simple s : Todos os membros da população
5 Ø Principais técnicas de amostragem: Amostragem Aleatória Simple s : Todos os membros da população

Amostragem Aleatória Simples:

Todos os membros da população têm a mesma chance de ser escolhido para participar da amostra. EX: Podemos gerar através dos computadores, números de telefones.

Amostragem Estratificada:

Subdivido a população em estratos (ou grupos) e então, extraio uma amostragem proporcional a quantidade de elementos de cada estrato para participar da amostra.

Amostragem Sistemática:

Os elementos da população se encontram ordenados.

Dividi-se o número total da população pelo número total da amostra.

K =

n(amostra)

n(População)

Escolhe-se um número inicial para partir, e então, vai tomando os elementos de k em k até obter o número desejado na amostra.

Amostragem por conveniência:

Usa-se resultados que são fáceis de se obter.

Amostragem por Conglomerados:

Divido a população em conglomerados (ou seções), escolho (sorteio) aleatoriamente alguns desses conglomerados e tomo todos os elementos dos conglomerados escolhidos para fazer parte da amostra.

6

Os dados e a estatística

Aplicações em administração e economia.

Contabilidade Firmas públicas de contabilidade usam procedimentos de amostragem estatística quando estão realizando auditorias para seus clientes. EX.: Suponhamos que queremos determinar se a quantidade de contas a receber mostrada em um balancete do cliente representa honestamente a quantidade real de contas a receber. Em geral, o número de contas individuais a receber é tão grande que a revisão e a validação de cada conta pode ser bastante demorada e dispendiosa. A solução nesses casos é selecionar um subconjunto de contas, chamada amostra. Depois de rever a precisão das contas amostradas, os auditores redigem uma conclusão que determina se a quantidade de contas a receber mostrada no balancete do cliente é aceitável.

Finanças Os consultores financeiros utilizam uma série de informações estatísticas para guiar suas recomendações de investimentos. EX.: No caso das ações, os consultores revêem diversos dados financeiros incluindo relações preço/ganhos e rendimento de dividendos. Comparando a informação para uma determinada ação com informações sobre a média do mercado de ações, um consultor financeiro pode concluir se uma ação individual está sendo sobre ou sub-avaliada.

Produção Hoje, o controle da qualidade é uma importante aplicação da estatística à produção. EX.: Uma máquina está sendo usada para encher recipientes de 340ml de uma famosa marca de refrigerante. Periodicamente, uma amostra de recipientes é selecionada e o conteúdo médio do recipiente de amostra é calculado. Essa média, ou valor de barra, é situado em um gráfico. Um valor situado acima do limite superior de controle no gráfico indica um sobreenchimento, e um valor abaixo do limite inferior de controle indica um subenchimento. O processo estará sobre controle e tem permissão de continuar enquanto os valores de barra assinalados no gráfico estejam entre os limites de controle superior e inferior do gráfico.

Economia Os economistas são freqüentemente solicitados a fornecer previsões sobre o futuro da economia ou de algum aspecto dela. Eles usam uma série de informações estatísticas ao fazer tais previsões. EX.: Na previsão de taxas de inflação, os economistas usam informação estatística de indicadores como o índice de preços do produto, a taxa de desemprego e a utilização da capacidade de produção.

7

3- Distribuição de Freqüência

3.1- Tabela Primitiva – ROL

Suponhamos termos feito uma coleta de dados relativos às estruturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores;

Tabela I Estaturas de 40 alunos do colégio A

166

160

161

150

162

160

165

167

164

160

162

161

168

163

156

173

160

155

164

168

155

152

163

160

155

155

169

151

170

164

154

161

156

172

153

157

156

158

158

161

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. Partindo dos dados acima, é difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir dos dados não-organizados. A maneira mais simples de organizar os dados é através de uma certa organização (crescente ou decrescente). A tabela obtida após a ordenação dos dados recebe o nome de rol.

Tabela II Estaturas de 40 alunos do colégio A

3.2- Distribuição de Freqüência

um

determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de

distribuição de freqüência:

Denominamos

freqüência

o

número

de

alunos

que

fica

relacionado

a

8

Tabela III

Estat.

(cm)

Freq.

Estat.

Estat.

(cm)

(cm)

Freq.

Freq.

Estat.

(cm)

Freq.

150

 

158

150

 

167

 

151

151

160

168

152

161

152

169

153

153

162

170

154

163

154

172

155

155

164

173

156

165

156

total

157

157

166

 

Como exige muito espaço nesse processo, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos denominado classes. Chamamos de freqüência de uma classe o número de valores da variável pertencentes à classe.

Tabela IV Estaturas de 40 alunos do colégio A

Estaturas

Freqüência

(cm)

150

 

154

 

154

158154

158

162158

162

166162

166

170166

170

174170

total

 

O que pretendemos com a construção dessa nova tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados.

NOTA: O símbolo valor situado à direita.

casos isolados. NOTA: O símbolo valor situado à direita. indica inclusão na classe do valor situado

indica inclusão na classe do valor situado à esquerda e exclusão do

3. 3- Elementos de uma Distribuição de Freqüência.

3.3.1. Classe

Classe de freqüência ou, simplesmente, classe são intervalos de variações da variável.

9

No exemplo anterior, o intervalo 154

9 No exemplo anterior, o intervalo 154 3.3.2. Limite de classe 158 define a segunda classe

3.3.2. Limite de classe

158 define a segunda classe (i =

).

Denominamos limite de classe os extremos de cada classe.

Limite inferior da classe ( i );

Limite superior da classe (L i ). Na segunda classe, por exemplo, temos:

2 =

e

L 2 =

3.3.3. Amplitude de um intervalo de classe

Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida que define a classe.

 

h i = L i - i

Ex:

h 2 =

Ex: h 2 = h 2 = cm

h 2 =

cm

3.3.4.

Amplitude total da distribuição

Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe e o limite inferior da primeira classe:

AT = L(máx.) - (mín.)

Ex: AT =

da primeira classe: AT = L(máx.) - ℓ (mín.) Ex: AT = AT = cm 3.3.5.

AT =

cm

3.3.5. Ponto médio de uma classe

Ponto médio de uma classe (x i ) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais.

Ex:

x 2

=

o intervalo de classe em duas partes iguais. Ex: x 2 = x i = x

x i =

x 2 =

i + L i

2

cm

Resolva:

1. As notas obtidas por 50 alunos de uma classe foram:

7

2

3

4

6

6

6

4

7

5

8

3

3

7

5

3

9

7

8

8

2

9

4

4

5

6

6

5

2

2

9

3

8

7

8

5

6

1

8

6

2

6

4

5

5

6

7

7

4

3

10

a. Complete a distribuição de freqüência abaixo:

i

Notas

x i

f i

1

0

2

1

1

2

2

4

3

4

6

4

6

8

5

8

10

     

f i = 50

b. Agora, responda:

1. Qual a amplitude da distribuição?

2. Qual o número de classes da distribuição?

3. Qual o limite inferior da quarta classe?

4. Qual o limite superior da classe de ordem 2?

5. Qual a amplitude do segundo intervalo de classe?

c. Complete:

1. h 3 =

3. L 3 =

5. f 5 =

2. 1 =

4. x 2 =

2. Os resultados do lançamento de um dado 50 vezes foram os seguintes:

6

5

2

6

4

3

6

2

6

5

1

6

3

3

5

1

3

6

3

4

5

4

3

1

3

5

4

4

2

6

2

2

5

2

5

1

3

6

5

1

5

6

2

4

6

1

5

2

4

3

Forme uma distribuição de freqüência sem intervalos de classe.

11

3. 4- Tipos de Freqüências.

3.4.1. Freqüências simples ou absolutas (f i )

São os valores que realmente representam o número de dados de cada classe.

f i = n

3.4.2. Freqüência relativa (fr i )

São os valores das razões entre as freqüências simples e a freqüência total.

fr i = f i

f i

3.4.3. Freqüência acumulada (F i )

É o total das freqüências de todos os valores inferiores ao limite superior do intervalo de

uma dada classe.

F i = f 1 + f 2 + f 3 +

+ f k

3.4.4. Freqüência acumulada relativa ou percentual (Fr i )

É a freqüência acumulada de uma classe dividida pela freqüência total da distribuição.

Fr i = F i

f i

Exercícios.

Considerando a tabela IV da apostila, montar a seguinte tabela com as freqüências estudadas:

i

Estaturas (cm)

fi

xi

fri

Fi

Fri

1

150

 

154

         
 

2

154

1582 154

3

158

1623 158

4

162

1664 162

5

166

1705 166

6

170

1746 170

   

=

 

=

   

12

Responda as questões:

a) Quantos alunos têm estatura entre 154 cm, inclusive, e 158 cm?

b) Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm?

c) Quantos alunos têm abaixo de 162 cm?

d) Quantos alunos têm estatura não-inferior a 158 cm?

Gráfico Estatístico

É uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápidos à compreensão que as séries.

Tipos de gráficos:

1. Gráfico em Coluna

População Brasileira – 1940-1970

Ano População 1940 41.236.315 1950 51.944.397 1960 70.119.071 1970 93.139.037 100000000 80000000 60000000
Ano
População
1940
41.236.315
1950
51.944.397
1960
70.119.071
1970
93.139.037
100000000
80000000
60000000
40000000
20000000
0
1
2
3
4
Ano
População do Brasil

13

2. Gráfico em Barras

4 3 2 1 2E+07 4E+07 6E+07 8E+07 1E+08 0 0 20 40 60 80
4
3
2
1
2E+07 4E+07 6E+07 8E+07 1E+08
0 0
20
40
60
80
100
Ano

População do Brasil

milhões

3. Gráfico em Setores

É a representação gráfica de uma série estatística, em um círculo, por meio de setores. É utilizado principalmente quando se pretende comparar cada valor da série com o total. Para construí-lo, dividi-se o círculo em setores, cujas áreas serão proporcionadas aos valores da série. Essa divisão poderá ser obtida pela solução da regra de três.

Total

360º

Parte

Exemplo:

Rebanho de Suínos do Sudeste do Brasil 1992

Estado

quantidade (mil cabeça)

MG

3.363,70

ES

430,4

RJ

308,5

SP

2.035,90

total

6.138,50

Temos:

6.138,5

360º

3.363,7

MG ES RJ SP MG ES RJ SP Exercício:
MG ES RJ SP
MG
ES
RJ
SP
Exercício:

Elaborar um gráfico de cada tipo mencionado acima com um tema de sua área.