Você está na página 1de 9

1

INTRODUÇÃO:

Tópicos de Estatística Descritiva Professor Paulo Roberto paulnscmnt@globo.com

Iniciamos este estudo com algumas definições de Estatísticas de forma a esclarecer que

as definições estão baseadas na forma que cada um dos autores citados desenvolve suas pesquisas nessa área. Aqui, levaremos em conta que base dos estudos estatísticos está intimamente ligada aos fenômenos de populações que apresentam uma mesma característica “ESTATÍSTICA é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos

Ermes Medeiros da Silva

“A ESTATÍSTICA dedica-se ao desenvolvimento e ao uso de métodos para coleta e

a análise de dados, i. e., a interpretação substantiva e a construção de inferências neles

baseados”

Alfredo Alves de Farias

ESTATÍSTICA é uma coleção de métodos para planejar experimentos, obter dados

e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusõesMário Triola , Nesse contexto: Estatística prevê princípios racionais e técnicas, que nos

indicam quando e como podemos decidir sobre informações parciais e incompletas. Em nosso estudo dividiremos a Estatística em dois grupos:

(a) Estatística Descritiva

(b) Estatística Analítica (Inferência Estatística ou Estatística Inferencial) A primeira destina-se à coleta e à demonstração dos dados através de tabulações, tabelas, gráficos, enquanto a segunda fica destinada à interpretação, conclusões e a tomada de decisão. Na inferência estatística usamos o cálculo de probabilidades para estimar possíveis erros.

Considerações Entende-se, por POPULAÇÃO, qualquer conjunto de fenômenos estudados ou a serem estudados tais como objetos, pessoas ou acontecimentos. Esta população pode ser dividida em dois grupos: População finita ou população infinita. Pode parecer estranho falar em população infinita, mas quando estamos trabalhando com uma população finita, onde cada elemento pode ser selecionado mais de uma vez, teoricamente temos uma população infinita. Este fato é utilizado quando trabalhamos com amostragem com repetição. Quando nos referirmos a uma parte de população usaremos o termo AMOSTRA. O processo de obtenção de amostras é denominado AMOSTRAGEM. (Tipos de Amostragem:

Casual ou Aleatória, Sistemática, por Conglomerado, Tendenciosa etc). Na manipulação de dados estatísticos utilizamos dois tipos de variáveis ou dados:

Quantitativas consistem em números que representam contagens ou medidas As variáveis quantitativas, também se classificam em discretas (expressas por números inteiros) e contínuas (não enumeráveis intervalares). As Qualitativas quando podem ser separados em diferentes categorias que se distinguem por uma categoria não numérica.

MÉTODO ESTATÍSTICO Se considerarmos Estatística como um método, podemos dizer que: Os estudos estatísticos descritos como um método científico, que tem como objetivo operar dados numéricos. Este método pode definido em fases, sendo estas um processo utilizado para coletar, apresentar, descrever, interpretar e até mesmo prever os aspectos quantitativos dos fenômenos analisados, desde que eles possam conseguir a forma de contagem ou medida.

2

As fases do método estatístico são: PLANEJAMENTO ESTATÍSTICO, COLETA DE DADOS, APURAÇÃO DE DADOS, APRESENTAÇÃO DE DADOS, ANÁLISE, INTERPRETAÇÃO E CONCLUSÃO DE DADOS. COLETA DE DADOS A coleta de dados pode ser classificada de duas formas: Coleta de dados primária (Direta), quando o pesquisador coleta os dados na fonte originária, e Coleta de dados secundários (Indireta) APURAÇÃO DE DADOS Após a coleta de dados, torna-se necessária sua apuração, ou contagem, esse processo também é denominado tabulação. Um dos objetivos da apuração é a ordenação dos dados segundo critérios de ordenação. Essas classificações podem ser feitas de forma manual, mecânica ou eletrônica. Apuração eletrônica: Via Telefone - Roletas nos transportes coletivos Mecânica: Roletas nos transportes coletivos APRESENTAÇÃO DE DADOS Depois dos dados coletados e apurados eles podem ser apresentados sob a forma de tabelas, quadros ou gráficos. Uma delas é a Distribuição de freqüências, que é uma maneira de ordenar os dados estatísticos em linhas ou colunas, tornando possível sua leitura, tanto no sentido horizontal quanto no vertical. A distribuição de freqüências é uma série estatística. E as séries estatísticas também são classificadas em TEMPORAIS ou HISTÓRICAS, GEOGRÁFICAS e ESPECÍFICAS, porém nos deteremos nas distribuições de freqüências. Exemplo de uma Série Específica

Título:

Vendedor

Total de Vendas

Colunas1

Antonio

100

 

Carlos

200

 

Davi

600

 

Enio

350

 

Fernando

700

 

Gabriel

450

 

Fonte:

Análise e Conclusão dos Dados De todas as fases do Método estatístico, esta é a que apresenta maiores dificuldades. Isto porque todo o trabalho efetuado até o momento deixará de ter o valor devido, se a conclusão não estiver coerente. Não existe um critério a ser utilizado nesta fase TIPOS DE GRÁFICOS: Podemos também nessa fase apresentar os dados sob a forma de gráficos. Os mais conhecidos são. O gráfico de Barras ou colunas, O gráfico de linhas, O gráfico de setores e os histogramas etc.

3

Exemplos: Uma mesma situação é descrita por dois gráficos diferentes No primeiro Caso por um gráfico de Coluna e no segundo por um Gráfico de Setores.

Titulo:

de Coluna e no segundo por um Gráfico de Setores. Titulo: Fonte Titulo Fonte: Tabela de

Fonte

Titulo

no segundo por um Gráfico de Setores. Titulo: Fonte Titulo Fonte: Tabela de freqüência Os dados

Fonte:

Tabela de freqüência Os dados coletados quando ordenados segundo uma ordem de grandeza formam o que chamamos de ROL.

4

Ao número de vezes que um elemento figura no rol denominamos freqüência absoluta de elemento. As tabelas de freqüências podem ser classificadas em:

1)

Tabelas de freqüências para Dados não Agrupados.

2)

Tabelas de freqüências para Dados Agrupados em Classes.

Tipos de freqüências

1. Freqüência Simples Absoluta (F i )

É definida como o número de vezes que um determinado valor se repete no rol, ou

informações verificadas em cada classe.

A soma de todas as freqüências absolutas é denominada freqüência total denotada por

F i .

2. Freqüência Simples Relativa Fr

A freqüência Relativa de um elemento ou classe é o quociente entre a Freqüência

absoluta desse elemento ou classe e a Freqüência total. Fr i =

F

i

F

i

.

relativa por 100 obtemos a freqüência

percentual , que denotamos por

3. Freqüência Simples Acumulada.

A freqüência acumulada de um elemento ou de uma classe é obtida através da adição

sucessiva das freqüências absolutas de cada elemento ou classe anterior a ele/ela e a freqüência absoluta desse elemento ou classe.

Tabelas de freqüências para dados agrupados em classes

Não existe uma regra fixa para se determinar o número de classes STURGES sugere uma regra para determinação do número de classes, desde que se conheça o número de informações que é k =13,3.log N , onde k é o número de classes desejado e N número de dados a distribuir.

Após conhecido o número de classes, determinamos a AMPLITUDE TOTAL DO ROL (A T ) pela diferença entre o maior e o menor valor observado.

Nota : Quando multiplicamos a freqüência

Fr i % =100. Fri .

A amplitude ou comprimento de cada intervalo é obtida por

h = A T

K

. onde K é o

número de classes .

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS

a) A classe pode ser definida como sendo os subintervalos da Amplitude total.

b) Os limites de classes, são os valores de cada classe, sendo o da esquerda o limite inferior e o

da direita limite superior.

c) A média aritmética simples entre o limite superior e o inferior de uma mesma classe é denominada Ponto Médio da classe.

REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS

Em nosso estudo destacaremos dois tipos distintos de gráficos, assim classificados:

HISTOGRAMA

Construído em um sistema de eixos ortogonais é, uma representação gráfica em forma de colunas justapostas.

5

Para sua construção, deve ser observado o seguinte:

a) A área total do histograma deve ser proporcional à freqüência total, e as áreas

parciais, proporcionais as freqüências das classes.

b) As bases dos retângulos são proporcionais ã amplitude do intervalo de classe.

c) Caso as amplitudes dos intervalos de classes sejam unitárias, a altura de cada

retângulo terá como correspondente sua respectiva freqüência.

Polígono de Freqüências.

Formado por uma linha poligonal, cujos vértices são obtidos pela interseção de cada Ponto Médio da classe e sua respectiva freqüência absoluta de cada classe de valor.

MEDIDAS

Podemos reduzir um conjunto de números a uma ou algumas medidas numéricas que resumem todo o conjunto. Tais medidas são úteis para compreensão e manejo mais fácil dos dados originais. Além disso, são essenciais para técnicas computacionais. Duas características mais importantes dos dados que as medidas numéricas podem evidenciar são o valor central ou mais típico do conjunto e a dispersão dos números. MEDIDAS DE TENDÊNCIA CENTRAL (Medidas de posição) As medidas de tendência central são usadas para indicar um valor que tende a tipificar, ou a representar melhor um conjunto de números. As três medidas mais usadas são a média, a mediana e a moda. A mediana de um conjunto ordenado de números tem como objetivo, dividi-lo em duas partes iguais, a metade terá valores inferiores a mediana e a outra parte terá valores superiores a mediana. A moda é o valor que ocorre com maior freqüência. A média aritmética é a idéia que ocorre à maioria das pessoas quando se fala em média. E como ela possui certas propriedades matemáticas convenientes é considerada a mais importante das três. CÁLCULO DA MÉDIA ARITMÉTICA. Seja X uma distribuição de freqüência.

, F n , suas freqüências absolutas. A média

Sejam x 1 , x 2 , x 3 , aritmética de X e dada por:

, x n valores de X e F 1 , F 2,

x

.

x F

1

1

x F

2

.

2

x F

n

.

n

F F

1

2

F

n

x

x i

F

i

F

i

Observação: Considerando uma distribuição de freqüências em intervalos de Classes, substituímos os x i pelos pontos médios das classes, e a média resultante é uma aproximação. A utilização dos pontos médios das classes trata os pontos médios como médias de classes, o que nem sempre é o caso. Todavia, se não dispomos dos dados originais, não há outra alternativa razoável. Medidas de Dispersão As medidas de dispersão são utilizadas, quando desejamos medir a variabilidade ou dispersão de um conjunto de dados. As medidas de dispersão indicam se os valores estão relativamente próximos, uns dos outros, ou estão afastados. As medidas de dispersão mais utilizadas são: o desvio médio, a variância e o desvio - padrão. Todas elas têm como referência a média. Em cada caso o valor zero indica a ausência de dispersão: a dispersão aumenta à proporção que aumenta o valor da medida. Em razão de suas propriedades matemáticas, quase sempre se calcula a média de um conjunto de dados. Por isso, existem várias medidas de dispersão que têm a média como ponto

6

de referência. Todas requerem o cálculo do desvio, ou diferença, entre cada valor e a média

x i x .

Desvio Médio Absoluto O desvio médio absoluto de um conjunto de números é a média dos desvios dos valores a contar da média, ignorando o sinal de diferença. Cálculo do Desvio Médio

D m =

 x i  x  F i  F i
x i  x
 F
i
 F
i

Variância A variância de uma população é a média dos quadrados dos desvios dos valores a contar da média O desvio padrão de um conjunto de números é a raiz quadrada da variância. Cálculo da Variância

2

(

x

i

)

2

x F

i

F

i

EXERCÍCIOS

1 O número de automóvel modelo HC vendidos semanalmente em uma concessionária de veículos é apresentada na tabela de distribuição discreta X :

X

10

12

14

18

20

F

i

20

25

35

15

5

a) Determinar a média aritmética da distribuição.

b) Determinar a mediana e a moda da distribuição.

c) Determinar o desvio padrão e o coeficiente de variação.

2 . O quadro abaixo apresenta o rol do número de pontos obtidos pelos 80 candidatos aprovados na primeira fase de um exame de seleção para estagiários.

175

175

175

175

175

200

200

200

200

200

220

220

220

220

225

225

225

225

225

225

260

260

260

260

260

260

180

280

280

280

280

280

280

280

280

280

290

290

290

290

320

320

320

320

320

320

320

320

320

320

320

330

335

336

337

338

339

339

350

350

350

350

350

350

350

350

350

350

350

375

375

375

400

400

400

400

400

400

400

400

Pede-se:

a) Construir uma tabela de frequências para dados agrupados em nove classes contendo as seguintes frequências simples: Absoluta, Relativa, Percentual e Acumulada. E os

pontos médios de classes

b) Construir um histograma para a distribuição.

7

3.

Numa turma de Estatística com 50 alunos foram coletadas as seguintes notas na Prova II

3,0

 

3,0

4,0

4,0

4,0

4,0

4,0

5,0

5,0

5,0

 

5,0

 

5,0

5,0

5,0

5,0

5,0

5,0

5,0

5,0

5,0

5,0

 

5,0

5,0

5,0

5,0

5,0

6,0

6,0

6,0

6,0

6,0

 

6,0

6,0

6,0

6,0

6,0

6,0

7,0

7,0

7,0

7,0

 

7,0

7,0

7,0

7,0

9,0

9,0

9,0

10,0

10,0

Construir uma tabela de freqüências em dados não agrupados ou seja de dados discretos contendo: Freqüência absoluta simples, freqüência relativa e percentual, freqüência acumulada.

Considerando a relação de 50 comissões pagas por uma Empresa de médio porte a seus consultores no mês de fevereiro 2013. Construa uma distribuição de freqüências com 6 classes e esboce um histograma para a distribuição.

600

670

680

680

730

730

740

750

750

785

790

800

800

800

820

820

820

820

850

850

890

900

900

920

920

930

930

940

950

955

960

980

980

1000

1000

1000

1050

1050

1060

1060

1070

1090

1101

1105

1108

1150

1150

1150

1180

1200

5. : O quadro abaixo representa o rol das comissões pagas a 50 vendedores em uma loja especializada em material para esportes no mês de junho de 2012 (Dados fictícios)

200

250

260

260

261

275

290

300

310

339

341

342

345

378

402

408

410

418

420

420

430

434

435

436

491

494

495

500

510

520

530

540

545

545

555

600

620

620

630

630

730

730

740

810

820

850

876

900

900

920

a) Construir uma distribuição de frequências com oito intervalos de classes contendo Freqüência absoluta

simples, frequência relativa e percentual, frequência acumulada e pontos médios.

b) Construir um histograma para a distribuição.

6 Por engano, um professor omitiu uma nota no conjunto 20 alunos. As notas restantes estão descritas no quadro abaixo:

Notas

50

55

65 70

 

75

80

?

90

94

96

Número

de

1

2

 

1 3

2

3

1

3

2

2

alunos

a) Se a média dessas notas é 78. Qual é o valor da nota omitida?

b) Qual é o coeficiente de variação das notas?

7 Considerando a distribuição de 80 salários pagos a funcionários de nível básico por uma

Empresa de grande porte no mês de janeiro de 2013. Preencher a tabela com as outras freqüências. Calcular a Média Aritmética, a Mediana, a Moda e o Desvio padrão e o coeficiente de variação dos salários

SALÁRIOS F I 2650 5 2670 8 2690 5 2700 6 2710 10 2725 4
SALÁRIOS
F
I
2650
5
2670
8
2690
5
2700
6
2710
10
2725
4
2730
7
2740
5
TOTAL
50

8

8 O quadro abaixo representa o rol do número de pontos obtidos por 50 candidatos classificados em um Concurso Publico.

100

105

110

120

145

145

150

150

160

175

180

195

200

200

210

215

220

230

240

247

250

251

251

252

270

275

278

278

280

290

298

300

320

330

330

330

340

343

349

350

350

350

350

390

390

425

425

430

440

450

Pede-se: Construir uma distribuição de freqüências com 7 intervalos de classes. Contendo as Freqüências simples absoluta, relativa, percentual e acumulada e o ponto médio de cada classe. Construir um polígono de frequências para a distribuição.

9. O quadro abaixo representa o rol das comissões pagas a 50 colaboradores de Empresa de Publicitária no mês de dezembro de 2012

100

100

100

120

140

140

150

150

170

175

190

195

200

200

210

215

220

230

240

247

250

250

251

252

270

275

278

278

280

290

290

300

320

330

330

335

340

345

349

350

350

350

360

395

405

410

430

435

500

500

Construir uma distribuição de freqüências com oito intervalos de classes. Contendo as Freqüências simples absoluta, relativa, percentual e acumulada e o ponto médio de cada classe. Estime o valor da média aritmética da distribuição. Construir um polígono de freqüências para a distribuição

10 Num concurso para preenchimento de uma vaga foram propostas quatro provas de Conhecimentos. Constava no Edital que em caso de empate seria considerada as notas da prova Específica e a nota da prova de Português. Nos demais quesitos o Edital foi omisso. Por obra do acaso dois candidatos empataram em primeiro lugar e suas notas estão descritas tabela abaixo. A banca examinadora então resolveu calcular a (a) Média Aritmética e o (b) o desvio padrão das notas de cada um dos candidatos. Sabendo que a Média é uma medida de posição e o desvio padrão é uma medida de dispersão, seguindo o critério de menor dispersão, qual deve ter sido o candidato escolhido?

Candidato

Matemática

Português

Informática

Especifica

 

Augusto

400

500

600

100

Sérgio

Sérgio

500

700

100

300

Augusto

11. Considerando a relação de 40 comissões pagas

pela TEC-ENG

a seus colaboradores

eventuais no mês de janeiro de 2010. Construa uma distribuição de freqüências (Freqüência

simples absoluta) com 7 classes. Construa um polígono de freqüências para a Distribuição.

800

800

850

870

870

900

900

910

920

930

 

940

940

1000

1000

1010

1020

1020

1050

1050

1090

1100

1111

1111

1111

1132

1150

1150

1150

1150

1150

1200

1200

1200

1300

1350

1400

1450

1450

1500

1500

9

12. Considerando a distribuição dos salários de uma categoria de Funcionários da empresa

de Consultoria INF/PN em fevereiro de 2012

(Salários R$)

240

320

400

450

600

700

800

900

1000

F

i

30

40

50

30

50

70

50

40

40

Pede-se:

a) Completar a tabela com; Freqüência Simples Relativa, Freqüência Simples percentual,

Freqüência Simples Acumulada.

b) Determinar a moda, a mediana e a média aritmética da distribuição.

c) Determinar a variância e o desvio padrão da distribuição.

13. Considerando a relação de 50 comissões pagas pela Empresa Fictícia Consultoria a seus consultores no mês de junho 2012. Construa uma distribuição de freqüências com 6 classes. Construa um Histograma para a Distribuição.

600

600

600

700

730

730

740

750

750

789

790

800

800

800

820

820

820

820

850

850

890

900

900

920

920

930

930

940

950

955

960

980

980

1000

1000

1000

1050

1050

1060

1060

1070

1090

1101

1105

1108

1150

1150

1150

1150

1240

14.

.O quadro abaixo representa o rol das comissões pagas a 50 Cabos Eleitorais por Certa Empresa de Propaganda Política no mês de maio de 2010 (Dados fictícios)

100

100

100

120

140

140

150

150

170

175

 

190

195

200

205

210

215

220

230

240

247

250

251

251

252

270

275

278

278

280

290

298

300

320

330

330

335

340

345

349

350

350

350

360

395

405

405

425

435

445

500

Construir uma Distribuição de Freqüências com oito intervalos de classes. Contendo as Freqüências simples absoluta, relativa, percentual e acumulada e o ponto médio de cada classe. Construir um histograma para a distribuição.

15. Considerando a distribuição de 100 salários pagos por certa Companhia no mês de janeiro de 2013 Pede-se a média aritmética, a mediana, a moda e o desvio padrão dos salários.

SALÁRIOS

F

I

800

16

850

10

990

8

1000

13

1200

12

1520

8

1550

18

1600

15

TOTAL

100