Você está na página 1de 4

1

Discusso para decidir o tipo de tratamento (discreto)

Os seguintes dados referem-se a uma amostra colhida no ano de 2008, com alunos da disciplina de Probabilidade e Estatstica do curso de Cincia da Computao da PUC/SP em relao ao nmero de pessoas por residncia. 4 4 1 0 1 5 4 4 2 2 4 5 3 4 3 1 2 2 3 2 2 1 2 4 2 3 1 5 2 1 4 4 3 5 5 4 0 5 4 4 2 5 3 0 2 5 6 0

O fato de ser amostra ou populao nada interfere na construo de grficos e tabela. No caso de amostra, o tamanho do conjunto de dados, ou seja, o tamanho da amostra ser representado por ; ento, no Exemplo, . A varivel em questo, nmero de pessoas por

residncia, uma varivel quantitativa discreta e, por ter caracterstica numrica tem um estudo um pouco diferente das variveis qualitativas. Os dados brutos, apresentados no Exemplo, podem ser organizados em ordem (crescente, ou, decrescente) crescente, denominada Srie de Rol. Para obter a Srie de Rol na planilha do Excel, deve-se digitar (ou colar) os dados em uma coluna, selecionar a coluna (para tal, clique na letra no incio da coluna) e clicar no cone classificar 0 2 3 4 0 2 3 4 0 2 3 4 , o mesmo utilizado para organizar em ordem. 0 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 3 4 5 2 3 4 5 2 3 4 6

Em relao s variveis quantitativas (discretas ou contnuas), existem dois tipos de tratamento dos dados: tratamento discreto e tratamento contnuo. Como os nomes j indicam, na maioria dos casos de variveis discretas, o tratamento discreto o mais indicado e no caso de variveis contnuas, o tratamento contnuo o mais indicado. Entretanto, podem existir casos em que melhor o tratamento contnuo para uma varivel discreta e melhor o tratamento discreto para uma varivel contnua. O que influencia para a escolha do tipo de tratamento o fato de se ter poucos valores da varivel com muitas repeties (nesse caso, deve-se optar pelo tratamento discreto), ou, muitos valores com poucas repeties (nesse caso,

Profa, Dra. Maria Inez Miguel - PUC/SP

2
deve-se optar pelo tratamento contnuo). Os estatsticos esto habituados a olhar para o conjunto de dados e decidir o tipo de tratamento. Porm, no caso de um curso inicial, como o presente, algumas etapas iro decidir qual o tipo de tratamento que ser adotado. Inicialmente, observe que o conjunto de dados amostrais (porque so provenientes de uma amostra) tem poucos valores com muita repetio, o que implica que esse conjunto de dados tem grande chance de que o tratamento discreto seja o mais indicado. As etapas apresentadas a seguir foi uma opo entre outras para essa tomada de deciso e organizao. Isso quer dizer que, se voc consultar os livros sobre o tema poder encontrar uma organizao diferente para essa tomada de deciso, mas, isso no quer dizer que uma ou outra esteja errada. So apenas organizaes diferentes que levam a concluses estatisticamente equivalentes. Em nossa disciplina ser adotada a etapas apresentadas a seguir. Etapas para deciso do tipo de tratamento: 1) Calcular a amplitude total do conjunto de dados A amplitude total, que ser indicada pela letra , o tamanho do intervalo que contm

todos os dados, isto , a diferena entre os valores mximo e mnimo do conjunto de dados. Assim, que, no caso do Exemplo ser .

2) Calcular o nmero de classes O nmero de classes, que ser indicado por , , um nmero inicial de intervalos que

iremos considerar para organizar os dados. A frmula para determinar esse nmero foi construda por Herbert Sturges, em 1926, e : . Tambm se utiliza

, que adotaremos em nossa disciplina. Em geral esses valores so prximos. Assim, que se fizermos e no Exemplo ser: . Note ,

, que um valor prximo. Para determinar o valor de

deve-se fazer arredondamento para nmero inteiro, j que ele representa o nmero de classes. Portanto, nosso nmero inicial de classes . Dizemos nmero inicial, porque somente no

momento em que fizermos a organizao das classes que iremos decidir se esse nmero suficiente ou se iremos aumentar ou diminuir uma classe. 3) Calcular a amplitude de classe, ou passo A amplitude de classe, tambm denominada passo, que ser representada por , muito simples de ser obtida. Temos um intervalo de amplitude total , que se quer dividir em por , ou

classes (ou intervalos). Para saber a amplitude de cada classe, basta dividir seja, .

Profa, Dra. Maria Inez Miguel - PUC/SP

3
Assim, no caso do Exemplo, o passo ser dado por: . O arredondamento de ,

deve ser feito para o nmero mximo de casas decimais que aparece no conjunto de dados. No caso do Exemplo, como todos os dados so representados por nmeros inteiros, isto , com zero casas decimais, o valor de adotado ser arredondado para nmero inteiro. Portanto, o valor a ser

, porque na regra de arredondamento, quando o dgito seguinte ao que se quer

arredondar maior ou igual a 5, deve-se aumentar uma unidade no dgito de arredondamento e quando for menor que 5, deve-se manter o dgito de arredondamento. A sua calculadora ou computador j tm essa regra embutida, quando voc fixa o nmero de casas decimais. Para organizar as classes: a primeira classe ir iniciar no valor mnino do conjunto de dados e ir at o valor mnimo mais o passo, ou seja, a primeira classe vai de 0 a segunda classe vai de 1 at diante at completar as sete classes. Para montar a tabela, precisamos determinar as freqncias de cada classe, ou seja, quantos elementos do conjunto de dados pertencem a cada intervalo. Note que a primeira classe vai de 0 a 1, a segunda de 1 a 2, a terceira de 2 a 3, a quarta de3 a 4, a quinta de 4 a 5, a sexta de 5 a 6 e a stima de 6 a 7. A fim de determinar a freqncia de cada classe necessrio decidir se o nmero 1 pertence primeira, ou segunda classe; se o nmero 2 pertence segunda, ou terceira classe, etc.. A opo que ser adotada aqui que cada intervalo das classes ser um intervalo aberto esquerda e fechado direita (a mesma adotada pelo Excel em relao funo freqncia). Assim o nmero 1 pertence primeira classe, o 2 pertence segunda classe, e assim por diante. Observe que apenas na primeira classe, apesar de o intervalo ser aberto esquerda, considera-se o 0 na primeira classe. Obtm-se, ento: Classes Observe que, em cada classe tem um nico 0 -----| 1 1 -----| 2 2 -----| 3 3 -----| 4 4 -----| 5 5 -----| 6 6 -----| 7 elemento do conjunto de dados, pertencendo a cada intervalo, a menos da primeira classe que tem o zero e o um; na segunda classe s tem o 1, na terceira s tem o 2, na quarta s tem o 3, etc.. Por esse motivo, a deciso pelo tratamento discreto, ou seja, cada elemento do conjunto de dados ser estudado individualmente, sem a criao de classes e, por esse motivo, esse tipo de tratamento tambm . A terceira classe vai de 2 at .A e assim por

denominado clculo exato, outratamento exato.

Abandonando as classes, os valores da varivel: nmero de pessoas por residncia, sero estudados individualmente: . As variveis podem ser representadas por letras
Profa, Dra. Maria Inez Miguel - PUC/SP

4
maisculas. No caso, seja X a varivel, nmero de pessoas por residncias; assim, os valores da varivel X sero representados por: , e

. A freqncia de cada valor da varivel o nmero de vezes que cada valor aparece no conjunto de dados, no caso, na amostra. As aulinhas, cujos arquivos esto no moodle, ajudam a acompanhar a construo da Tabela e do Grfico apresentados na seqncia, bem como a utilizao da ferramenta freqncia, do Excel, para fazer a contagem. Tabela 1. Nmero de pessoas por residncia Xi 0 1 2 3 4 5 6 Fi 4 6 11 6 12 8 1

Fonte: alunos de PE, 2008, Cincia da Computao, PUC/SP

12 12 11

F 9 r e 6 q 3

8 6 4 6

1 0 0 1 2 3 4 n de pessoas 5 6

Grfico 1. Nmero de pessoas por residncia


Fonte: alunos de PE, 2008, Cincia da Computao, PUC/SP

O grfico de barras tambm pode ser feito, mas, mais utilizado o de colunas, mesmo porque os valores da varivel so nmeros e no textos. Note que no grfico de colunas, como os valores so nmeros exatos, a representao deve ser feita apenas com segmentos verticais na direo dos nmeros. Nos aplicativos, como no existe a possibilidade de representar por segmento, deve-se ter o cuidado de deixar o espaamento mximo entre as colunas.

Profa, Dra. Maria Inez Miguel - PUC/SP

Você também pode gostar