Você está na página 1de 8

Tnia Maia 2006

Estatstica para as Cincias Sociais


1 Parte Populao coleco de unidades individuais, que podem ser pessoas, animais, resultados experimentais, com uma ou mais caractersticas comuns, que se pretendem analisar (conjunto de indivduos, elementos ou objectos que apresentam uma ou mais caractersticas (atributos) em comum). Parmetro um nmero que descreve a populao. Este nmero, embora seja fixo, normalmente desconhecido. Amostra subconjunto da populao, que se observa com o objectivo de tirar concluses para a populao de onde foi recolhida. Estatstica um nmero que descreve a amostra. Calcula-se o valor de uma estatstica a partir dos valores observados na amostra, variando o valor da estatstica de amostra para amostra. Utiliza-se a estatstica para estimar um parmetro desconhecido. Recenseamento (censo) estudo cientfico de um universo de pessoas, instituies ou objectos fsicos com o propsito de adquirir conhecimentos, observando todos os seus elementos, e fazer juzos quantitativos acerca de caractersticas importantes desse universo. Sondagem estudo cientfico de uma parte da populao com o objectivo de estudar atitudes, hbitos e preferncias da populao relativamente a acontecimentos, circunstncias e assuntos de interesse comum. A amostragem diz respeito ao procedimento de recolha de amostras. A sondagem, por sua vez, pressupe a existncia de uma amostragem, isto , a amostragem uma das vrias fases do processo de sondagem. Enviesamento desvio nos valores da estatstica em relao ao valor do parmetro. reduzido com o recurso de amostras aleatrias simples. (uma amostra que no seja representativa da populaa diz-se enviesada) Amostra aleatria simples dada uma populao, uma amostra aleatria simples de dimenso n um conjunto de n unidades da populao, tal que qualquer outro conjunto de n unidades teria igual probabilidade de ser seleccionado. Dgitos aleatrios uma tabela de dgitos aleatrios uma listagem dos dgitos 0 a 9 tal que: 1) qualquer um dos dgitos considerados tem igual possibilidade de figurar em qualquer posio da lista; 2) a posio em que figura cada dgito independente das posies dos outros dgitos. Preciso a utilizar o valor de uma estatstica para estimar um parmetro, vimos que cada amostra fornece um valor para a estatstica que se utiliza como estimativa desse parmetro. Estas estimativas no so iguais devido variabilidade presente na amostra. Se, no entanto, os diferentes valores obtidos para a estatstica forem prximos, podemos

Tnia Maia 2006

ter confiana de que o valor calculado a partir da amostra recolhida est prximo do valor do parmetro (desconhecido). Estatstica Descritiva o seu objectivo o estudo descritivo dos dados. Inferncia Estatstica vai permitir estimar/testar uma hiptese atravs da utilizao de tcnicas estatsticas convenientes que vo permitir tirar concluses e que do uma medida do erro cometido, ou seja, uma Probabilidade continuao do estudo para quantificar incertezas. 2 Parte Dados Qualitativos representam a informao que identifica alguma qualidade, categoria ou caracterstica, no susceptvel de medida, mas de classificao, assumindo vrias modalidades (ex: estado civil) Frequncia relativa = Frequncia Absoluta -------------------------Dimenso da Amostra Tabela de Frequncias (exemplo) Regime de Bens Comunho Adquiridos Comunho geral Separao Total Freq. Absoluta 64498 4037 3273 71808 Freq. Relativa 0,898 0,056 0,046 1,000

Em relao tabela um processo de fcil verificao de que as frequncias esto bem calculadas consiste em som-las para todas as classes consideradas, pois: A soma das frequncias absolutas igual dimenso da amostra A soma das frequncias relativas igual a 1.

Diagrama Circular uma representao grfica que tem por base o crculo, que se divide em vrios sectores circulares, tantos quantas as classes consideradas para a varivel em estudo. Os ngulos dos sectores so proporcionais s frequncias das classes. Para se obterem os ngulos dos sectores circulares, basta multiplicar a frequncia relativa das classes por 360. Ex.: Freq = 0,311 0,311 x 360 = 112 graus Este diagrama a representao ideal quando se pretende realar o valor de cada classe relativamente ao todo.

Tnia Maia 2006

Diagrama de Barras uma representao grfica, que consiste em marcar num sistema de eixos coordenados, no eixo dos xx, pontos que representam as classes e nesses pontos barras verticais de altura igual ou proporcional frequncia absoluta ou relativa. --- * --Dados Quantitativos representam a informao resultante de caractersticas susceptveis de serem medidas, apresentando-se com diferentes intensidades, que podem ser de natureza discreta dados discretos, ou contnua dados contnuos. Varivel discreta toma valores finitos (1; 4; 89) Varivel contnua toma valores infinitos (1,65; 89,7666) Dados contnuos definio das classes para a construo da tabela de frequncias: - As classes vo ser intervalos fechados esquerda e abertos direita, todos eles com a mesma amplitude. - As classes no se devem sobrepor nem deixar intervalos entre elas. - O valor mnimo da amostra deve pertencer primeira classe e o mximo deve pertencer ltima. - O nmero total de classes e a amplitude de cada classe esto relacionados entre si: se a amplitude aumentar, o nmero de classes diminui, e vice-versa. - conveniente que os extremos de cada classe sejam nmeros de fcil leitura de modo a que, quando se observa uma tabela ou um grfico, se tenha imediatamente a ideia do significado de cada classe. Classes e Amplitudes: Para uma amostra de dimenso n, o nmero de classes k o menor inteiro tal que 2k >= n (maior ou igual) Exemplo: dispomos de 50 dados 25<50 mas 26>50 vamos utilizar 6 classes Para a amplitude: Exemplo: mximo = 17,8 mnimo = 3,8 Amplitude da amostra = 17,8 3,8 = 14,0 Amplitude de cada classe = 14 ---6 = 2,4

--- * --Histograma para a representao grfica de dados contnuos, usa-se um diagrama de reas ou histograma, formado por uma sucesso de rectngulos adjacentes, tendo cada um por base um intervalo de classe e por rea a frequncia relativa (ou a frequncia 3

Tnia Maia 2006

absoluta). Deste modo, a rea total coberta pelo histograma igual a 1 (respectivamente igual a n, a dimenso da amostra). Altura de cada rectngulo = frequncia relativa (fi) ----------------------Amplitude da classe (hi) Outras representaes grficas:

Diagrama de caule e folhas

Srie Cronolgica Diagrama de Extremos e Quartis

uma representao grfica muito sugestiva, de fcil construo e que reala informao importante sobre os dados. Para a sua construo necessrio comear por calcular o chamado resumo de 5 nmeros. Resumo de 5 nmeros O resumo de 5 nmeros de uma distribuio o conjunto formado pelo mnimo, 1 quartil, mediana, 3 quartil e mximo das observaes. 1 quartil valor Q25 tal que 25% das observaes so menores ou iguais a ele Mediana valor tal que 50% das observaes so menores ou iguais a ela 3 quartil valor Q75 tal que 75% das observaes so menores ou iguais a ele Extremo inferior mnimo da amostra Extremo superior mximo da amostra 4

Tnia Maia 2006

3 Parte Medidas de Localizao localizam o centro da amostra (mdia e mediana) Medidas de Disperso medem a variabilidade dos dados (desvio-padro e amplitude inter-quartil) Mdia: a medida de localizao do centro da amostra, mais utilizada e obtm-se somando todos os elementos da amostra e dividindo o resultado da soma pelo nmero desses elementos. (medida menos resistente que a mediana) Se representarmos as n observaes por x1, x2, ., xn, a mdia x ser x = x1 + x2 + xn -------------------n se calcularmos os desvios de todas as observaes relativamente mdia e somarmos esses desvios o resultado obtido igual a zero. (x1 x) + (x2 x) + + (xn x) = 0 Mediana: uma medida do centro da distribuio dos dados e que surge intuitivamente como um valor que divide a amostra ao meio, isto metade dos elementos do conjunto de dados so menores ou iguais mediana, enquanto que os restantes so superiores ou iguais. (medida mais resistente que a mdia) Para determinar a mediana fundamental ordenar os dados. Uma vez a amostra ordenada podem-se verificar duas situaes: se o n de observaes n mpar, ento a mediana o elemento mdio se o n de observaes n par, qualquer valor entre os dois elementos mdios poderia servir para a mediana. Para fixar ideias escolhemos a semi-soma desses dois elementos mdios.

Uma regra prtica: n + 1 ------2

Tnia Maia 2006

Quartis: Como calcular? 1 ordenar as observaes e calcular a mediana. 2 o 1 quartil a mediana das observaes que ficam para a esquerda de m. 3 o 3 quartil a mediana das observaes que ficam para a direita de m. Moda: o valor que surge com mais frequncia num conjunto de dados, se estes so discretos, ou a classe com maior frequncia se os dados so contnuos ou esto agrupados. Medida sempre utilizada em variveis qualitativas.

Desvio Padro: a raiz quadrada da varincia. a varincia a mdia dos quadrados dos desvios das observaes. tal como a mdia, uma medida pouco resistente.

o desvio padro sempre no negativo e ser tanto maior, quanta mais variabilidade houver entre os dados. se s = 0, ento no existe variabilidade, isto , os dados so todos iguais.
no no intervalo intervalo

Propriedades para dados com distribuio aproximadamente normal: 1 Aproximadamente 68% dos dados esto 2 Aproximadamente 95% dos dados esto

Tnia Maia 2006

3 - Aproximadamente 100% dos dados esto no intervalo

Amplitude: R = mximo mnimo uma medida muito pouco resistente. Amplitude Inter-Quartil: amplitude inter-quartil = 3 quartil 1 quartil uma medida resistente. D-nos informao sobre a amplitude em que sem encontram 50% das observaes centrais. Propriedades: a amplitude inter-quartil ser tanto maior, quanto mais variabilidade houver entre os dados. Se no houver variabilidade, isto , se as observaes forem todas iguais, ento a amplitude inter-quartil vem igual a zero. No entanto, ao contrrio do que se verifica com o desvio padro, uma amplitude inter-quartil nula no significa necessariamente que no exista variabilidade. 4 Parte Diagrama de Disperso: uma representao grfica para os dados bivariados, em que cada par de dados (xi, yi) representado por um ponto de coordenadas (xi, yi), num sistema de eixos coordenados. Coeficiente de Correlao medida que indica a maior ou menor associao com que duas variveis se relacionam (linearmente apenas). Associao Linear Positiva duas variveis dizem-se associadas positivamente se aos maiores valores de uma correspondem, de um modo geral, os maiores valores da outra. Associao Linear Negativa duas variveis dizem-se associadas negativamente se aos maiores valores de uma correspondem, de um modo geral, os menores valores de outra e vice-versa.

Tnia Maia 2006

Propriedades do Coeficiente de Correlao: 1 o valor do coeficiente de correlao r est no intervalo entre -1 e 1. 2 quanto maior for o valor absoluto de r, mais forte ser a relao linear existente entre os xi e os yi. 3 o facto de r ser positivo, significa que a relao entre os xs e os ys do mesmo sentido, isto , a valores grandes de x, correspondem valores grandes de y e vice-versa associao positiva. Quando r negativo, a relao entre os xs e os ys de sentido contrrio, o que significa que a valores grandes de x, correspondem valores pequenos de y e vice-versa associao negativa. Recta de Regresso: y = a + bx a = y bx

Você também pode gostar