Você está na página 1de 24

MATEMTICA - ESTATISTICA

Introduo
O mundo dos negcios, em qualquer que seja a rea, de Recursos Humanos a Marketing, no pode mais embasar as tomadas de decises e assumir risco simplesmente no feeling e no bom-senso dos executivos e gerentes organizacionais. A complexidade da sociedade e dos mercados apresentada atualmente exige que estes agentes se utilizem de recursos precisos e poderosos de forma a minimizar os potenciais riscos da atividade econmica. Neste contexto pode-se destacar a crescente utilizao da informtica, do mtodo e dos recursos de estatstica nas organizaes que almejam destacar-se como agentes econmicos de ponta. O barateamento exponencial destes recursos nos ltimos anos tem feito que muitas empresas invistam neste hardware (computadores, pacotes estatsticos, Internet, bases de dados) mas uma menor ateno tem sido dada ao humanware ou seja aos indivduos que efetivamente extrairo deste arsenal tecnolgico a informao e o conhecimento que possibilitaro conduzir estas organizaes liderana em seus segmentos. Sem este aprimoramento do humanware de muita pouca valia ser o investimento feito no aparato tecnolgico. Este curso tem a inteno de aportar conhecimentos bsicos de ferramentas e mtodos relacionados pesquisa e anlise estatstica de dados visando o aprimoramento da utilizao de poderosos recursos com a viso gerencial de como, e porque explorar a informao e de como enxergar em um oceano de dados aqueles que efetivamente so capazes de promover um diferencial competitivo organizao. Estatstica bsica para pesquisa de mercado no pretende cobrir todas as possibilidades da anlise estatstica de dados mas sim de prover uma consistente base sobre a qual novas habilidades podem ser facilmente construdas e desenvolvidas. Bemvindo ao mundo da anlise estatstica de dados!!!!

1. Definies
Estatstica uma cincia exata que visa fornecer subsdios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parmetros extrados da populao, tais como mdia ou desvio padro. Enfim, quando se fala de estatstica, fala-se de uma cincia presente em todos os eventos mensurveis do cotidiano. Muitas vezes ela est to presente nas atividades rotineiras que no se d conta de que a mesma encontra-se ali. Por exemplo, em um jogo de futebol, tomando-se a goleira e seu espao vizinho, tem-se uma distribuio normal. Sim, afinal ao longo do jogo, os chutes a gol, tendem rea delimitada e defendida pelo goleiro. Ao final do jogo se houvesse uma quantificao dos chutes a gol, ter-se-ia a normalidade dos chutes (provavelmente entre 68% a 99% dos chutes para a linha de fundo concentrar-se-iam neste espao). Este apenas um dos inmeros exemplos que fazem com a estatstica seja mais familiar do que se imagina.

2. Coleta de dados

Toda e qualquer ao estatstica deve estar centrada em objetivos claros. O primeiro passo para um procedimento estatstico o trabalho que envolve os dados de um estudo. Estando estes objetivos definidos, buscam-se os dados que os satisfaam, sejam eles primrios ou secundrios. Dados primrios so aqueles que foram prospectados sem que no tenha havido um estudo preliminar acerca da amostra em especfico, ou seja, so dados originais. Dados secundrios so aqueles que esto a nossa disposio oriunda de outros estudos. So fontes de dados secundrios; Internet, bancos de dados, cadastros, jornais, revistas, filmes, entre muitas outras fontes. Basicamente podemos dividir os dados em histricos ou planejados.

3. Populao e amostra
Qualquer estudo cientfico enfrenta o dilema de estudo da populao ou da amostra. Obviamente tera-se uma preciso muito superior se fosse analisado o grupo inteiro, a populao, do que uma pequena parcela representativa, denominada amostra. Observa-se que impraticvel na grande maioria dos casos, estudar-se a populao em virtude de distncias, custo, tempo, logstica, entre outros motivos. A alternativa praticada nestes casos o trabalho com uma amostra confivel. Se a amostra confivel e proporciona inferir sobre a populao, chamamos de inferncia estatstica. Para que a inferncia seja vlida, necessria uma boa amostragem, livre de erros, tais como falta de determinao correta da populao, falta de aleatoriedade e erro no dimensionamento da amostra.

3.1. Amostras relacionadas


Quando se retira aleatoriamente, dois elementos de uma mesma populao e expe-se apenas um elemento a um determinado fator (propaganda, por exemplo). Avalia-se o impacto junto aos dois elementos.

3.2. Amostras no relacionadas


Apenas um elemento selecionado e exposto ao fator. Uma comparao feita considerando o antes e o depois.

4. Amostragem

No Probabilstica
1. 2. 3. Acidental ou convenincia Intencional Quotas ou proporcional

Tipos de amostragens

4. Desproporcional Probabilstica 1. Aleatria Simples 2. Aleatria Estratificada 3. Conglomerado

4.1 No probabilstica
Este tipo de amostra, determinada por ordem do pesquisador, ou seja no h uma aleatoriedade para a escolha de um elemento da populao. A escolha de um mtodo no probabilstico, via de regra, sempre encontrar desvantagem frente ao mtodo probabilstico. No entanto, em alguns casos, se faz necessrio a opo por este mtodo. Observa-se que no envio de questionrios via correio o mtodo no probabilstico (mesmo que a opo seja por amostragem Probabilstica). O respondente pode no querer responder o questionrio ou mesmo no ser localizado. Fonseca (1996), alerta que no h formas de se generalizar os resultados obtidos na amostra para o todo da populao quando se opta por este mtodo de amostragem.

4.1.1 Acidental ou convenincia


Indicada para estudos exploratrios. Freqentemente utilizados em super mercados para testar produtos.

4.1.2 Intencional
O entrevistador dirige-se a um grupo em especfico para saber sua opinio. Por exemplo, quando de um estudo sobre automveis, o pesquisador procura apenas oficinas.

4.1.3 Quotas ou proporcional


Na realidade, trata-se de uma variao da amostragem intencional. Necessita-se ter um prvio conhecimento da populao e sua proporcionalidade. Por exemplo, deseja-se entrevistar apenas indivduos da classe A, que representa 12% da populao. Esta ser a quota para o trabalho. Comumente tambm substratifica-se uma quota obedecendo a uma segunda proporcionalidade.

4.1.4 Desproporcional
Muito utilizada quando a escolha da amostra for desproporcional populao. Atribui-se pesos para os dados, e assim obtm-se resultados ponderados representativos para o estudo. Por exemplo, em um mercado de telefones celulares, considerando uma fatia de mercado meramente ilustrativa, obteve-se os resultados conforme descritos a seguir:

Marcas Nokia Ericsson Gradiente Philips Total

Participao no mercado 60% 20% 15% 05% 100%

Elementos na amostra n % 50 25% 50 25% 50 25% 50 25% 200 100%

Objetivando obter os pesos a serem atribudos a cada marca de telefone celular, para uma anlise conjunta de todas as marcas no exemplo acima, obteve-se os seguintes coeficientes: Nmero de elementos a serem entrevistados 120 40 30 10 200

Peso Nokia Peso Ericsson Peso Gradiente Peso Philips

2,4 0,8 0,6 0,2 Total:

Frmula aplicada: Peso = participao no mercado/elementos na amostra (%)

4.2 Probabilstica
Para que se possa realizar inferncias sobre a populao, necessrio que se trabalhe com amostragem probabilstica. o mtodo que garante segurana quando investiga-se alguma hiptese. Normalmente os indivduos investigados possuem a mesma probabilidade de ser selecionado na amostra.

4.2 Aleatria Simples


o mais utilizado processo de amostragem. Prtico e eficaz, confere preciso ao processo de amostragem. Normalmente utiliza-se uma tabela de nmeros aleatrios e nomeia-se os indivduos, sorteando-se um por um at completar a amostra calculada. Utiliza-se comumente o sorteio aleatrio disponvel em planilhas eletrnicas como o Excel.

Uma variao deste tipo de amostragem a sistemtica. Em um grande nmero de exemplos, o pesquisador depara-se com a populao ordenada. Neste sentido, tem-se os indivduos dispostos em seqncia o que dificulta a aplicao exata desta tcnica. Quando se trabalha com sorteio de quadras de casas por exemplo, h uma regra crescente para os nmeros das casas. Em casos como este, divide-se a populao pela amostra e obtm-se um coeficiente (). A primeira casa ser a de nmero x, a segunda ser a de nmero x + ; a terceira ser a de nmero x + 3. . Supondo que este coeficiente seja 6. O primeiro elemento ser 3. O segundo ser 3 + 6. O terceiro ser 3 + 2.6. O quarto ser 3 + 3.6, e assim sucessivamente.

4.2 Aleatria Estratificada


Quando se deseja guardar uma proporcionalidade na populao heterognea. Estratifica-se cada subpopulao por intermdio de critrios como classe social, renda, idade, sexo, entre outros.

4.2.3 Conglomerado Em corriqueiras situaes, torna-se difcil coletar caractersticas da populao. Nesta modalidade de amostragem, sorteia-se um conjunto e procura-se estudar todo o conjunto. exemplo de amostragem por conglomerado, famlias, organizaes e quarteires.

4.3 Dimensionamento da amostra


Quando deseja-se dimensionar o tamanho da amostra, o procedimento desenvolve-se em trs etapas distintas: 1. Avaliar o instrumento de coleta de dados e julgar a varivel mais importante do questionrio ou o grupo de variveis mais significativas; 2. Analisar se ordinal, intervalar ou nominal; 3. Verificar se a populao finita ou infinita;

Varivel intervalar e populao infinita Varivel intervalar e populao finita Varivel nominal ou ordinal e populao infinita Varivel nominal ou ordinal e populao finita

Obs.: A proporo (p) ser a estimativa da verdadeira proporo de um dos nveis escolhidos para a varivel adotada. Por exemplo, 60% dos telefones da amostra Nokia, ento p ser 0,60. A proporo (q) ser sempre 1 - p. Neste exemplo q, ser 0,4. O erro representado por d. Para casos em que no se tenha como identificar as propores confere-se 0,5 para p e q.

5. Tipos de dados
Basicamente os dados de uma pesquisa quantitativa, dividem-se em contnuos e discretos. O primeiro definido como qualquer valor entre dois limites quaisquer, tal como um dimetro. Portanto trata-se de um valor que ser quebrado. So dados contnuos, questes que envolvem idade, renda, gastos, vendas, faturamento, entre muitas outras. Quando fala-se em valores discretos, aborda-se um valor exato, tal como quantidade de peas defeituosas. Comumente utiliza-se este tipo de variveis para tratar de numero de filhos, satisfao e escalas nominais no geral. O tipologia dos dados determina a varivel, ela ser portanto contnua ou discreta. Isto quer dizer que ao definir-se uma varivel com contnua ou discreta, futuramente j definiu-se que tipo de tratamento se dar a ela. Por exemplo, a varivel dependente em uma anlise envolvendo Anova, no poder ser discreta.

6. Tipos de variveis escalares


Ordinal, Objetiva criar como o prprio nome diz, uma ordem de valor, segundo a preferncia do respondente. Por exemplo, em um escala, A preferido a B, mas no identifica-se o quanto A menor que B. Nominal, So as escalas mais comuns em pesquisas de marketing. Seus nmeros servem para identificar a escolha do respondente e no determinar ordem ou mesmo se A melhor que B. Os nmeros so associados aos pontos de resposta, visando criar uma organizao nas escalas. exemplo clssico de escala nominal, questes de sexo e as de dicotomia (sim; no) e diferencial semntico (puro _ _ _ impuro).

Intervalar, So questes que visam comparar intervalos e medir o quanto uma preferncia encontra-se distante de outra. Atualmente so objeto de infindveis discusses entre estatsticos e acadmicos de marketing quando da aplicao de testes estatsticos, afinal so consideradas discretas mas podem passar por um processo de aproximao e tornarem-se contnuas. Um processo semelhante, descrito por Cunha (1997), quando o autor aborda a tcnica de Anlise de Correspondncia (AC) e comenta que as variveis de melhor emprego para tal tcnica so as qualitativas ou as que passaram por processo de categorizao. Exemplo de escalas intervalares: 1;2;3;4;5, muito insatisfeito; insatisfeito; indiferente; satisfeito; muito satisfeito. Razo, so as variveis contnuas. Peso, idade, renda, so exemplos de questes de razo. Abaixo sero descritos modelos estatsticos possveis para os tipos de escalas abordadas. Tipo de escala
Ordinal

Nominal
Intervalar

Razo

Estatstica possvel Todas de tendncia central Moda e Qui quadrado Mdias, desvio padro e mdio, amplitudes, varincia, teste z e t, correlao e regresso. Todos do anterior

7. Distribuio de frequncias
Quando da anlise de dados, comum procurar conferir certa ordem aos nmeros tornando-os visualmente mais amigveis. O procedimento mais comum o de diviso por classes ou categorias, verificando-se o nmero de indivduos pertencentes a cada classe. O exemplo a seguir apresenta um conjunto de tempos para determinada operao. 5,1 6,3 6,7 7,3 7,8 8,5 9,4 10,4 5,3 6,3 6,8 7,4 7,9 8,5 9,4 10,6 5,3 6,3 6,8 7,5 7,9 8,6 9,5 10,8 5,6 6,4 6,9 7,5 8 8,7 9,5 10,9 5,8 6,4 6,9 7,6 8 8,8 9,6 11,2 5,9 6,4 7 7,6 8,1 8,8 9,8 11,5 6 6,5 7,1 7,6 8,2 8,9 9,9 11,8 6,1 6,5 7,1 7,7 8,3 9 10 12,3 6,2 6,6 7,2 7,7 8,3 9,1 10,2 12,7 6,2 6,7 7,2 7,8 8,4 9,2 10,2 14,9

7.1 Regras para a elaborao de uma distribuio de frequncias


1. Determina-se o menor e o maior valor para o conjunto: Valor mnimo: 5,1 Valor mximo: 14,9 2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observaes: LI: 5,1

3. Definir o limite superior da ltima classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observaes: LS:15 4. Definir o nmero de classes (K), que ser calculado usando K = . Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K igual a 8,94, aproximadamente, 8. 5. Conhecido o nmero de classes define-se a amplitude de cada classe:

No exemplo, a ser igual a:

6. Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior), onde limite Inferior ser 5,1 e o limite superior ser 15 + 1,23. 7. Intervalo de Classe 05,10 a 06,33 06,34 a 07,57 07,58 a 08,81 08,82 a 10,05 10,06 a 11,29 11,30 a 12,53 12,54 a 13,77 13,78 a 15,01 Freqncia Absoluta 13 21 22 15 4 3 1 1 80 Freqncia Acumulada 13 34 56 71 75 78 79 80 Freqncia Relativa 16,25% 26,25% 27,50% 18,75% 5,00% 3,75% 1,25% 1,25% 100%

8. Medidas de tendncia central


H vrias medidas de tendncia central, entretanto nesta apostila, ser abordado o estudo de apenas aquelas que forem as mais significativas para a teoria de pesquisa mercadolgica. As mais importante medidas de tendncia central, so a mdia aritmtica, mdia aritmtica para dados agrupados, mdia aritmtica ponderada, mediana, moda, mdia geomtrica, mdia harmnica, quartis. Quando se estuda variabilidade, as medidas mais importantes so: amplitude, desvio padro e varincia. Medidas Mdia aritmtica Mdia aritmtica para dados agrupados Frmula Exemplo

Mdia aritmtica ponderada Mediana Moda Mdia geomtrica Mdia harmnica 1) Se n impar, o valor central, 2) se n par, o valor a mdia dos dois valores centrais. Valor que ocorre com mais freqncia. G = nv X1 X2...

4 (4) + 6 (9) = 7 12 13 14 = 13 12 13 14 15 = 13,5 22 23 22 22 34 45 = 22 3 v12 x 14 x 16 = 13,90

Quartis

Exemplo de calculo de quartil:


Para a amostra abaixo, calcular o primeiro e o terceiro quartis: 1) Valores em ordem crescente e clculo de p(i). 13,3 13,5 17,2 13,8 12,3 12,7 13,0 14,5 14,9 15,8 13,1 13,3 14,1 12,3 12,7 13,0 13,1 13,3 13,3 13,5 13,8 14,1 14,5 14,9 15,8 17,2

X (i)

0,038 12,3 12,7 13,0 13,1 13,3 13,3 13,5 13,8 14,1 14,5 14,9 15,8 17,2 01 02 03 04 05 06 07 08 09 10 11 12 13
2) Valores imediatamente acima e abaixo de 0,25 (13,0 e 13,1), associados com p(inf) = 0,192 e p (sup) = 0,269

0,115 0,192 0,269 0,346 0,423 0,500 0,577 0,654 0,731 0,808 0,885 0,962

Valores imediatamente acima e abaixo de 0,75: x(inf) = 14,5 e x (sup) = 14,9, associados com p(inf) = 0,731 e p(sup) = 0,808:

O valor para o segundo quartil representado pela mediana (13,5).

9. Variabilidade
Amplitude total: Definida como a diferena entre o maior e o menor valor das observaes

Por exemplo, a amplitude entre 8 12 14 16 18, 10. Desvio Padro (DP): O DP a raiz quadrada da varincia. uma medida de variabilidade que leva em considerao toda a informao contida na amostra. Um exemplo como o a seguir ilustra bem a aplicao da medida do desvio padro. A mdia da idade da amostra foi de 15,00 anos, com desvio-padro de 1,05 anos, o que indica a maioria dos respondentes entre 14 e 16 anos.

Por exemplo, na amostra (10 12 14 16 18), o desvio padro ser

...

10. Teste de hiptese


Uma hiptese estatstica uma afirmativa a respeito de um parmetro de uma distribuio de probabilidade. Atravs dos elementos amostrais faz-se um teste que indicar a aceitao ou rejeio da hiptese formulada.

Hiptese estatstica uma suposio de um parmetro populacional. Por exemplo: 1. A renda mdia da populao de Forquilhinha R$ 350,00.Ento H: = 350,00. 2. A proporo de alunos reprovados 35%, ou seja: H:p = 0,35 A contrapartida para uma hiptese alternativa (H1) a hiptese nula (H0). A primeira sempre expressa por uma desigualdade e a segunda sempre por uma igualdade. Utiliza-se o teste de hiptese para casos como comparao de mdias, de pares de observao, de varincias, e de parmetros, entre outros.

11. Estatstica no paramtrica


Distintamente da estatstica paramtrica que trata de testes para variveis razo e intervalares, a estatstica paramtrica aborda os testes para variveis nominais e ordinais.

Conclui-se ento que os parmetros populacionais e as estimativas so desconsiderados nos testes a seguir. Segundo Fonseca (1996), os testes no paramtricos so muito interessantes para os dados qualitativos quando se trabalha com amostras pequenas, (inferiores a 30).
Os principais representantes desta estatstica so os testes de Qui Quadrado, de Wilcoxon, de Mann-Whitney, da Mediana, e de Kruskall-Wallis.

Abordar-se- apenas o de Qui quadrado por considerar-se o mais importante e popular.

11.1 Teste do qui quadrado


Este teste objetiva verificar se a freqncia absoluta observada de uma varivel significativamente diferente da distribuio de freqncia absoluta esperada.

11.1.1 Teste do qui quadrado para uma amostra


Aplica-se quando se quer estudar a dependncia entre duas variveis, atravs de uma tabela de dupla entrada ou tambm conhecida como tabela de contingncia.

11.1.1.1 Condies para a execuo do teste


Exclusivamente para variveis nominais e ordinais; Observaes independentes; No se aplica se 20% das observaes forem inferiores a 5 No pode haver freqncias inferiores a 1;
Nos dois ltimos casos, se houver incidncias desta ordem, aconselha-se agrupar os dados segundo um critrio em especfico.

11.1.1.2 Procedimento para a execuo do teste


1. esperada; 2. Determinar H0. Ser a negativa da existncia de diferenas entre a distribuio de freqncia observada e a Estabelecer o nvel de significncia ( );

3. Determinar a regio de rejeio de H0. Determinar o valor dos graus de liberdade (), sendo K 1 (K = nmero de categorias). Encontrar portanto, o valor do Qui-quadrado tabelado; 4. Calcular o Qui Quadrado, atravs da frmula:

Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1. Exemplo: Um vendedor trabalhou comercializando um produto em sete bairros residenciais de uma mesma cidade em um mesmo perodo do ano. Seu gerente decidiu verificar se o desempenho do vendedor oscilava em virtude do bairro trabalhado, ou seja, se as diferenas eram significativas nos bairros trabalhados. A partir deste estudo o gerente poderia ento elaborar uma estratgia comercial para cada bairro ou manter uma para todos.

Bairro Valores Observados Valores Esperados

1 9 16

2 11 16

3 25 16

4 20 16

5 15 16

Total 80 80

H0: no h diferenas significativas entre os bairros H1: as diferenas observadas para os bairros 3 e 4 so significativamente diferentes para melhor em relao aos demais bairros. = 0,05 g.l = 5 1 = 4, onde Qui quadrado tabelado igual a 9,49. 2 = (9-16)2 + (11 16) 2 + (25-16) 2 + (20 16) 2 + (15 16) 2/16 2 = 72 + 52 +92 + 42 + 12= 172/16 = 10,75 Conclui-se que o Qui quadrado calculado (10,75) maior do que o tabelado (9,49), rejeita-se H0 em prol de H1. Portanto h diferena significativa, ao nvel de 0,05, para os bairros 3 e 4. Face ao clculo o gerente deve elaborar uma estratgia comercial para cada bairro.

11.1.2 Teste do qui quadrado para independncia (duas amostras)


A utilizao do presente teste em pesquisa visa verificar se as distribuies de duas ou mais amostras no relacionadas diferem significativamente em relao determinada varivel.

11.1.2.1 Condies para a execuo do teste


Exclusivamente para variveis nominais e ordinais; Preferencialmente para amostras grandes, <30; Observaes independentes; No se aplica se 20% das observaes forem inferiores a 5 No pode haver freqncias inferiores a 1; Nos dois ltimos casos, se houver incidncias desta ordem, aconselha-se agrupar os dados segundo um critrio em especfico.

11.1.2.2 Procedimento para a execuo do teste


Determinar H0. As variveis so independentes, ou as variveis no esto associadas; Estabelecer o nvel de significncia ( ); Determinar a regio de rejeio de H0. Determinar o valor dos graus de liberdade (), sendo = (L 1) (C 1), onde L = nmeros de linhas da tabela e C = ao nmero de colunas.. Encontrar portanto, o valor do Qui-quadrado tabelado; Calcular o Qui Quadrado, atravs da frmula:

Para encontrar o valor esperado (E), utilizar a frmula a seguir:

Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1. H dependncia ou as variveis no esto associadas. Exemplo: Um pesquisador deseja identificar se h dependncia no consumo de seus chocolates e as cidades de sua regio.

Cidades do Vale do Taquari Sabor do chocolate Chocolate com caju Chocolate com amendoim Chocolate com flocos Chocolate com passas Lajeado 60 45 55 70 230 Santa Cruz 30 35 25 35 125 Estrela 20 20 47 25 112 Taquari 40 10 13 20 83 150 110 140 150 550

H0: A preferncia pelos sabores independe da cidade H1: A preferncia pelos sabores depende da cidade. = 0,05 = (4 1) (3 1) = 6, onde Qui quadrado tabelado igual a 12,6.

Calculo dos valores esperados (E). Sabor do chocolate Chocolate com caju Chocolate com amendoim Chocolate com flocos Chocolate com passas Lajeado

Cidades do Vale do Taquari Santa Cruz Estrela Taquari

62,7 46,0 58,5 62,7

34,1 25,0 31,8 34,1

30,5 22,4 28,5 30,5

22,6 16,6 21,1 22,6

2 = (60 62,7)2/62,7 + [(30 34,1) 2/34,1 ...[(20 22,6) 2/22,6 =

0,11+0,49+3,61+13,39+0,02+4+0,25+2,62+0,21+1,45+12+3,11+0,85+0,32+0,99+0,29 = 43,72 Conclui-se que o Qui quadrado calculado (43,72) maior do que o tabelado (12,6), rejeita-se H0 em prol de H1.

Portanto h diferena significativa, ao nvel de 0,05, para as cidades.

11.1.3 Coeficiente de contingncia (CC)


O CC um indicador do grau de associao entre duas variveis analisadas pelo Qui quadrado. Quanto mais prximo de 1, melhor o coeficiente de contingncia, que varia de 0 a 1. No exemplo dado acima o coeficiente seria 0,3442.

12. Teste T para duas amostras no relacionadas


O teste t muito utilizado em pesquisa para verificar se a diferena observada entre duas mdias obtidas nas amostras considerada grande para ser significativa.

Supondo que dois estabelecimentos discutem qual possui clientes mais satisfeitos. Para mensurara o grau de satisfao junto aos clientes, resolve-se realizar uma pesquisa de satisfao aplicando um questionrio com questes intervalares de 5 pontos. O cliente A obteve mdia geral 2,85 e o cliente B obteve mdia geral 3,45. Supostamente, conclui-se que o cliente B possui clientes mais satisfeitos que A. O teste t visa justamente comprovar se tal diferena significativa e explicar se as diferenas entre as mdias ocorrem devido ao erro amostral ou no. Quando trabalha-se com amostras pequenas, existe uma tendncia para que as mdias das amostras seja realmente diferentes, mesmo que originem-se da mesma populao. Neste caso o teste t, objetiva justamente verificar se o grau de diferena entre os dois conjuntos pode ser devido a fatores outros que no o erro de amostragem.

12.1 Condies para aplicao


Somente para questes intervalares; Quando a varincia da populao for desconhecida;

n pode ser de qualquer tamanho.

12.2 Procedimento de execuo


1. Determinar H0, no havendo diferenas entre as mdias; 2. Determinar H1, para a existncia de diferena entre as mdias; 3. Estabelecer um nvel de significncia; 4. Calcular t, onde os graus de liberdade, = n1 + n2 2

onde SQ a soma dos quadrados e x1 e x2 so as mdias de cada grupo. A frmula acima pode divergir em alguns livros de estatsticas que abordem amostras desiguais, no entanto, a mesma contempla amostras de tamanhos iguais ou no. Comparar o t tabelado com t calculado e rejeitar a hiptese nula em prol da alternativa, em caso de encontrar-se t calculado maior que o tabelado. Exemplo: A 1 3 2 4 3 3 2 2 4 1 3 3 3 4 3 2 4 4 4 2 T = 57 n = 20 X = 2,85 SQ = 18,55 B 2 3 4 3 5 4 3 5 3 3 4 2 2 1 5 3 4 4 5 2 T = 69 n = 20 X = 3,45 SQ = 24,95

Sendo t tabelado igual a 2,02 com 38 graus de liberdade e t calculado igual a 1,77, rejeitase a hiptese nula em prol da hiptese verdadeira. Conclui-se, portanto que os dois grupos de clientes esto satisfeitos e que provavelmente as diferenas entre as mdias sejam devido ao erro de amostragem.

13. Anlise de varincia


A anlise de varincia um teste estatstico amplamente difundido entre os analistas, e visa fundamentalmente verificar se existe uma diferena significativa entre as mdias e se os fatores exercem influncia em alguma varivel dependente.

Os fatores propostos podem ser de origem qualitativa ou quantitativa, mas a varivel dependente necessariamente dever ser contnua. Haja visto que trata-se de um teste bastante difundido e inmeros bons softwares estatsticos e planilhas eletrnicas possuem o recurso disponvel, no haver aprofundamento desta tcnica neste captulo, sendo recomendada literatura especializada. A principal aplicao da ANOVA (analise of variance) a comparao de mdias oriundas de grupos diferentes, tambm chamados tratamentos, como por exemplo mdias histricas de questes de satisfao, empresas que operam simultaneamente com diferentes rendimentos, entre muitas outras aplicaes. Existem dois mtodos para calcular-se a varincia: dentro de grupos (MQG) e a varincia das mdias (MQR). Em uma Anova, calcula-se esses dois componentes de varincia. Se a varincia calculada usando a mdia (MQR) for maior do que a calculada (MQG) usando os dados pertencentes a cada grupo individual, isso pode indicar que existe uma diferena significativa entre os grupos. Existem dois tipos de problemas a serem resolvidos atravs da Anova: a nveis fixos ou a nveis aleatrios. A aleatoriedade determinada a questo do problema. Na grande maioria dos casos trata-se de nveis fixos, afinal o segundo tipo de problema (aleatrio) somente surgir quando ocorrer um estudo envolvendo uma escolha aleatria de fatores (em 10 lotes de produo, escolhe-se apenas 5, entre 15 mquinas de um total de 20, por exemplo).
Tabela de Anlise de Varincia ou tabela ANOVA.

Fonte de Variao SQ GDL Entre Grupos SQG K 1 Dentro dos Grupos SQR N-K Total SQT N-1

MQ Teste F MQG MQG/MQR MQR

SQT = SQG + SQR (mede a variao geral de todas as observaes). SQT a soma dos quadrados totais, decomposta em:

SQG soma dos quadrados dos grupos (tratamentos), associada exclusivamente a um efeito dos grupos
SQR soma dos quadrados dos resduos, devidos exclusivamente ao erro aleatrio, medida dentro dos grupos.

MQG = Mdia quadrada dos grupos MQR = Mdia quadrada dos resduos (entre os grupos) SQG e MQG: medem a variao total entre as mdias SQR e MQR: medem a variao das observaes de cada grupo

f = MQG MQR
N 1=(K 1) + (N K)

SQT = SQG + SQR MQG = SQG (K 1) A hiptese nula sempre ser rejeitada quando f calculado for maior que o valor tabelado. Da mesma forma, se MQG for maior que MQR, rejeita-se a hiptese nula.

Quadro Fonte de variao SQ (soma dos quadrados) GDL (g.l) MQ (quadrados mdio) Teste F Entre Grupos Dentro dos grupos Total Se o teste f indicar diferenas significativas entre as mdias, e os nveis forem fixos, haver interesse em identificar quais as mdias que diferem entre si. Calcular o desvio padro das mdias;

Sx = de variveis. 3 x Sx

, ,onde nc a soma do nmero de cada varivel (grupo) dividido pelo nmero

Calcular o limite de deciso (ld) Ordenar as mdias em ordem crescente ou decrescente e compara-las duas a duas. A diferena ser significativa se for maior que Ld. Se o teste f indicar diferenas significativas entre as mdias, e os nveis forem aleatrios, haver interesse em identificar a estimativa dos componentes de variao.

O valor encontrado acima indicar a variabilidade total entre grupos, indicando se considerado significativa ou no. Exemplo (nveis fixos): Um pesquisador realizou um estudo para verificar qual posto de trabalho gerava mais satisfao para o funcionrio. Para isso, durante um ms, 10 funcionrios foram entrevistados. Ao final de um ms os funcionrios responderam um questionrio gerando uma nota para o bem estar do funcionrio.

Postos Funcionrios 1 2 3 4 5 6 7 8 9 10 1 7 8 7 8 9 7 8 6 7 6 2 5 6 7 6 5 6 7 5 6 6 3 8 9 8 9 8 8 9 10 8 9

RESUMO Grupo 1 2 3 Contagem 10 10 10 Soma 73 59 86 Mdia Varincia 7,3 0,9 5,9 0,544444 8,6 0,488889

ANOVA Fonte da variao SQ Entre grupos 36,46667 Dentro dos grupos 17,4 Total 53,86667 gl 2 27 29 MQ 18,23 0,64 F valor-P F crtico 28,29 2,37E-07 3,35

Como f calculado maior do que o f tabelado, rejeita-se a hiptese nula em prol da hiptese alternativa ao risco de 5%. H diferenas significativas entre os grupos. Observa-se que MQG muito superior a MQR, indicando uma forte varincia entre os grupos. 1. Calcular o desvio padro das mdias;

2.

Calcular o limite de deciso (Ld) 3 x Sx

3.

Ordenar as mdias em ordem crescente ou decrescente e compara-las duas a duas. 5,9 7,3 8,6 x1 x2 = - 1,4 x1 x3 = - 2,7 x2 x3 = - 1,3

As trs diferenas so menores que o Ld, conclui-se portanto que as mdias diferem entre si.

14. Regresso simples (RLS)


Em inmeras problemticas, o pesquisador depara-se com duas varveis que proporcionam previso de comportamentos futuros. Esta previso pode ser alcanada atravs de um estudo que envolve a equao da reta de regresso, concebida atravs das variveis critrio (y, dependente ou de resposta) e a independente (x, tambm conhecida como prognstico). Trata-se de uma realidade comum no universo da pesquisa, envolvendo variveis como renda, idade, gastos, entre muitas outras. Equao da reta: Y = a1 + a2.x Onde, y a varivel dependente e x a independente. a1 o valore de y para x e a2. valor mdio de y por unidade x. A relao linear entre as duas variveis medida pelo coeficiente de correlao (R). R varia de 1 a 1, onde 1 a correlao perfeita e o oposto indica forte correlao negativa. Valores prximos de zero indicam fraca correlao. No exemplo abaixo, se existisse um R elevado poderia-se prever y para eventos futuros. Y Gastos com combustvel Renda Pessoal Nmeros de defeitos de peas X Km rodados Anos de estudo Horas de treinamentos em qualidade

O clculo de R uma operao bastante simples para softwares com funes estatsticas, sendo desnecessrio o aprofundamento dos procedimentos de calculo. Neste tipo de anlise importante determinar o quanto a linha de regresso representa os dados. Neste caso, se faz necessrio calcular o R2 de Pearson ou coeficiente de determinao. Um R2 igual a 0,80, tem-se que 80% da variabilidade decorre de x. Inversamente, pode-se dizer que 20% da varincia de Y no atribuvel s diferenas em x. Para obter-se o teste de hiptese, formula-se H0 e H1 da seguinte forma: H0 :p = 0 H1: p 0 O clculo de t realizado atravs da formula,

Sendo t calculado maior do que t tabelado, rejeita-se a hiptese nula. Exemplo: Um motorista deseja prever seus gastos com seu automvel em funo dos quilmetros que roda por ms. QUILMETROS GASTOS (R$) 3203 400

3203 2603 3105 1305 804 1604 2706 805 1903 3203 3702 3203 3203 803 803 1102 3202 1604 1603 3203 3702 3403

400 340 400 150 100 200 300 100 200 400 450 400 400 100 100 130 400 150 200 400 450 440

Estatstica de regresso R mltiplo 0,993064678 R-Quadrado 0,986177454 R-quadrado ajustado 0,985519237 Erro padro 127,508336 Observaes 23 Observando a tabela acima, percebe-se uma forte correlao entre as variveis, onde R est muito prximo de 1. Quilmetros rodados explica 98% da varincia de gastos.

15. Regresso linear mltipla (RLM)


Muitos problemas de regresso envolvem mais de uma varivel regressora. Por exemplo: a satisfao geral poder ser composta por diversas variveis independente tais como preo, prazo de entrega, embalagem, entre outras. Em virtude dos princpios da regresso mltipla serem anlogos da regresso simples, no se abordar aqui as particularidades que envolvem a equao geral da equao da Regresso Mltipla: y = 0 + x1 + 2x2 + ...+ kxk + . Analogamente, a preocupao geral do analista nesta anlise, o R2 que indica a variabilidade total do modelo de regresso, e os Rs que variam de 1 a 1, indicando a variabilidade total, onde haver uma relao entre a varivel de resposta e as regressoras.

O teste de hiptese baseia-se no j abordado valor do t, onde ocorre a situao do mesmo sendo calculado e maior do que o tabelado, rejeita-se a hiptese nula. Exemplo: Variveis Prazo de entrega Envolvimento da equipe na soluo de problemas Preo praticado Trabalho de ps venda Embalagem Coeficiente 0,154 0,135 -0,002 0,134 0,065

Neste exemplo real, objetivava-se mensurar o grau de satisfao dos clientes de uma empresa distribuidora de software, onde a varivel de resposta era a satisfao geral e as regressoras eram as acima citadas (para um grupo de fatores). Observa-se que pouca representatividade exercida por estas variveis, afinal os coeficientes pouco se afastam de zero. No entanto o R2 elevado (0,68), conferindo uma boa preciso no clculo.

16. Exerccios
1. Uma empresa possui quatro equipes de vendedores e deseja avaliar os resultados abaixo discriminados. As vendas deveriam ser as mesmas. Para testar essa hiptese foram feitas medies nas equipes. Analise os resultados e conclua a respeito de possveis diferenas entre as equipes.

Equipe 1 Equipe 2 Equipe 3 Equipe 4 824 817 822 826 821 830 810 828 829 819 831 810 808 809 824 820 815 825 818 815

2.

Supondo que a varivel escolhida de um pesquisa, seja nominal e a populao finita de 600 indivduos (onde 60% dos indivduos so mulheres). Deseja-se trabalhar com um alpha de 5% e um erro amostral de 7%. Calcule o tamanho da amostra.

3.

Organize os dados abaixo em uma tabela de distribuio de freqncia, contendo o intervalo de classe, a freqncia absoluta, a freqncia acumulada, a freqncia relativa e a freqncia relativa acumulada.

20,4 24,9 26,0 27,1

22,3 25,0 26,1 27,1

23,1 25,1 26,2 27,3

23,5 25,3 26,2 27,5

23,8 25,3 26,3 27,7

24,1 25,4 26,5 27,9

24,3 25,6 26,6 28,0

24,3 25,7 26,7 28,3

24,6 25,8 26,8 28,7

24,8 26,0 26,9 29,6

4.

Trs arremessadores de disco, treinam para a Olimpada. Os atletas arremessam seus discos a 66 metros de distncia (em mdia), com desvio padro de 6,1 metros.

Qual a probabilidade de um atleta lanar seu disco entre 64 e 67 metros?

5.

Uma determinada amostra possui varincia de 0,0015 e mdia de 12,258. Sendo o n igual a 12, construa o intervalo de confiana para mdia amostral.

6.

Um gerente geral de determinada rede de lojas de varejo deseja saber se a estao climtica do ano interfere no volume de artigos vendidos. Teste a hiptese da estao do ano interferir no volume vendido.

Loja Centro Loja Sul Loja Norte Loja Matriz

Vero 150 180 167 199

Outono 160 179 187 187

Inverno 165 177 123 182

Primavera 172 180 155 176

7.

Um automvel recebeu as notas abaixo junto a leitores de revista especializada. Durante dois meses o pesquisa foi publicada e agora o fabricante deseja saber se h diferenas significativas entre as notas ao longo dos dois meses.

Ms Jan 9 8 7 9 7 6 4 9 9 9

Ms de Fev 6 6 6 6 5 5 5 4 3 2

9 8 8 7

6 5 5 8

8.

Atravs de um estudo de share of mind, quatro amostras de telespectadores foram entrevistados, oriundas dos estados de SP, AM, RN e RS. O objetivo do pesquisador verificar se h diferenas significativas entre as quatro amostras, se houve o mesmo impacto da propaganda nos estados.

SP 5,2 5,9 6,6 7,3 8,0 8,7 9,4 7,9 8,3 7,3 8,0 8,7 9,4 7,9 8,3

AM 5,9 6,3 6,7 7,1 7,5 7,9 8,3 8,7 9,1 9,5 5,9 6,3 6,7 7,1 7,5

RN 5,2 5,9 6,6 7,3 8,0 8,7 9,4 9,7 5,2 5,9 6,6 7,3 8,0 8,7 9,4

RS 6,9 6,8 6,7 6,6 6,5 6,4 6,3 6,2 6,1 6,0 5,9 5,8 5,7 5,6 5,5

17. Bibliografia
CUNHA, M.V. Anlise Multidimensional de Dados Categricos. In: PPGA, UFRGS, 16. 1997. Porto Alegre, RS FONSECA, J. S, MARTINS, G. Curso de Estatstica. So Paulo. Atlas.1996 FREITAS & CUNHA CONSULTORES LTDA. Guia do Usurio Sphinx Lxica 2.08 for Windows. Porto Alegre, 1998. KOTLER, P. Administrao de Marketing: Anlise, Planejamnto, Implementao e controle. So Paulo: Atlas, 1996. LABES, E. M. Questionrio: do planejamento aplicao na pesquisa. Chapec: Grifos, 1998.

MARR, S.L., CROSBY, L.A. Customer Satisfaction Measurement: a management Information system for total quality. Artigo de trabalho da Disciplina de Comportamento do consumidor PPGA UFRGS, 1996. MATTAR, F. N. Pesquisa de Marketing. So Paulo: Atlas, 1996. ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfao de clientes: o estado-da-arte proposio de um mtodo Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais. 1997, Rio das Pedras, RJ. p.124 SLACK, N. Administrao da produo. So Paulo: Atlas, 1997.

Você também pode gostar