Escolar Documentos
Profissional Documentos
Cultura Documentos
SAS
FCAV/UNESP
Campus de Jaboticabal
ii
NDICE
I. APRESENTAO ........................................................................................................1
I.1. Mdulos do SAS ......................................................................................................1
I.2. Janelas do SAS ........................................................................................................1
I.3. Barra de ferramentas .............................................................................................4
I.4. Help do SAS ............................................................................................................5
Procedimentos ..........................................................................................................24
UNIVARIATE .....................................................................................................24
INSIGHT..............................................................................................................24
Lista de Exerccios Aula 4 ...................................................................................25
I. Apresentao
O SAS um sistema composto por vrios mdulos, com aplicaes diversas. Alm do
mdulo para anlises estatsticas, o SAS/STAT, vrios outros mdulos fazem parte do
sistema.
Acessos s janelas, bem como outras operaes, podem ser feitos utilizando-se as Teclas
de Atalhos, como:
Essas e outras Teclas de Atalho podem ser vistas na Janela KEYS. Ver a Figura 3:
Toda vez que o Programa existente na janela PGM rodado (RUN), so geradas linhas
nas janelas LOG e OUTPUT, conforme apresentado na Figura 4.
LOG
RUN
PGM
OUTPUT
Figura 4. Esquema usado pelo SAS para gerar as Janelas LOG e OUTPUT.
4
Assim sendo, toda vez que um programa for rodado e precisar ser editado, para a
correo de algum erro ou para a incluso de outros comandos, deve-se:
Acessar a janela OUTPUT e apag-la ............................................. (F7 / F12),
Acessar a janela LOG e apag-la ..................................................... (F6 / F12),
Acessar a janela PGM e recarregar o ltimo programa rodado .......... (F5 / F4).
HELP
SAS/ASSISTENTE
PASTAS
PROMPT DO DOS
DESFAZER
COLAR
COPIAR
RECORTAR
IMPRIMIR
ARQUIVO NOVO
ABRIR ARQUIVO
RODAR (RUN)
COMANDOS DE OPERAO
Figura 5. Barra de Ferramentas do SAS.
5
O SAS possui um Auxlio completo e interativo. Para utiliz-lo, basta acessar a janela
HELP pela tecla F1, ou pela Barra de Ferramentas.
6
ARQUIVOS DE
DADOS
Figura 7. Fases de um programa SAS.
O SAS-DATA-SET o arquivo de dados a ser usado pelo SAS. Ele formado por linhas
e colunas, sendo nas colunas as variveis e nas linhas os registros.
Exemplo:
Ex: PORCG=PGORD/PLEITE*100;
Operadores aritmticos:
Exemplos
Operador Operao
Usual SAS
+ Adio A+B A+B
- Subtrao ou Negao A-B ou -B A-B ou -B
* Multiplicao A.B A*B
/ Diviso A:B A/B
B
** Potenciao A A**B
9
Operadores lgicos:
Exemplos
Operador Operao
Usual SAS
& ou AND AeB A&B ou A AND B
| ou OR AouB A|B ou A OR B
^ ou NOT Negao No A ^A ou NOT A
Operadores de comparao:
Exemplos
Operador Operao
Usual SAS
= ou EQ Igual a A=B A=B ou A EQ B
> ou GT Maior que A>B A>B ou A GT B
< ou LT Menor que A<B A<B ou A LT B
>= ou GE Maior ou igual que AB A>=B ou A GE B
<= ou LE Menor ou igual que AB A<=B ou A LE B
^= ou NE Diferente de AB A^=B ou A NE B
Para maiores detalhes consultar o HELP.
IF ... THEN ... ELSE: Usado para testar se uma condio verdadeira ou falsa.
Sintaxe: IF <condio> THEN <comando>;
[ELSE < comando>;]
10
DO ... END: Usado para controle de loops, ou seja, para executar a mesma
seqncia de comandos um nmero finito de vezes.
Sintaxe: DO x=a TO b [BY c];
Comando 1;
Comando 2;
....
END;
Obs . X X2 X3
1 5 25 125
2 10 100 1.000
3 15 225 3.375
4 20 400 8.000
5 25 625 15.625
6 30 900 27.000
Seqncia:
ROC IMPORT OUT=SDS DATAFILE="ARQ.XLS" DBMS=EXCEL2000
REPLACE;
SHEET="PLANILHA$";
GETNAMES=YES;
RUN;
Comando INPUT
Formatado: quando se especifica a varivel e formato que o dado a ser lido deve
ser considerado.
DDMMYY6. especifica que a data a ser lida contm 2 caracteres para o dia, 2
para o ms e 2 para o ano, num total de 6.
8.2 especifica que o peso a ser lido tem 8 casas, sendo 2 decimais.
12
Obs.: Quando se usa o INPUT, o nmero de valores por linha de dados deve coincidir
com o nmero de variveis do INPUT, a menos que a lista de variveis seja
seguida por @@.
Exemplo:
DATA EXEMPLO; DATA EXEMPLO;
INPUT X Y; INPUT X Y@@;
CARDS; CARDS;
10 20 10 20 12 22 15 35
12 22 ;
15 35
;
Lista de Opes.
Nome do Procedimento.
Prefixo de todo Procedimento (PROCEDURE).
Com esta opo, ser apresentada uma lista de lies do curso selecionado, e as possveis
sees (Instructions - que corresponde s instrues da lio, Summary - que
corresponde a um resumo da lio e Quiz - que um teste de avaliao da lio).
COMANDOS
PROCEDIMENTOS
PROC CONTENTS
Finalidade: Apresenta uma descrio do SAS-DATA-SET.
Sintaxe: PROC CONTENTS < opes >;
PROC PRINT
Finalidade: Imprimir o SAS-DATA-SET no OUTPUT.
Sintaxe: PROC PRINT < opes >;
Algumas opes so:
NOOBS No imprime o nmero da observao (Registro).
DOUBLE Imprime com espaamento duplo.
ROUND Imprime os nmeros reais arredondados para 2 casas decimais.
LABEL Imprime tendo como cabealho das colunas os labels no lugar dos
nomes das variveis.
PROC SORT
Finalidade: Classificar o SAS-DATA-SET.
16
PROC MEANS
Finalidade: Calcular estatsticas descritivas de variveis numricas.
Sintaxe: PROC MEANS < opes > < lista de estatsticas >;
Algumas opes:
ALPHA=valor Especifica o nvel de significncia para o intervalo de confianca.
Algumas estatsticas:
N Nmero de observaes.
NMISS Nmero de observaes perdidas.
MEAN - Mdia aritmtica.
VAR Varincia.
STD - Desvio padro.
STDERR - Erro padro da mdia.
MIN - Valor mnimo.
MAX - Valor mximo.
CLM - Intervalo de confiana para a mdia.
RANGE - Amplitude (Mximo-Mnimo).
T - Teste t para a hiptese H0:mdia=0 vs H1:mdia0.
PRT - Nvel Mnimo de significncia para o teste t.
COLUNAS CAMPO
1-4 vaca
5-8 paiv
9-12 maev
13-14 diap
15-16 mesp
17-18 anop
19-20 orparto
21 sexo
22-23 anod
24-25 mesd
26-27 diad
28-33 pesonasc
34-39 pesodesm
Obs: Sexo = M ou F e Pesos com duas casas decimais
d) Imprimir o arquivo.
18
5. Fazer um programa SAS para tabular a funo y=10 + 0.5 x + 2 x2, -5 x 5, para x
variando de 0.5 em 0.5 (Usar comandos DO ... END).
6. Fazer um programa no SAS para criar um Arquivo SAS, a partir dos dados do
Exerccio 1, considerando-se que a segunda repetio do tratamento 1 tenha sido perdida,
e digitando apenas os valores observados (Usar comandos DO ... END).
7. Fazer um programa no SAS para criar um Arquivo SAS, a partir dos dados do
Exerccio 1, importando os dados do EXCEL.
8. Fazer um programa no SAS para criar um Arquivo SAS, a partir dos dados do
Exerccio 1, importando o arquivo ASC.
19
Comandos
SDS1 SDS2
Nome Sexo Funo Nome Salrio
Antnio M Aux. Escritrio Antnio 600.00
Maria F Secretria Maria 800.00
Pedro M Servente Rosa 300.00
Rosa F Cozinheira
Com os comandos:
PROC SORT DATA=SDS1; BY NOME; RUN;
PROC SORT DATA=SDS2; BY NOME; RUN;
DATA SDS;
MERGE SDS1 SDS2;
BY NOME;
20
SDS
Nome Sexo Funo Salrio
Antnio M Aux. Escritrio 600.00
Maria F Secretria 800.00
Pedro M Servente .
Rosa F Cozinheira 300.00
Obs.: Os arquivos SDS1 e SDS2 devem estar classificados pela varivel NOME.
Comandos:
DATA TEST;
SET TEST;
FILE C:\Arq_ASC.txt;
PUT TOURO $10. (PN PD) (2*F8.2);
RUN;
21
Procedimentos
PROC FREQ
Finalidade: Criar tabelas de freqncia. A Tabela conter a freqncia, as
porcentagens em relao ao total geral, as porcentagens em relao ao
total das linhas e as porcentagens em relao ao total de colunas.
Sintaxe: PROC FREQ < opes1 >;
TABLE < varivel A > [* < varivel B >] / < opes2 >;
Algumas das <opes1> so:
DATA= <SDS> - especifica O Sas-Data-Set a ser usado
PAGE especifica para imprimir, no OUTPUT, uma tabela por pgina.
Algumas das <opes2> so:
NOFREQ No apresenta as freqncias
NOPERCENT No apresenta as porcentagens em relao ao total geral
NOROW No apresenta as porcentagens em relao ao total de linhas
NOCOL No apresenta as porcentagens em relao ao total de linhas
EXPECTED Apresenta os valores esperados
CHISQ Realiza o teste Qui-Quadrado para a independncia das variveis
EXACT - Realiza o teste Exato de Fischer para a independncia das variveis
PROC TTEST
Finalidade: Teste t de Student para comparao das mdias de 2 grupos.
Sintaxe: PROC TTEST < opes >;
CLASS < varivel >; Varivel que classifica
os grupos
Uma das <opes> :
DATA= <SDS> - especifica O Sas-Data-Set a ser usado
23
2. Fazer um programa no SAS para fazer o teste Qui-quadrado e o teste Exato de Fisher
para a tabela de contingncia:
RESULTADO DO ACASALAMENTO
RAA fecundo infecundo
Charolesa 52 128
Zebu 77 83
d) Imprimir o arquivo.
e) Aplicar o test t para testar a hiptese: H0: T1 = T2 .
c) Substituir as 2 primeiras repeties de T2 por 708 e 798, respectivamente, e ver o que
acontece.
24
Procedimentos
PROC UNIVARIATE
Finalidade: Apresenta as estatsticas descritivas necessrias para um diagnstico
da distribuio dos dados.
Sintaxe: PROC UNIVARIATE < opes >;
Algumas opes:
NORMAL Faz o teste de normalidade. Teste de Shapiro-Wilk (W) se o
nmero de observaes for <2000, caso contrrio o teste de Kolmogorov (D).
PLOT Gera um grfico de ramos e folhas que permite interpretar certas
caractersticas da distribuio e um grfico contendo os valores esperados, caso a
distribuio for normal (+), e os valores observados (*).
PROC INSIGHT
Finalidade: Entra no modo interativo do SAS.
1. Sintaxe via programa:
PROC INSIGHT DATA=<SDS>;
DIST Var ;
RUN;
a) Seleo do arquivo:
Selecione o caminho. Campo LIBRARY.
Selecione o arquivo. Campo DATA SET.
Selecione Open
Grficos de disperso
PROC PLOT
Finalidade: Editar grficos de disperso no OUTPUT.
Sintaxe: PROC PLOT < opes1 >;
PLOT < Vertical >* < Horizontal > [=caracter] / < opes2 >;
Algumas das opes1 so: caracter a ser usado
NOLEGEND No apresenta as legendas do grfico na representao dos
HPERCENT Especifica a porcentagem da pgina, pontos
na horizontal, deve ser usada pelo grfico
VPERCENT Especifica a porcentagem da pgina, na vertical, deve ser
usada pelo grfico
PROC GPLOT
Finalidade: Editar grficos de disperso na janela GRAPHICS.
Sintaxe: PROC GPLOT < opes1 >;
PLOT < Vertical >* < Horizontal > / < opes2 >;
SYMBOL[n] <opes3>;
Outros grficos
Os procedimentos utilizados so:
PROC CHART ou GCHART para grficos no output ou na janela GRAPHICS,
respectivamente.
VBAR ou HBAR ou PIE, etc define o tipo do grfico, que pode ser: Barras
verticais, Barras Horizontais, tipo Pizza, etc.
M 22 F 23.2 M 20 F 21 M 31 F 28 F 20 M 13.5 F 23 M 19 M 18 M 16 F 17
;
RUN;
GOPTIONS DEVICE=WIN;
PATTERN V=SOLID COLOR=BLUE;
PROC GCHART;
VBAR PESO/GROUP=SEX LEVELS=10 ;
RUN;
DATA EX2;
DO X=-5 TO 5 BY 0.2;
DO Y=-5 TO 5 BY 0.2;
Z=X**2+Y**2;
OUTPUT;
END;
END;
PROC G3D;
PLOT X*Y=Z/GRID CAXIS=RED CBOTTOM=BLUE;
RUN;
29
2. Fazer um programa SAS para gerar 100 dados com distribuio normal e fazer
um histograma (grfico de barras verticais). Usar as opes que voc julgar
serem interessantes.
Regresso Linear
PROC REG
Finalidade: Ajuste da equao de regresso linear.
Sintaxe: PROC REG < opes1 >;
MODEL < Var. Dep > = < Lista Var. Indep. > / < opes2 >;
RUN;
PROC ANOVA
A sintaxe do PROC ANOVA :
Nos Comandos:
PROC GLM
Apenas os comandos no descritos no PROC ANOVA (em azul) sero descritos aqui,
uma vez que para os outros a descrio seria igual,
2.B. Fazer um programa no SAS para a Anlise de Varincia dos dados do exerccio 2.A.,
supondo que a observao (Trat. 5 e Bloco 2) tenha sido perdida.
36
TRATAMENTOS
BLOCOS TRAT1 TRAT2 TRAT3 TRAT4 TRAT5
Y X Y X Y X Y X Y X
1 74 9 58 7 118 9 41 6 95 8
2 51 9 67 8 48 9 38 9 41 8
3 95 8 40 5 49 9 77 8 39 9
4 62 9 58 8 64 9 92 9 114 9
5 60 9 29 6 67 8 57 7 35 6
6 47 9 64 8 51 8 77 7 49 8
7 14 6 55 9 15 8 59 8 39 9
8 19 8 47 8 29 9 32 8 100 9
Fonte: PIMENTELGOMES, F. Estatstica Experimental. Piracicaba:ESALQ/USP, 12. Ed., 1987.
b) Fazer anlise de Covarincia
4.B. Fazer um programa no SAS para a Anlise de Varincia dos dados do exerccio 4.A.,
supondo que B esta aninhado em A.
Consideraes estatsticas
E(QM)
F. V. G.L. S.Q. F
Ef. Aleatrio Ef. Fixo
2 2
Trat, nt 1 SQ(Trat,) + nt t 2+ nt t QM(Trat)/QM(Res)
Resduo nt(nr 1) SQ(Res,) 2 2
Total nt nr 1 SQ(Total)
1 nt
Onde t = ( i ) 2
nt 1 i =1
2 = QM (Re s)
2 + nt t2 = QM (Trat )
logo:
2 = QM (Re s )
1
t2 = [QM (Trat ) QM (Re s )]
nt
38
Regras prticas para obteno das esperanas dos quadrados mdios E(QM) -
dados balanceados
2. A anlise de Varincia ter uma linha para cada Causa de Variao, inclusive para
o resduo.
3. O n de graus de liberdade de uma linha genrica obtida pelo produto dos (ni-1)
associados aos fatores esquerda dos dois pontos (:) com os nj aos direita.
Ex: Para AB:XY ------> (na-1)(nb-1)nxny graus de liberdade.
6. Cada E(QM) conter aqueles s2 (com respectivos coeficientes) que possuem como
ndices, no mnimo, todas as letras presentes naquela linha.
7. Para os modelos mistos, sem restries nos parmetros, trat-los como aleatrios,
substituindo os s2 dos efeitos fixos pelas funes quadrticas correspondentes.
8. Para modelos mistos, com restries nos parmetros, eliminar da E(QM) aqueles
Componentes da Varincia que tm entre suas letras, qualquer letra de efeito fixo,
exceto as da linha.
39
PROC VARCOMP
PROC NPAR1WAY
TRATAM,
REPETIES
1 2 3 4 5
1 2212,8 2025,3 1989,0 2232,8 2027,8
2 2195,2 2031,5 1876,5 1750,3 1060,3
3 1770,3 1800,0 1852,8 1769,0
Fonte: CAMPOS, H. Estatstica Experimental no paramtrica. Piracicaba:ESALQ/USP. 3. Ed., 1979.