Você está na página 1de 338

Guia de Script e Automao Python do

IBM SPSS Modeler 17.1

IBM
Nota
Antes de usar estas informaes e o produto suportado por elas, leia as informaes em Avisos na pgina 321.

Informaes sobre o Produto


Esta edio se aplica verso 17, liberao 1, modificao 0 do IBM(r) SPSS(r) Modeler e a todas as liberaes e
modificaes subsequentes, at que indicado de outra forma em novas edies.
ndice
Captulo 1. Script e a Linguagem de Criando ns e modificando fluxos . . . . . .. 30
Script . . . . . . . . . . . . . . .. 1 Criando ns . . . . . . . . . . . .. 31
Viso Geral de Script . . . . . . . . . .. 1 Vinculando e desvinculando ns . . . . .. 31
Tipos de Scripts . . . . . . . . . . . .. 1 Importando, substituindo e excluindo ns . .. 32
Scripts de Fluxo . . . . . . . . . . . .. 1 Percorrendo os ns em um fluxo . . . . .. 33
Exemplo de Script de Fluxo: Treinando uma Rede Limpando ou removendo itens . . . . . . .. 34
Neural . . . . . . . . . . . . . .. 3 Obtendo informaes sobre ns. . . . . . .. 34
Scripts Independentes . . . . . . . . . .. 4
Exemplo de Script Independente: Salvando e Captulo 4. A API de Script . . . . .. 37
Carregando um Modelo . . . . . . . .. 4 Introduo API de Script . . . . . . . .. 37
Exemplo de Script Independente: Gerando um Exemplo: procurando por ns utilizando um filtro
Modelo de Seleo de Varivel . . . . . .. 4 customizado . . . . . . . . . . . . .. 37
Scripts SuperNode . . . . . . . . . . .. 5 Metadados: Informaes sobre dados . . . . .. 37
Exemplo de Script SuperNode . . . . . .. 6 Acessando Objetos Gerados . . . . . . . .. 40
Executando loop e execuo condicional em fluxos . 6 Manipulando Erros . . . . . . . . . . .. 41
Executando loop em fluxos . . . . . . .. 7 Parmetros de Fluxo, Sesso e SuperNode . . .. 42
Execuo condicional em fluxos . . . . .. 10 Valores Globais . . . . . . . . . . . .. 45
Executando e Interrompendo Scripts . . . . .. 11 Trabalhando com Diversos Fluxos: Scripts
Localizar e substituir . . . . . . . . . .. 12 Independentes . . . . . . . . . . . .. 46

Captulo 2. A Linguagem de Script . .. 15 Captulo 5. Dicas de Script . . . . .. 49


Viso Geral de Linguagem de Script . . . . .. 15 Modificando a Execuo de Fluxo . . . . . .. 49
Python e Jython . . . . . . . . . . . .. 15 Executando loop pelos Ns . . . . . . . .. 49
Script Python . . . . . . . . . . . . .. 16 Acessando Objetos no IBM SPSS Collaboration and
Operaes . . . . . . . . . . . . .. 16 Deployment Services Repository . . . . . .. 49
Listas . . . . . . . . . . . . . .. 16 Gerando uma Senha Codificada . . . . . .. 51
Sequncias de caracteres . . . . . . . .. 17 Verificao de Script . . . . . . . . . .. 51
Observaes . . . . . . . . . . . .. 18 Script a partir da Linha de Comandos . . . .. 51
Sintaxe da Instruo . . . . . . . . .. 18 Compatibilidade com Liberaes Anteriores . .. 52
Identificadores . . . . . . . . . . .. 19 Acessando Resultados da Execuo do Fluxo . .. 52
Blocos de Cdigo . . . . . . . . . .. 19 Modelo de Contedo de Tabela. . . . . .. 53
Transmitindo Argumentos para um Script . .. 20 Modelo de Contedo XML . . . . . . .. 54
Exemplos . . . . . . . . . . . . .. 20 Modelo de Contedo JSON . . . . . . .. 55
Mtodos Matemticos . . . . . . . . .. 21 Modelo de Contedo de Estatsticas de Coluna e
Utilizando caracteres no ASCII . . . . .. 22 Modelo de Contedo de Estatsticas de Pares .. 57
Programao Orientada a Objetos . . . . . .. 23
Definindo uma Classe . . . . . . . . .. 23 Captulo 6. Argumentos de Linha de
Criando uma Instncia de Classe . . . . .. 24 Comandos . . . . . . . . . . . .. 61
Incluindo Atributos em uma Instncia de Classe 24 Chamando o Software . . . . . . . . . .. 61
Definindo Atributos e Mtodos de Classe . .. 24 Utilizando Argumentos de Linha de Comandos .. 61
Variveis ocultas. . . . . . . . . . .. 25 Argumentos do sistema . . . . . . . .. 62
Herana . . . . . . . . . . . . .. 25 Argumentos de Parmetros . . . . . . .. 63
Argumentos de Conexo do Servidor . . . .. 64
Captulo 3. Criando Script em IBM Argumentos de Conexo do IBM SPSS
SPSS Modeler . . . . . . . . . .. 27 Collaboration and Deployment Services
Tipos de scripts . . . . . . . . . . . .. 27 Repository. . . . . . . . . . . . .. 65
Fluxos, fluxos de SuperNode e diagramas . . .. 27 Argumentos de Conexo do IBM SPSS Analytic
Fluxos . . . . . . . . . . . . . .. 27 Server . . . . . . . . . . . . . .. 65
Fluxos de SuperNode . . . . . . . . .. 27 Combinando Diversos Argumentos . . . .. 66
Diagramas. . . . . . . . . . . . .. 27
Executando um fluxo . . . . . . . . . .. 27 Captulo 7. Referncia de Propriedades 67
O contexto de script . . . . . . . . . .. 28 Viso Geral de Referncia de Propriedades . . .. 67
Referenciando ns existentes. . . . . . . .. 29 Sintaxe para Propriedades . . . . . . .. 67
Localizando ns . . . . . . . . . . .. 29 Exemplos de Propriedade de N e de Fluxo .. 68
Configurando propriedades . . . . . . .. 30

iii
Viso Geral de Propriedades do N . . . . .. 69 Propriedades de timeintervalsnode . . . . .. 132
Propriedades Comuns do N . . . . . .. 69 Propriedades de transposenode . . . . . .. 136
Propriedades de typenode . . . . . . . .. 137
Captulo 8. Propriedades do Fluxo . .. 71
Captulo 12. Propriedades do N de
Captulo 9. Propriedades do N de Grfico . . . . . . . . . . . . .. 143
Origem. . . . . . . . . . . . . .. 75 Propriedades Comuns do N Grfico . . . .. 143
Propriedades Comuns do N de Origem . . .. 75 Propriedades de collectionnode . . . . . .. 144
Propriedades de asimport . . . . . . . .. 79 Propriedades de distributionnode . . . . .. 145
Propriedades do N cognosimport . . . . .. 79 Propriedades de evaluationnode . . . . . .. 145
Propriedades de databasenode . . . . . . .. 81 Propriedades de graphboardnode . . . . .. 147
Propriedades de datacollectionimportnode . . .. 83 Propriedades de histogramnode . . . . . .. 149
Propriedades de excelimportnode . . . . . .. 85 Propriedades de multiplotnode . . . . . .. 150
Propriedades de evimportnode . . . . . . .. 86 Propriedades de plotnode . . . . . . . .. 151
Propriedades de fixedfilenode . . . . . . .. 87 Propriedades de timeplotnode . . . . . . .. 153
Propriedades do N gsdata_import . . . . .. 89 Propriedades de webnode . . . . . . . .. 154
Propriedades de sasimportnode . . . . . .. 89
Propriedades de simgennode . . . . . . .. 90 Captulo 13. Propriedades do N de
Propriedades de statisticsimportnode . . . . .. 92 Modelagem . . . . . . . . . . .. 157
Propriedades do N tm1import. . . . . . .. 92 Propriedades Comuns do N de Modelagem . .. 157
Propriedades de userinputnode. . . . . . .. 93 Propriedades de anomalydetectionnode . . .. 157
Propriedades de variablefilenode . . . . . .. 94 Propriedades de apriorinode . . . . . . .. 159
Propriedades de xmlimportnode . . . . . .. 97 Propriedades de associationrulesnode . . . .. 160
Propriedades de dataviewimport . . . . . .. 97 Propriedades de autoclassifiernode . . . . .. 162
Configurando Propriedades de Algoritmo . .. 164
Captulo 10. Propriedades do N de Propriedades de autoclusternode . . . . . .. 165
Operaes de Registro. . . . . . .. 99 Propriedades de autonumericnode . . . . .. 166
Propriedades de appendnode . . . . . . .. 99 Propriedades de bayesnetnode . . . . . .. 167
Propriedades de aggregatenode. . . . . . .. 99 Propriedades de buildr . . . . . . . . .. 169
Propriedades de balancenode . . . . . . .. 100 Propriedades de c50node . . . . . . . .. 169
Propriedades de derive_stbnode . . . . . .. 101 Propriedades de carmanode . . . . . . .. 170
Propriedades de distinctnode . . . . . . .. 103 Propriedades de cartnode . . . . . . . .. 172
Propriedades de mergenode . . . . . . .. 104 Propriedades de chaidnode . . . . . . . .. 174
Propriedades de rfmaggregatenode . . . . .. 106 Propriedades de coxregnode . . . . . . .. 176
Propriedades de Rprocessnode . . . . . .. 107 Propriedades de decisionlistnode . . . . . .. 177
Propriedades de samplenode . . . . . . .. 108 Propriedades de discriminantnode . . . . .. 179
Propriedades de selectnode . . . . . . . .. 110 Propriedades de factornode . . . . . . .. 180
Propriedades de sortnode . . . . . . . .. 110 Propriedades de featureselectionnode . . . .. 182
Propriedades de streamingts . . . . . . .. 110 Propriedades de genlinnode . . . . . . .. 183
Propriedades de glmmnode . . . . . . .. 187
Propriedades gle . . . . . . . . . . .. 190
Captulo 11. Propriedades do N de
Propriedades de kmeansnode . . . . . . .. 195
Operaes de Campo . . . . . . .. 115 Propriedades de knnnode . . . . . . . .. 196
Propriedades de anonymizenode . . . . . .. 115 Propriedades de kohonennode . . . . . .. 198
Propriedades de autodataprepnode . . . . .. 116 Propriedades de linearnode . . . . . . .. 199
Propriedades de astimeintervalsnode . . . .. 119 Propriedades de linearasnode . . . . . . .. 200
Propriedades de binningnode . . . . . . .. 119 Propriedades de logregnode . . . . . . .. 201
Propriedades de derivenode . . . . . . .. 122 Propriedades de lsvmnode . . . . . . . .. 205
Propriedades de ensemblenode . . . . . .. 124 Propriedades de neuralnetnode . . . . . .. 206
Propriedadades de fillernode . . . . . . .. 125 Propriedades de neuralnetworknode . . . .. 208
Propriedades de filternode . . . . . . . .. 125 Propriedades de questnode . . . . . . . .. 210
Propriedades de historynode . . . . . . .. 126 Propriedades de randomtrees . . . . . . .. 212
Propriedades de partitionnode. . . . . . .. 127 Propriedades de regressionnode . . . . . .. 213
Propriedades de reclassifynode . . . . . .. 128 Propriedades de sequencenode . . . . . .. 215
Propriedades de reordernode . . . . . . .. 129 Propriedades de slrmnode . . . . . . . .. 216
Propriedades de reprojectnode. . . . . . .. 129 Propriedades de statisticsmodelnode . . . .. 217
Propriedades de restructurenode . . . . . .. 130 Propriedades de stpnode . . . . . . . .. 217
Propriedades de rfmanalysisnode. . . . . .. 130 Propriedades de svmnode . . . . . . . .. 221
Propriedades de settoflagnode. . . . . . .. 131 Propriedades de tcmnode . . . . . . . .. 222
Propriedades de statisticstransformnode . . .. 132 Propriedades de timeseriesnode . . . . . .. 226

iv Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de treeas . . . . . . . . .. 228 Propriedades de Nugget do Modelo do IBM
Propriedades de twostepnode . . . . . . .. 230 DB2 . . . . . . . . . . . . . .. 263
Propriedades de twostepAS . . . . . . .. 231 Propriedades do N de Modelagem para IBM
Netezza Analytics . . . . . . . . . . .. 264
Captulo 14. Propriedades do N de Propriedades do N de Modelagem Netezza 264
Nugget do Modelo . . . . . . . .. 233 Propriedades de Nugget do Modelo Netezza 274
Propriedades de applyanomalydetectionnode. .. 233
Propriedades de applyapriorinode . . . . .. 233 Captulo 16. Propriedades do N de
Propriedades de applyassociationrulesnode . .. 234 Sada . . . . . . . . . . . . . .. 275
Propriedades de applyautoclassifiernode . . .. 234 Propriedades de analysisnode . . . . . . .. 275
Propriedades de applyautoclusternode . . . .. 235 Propriedades de dataauditnode . . . . . .. 276
Propriedades de applyautonumericnode . . .. 235 Propriedades de matrixnode . . . . . . .. 277
Propriedades de applybayesnetnode. . . . .. 235 Propriedades de meansnode . . . . . . .. 279
Propriedades de applyc50node . . . . . .. 236 Propriedades de reportnode . . . . . . .. 281
Propriedades de applycarmanode . . . . .. 236 Propriedades de routputnode . . . . . . .. 281
Propriedades de applycartnode . . . . . .. 236 Propriedades de setglobalsnode . . . . . .. 282
Propriedades de applychaidnode . . . . . .. 237 Propriedades de simevalnode . . . . . . .. 283
Propriedades de applycoxregnode . . . . .. 237 Propriedades de simfitnode . . . . . . .. 283
Propriedades de applydecisionlistnode . . . .. 237 Propriedades de statisticsnode. . . . . . .. 284
Propriedades de applydiscriminantnode . . .. 238 Propriedades de statisticsoutputnode . . . .. 285
Propriedades de applyfactornode . . . . . .. 238 Propriedades de tablenode . . . . . . . .. 285
Propriedades de applyfeatureselectionnode . .. 238 Propriedades de transformnode . . . . . .. 287
Propriedades de applygeneralizedlinearnode . .. 238
Propriedades de applyglmmnode. . . . . .. 239 Captulo 17. Propriedades do N de
Propriedades applygle . . . . . . . . .. 239 Exportao . . . . . . . . . . .. 289
Propriedades de applykmeansnode . . . . .. 239
Propriedades Comuns do N Exportao . . .. 289
Propriedades de applyknnnode . . . . . .. 240
Propriedades de asexport . . . . . . . .. 289
Propriedades de applykohonennode . . . . .. 240
Propriedades de cognosexportnode . . . . .. 289
Propriedades de applylinearnode . . . . . .. 240
Propriedades de databaseexportnode . . . .. 291
Propriedades de applylinearasnode . . . . .. 240
Propriedades de datacollectionexportnode . . .. 295
Propriedades de applylogregnode . . . . .. 240
Propriedades de excelexportnode . . . . . .. 295
Propriedades de applylsvmnode . . . . . .. 241
Propriedades de outputfilenode . . . . . .. 296
Propriedades de applyneuralnetnode . . . .. 241
Propriedades de sasexportnode . . . . . .. 297
Propriedades de applyneuralnetworknode. . .. 241
Propriedades de statisticsexportnode . . . .. 297
Propriedades de applyquestnode . . . . . .. 242
Propriedades do N tm1export . . . . . .. 298
Propriedades de applyr . . . . . . . . .. 242
Propriedades de xmlexportnode . . . . . .. 299
Propriedades de applyrandomtrees . . . . .. 243
Propriedades de applyregressionnode . . . .. 243
Propriedades de applyselflearningnode . . . .. 243 Captulo 18. Propriedades do N do
Propriedades de applysequencenode . . . .. 244 IBM SPSS Statistics . . . . . . .. 301
Propriedades de applysvmnode . . . . . .. 244 Propriedades de statisticsimportnode . . . .. 301
Propriedades de applystpnode . . . . . .. 244 Propriedades de statisticstransformnode . . .. 301
Propriedades de applytcmnode . . . . . .. 244 Propriedades de statisticsmodelnode . . . .. 302
Propriedades de applytimeseriesnode . . . .. 245 Propriedades de statisticsoutputnode . . . .. 302
Propriedades de applytreeas . . . . . . .. 245 Propriedades de statisticsexportnode . . . .. 303
Propriedades de applytwostepnode . . . . .. 245
Propriedades de applytwostepAS. . . . . .. 245 Captulo 19. Propriedades do
SuperNode . . . . . . . . . . .. 305
Captulo 15. Propriedades do N de
Modelagem de Banco de Dados . .. 247 Apndice A. Referncia de nomes de
Propriedades do N de Modelagem para Microsoft 247 ns. . . . . . . . . . . . . . .. 307
Propriedades do N de Modelagem Microsoft 247 Nomes do Nugget do Modelo . . . . . . .. 307
Propriedades de Nugget do Modelo da Evitando Nomes de Modelos Duplicados . . .. 309
Microsoft . . . . . . . . . . . . .. 249 Nomes do Tipo de Sada . . . . . . . .. 309
Propriedades do N de Modelagem para Oracle 251
Propriedades do N de Modelagem Oracle .. 251
Propriedades de Nugget do Modelo da Oracle 256
Apndice B. Migrando do script
Propriedades do N de Modelagem para o IBM legado para o script Pythong . . .. 311
DB2 . . . . . . . . . . . . . . .. 257 Viso geral de migrao de script de legado . .. 311
Propriedades do N de Modelagem IBM DB2 257 Diferenas gerais . . . . . . . . . . .. 311

ndice v
O contexto de script . . . . . . . . . .. 311 Acessando objetos por meio do sistema de
Comandos e funes . . . . . . . . . .. 311 arquivos e do repositrio . . . . . . . .. 318
Literais e comentrios . . . . . . . . .. 312 Operaes de fluxo . . . . . . . . .. 318
Operadores . . . . . . . . . . . . .. 312 Operaes de modelo . . . . . . . .. 319
Condicionais e Loop . . . . . . . . . .. 313 Operaes de sada do documento . . . .. 319
Variveis . . . . . . . . . . . . . .. 314 Outras diferenas entre script legado e script
Tipos de n, de sada e de modelo . . . . .. 314 Python . . . . . . . . . . . . . .. 319
Nomes de propriedades . . . . . . . . .. 314
Referncias do N . . . . . . . . . . .. 314 Avisos . . . . . . . . . . . . .. 321
Obtendo e configurando propriedades . . . .. 315 Marcas comerciais . . . . . . . . . . .. 322
Editando fluxos . . . . . . . . . . .. 315
Operaes do n . . . . . . . . . .. 316
ndice Remissivo . . . . . . . . .. 325
Executando Loop . . . . . . . . . . .. 316
Executando fluxos . . . . . . . . . . .. 317

vi Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Captulo 1. Script e a Linguagem de Script
Viso Geral de Script
A criao de script no IBM SPSS Modeler uma ferramenta poderosa para automatizar processos na
interface com o usurio. Os scripts podem executar os mesmos tipos de aes que podem ser executadas
com o mouse ou teclado e podem ser utilizados para automatizar tarefas que seriam altamente repetitivas
ou que demorariam muito tempo para serem executadas manualmente.

possvel utilizar scripts para:


v Impor uma ordem especfica s execues de n em um fluxo.
v Configurar propriedades para um n, bem como executar derivaes utilizando um subconjunto de
CLEM (Linguagem de Controle para Manipulao de Expresso).
v Especificar uma sequncia de aes automtica que normalmente envolve interao do usurio, por
exemplo, possvel construir um modelo e, em seguida, test-lo.
v Configurar processos complexos que requerem interao com o usurio substancial, por exemplo,
procedimentos de validao cruzada que requerem gerao e teste de modelo repetitivos.
v Configurar processos que manipulam fluxos, por exemplo, possvel selecionar um fluxo de
treinamento do modelo, execut-lo e produzir o fluxo de teste de modelo correspondente
automaticamente.

Este captulo fornece descries de alto nvel e exemplos de scripts de nvel de fluxo, scripts
independentes e scripts em SuperNodes na interface do IBM SPSS Modeler. Mais informaes sobre a
linguagem de script, sintaxe e comandos so fornecidas nos captulos que se seguem.

Nota: No possvel importar e executar os scripts criados no IBM SPSS Statistics no IBM SPSS Modeler.

Tipos de Scripts
O IBM SPSS Modeler utiliza trs tipos de scripts:
v Os Scripts de fluxo so armazenados como uma propriedade de fluxo e, portanto, so salvos e
carregados com um fluxo especfico. Por exemplo, possvel gravar um script de fluxo que automatiza
o processo de treinamento e aplicao de um nugget do modelo. Tambm possvel especificar que,
sempre que um fluxo especfico for executado, o script dever ser executado ao invs do contedo da
tela do fluxo.
v Os Scripts independentes no esto associados a nenhum fluxo especfico e so salvos em arquivos
de texto externos. possvel utilizar um script independente, por exemplo, para manipular diversos
fluxos juntos.
v Os scripts de SuperNode so armazenados como uma propriedade fluxo de SuperNode. Os scripts de
SuperNode esto disponveis apenas nos SuperNodes de terminal. possvel utilizar um script
SuperNode para controlar a sequncia de execuo do contedo do SuperNode. Para SuperNodes de
no terminal, (origem ou processo), possvel definir propriedades para o SuperNode ou para os ns
que ele contiver em seu script de fluxo diretamente.

Scripts de Fluxo
Os scripts podem ser utilizados para customizar operaes dentro de um fluxo especfico e so salvos
com esse fluxo. Os scripts de fluxo podem ser usados para especificar uma ordem de execuo especfica
para os ns terminais em um fluxo. Utilize a caixa de dilogo do script de fluxo para editar o script que
salvo com o fluxo atual.

Copyright IBM Corporation 1994, 2015 1


Para acessar a guia de script de fluxo na caixa de dilogo Propriedades do Fluxo:
1. No menu Ferramentas, escolha:
Propriedades do Fluxo > Execuo
2. Clique na guia Execuo para trabalhar com scripts para o fluxo atual.

Os cones da barra de ferramentas na parte superior da caixa de dilogo de script de fluxo permitem
executar as operaes a seguir:
v Importar o contedo de um script independente pr-existente na janela.
v Salvar um script como um arquivo de texto.
v Imprimir um script.
v Anexar script padro.
v Editar um script (desfazer, recortar, copiar, colar e outras funes comuns de edio).
v Executar o script atual inteiro.
v Execute as linhas selecionadas a partir de um script.
v Parar um script durante a execuo. (Este cone ativado apenas quando um script estiver em
execuo).
v Verificar a sintaxe do script e, se quaisquer erros forem localizados, exibi-los para reviso no painel
inferior da caixa de dilogo.

A partir da verso 16.0, o SPSS Modeler utiliza a linguagem de script Python. Todas as verses anteriores
a esta usavam uma linguagem de script exclusiva para o SPSS Modeler, agora referida como script
Legacy. Dependendo do tipo de script com o qual voc estiver trabalhando, na guia Execuo, selecione o
modo de execuo Padro (script opcional) e, em seguida, selecione Python ou Legacy.

Alm disso, possvel especificar se esse script deve ou no ser executado quando o fluxo for executado.
possvel selecionar Executar este script para executar o script toda vez em que o fluxo for executado,
respeitando a ordem de execuo do script. Essa configurao fornece automao no nvel do fluxo para
uma construo de modelo mais rpida. No entanto, a configurao padro ignorar este script durante
a execuo de fluxo. Mesmo se voc selecionar a opo Ignorar este script, o script sempre poder ser
executado diretamente a partir dessa caixa de dilogo.

O editor de script inclui os recursos a seguir que ajudam na criao de script:


v Destaque da sintaxe; palavras-chave, valores literais (como sequncias e nmeros) e comentrios so
destacados.
v Numerao de linha.
v Correspondncia do bloco; quando o cursor colocado no incio de um bloco do programa, o bloco
final correspondente tambm destacado.
v Concluso automtica sugerida.

As cores e estilos de texto utilizados pelo marcador de sintaxe podem ser customizados utilizando as
preferncias de exibio do IBM SPSS Modeler. possvel acessar as preferncias de exibio escolhendo
Ferramentas > Opes > Opes do Usurio e clicando na guia Sintaxe.

Uma lista de preenchimentos de sintaxe sugeridos pode ser acessada selecionando Sugesto Automtica
no menu de contexto ou pressionando Ctrl + Espao. Utilize as teclas de cursor para mover a lista para
cima e para baixo e, em seguida, pressione Enter para inserir o texto selecionado. Pressione Esc para sair
do modo de sugesto automtica sem modificar o texto existente.

A guia Depurao exibe mensagens de depurao e pode ser utilizada para avaliar o estado do script
quando o script tiver sido executado. A guia Depurao consiste em uma rea de texto somente leitura e
em um campo de texto de entrada de linha nica. A rea de texto exibe o texto que enviado para a
sada padro ou para o erro padro pelos scripts, por exemplo, por meio do texto da mensagem de erro.

2 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


O campo de texto de entrada aceita entrada do usurio. Esta entrada ento avaliada dentro do contexto
do script que foi executado mais recentemente no dilogo (conhecido como contexto de script). A rea de
texto contm o comando e a sada resultante para que o usurio possa ver um rastreio de comandos. O
campo de texto de entrada sempre contm o prompt de comandos (--> para script legado).

Um novo contexto de script criado nas circunstncias a seguir:


v Um script executado utilizando o boto Executar este script ou o boto Executar linhas
selecionadas.
v A linguagem de script alterada.

Se um novo contexto de script for criado, a rea de texto ser limpa.

Nota: Executar um fluxo fora do painel de script no modificar o contexto de script do painel de script.
Os valores de quaisquer variveis criadas como parte dessa execuo no estaro visveis dentro do
dilogo do script.

Exemplo de Script de Fluxo: Treinando uma Rede Neural


Um fluxo pode ser utilizado para treinar um modelo de rede neural quando executado. Normalmente,
para testar o modelo, possvel executar o n de modelagem para incluir o modelo no fluxo, fazer as
conexes apropriadas e executar um n Anlise.

Usando um script IBM SPSS Modeler, possvel automatizar o processo de teste do nugget do modelo
aps cri-lo. Por exemplo, o script de fluxo a seguir para testar o fluxo de demo druglearn.str (disponvel
na pasta /Demos/streams/ em sua instalao do IBM SPSS Modeler) pode ser executado a partir do dilogo
Propriedades do Fluxo (Ferramentas > Propriedades do Fluxo > Script):
stream = modeler.script.stream()
neuralnetnode = stream.findByType("neuralnetwork", None)
results = []
neuralnetnode.run(results)
appliernode = stream.createModelApplierAt(results[0], "Drug", 594, 187)
analysisnode = stream.createAt("analysis", "Drug", 688, 187)
typenode = stream.findByType("type", None)
stream.linkBetween(appliernode, typenode, analysisnode)
analysisnode.run([])

Os marcadores a seguir descrevem cada linha neste exemplo de script.


v A primeira linha define uma varivel que aponta para o fluxo atual.
v Na linha 2, o script localiza o n construtor Rede Neural.
v Na linha 3, o script cria uma lista onde os resultados da execuo podem ser armazenados.
v Na linha 4, o nugget do modelo de Rede Neural criado. Ele armazenado na lista definida na linha
3.
v Na linha 5, um n de aplicao de modelo criado para o nugget do modelo e colocado na tela do
fluxo.
v Na linha 6, um n de anlise chamado Drug criado.
v Na linha 7, o script localiza o n Tipo.
v Na linha 8, o script conecta o n de aplicao de modelo criado na linha 5 entre o n Tipo e o n
Anlise.
v Finalmente, o n Anlise executado para produzir o relatrio Anlise.

possvel utilizar um script para construir e executar um fluxo desde o incio, comeando com uma tela
em branco. Para aprender mais sobre a linguagem de script em geral, consulte Viso Geral de Linguagem
de Script.

Captulo 1. Script e a Linguagem de Script 3


Scripts Independentes
A caixa de dilogo Script Independente utilizada para criar ou editar um script que salvo como um
arquivo de texto. Ela exibe o nome do arquivo e fornece recursos para carregar, salvar, importar e
executar os scripts.

Para acessar a caixa de dilogo de script independente:

No menu principal, escolha:

Ferramentas > Script Independente

As mesmas opes de verificao de barra de ferramentas e de sintaxe de script esto disponveis tanto
para scripts independentes quanto para scripts de fluxo. Consulte o tpico Scripts de Fluxo na pgina 1
para obter mais informaes.

Exemplo de Script Independente: Salvando e Carregando um Modelo


Os scripts independentes so teis para manipulao de fluxo. Suponha que voc tenha dois fluxos um
que cria um modelo e outro que utiliza grficos para explorar o conjunto de regras gerado a partir do
primeiro fluxo com campos de dados existentes. Um script independente para este cenrio pode ser
semelhante a este:
taskrunner = modeler.script.session().getTaskRunner()

# Modify this to the correct Modeler installation Demos folder.


# Note use of forward slash and trailing slash.
installation = "C:/Program Files/IBM/SPSS/Modeler/16/Demos/"

# First load the model builder stream from file and build a model
druglearn_stream = taskrunner.openStreamFromFile(installation + "streams/druglearn.str", True)
results = []
druglearn_stream.findByType("c50", None).run(results)

# Save the model to file


taskrunner.saveModelToFile(results[0], "rule.gm")

# Now load the plot stream, read the model from file and insert it into the stream
drugplot_stream = taskrunner.openStreamFromFile(installation + "streams/drugplot.str", True)
model = taskrunner.openModelFromFile("rule.gm", True)
modelapplier = drugplot_stream.createModelApplier(model, "Drug")

# Now find the plot node, disconnect it and connect the


# model applier node between the derive node and the plot node
derivenode = drugplot_stream.findByType("derive", None)
plotnode = drugplot_stream.findByType("plot", None)
drugplot_stream.disconnect(plotnode)
modelapplier.setPositionBetween(derivenode, plotnode)
drugplot_stream.linkBetween(modelapplier, derivenode, plotnode)
plotnode.setPropertyValue("color_field", "$C-Drug")
plotnode.run([])

Nota: Para aprender mais sobre a linguagem de script em geral, consulte Viso Geral de Linguagem de
Script.

Exemplo de Script Independente: Gerando um Modelo de Seleo de


Varivel
Iniciando com uma tela em branco, esse exemplo constri um fluxo que gera um modelo de Seleo de
Varivel, aplica o modelo e cria uma tabela que lista os 15 campos mais importantes com relao ao
destino especificado.
stream = modeler.script.session().createProcessorStream("featureselection", True)

statisticsimportnode = stream.createAt("statisticsimport", "Statistics File", 150, 97)


statisticsimportnode.setPropertyValue("full_filename", "$CLEO_DEMOS/customer_dbase.sav")

typenode = stream.createAt("type", "Type", 258, 97)


typenode.setKeyedPropertyValue("direction", "response_01", "Target")

4 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


featureselectionnode = stream.createAt("featureselection", "Feature Selection", 366, 97)
featureselectionnode.setPropertyValue("top_n", 15)
featureselectionnode.setPropertyValue("max_missing_values", 80.0)
featureselectionnode.setPropertyValue("selection_mode", "TopN")
featureselectionnode.setPropertyValue("important_label", "Check Me Out!")
featureselectionnode.setPropertyValue("criteria", "Likelihood")

stream.link(statisticsimportnode, typenode)
stream.link(typenode, featureselectionnode)
models = []
featureselectionnode.run(models)

# Assumes the stream automatically places model apply nodes in the stream
applynode = stream.findByType("applyfeatureselection", None)
tablenode = stream.createAt("table", "Table", applynode.getXPosition() + 96, applynode.getYPosition())
stream.link(applynode, tablenode)
tablenode.run([])

O script cria um n de origem para ler nos dados, utiliza um n Tipo para configurar a funo (direo)
para o campo response_01 para Target e, em seguida, cria e executa um N de Varivel. O script
tambm conecta os ns e posiciona cada um na tela do fluxo para produzir um layout legvel. O nugget
do modelo resultante ento conectado a um n Tabela que lista os 15 campos mais importantes,
conforme determinado pelas propriedades selection_mode e top_n. Consulte o tpico Propriedades de
featureselectionnode na pgina 182 para obter mais informaes.

Scripts SuperNode
possvel criar e salvar os scripts em quaisquer SuperNodes de terminal utilizando a linguagem de
script do IBM SPSS Modeler. Esses scripts esto disponveis apenas para os SuperNodes de terminal e so
geralmente utilizados quando criar fluxos de modelo ou para impor uma ordem de execuo especial ao
contedo do SuperNode. Os scripts SuperNode tambm permitem ter mais de um script em execuo
dentro de um fluxo.

Por exemplo, suponha que voc precise especificar a ordem de execuo para um fluxo complexo e seu
SuperNode contm vrios ns que incluem um n SetGlobals, que precisa ser executado antes de obter
um novo campo utilizado em um n Grfico. Neste caso, possvel criar um script SuperNode que
executa o n SetGlobals primeiro. Em seguida, os valores calculados por este n, como o desvio mdio ou
padro, podero ser utilizados quando o n Grfico for executado.

Em um script SuperNode, possvel especificar propriedades do n da mesma maneira que outros


scripts. Como alternativa, possvel alterar e definir as propriedades para qualquer SuperNode ou seus
ns encapsulados diretamente a partir de um script de fluxo. Consulte o tpico Captulo 19,
Propriedades do SuperNode, na pgina 305 para obter mais informaes. Este mtodo funciona para
SuperNodes de origem e de processo, bem como para SuperNodes de terminal.

Nota: Como apenas SuperNodes de terminal podem executar seus prprios scripts, a guia Scripts da caixa
de dilogo SuperNode est disponvel apenas para SuperNodes de terminal.

Para abrir a caixa de dilogo do script SuperNode a partir da tela principal:

Selecione um SuperNode de terminal na tela de fluxo e, a partir do menu SuperNode, escolha:

Script SuperNode...

Para abrir a caixa de dilogo do script SuperNode a partir da tela do SuperNode com zoom aumentado:

Clique com o boto direito na tela SuperNode e, no menu de contexto, escolha:

Script SuperNode...

Captulo 1. Script e a Linguagem de Script 5


Exemplo de Script SuperNode
O script SuperNode a seguir declara a ordem na qual os ns terminais devem ser executados dentro do
SuperNode. Essa ordem assegura que o n Configurar Globais seja executado primeiro para que os
valores calculados por este n possam ento ser utilizados quando outro n for executado.
execute Set Globals
execute gains
execute profit
execute age v. $CC-pep
execute Table

Executando loop e execuo condicional em fluxos


A partir da verso 16.0, o SPSS Modeler permite criar alguns scripts bsicos a partir de dentro de um
fluxo ao selecionar valores em vrias caixas de dilogo ao invs de ter que gravar instrues diretamente
na linguagem de script. Os dois tipos principais de scripts que podem ser criados dessa forma so loops
simples e uma maneira de executar ns se uma condio tiver sido atendida.

possvel combinar ambas as regras de execuo de loop e condicional dentro de um fluxo. Por exemplo,
possvel ter dados relativos a vendas de carros de fabricantes do mundo todo. possvel configurar um
loop para processar os dados em um fluxo, identificar detalhes pelo pas do fabricante e gerar os dados
para diferentes grficos mostrando detalhes como o volume de vendas por modelo, nveis de emisses
por fabricante e tamanho do motor, e assim por diante. Se voc desejar analisar apenas informaes
europeias, tambm possvel incluir condies no loop para impedir que sejam criados grficos de
fabricantes baseados nas Amricas e sia.

Nota: Como as execues de loop e condicional baseiam-se em scripts de histrico, elas se aplicaro a um
fluxo inteiro somente quando ele for executado.
v Loop possvel utilizar loop para automatizar tarefas repetitivas. Por exemplo, isso pode significar
incluir um determinado nmero de ns em um fluxo e alterar um parmetro de n todas as vezes.
Como alternativa, possvel controlar a execuo de um fluxo ou ramificao muitas outras vezes
mais, como nos exemplos a seguir:
Executar o fluxo em um determinado nmero de vezes e alterar a origem todas as vezes.
Executar o fluxo em um determinado nmero de vezes, alterando o valor de uma varivel todas as
vezes.
Executar o fluxo em um determinado nmero de vezes, inserindo um campo extra em cada
execuo.
Construir um modelo em um determinado nmero de vezes e alterar a configurao do modelo
todas as vezes.
v Execuo Condicional possvel utilizar esta opo para controlar como os ns terminais so
executados com base nas condies que voc predefinir, como nos exemplos a seguir:
Com base em se um determinado valor true ou false, controlar se um n ser executado.
Defina se um loop de ns ser executado em paralelo ou sequencialmente.

Ambas as execues de loop e condicional so configuradas na guia Execuo dentro da caixa de dilogo
Propriedades do Fluxo. Todos os ns que forem utilizados nos requisitos condicional ou de loop so
mostrados com um smbolo adicional anexado a eles na tela do fluxo para indicar que fazem parte das
execues de loop e condicional.

possvel acessar a guia Execuo de uma das 3 maneiras:


v Utilizando os menus na parte superior da caixa de dilogo principal:
1. No menu Ferramentas, escolha:
Propriedades do Fluxo > Execuo
2. Clique na guia Execuo para trabalhar com scripts para o fluxo atual.

6 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


v De dentro de um fluxo:
1. Clique com o boto direito em um n e escolha Execuo de Loop/Condicional.
2. Selecione a opo de submenu relevante.
v Na barra de ferramentas grficas na parte superior da caixa de dilogo principal, clique no cone de
propriedades do fluxo.

Se estiver configurando pela primeira vez os detalhes de execuo de loop ou condicional, selecione o
modo de execuo Execuo de Loop/Condicional na guia Execuo e, em seguida, selecione a subguia
Condicional ou Loop.

Executando loop em fluxos


Com o loop, possvel automatizar tarefas repetitivas em fluxos; exemplos podem incluir o seguinte:
v Executar o fluxo em um determinado nmero de vezes e alterar a origem todas as vezes.
v Executar o fluxo em um determinado nmero de vezes, alterando o valor de uma varivel todas as
vezes.
v Executar o fluxo em um determinado nmero de vezes, inserindo um campo extra em cada execuo.
v Construir um modelo em um determinado nmero de vezes e alterar a configurao do modelo todas
as vezes.

Configure as condies a serem atendidas na subguia Loop da guia Execuo do fluxo. Para exibir a
subguia, selecione o modo de execuo Execuo de Loop/Condicional.

Quaisquer requisitos de execuo de loop que voc definir entraro em vigor ao executar o fluxo, se o
modo de execuo Execuo de Loop/Condicional foi configurado. Opcionalmente, possvel gerar o
cdigo de script para seus requisitos de execuo de loop e col-lo no editor de script clicando em
Colar... no canto inferior direito da subguia Executar Loop; a exibio da guia Execuo principal
alterada para mostrar o modo de execuo Padro (script opcional) com o script na parte superior da
guia. Isso significa que possvel definir uma estrutura de execuo de loop utilizando as vrias opes
da caixa de dilogo de loop antes de gerar um script que poder ser customizado posteriormente no
editor de script. Observe que quando voc clica em Colar..., quaisquer requisitos de execuo condicional
definidos tambm sero exibidos no script gerado.

Importante: As variveis de loop que voc configurar em um fluxo do SPSS Modeler podero ser
substitudas se executar o fluxo em uma tarefa do IBM SPSS Collaboration and Deployment Services. Isso
ocorre porque a entrada do editor de tarefas do IBM SPSS Collaboration and Deployment Services
substitui a entrada do SPSS Modeler. Por exemplo, se voc configurar uma varivel de loop no fluxo para
criar um nome de arquivo de sada diferente para cada loop, os arquivos sero nomeados corretamente
no SPSS Modeler, porm sero substitudos pela entrada fixa inserida na guia Resultado do IBM SPSS
Collaboration and Deployment Services Deployment Manager.

Para configurar um loop:


1. Crie uma chave de iterao para definir a estrutura de loop principal a ser executada em um fluxo.
Consulte Crie uma chave de iterao para obter mais informaes.
2. Onde necessrio, defina uma ou mais variveis de iterao. Consulte Criar uma varivel de iterao
para obter mais informaes.
3. As iteraes e quaisquer variveis criadas so mostradas no corpo principal da subguia. Por padro,
as iteraes so executadas na ordem em que aparecem; para mover uma iterao para cima ou para
baixo na lista, clique nela para selecion-la e, em seguida, utilize a seta para cima ou para baixo na
coluna direita da subguia para alterar a ordem.

Criando uma chave de iterao para loop em fluxos


Utilize uma chave de iterao para definir a estrutura de loop principal a ser realizada em um fluxo. Por
exemplo, se estiver analisando vendas de automveis, ser possvel criar um parmetro de fluxo Pas de

Captulo 1. Script e a Linguagem de Script 7


fabricao e utilizar isso como a chave de iterao; quando o fluxo executado, essa chave configurada
para cada valor de pas diferente em seus dados durante cada iterao. Utilize a caixa de dilogo Definir
Chave de Iterao para configurar a chave.

Para abrir a caixa de dilogo, selecione o boto Chave de Iterao ... no canto inferior esquerdo da
subguia Loop ou clique com o boto direito em qualquer n no fluxo e selecione Execuo de
Loop/Condicional > Definir Chave de Iterao (Campos) ou Execuo de Loop/Condicional > Definir
Chave de Iterao (Valores). Se voc abrir a caixa de dilogo a partir do fluxo, alguns dos campos
podero ser preenchidos automaticamente, como o nome do n.

Para configurar uma chave de iterao, preencha os campos a seguir:

Iterar em. possvel selecionar uma das opes a seguir:


v Parmetro do Fluxo - Campos. Utilize esta opo para criar um loop que configura o valor de um
parmetro de fluxo existente para cada campo especificado por vez.
v Parmetro de Fluxo Valores. Utilize esta opo para criar um loop que configura o valor de um
parmetro de fluxo existente para cada valor especificado por vez.
v Propriedade do N Campos. Utilize esta opo para criar um loop que configura o valor de uma
propriedade do n para cada campo especificado por vez.
v Propriedade do N Valores. Utilize esta opo para criar um loop que configura o valor de uma
propriedade do n para cada valor especificado por vez.

O Que Configurar. Escolha o item que ter seu valor configurado toda vez que o loop for executado.
possvel selecionar uma das opes a seguir:
v Parmetro. Disponvel apenas se selecionar Parmetro de Fluxo Campos ou Parmetro de Fluxo
Valores. Selecione o parmetro necessrio na lista disponvel.
v N. Disponvel apenas se selecionar Propriedade do N Campos ou Propriedade do N Valores.
Selecione o n para o qual deseja configurar um loop. Clique no boto Navegar para abrir o dilogo
Selecionar N e escolha o n desejado; se houver muitos ns listados, tambm ser possvel filtrar a
exibio para mostrar apenas determinados tipos de ns selecionando uma das seguintes categorias:
ns de Origem, Processo, Grfico, Modelagem, Sada, Exportar ou Aplicar Modelo de ns.
v Propriedade. Disponvel apenas se selecionar Propriedade do N Campos ou Propriedade do N
Valores. Selecione a propriedade do n na lista disponvel.

Campos para Usar. Disponvel apenas se selecionar Parmetro de Fluxo Campos ou Parmetro de
Fluxo Valores. Escolha o campo, ou campos, dentro de um n a serem utilizados para fornecer os
valores de iterao. possvel selecionar uma das opes a seguir:
v N. Disponvel apenas se selecionar Parmetro de Fluxo Campos. Selecione o n que contm os
detalhes para os quais deseja configurar um loop. Clique no boto Navegar para abrir o dilogo
Selecionar N e escolha o n desejado; se houver muitos ns listados, tambm ser possvel filtrar a
exibio para mostrar apenas determinados tipos de ns selecionando uma das seguintes categorias:
ns de Origem, Processo, Grfico, Modelagem, Sada, Exportar ou Aplicar Modelo de ns.
v Lista de Campo. Clique no boto de lista na coluna direita para exibir a caixa de dilogo Selecionar
Campos, na qual voc seleciona os campos no n para fornecer os dados de iterao. Consulte
Selecionando campos para iteraes na pgina 9 para obter mais informaes.

Valores para Usar. Disponvel apenas se selecionar Parmetro de Fluxo Valores ou Propriedade do N
Valores. Escolha o valor, ou valores, dentro do campo selecionado a serem utilizados como valores de
iterao. possvel selecionar uma das opes a seguir:
v N. Disponvel apenas se selecionar Parmetro de Fluxo Valores. Selecione o n que contm os
detalhes para os quais deseja configurar um loop. Clique no boto Navegar para abrir o dilogo
Selecionar N e escolha o n desejado; se houver muitos ns listados, tambm ser possvel filtrar a

8 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


exibio para mostrar apenas determinados tipos de ns selecionando uma das seguintes categorias:
ns de Origem, Processo, Grfico, Modelagem, Sada, Exportar ou Aplicar Modelo de ns.
v Lista de Campo. Selecione o campo no n para fornecer os dados de iterao.
v Lista de Valores. Clique no boto de lista na coluna direita para exibir a caixa de dilogo Selecionar
Valores, na qual voc seleciona os valores no campo para fornecer os dados de iterao.

Criando uma varivel de iterao para loop em fluxos


possvel utilizar variveis de iterao para alterar os valores de parmetros ou de propriedades de
fluxos de ns selecionados em um fluxo sempre que um loop for executado. Por exemplo, se seu loop de
fluxo estiver analisando os dados de vendas de automveis e utilizando Pas de fabricao como a chave
de iterao, voc poder ter uma sada de grfico mostrando as vendas por modelo e outra sada de
grfico mostrando informaes sobre emisses de gases de escape. Nesses casos, possvel criar variveis
de iterao que criar novos ttulos para os grficos resultantes, como Emisses de veculos suecos e Vendas de
automveis japoneses por modelo. Utilize a caixa de dilogo Definir Varivel de Iterao para configurar
todas as variveis que precisar.

Para abrir a caixa de dilogo, selecione o boto Incluir Varivel... no canto inferior esquerdo da subguia
Loop ou clique com o boto direito em qualquer n no fluxo e selecione: Execuo de Loop/Condicional
> Definir Varivel de Iterao.

Para configurar uma varivel de iterao, preencha os campos a seguir:

Alterar. Selecione o tipo de atributo que deseja corrigir. possvel escolher a partir de Parmetro de
Fluxo ou Propriedade do N.
v Se voc selecionar Parmetro de Fluxo, escolha o parmetro necessrio e, em seguida, utilizando uma
das opes a seguir, se disponvel em seu fluxo, defina o valor para o qual esse parmetro dever ser
configurado com cada iterao do loop:
Varivel global. Selecione a varivel global para a qual o parmetro de fluxo dever ser
configurado.
Clula de sada da tabela. Para configurar um parmetro de fluxo para ser o valor em uma clula
de sada de tabela, selecione a tabela na lista e insira a Linha e a Coluna a serem utilizadas.
Inserir manualmente. Selecione esta opo se desejar inserir manualmente um valor para esse
parmetro a ser usado em cada iterao. Ao retornar para a subguia Loop, uma nova coluna
criada na qual voc insere o texto necessrio.
v Se voc selecionar Propriedade do N, escolha o n necessrio e uma de suas propriedades e, em
seguida, configure o valor que deseja utilizar para essa propriedade. Configure o novo valor da
propriedade usando uma das seguintes opes:
Independentes. O valor da propriedade usar o valor da chave de iterao. Consulte Criando uma
chave de iterao para loop em fluxos na pgina 7 para obter mais informaes.
Como prefixo para raiz. Utiliza o valor da chave de iterao como um prefixo para o que voc
inserir no campo Raiz.
Como sufixo para raiz. Utiliza o valor da chave de iterao como um sufixo para o que voc inserir
no campo Raiz.
Se voc selecionar qualquer uma das opes de prefixo ou de sufixo, ser solicitado a incluir o texto
adicional no campo Raiz. Por exemplo, se seu valor da chave de iterao for Pas de fabricao e voc
selecionar Como prefixo para raiz, ser possvel inserir vendas por modelo neste campo.

Selecionando campos para iteraes


Ao criar iteraes, possvel selecionar um ou mais campos utilizando a caixa de dilogo Selecionar
Campos.

Classificar por possvel classificar campos disponveis para visualizao selecionando uma das opes
a seguir:

Captulo 1. Script e a Linguagem de Script 9


v Natural Visualize a ordem dos campos conforme eles foram transmitidos para o fluxo de dados no n
atual.
v Nome Utilize a ordem alfabtica para classificar campos para visualizao.
v Tipo Visualize campos classificados pelo seu nvel de medio. Essa opo til quando selecionar
campos com um nvel de medio especfico.

Selecione os campos da lista um por vez ou utilize os mtodos Shift-clique e Ctrl-clique para selecionar
vrios campos. Tambm possvel utilizar os botes abaixo da lista para selecionar grupos de campos
com base em seu nvel de medio, ou para selecionar ou cancelar seleo de todos os campos na tabela.

Observe que os campos disponveis para seleo so filtrados para mostrar apenas os campos que forem
apropriados para o parmetro de fluxo ou propriedade do n que estiver utilizando. Por exemplo, se
estiver utilizando um parmetro de fluxo que tenha um tipo de armazenamento String, apenas os campos
que possurem um tipo de armazenamento String sero mostrados.

Execuo condicional em fluxos


A execuo condicional permite controlar como os ns terminais so executados com base no contedo
do fluxo correspondente s condies que voc definir; exemplos podem incluir o seguinte:
v Com base em se um determinado valor true ou false, controlar se um n ser executado.
v Defina se um loop de ns ser executado em paralelo ou sequencialmente.

Configure as condies a serem atendidas na subguia Condicional da guia Execuo do fluxo. Para exibir
a subguia, selecione o modo de execuo Execuo de Loop/Condicional.

Quaisquer requisitos de execuo condicional que voc definir entraro em vigor ao executar o fluxo, se o
modo de execuo Execuo de Loop/Condicional foi configurado. Opcionalmente, possvel gerar o
cdigo de script para seus requisitos de execuo condicional e col-lo no editor de script clicando em
Colar... no canto inferior direito da subguia Condicional; a exibio da guia Execuo principal alterada
para mostrar o modo de execuo Padro (script opcional) com o script na parte superior da guia. Isso
significa que possvel definir condies utilizando as vrias opes da caixa de dilogo de loop antes de
gerar um script que poder ser customizado posteriormente no editor de script. Observe que quando
voc clica em Colar..., quaisquer requisitos de loop definidos tambm sero exibidos no script gerado.

Para configurar uma condio:

1. Na coluna direita da subguia Condicional, clique no boto Incluir Nova Condio para abrir
a caixa de dilogo Incluir Instruo de Execuo Condicional. Neste dilogo voc especifica a
condio que deve ser atendida para que o n seja executado.
2. Na caixa de dilogo Incluir Instruo de Execuo Condicional, especifique o seguinte:
a. N. Selecione o n para o qual deseja configurar a execuo condicional. Clique no boto Navegar
para abrir o dilogo Selecionar N e escolha o n desejado; se houver muitos ns listados, ser
possvel filtrar a exibio para mostrar ns por uma das seguintes categorias: n Exportar, Grfico,
Modelagem ou Sada.
b. Condio baseada em. Especifique a condio que deve ser atendida para o n a ser executado.
possvel escolher a partir de uma de quatro opes: Parmetro de fluxo, Varivel global, Clula
de sada de tabela ou Sempre true. Os detalhes que forem inseridos na metade inferior da caixa
de dilogo so controlados pela condio que voc escolher.
v Parmetro de fluxo. Selecione o parmetro na lista disponvel e, em seguida, escolha o
Operador para esse parmetro; por exemplo, o operador pode ser More than, Equals, Less than,
Between, e assim por diante. Em seguida, insira o Valor, ou valores mnimo e mximo,
dependendo do operador.

10 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


v Varivel global. Selecione a varivel na lista disponvel; por exemplo, isso pode incluir: Mdia,
Soma, valor Mnimo, valor Mximo ou Desvio padro. Em seguida, selecione o Operador e os
valores necessrios.
v Clula de sada de tabela. Selecione o n de tabela da lista disponvel e, em seguida, escolha a
Linha e a Coluna na tabela. Em seguida, selecione o Operador e os valores necessrios.
v Sempre true. Selecione esta opo se o n tiver que sempre ser executado. Se voc selecionar
essa opo, no haver parmetros adicionais para selecionar.
3. Repita as etapas 1 e 2, sempre que necessrio, at configurar todas as condies que precisar. O n
que voc selecionou e a condio a ser atendida antes que o n seja executado so mostrados no
corpo principal da subguia nas colunas Executar N e Se esta condio for true, respectivamente.
4. Por padro, os ns e as condies so executados na ordem em que eles aparecem; para mover um n
e uma condio para cima ou para baixo na lista, clique nele(a) para selecion-lo(a) e, em seguida,
utilize a seta para cima ou para baixo na coluna direita da subguia para alterar a ordem.

Alm disso, possvel configurar as seguintes opes no final da subguia Condicional:


v Avaliar tudo na ordem. Selecione esta opo para avaliar cada condio na ordem em que elas so
mostradas na subguia. Todos os ns para os quais condies foram localizadas para ser "True" sero
executados quando todas as condies tiverem sido avaliadas.
v Executar um por vez. Disponvel apenas se Avaliar tudo na ordem for selecionado. Selecionar isso
significa que se uma condio for avaliada como "True", o n associado a essa condio ser executado
antes da prxima condio ser avaliada.
v Avaliar at a primeira ocorrncia. Selecionar isto significa que apenas o primeiro n que retornar uma
avaliao "True" das condies especificadas ser executado.

Executando e Interrompendo Scripts


Diversas formas de executar scripts esto disponveis. Por exemplo, no dilogo de script de fluxo ou de
script independente, o boto "Executar este script" executa o script completo:

Figura 1. Boto Executar Este Script

O boto "Executar as linhas selecionadas" executa uma nica linha, ou um bloco de linhas adjacentes, que
voc selecionou no script:

Figura 2. Boto Executar Linhas Selecionadas

possvel executar um script utilizando qualquer um dos mtodos a seguir:


v Clique no boto "Executar este script" ou "Executar linhas selecionadas" em uma caixa de dilogo de
script de fluxo ou de script independente.
v Execute um fluxo em que Executar este script esteja configurado como o mtodo de execuo padro.
v Use o sinalizador -execute na inicializao no modo interativo. Consulte o tpico Utilizando
Argumentos de Linha de Comandos na pgina 61 para obter mais informaes.

Nota: Um script SuperNode executado quando o SuperNode executado, desde que Executar este
script tenha sido selecionado na caixa de dilogo do script SuperNode.

Interrompendo Execuo do Script

Captulo 1. Script e a Linguagem de Script 11


Na caixa de dilogo do script de fluxo, o boto vermelho de parada ativado durante a execuo do
script. Utilizando este boto, possvel abandonar a execuo do script e de qualquer fluxo atual.

Localizar e substituir
A caixa de dilogo Localizar/Substituir est disponvel em locais onde voc edita script ou texto de
expresso, incluindo o editor de script, construtor de expresses do CLEM ou quando voc define um
modelo no n de Relatrio. Durante a edio de texto em qualquer uma dessas reas, pressione Ctrl+F
para acessar a caixa de dilogo, assegurando que o foco do cursor esteja na rea de texto. Se estiver
trabalhando em um n de Preenchimento, por exemplo, possvel acessar a caixa de dilogo a partir de
qualquer uma das reas de texto na guia Configuraes ou do campo de texto no construtor de
expresses.
1. Com o cursor em uma rea de texto, pressione Ctrl+F para acessar a caixa de dilogo
Localizar/Substituir.
2. Insira o texto que deseja procurar ou escolha na lista suspensa de itens procurados recentemente.
3. Insira o texto de substituio, se houver.
4. Clique em Localizar Prximo para iniciar a procura.
5. Clique em Substituir para substituir a seleo atual ou em Substituir Todos para atualizar todas as
instncias ou as selecionadas.
6. A caixa de dilogo fecha aps cada operao. Pressione F3 em qualquer rea de texto para repetir a
ltima operao Localizar ou pressione Ctrl+F para acessar a caixa de dilogo novamente.

Opes de procura

Respeitar maisculas e minsculas. Especifica se a operao Localizar faz distino entre maisculas e
minsculas; por exemplo, se myvar corresponde a myVar. O texto de substituio sempre inserido
exatamente como digitado, independentemente dessa configurao.

Somente palavras inteiras. Especifica se a operao Localizar corresponde ao texto integrado s palavras.
Se for selecionada, por exemplo, uma procura por spider no corresponder a spiderman ou spider-man.

Expresses regulares. Especifica se a sintaxe de expresso regular usada (consulte a prxima seo).
Quando selecionada, a opo Somente palavras inteiras desativada e seu valor ignorado.

Somente texto selecionado. Controla o escopo da procura durante o uso da opo Substituir Todos.

Sintaxe de expresso regular

Expresses regulares permitem procurar caracteres especiais, como guias ou caracteres de nova linha,
classes ou intervalos de caracteres, como de a a d, qualquer dgito ou no dgito e limites, como incio ou
fim de uma linha. Os tipos de expresses a seguir so suportados.
Tabela 1. Correspondncias de caractere.
Caracteres Correspondncias
x O caractere x
\\ O caractere de barra invertida
\0n O caractere com valor octal 0n (0 <= n <= 7)
\0nn O caractere com valor octal 0nn (0 <= n <= 7)
\0mnn O caractere com valor octal 0mnn (0 <= m <= 3, 0 <= n <= 7)
\xhh O caractere com valor hexadecimal 0xhh
\uhhhh O caractere com valor hexadecimal 0xhhhh

12 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 1. Correspondncias de caractere (continuao).
Caracteres Correspondncias
\t O caractere de tabulao ('\u0009')
\n O caractere de nova linha (feed de linha) ('\u000A')
\r O caractere de retorno de linha ('\u000D')
\f O caractere de feed de formulrio ('\u000C')
\a O caractere de alerta (sino) ('\u0007')
\e O caractere de escape ('\u001B')
\cx O caractere de controle correspondente a x

Tabela 2. Classes de caracteres correspondentes.


Classes de caractere Correspondncias
[abc] a, b ou c (classe simples)
[^abc] Qualquer caractere, exceto a, b ou c (subtrao)
[a-zA-Z] a a z ou A a Z, inclusivo (intervalo)
[a-d[m-p]] a a d ou m a p (unio). Alternativamente, poderia ser especificado como
[a-dm-p]
[a-z&&[def]] a a z e d, e ou f (interseco)
[a-z&&[^bc]] a a z, exceto para b e c (subtrao). Alternativamente, poderia ser especificado
como [ad-z]
[a-z&&[^m-p]] a a z, e no m a p (subtrao). Alternativamente, poderia ser especificado como
[a-lq-z]

Tabela 3. Classes de caractere predefinidas.


Classes de caractere predefinidas Correspondncias
. Qualquer caractere (pode ou no corresponder aos terminadores de linha)
\d Qualquer dgito: [0-9]
\D Um no dgito: [^0-9]
\s Um caractere de espao em branco: [ \t\n\x0B\f\r]
\S Um caractere de espao no em branco: [^\s]
\w Um caractere de palavra: [a-zA-Z_0-9]
\W Um caractere de no palavra: [^\w]

Tabela 4. Correspondncias de limite.


Correspondentes de limite Correspondncias
^ O incio de uma linha
$ O fim de uma linha
\b Um limite de palavra
\B Um limite de no palavra
\A O incio da entrada
\Z O fim da entrada, mas para o terminador final, se houver
\z O fim da entrada

Captulo 1. Script e a Linguagem de Script 13


14 Guia de Script e Automao Python do IBM SPSS Modeler 17.1
Captulo 2. A Linguagem de Script
Viso Geral de Linguagem de Script
O recurso de script para o IBM SPSS Modeler permite criar scripts que operam na interface com o
usurio do SPSS Modeler, manipular objetos de sada e executar sintaxe de comando. possvel executar
scripts diretamente de dentro do SPSS Modeler.

Os scripts no IBM SPSS Modeler so gravados na linguagem de script Python. A implementao baseada
em Java de Python que utilizada pelo IBM SPSS Modeler chamada Jython. A linguagem de script
consiste nos recursos a seguir:
v Um formato para fazer referncia a ns, fluxos, projetos, sada e outros objetos do IBM SPSS Modeler.
v Um conjunto de instrues de scripts ou comandos que podem ser utilizados para manipular esses
objetos.
v Uma linguagem de expresso de script para configurar os valores de variveis, parmetros e outros
objetos.
v Suporte para comentrios, continuaes e blocos de texto literal.

As sees a seguir descrevem a linguagem de script Python, a implementao Jython de Python e a


sintaxe bsica para iniciar com o script dentro do IBM SPSS Modeler. Informaes sobre propriedades e
comandos especficos so fornecidas nas sees seguintes.

Python e Jython
O Jython uma implementao da linguagem de script Python que escrita na linguagem Java e
integrada com a plataforma Java. O Python uma linguagem de script poderosa orientada a objetos. O
Jython til porque fornece os recursos de produtividade de uma linguagem de script madura e, ao
contrrio de Python, executado em qualquer ambiente que suportar uma Java virtual machine (JVM).
Isso significa que as bibliotecas Java na JVM esto disponveis para uso quando voc estiver gravando
programas. Com o Jython, possvel aproveitar esta diferena e utilizar a sintaxe e a maioria dos recursos
da linguagem Python.

Como uma linguagem de script, o Python (e sua implementao Jython) fcil de aprender, eficiente de
codificar e tem uma estrutura mnima necessria para criar um programa em execuo. Um cdigo pode
ser inserido interativamente, ou seja, uma linha por vez. O Python uma linguagem de script
interpretada e no h etapa de pr-compilao como h em Java. Os programas Python so simplesmente
arquivos de texto que so interpretados conforme so inseridos (aps a anlise de erros de sintaxe).
Expresses simples, como valores definidos, bem como as aes mais complexas, como definies de
funo, so imediatamente executadas e disponibilizadas para uso. Todas as mudanas que forem feitas
no cdigo podem ser testadas rapidamente. No entanto, a interpretao de script tem algumas
desvantagens. Por exemplo, como o uso de uma varivel no definida no um erro do compilador, ela
ser detectada apenas se (e quando) a instruo na qual a varivel utilizada for executada. Neste caso, o
programa pode ser editado e executado para depurar o erro.

O Python v tudo, incluindo todos os dados e o cdigo, como um objeto. Portanto, possvel manipular
esses objetos com as linhas de cdigo. Alguns tipos de seleo, como nmeros e sequncias, so mais
convenientemente considerados valores e no objetos, e isso suportado pelo Python. H um valor nulo
que suportado. Este valor nulo tem o nome reservado None.

Para obter uma introduo mais detalhada para script Python e Jython e tambm obter alguns scripts de
exemplo, consulte http://www.ibm.com/developerworks/java/tutorials/j-jython1/j-jython1.html e
http://www.ibm.com/developerworks/java/tutorials/j-jython2/j-jython2.html .

15
Script Python
Este guia para a linguagem de script Python uma introduo aos componentes que mais provavelmente
sero utilizados ao executar scripts no IBM SPSS Modeler, incluindo conceitos e princpios bsicos de
programao. Isso fornecer um conhecimento suficiente para comear a desenvolver seus prprios
scripts Python para uso no IBM SPSS Modeler.

Operaes
A designao feita utilizando um sinal de igual (=). Por exemplo, para designar o valor "3" para uma
varivel chamada "x", voc utiliza a seguinte instruo:
x = 3

O sinal de igual utilizado tambm para designar dados de tipo de sequncia para uma varivel. Por
exemplo, para designar o valor "a string value" para a varivel "y", voc utiliza a seguinte instruo:
y = "a string value"

A tabela a seguir lista algumas comparaes e operaes numricas normalmente utilizadas e suas
descries.
Tabela 5. Comparao e operaes numricas comuns
Operao Descrio
x < y O x menor que y?
x > y O x maior que y?
x <= y O x menor ou igual a y?
x >= y O x maior ou igual a y?
x == y O x igual a y?
x != y O x no igual a y?
x <> y O x no igual a y?
x + y Soma y ao x
x - y Subtrai y de x
x * y Multiplica x por y
x / y Divide x por y
x ** y Eleva o x potncia de y

Listas
Listas so sequncias de elementos. Uma lista pode conter qualquer nmero de elementos e os elementos
da lista podem ser qualquer tipo de objeto. As listas tambm podem ser consideradas como matrizes. O
nmero de elementos na lista pode aumentar ou diminuir conforme os elementos so includos,
removidos ou substitudos.

Exemplos

[] Qualquer lista vazia.


[1] Uma lista com um nico elemento, um nmero inteiro.
["Mike", 10, "Don", 20] Uma lista com quatro elementos, dois elementos de
sequncia e dois elementos de nmero inteiro.
[[],[7],[8,9]] Uma lista de listas. Cada sublista uma lista vazia ou
uma lista de elementos de nmero inteiro.

16 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


x = 7; y = 2; z = 3; Uma lista de nmeros inteiros. Este exemplo demonstra o
[1, x, y, x + y] uso de variveis e expresses.

possvel designar uma lista para uma varivel, por exemplo:


mylist1 = ["one", "two", "three"]

Em seguida, possvel acessar elementos especficos da lista, por exemplo:


mylist[0]

Isso resulta na sada a seguir:


one

O nmero entre colchetes ([]) conhecido como um ndice e faz referncia a um elemento especfico da
lista. Os elementos de uma lista so indexados iniciando a partir de 0.

Tambm possvel selecionar um intervalo de elementos de uma lista; isso denominado fatiamento. Por
exemplo, x[1:3] seleciona o segundo e o terceiro elementos de x. O ndice final um aps a seleo.

Sequncias de caracteres
Uma sequncia uma sequncia imutvel que manipulada como um valor. As sequncias suportam
todas as funes e operadores de sequncia imutveis que resultam em uma nova sequncia. Por
exemplo, "abcdef"[1:4] resulta na sada "bcd".

No Python, os caracteres so representados por sequncias de comprimento um.

As sequncias literais so definidas utilizando aspas simples ou triplas. As sequncias que so definidas
utilizando aspas simples no podem abranger outras linhas, enquanto que as sequncias que so
definidas utilizando aspas triplas podem. Uma sequncia pode ser colocada entre aspas simples () ou
aspas duplas ("). Um caractere aspas pode conter o outro caractere aspas sem escape ou um caractere
aspas com escape, que precedido por um caractere barra invertida (\).

Exemplos
"This is a string"
This is also a string
"Its a string"
This book is called "Python Scripting and Automation Guide".
"This is an escape quote (\") in a quoted string"

Diversas sequncias separadas por espao em branco so automaticamente concatenadas pelo analisador
Python. Isso facilita inserir sequncias longas e combinar tipos de aspas em uma nica sequncia, por
exemplo:
"This string uses and " that string uses ".

Isso resulta na sada a seguir:


This string uses and that string uses ".

As sequncias suportam vrios mtodos teis. Alguns desses mtodos so fornecidos na tabela a seguir.
Tabela 6. Mtodos de sequncia
Mtodo Uso
s.capitalize() Altera a letra inicial s em maiscula
s.count(ss {,start {,end}}) Conta as ocorrncias de ss em s[start:end]
s.startswith(str {, start {, end}}) Testa se o s inicia com str
s.endswith(str {, start {, end}}) Testa se o s termina com str

Captulo 2. A Linguagem de Script 17


Tabela 6. Mtodos de sequncia (continuao)
Mtodo Uso
s.expandtabs({size}) Substitui tabulaes por espaos, o size padro 8
s.find(str {, start {, end}}) Localiza o primeiro ndice de str em s; se no for
s.rfind(str {, start {, end}}) localizado, o resultado ser -1. rfind procura da direita
para a esquerda.
s.index(str {, start {, end}}) Localiza primeiro ndice de str em s; se no localizado:
s.rindex(str {, start {, end}}) aumenta o ValueError. rindex procura da direita para a
esquerda.
s.isalnum Testa se a sequncia alfanumrica
s.isalpha Testa se a sequncia alfabtica
s.isnum Testa se a sequncia numrica
s.isupper Testa se a sequncia est toda em letras maisculas
s.islower Testa se a sequncia est toda em letras minsculas
s.isspace Testa se a sequncia est toda em espao em branco
s.istitle Testa se a cadeia uma sequncia de cadeias
alfanumricas com iniciais maisculas
s.lower() Converte tudo em letras minsculas
s.upper() Converte tudo em letras maisculas
s.swapcase() Converte tudo em letras maisculas e minsculas opostas
s.title() Converte todas as maisculas e minsculas do ttulo
s.join(seq) Junta as sequncias em seq com s como o separador
s.splitlines({keep}) Divide s em linhas, se keep for true, mantm as novas
linhas
s.split({sep {, max}}) Divide s em "palavras" usando sep (o sep padro um
espao em branco) para at max vezes
s.ljust(width) Justifica a sequncia esquerda em um campo de largura width
s.rjust(width) Justifica a sequncia direita em um campo de largura width
s.center(width) Centraliza a sequncia em um campo de largura width
s.zfill(width) Preenche com 0.
s.lstrip() Remove espao em branco direita
s.rstrip() Remove espao em branco esquerda
s.strip() Remove espao em branco direita e esquerda
s.translate(str {,delc}) Converte s utilizando a tabela, depois de remover
quaisquer caracteres em delc. str deve ser uma
sequncia de comprimento == 256.
s.replace(old, new {, max}) Substitui todas as max ocorrncias da sequncia old pela
sequncia new

Observaes
As observaes so comentrios que so introduzidos pelo sinal de sustenido ou hash (#). Todo o texto
aps o sinal de sustenido na mesma linha considerado parte do comentrio e ignorado. Um
comentrio pode iniciar em qualquer coluna. O exemplo a seguir demonstra o uso de comentrios:
#The HelloWorld application is one of the most simple
print Hello World # print the Hello World line

Sintaxe da Instruo
A sintaxe da instruo para Python muito simples. Em geral, cada linha de origem uma instruo
nica. Exceto para as instrues expression e assignment, cada instruo introduzida por um nome de

18 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


palavra-chave, como if ou for. Linhas em branco ou linhas de comentrio podem ser inseridas em
qualquer lugar entre quaisquer instrues no cdigo. Se houver mais de uma instruo em uma linha,
cada instruo dever ser separada por um ponto e vrgula (;).

Instrues muito longas podem continuar em mais de uma linha. Neste caso, a instruo que precisar
continuar na prxima linha dever terminar com uma barra invertida (\), por exemplo:
x = "A loooooooooooooooooooong string" + \
"another looooooooooooooooooong string"

Quando uma estrutura colocada entre parnteses (()), colchetes ([]) ou chaves ({}), a instruo poder
continuar em uma nova linha aps qualquer vrgula, sem a necessidade de inserir uma barra invertida,
por exemplo:
x = (1, 2, 3, "hello",
"goodbye", 4, 5, 6)

Identificadores
Identificadores so utilizados para nomear variveis, funes, classes e palavras-chave. Os identificadores
podem ter qualquer comprimento e devem iniciar com um caractere alfabtico maisculo ou minsculo
ou com o caractere sublinhado (_). Os nomes que comeam com um sublinhado geralmente so
reservados para nomes internos ou privados. Aps o primeiro caractere, o identificador pode conter
qualquer nmero e combinao de caracteres alfabticos, nmeros de 0 a 9 e o caractere de sublinhado.

H algumas palavras reservadas no Jython que no podem ser utilizadas para nomear variveis, funes
ou classes. Elas se enquadram nas categorias a seguir:
v Introdutores de instruo: assert, break, class, continue, def, del, elif, else, except, exec, finally,
for, from, global, if, import, pass, print, raise, return, try e while
v Introdutores de parmetro: as, import e in
v Operadores: and, in, is, lambda, not e or

O uso de palavra-chave inadequada geralmente resulta em um SyntaxError.

Blocos de Cdigo
Os blocos de cdigo so grupos de instrues que so utilizados onde instrues nicas so esperadas.
Os blocos de cdigo podem seguir qualquer uma das instrues a seguir: if, elif, else, for, while, try,
except, def e class. Essas instrues introduzem um cdigo de cloco com o caractere dois pontos (:), por
exemplo:
if x == 1:
y = 2
z = 3
elif:
y = 4
z = 5

A indentao utilizada para delimitar os blocos de cdigo (ao invs de chaves que so utilizadas em
Java). Todas as linhas em um bloco devem ser indentadas para a mesma posio. Isso ocorre porque uma
mudana na indentao indica o final de um bloco de cdigos. comum recuar por quatro espaos por
nvel. Recomenda-se que espaos sejam usados para indentar as linhas, ao invs de usar tabulaes.
Espaos e tabulaes no devem ser misturados. As linhas no bloco mais afastado de um mdulo devem
iniciar na coluna um, ou um SyntaxError ocorrer.

As instrues que compem um bloco de cdigos (e aps os dois pontos) tambm podem estar em uma
nica linha, separadas por ponto e vrgula, por exemplo:
if x == 1: y = 2; z = 3;

Captulo 2. A Linguagem de Script 19


Transmitindo Argumentos para um Script
Transmitir argumentos para um script til j que isso significa que um script pode ser utilizado
repetidamente sem modificao. Os argumentos que so transmitidos na linha de comandos so
transmitidos como valores na lista sys.argv. O nmero de valores transmitidos pode ser obtido
utilizando o comando len(sys.argv). Por exemplo:
import sys
print "test1"
print sys.argv[0]
print sys.argv[1]
print len(sys.argv)

Neste exemplo, o comando import importa toda a classe sys para que os mtodos existentes para essa
classe, como argv, possam ser utilizados.

O script nesse exemplo pode ser chamado usando a linha a seguir:


/u/mjloos/test1 mike don

O resultado a sada a seguir:


/u/mjloos/test1 mike don
test1
mike
don
3

Exemplos
A palavra-chave print imprime os argumentos imediatamente aps ele. Se a instruo for seguida por
uma vrgula, uma nova linha no ser includa na sada. Por exemplo:
print "This demonstrates the use of a",
print " comma at the end of a print statement."

Isso resulta na sada a seguir:


Isso demonstra o uso de uma vrgula no trmino de uma instruo print.

A instruo for utilizada para iterar atravs de um bloco de cdigo. Por exemplo:
mylist1 = ["one", "two", "three"]
for lv in mylist1:
print lv
continue

Neste exemplo, trs sequncias so designadas lista mylist1. Em seguida, os elementos da lista so
impressos, com um elemento de cada linha. Isso resulta na sada a seguir:
one
two
three

Neste exemplo, o agente iterativo lv utiliza o valor de cada elemento na lista mylist1 sucessivamente
conforme o loop 'for' implementa o bloco de cdigos de cada elemento. Um agente iterativo pode ser
qualquer identificador vlido de qualquer comprimento.

A instruo if uma instruo condicional. Ela avalia a condio e retorna true ou false, dependendo do
resultado da avaliao. Por exemplo:
mylist1 = ["one", "two", "three"]
for lv in mylist1:
if lv == "two"
print "The value of lv is ", lv
else
print "The value of lv is not two, but ", lv
continue

20 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Neste exemplo, o valor do agente iterativo lv avaliado. Se o valor de lv for two, uma sequncia
diferente ser retornada para a sequncia que for retornada se o valor de lv no for two. Isso resulta na
sada a seguir:
The value of lv is not two, but one
The value of lv is two
The value of lv is not two, but three

Mtodos Matemticos
No mdulo math, possvel acessar mtodos matemticos teis. Alguns desses mtodos so fornecidos na
tabela a seguir. A menos que seja especificado o contrrio, todos os valores so retornados como
flutuantes.
Tabela 7. Mtodos matemticos
Mtodo Uso
math.ceil(x) Retorna o limite de x como um valor flutuante, que o
menor nmero inteiro maior ou igual a x
math.copysign(x, y) Retorna x com sinal de y. copysign(1, -0.0) retorna -1
math.fabs(x) Retorna o valor absoluto de x
math.factorial(x) Retorna x fatorial. Se x for negativo ou no for um
nmero inteiro, um ValueError ser emitido.
math.floor(x) Retorna o piso de x como um valor flutuante, que o
maior nmero inteiro menor ou igual a x
math.frexp(x) Retorna a mantissa (m) e o expoente (e) de x como o par
(m, e). m um valor flutuante e e um nmero inteiro,
de forma que x == m * 2**e exatamente. Se x for zero,
retornar (0,0, 0), caso contrrio, 0.5 <= abs(m) < 1.
math.fsum(iterable) Retorna uma soma de valores de ponto flutuante de
preciso iterable
math.isinf(x) Verifique se o valor flutuante x infinitivo positivo ou
negativo
math.isnan(x) Verifique se o valor flutuante x NaN (no um nmero)
math.ldexp(x, i) Retorna x * (2**i). Isso essencialmente o inverso da
funo frexpf.
math.modf(x) Retornar as partes fracionrias e inteiras de x. Ambos os
resultados transportam o sinal de x e so valores
flutuantes.
math.trunc(x) Retorna o valor Real de x, que foi truncado para um
Integral.
math.exp(x) Retorna e**x
math.log(x[, base]) Retorna o logaritmo de x para o valor especificado de
base. Se base no for especificado, o logaritmo natural de
x ser retornado.
math.log1p(x) Retorna o logaritmo natural de 1+x (base e)
math.log10(x) Retorna o logaritmo de base 10 de x
math.pow(x, y) Retorna x elevado potncia y. pow(1.0, x) e pow(x,
0.0) sempre retorna 1, mesmo quando x for zero ou
NaN.
math.sqrt(x) Retorna a raiz quadrada de x

Alm das funes matemticas, h alguns mtodos trigonomtricos teis. Esses mtodos so mostrados
na tabela a seguir.

Captulo 2. A Linguagem de Script 21


Tabela 8. Mtodos trigonomtricos
Mtodo Uso
math.acos(x) Retorna o arco cosseno de x em radianos
math.asin(x) Retorna o arco seno de x em radianos
math.atan(x) Retorna o arco tangente de x em radianos
math.atan2(y, x) Retorna atan(y / x) em radianos.
math.cos(x) Retorna o cosseno de x em radianos.
math.hypot(x, y) Retorna a norma euclidiana sqrt(x*x + y*y). Este o
comprimento do vetor da origem at o ponto (x, y).
math.sin(x) Retorna o seno de x em radianos
math.tan(x) Retorna a tangente de x em radianos
math.degrees(x) Converte o ngulo x de radianos em graus
math.radians(x) Converte o ngulo x de graus em radianos
math.acosh(x) Retorna o cosseno hiperblico inverso de x
math.asinh(x) Retorna o seno hiperblico inverso de x
math.atanh(x) Retorna a tangente hiperblica inversa de x
math.cosh(x) Retorna o cosseno hiperblico de x
math.sinh(x) Retorna o cosseno hiperblico de x
math.tanh(x) Retorna a tangente hiperblica de x

H tambm duas constantes matemticas. O valor de math.pi o pi constante matemtico. O valor de


math.e a constante matemtica e.

Utilizando caracteres no ASCII


Para utilizar caracteres no ASCII, o Python requer codificao e decodificao explcitas das sequncias
em Unicode. No IBM SPSS Modeler, os scripts Python so assumidos como estando codificados em
UTF-8, que uma codificao Unicode padro que suporta caracteres no ASCII. O script a seguir
realizar compilao porque o compilador Python foi configurado para UTF-8 pelo SPSS Modeler.

No entanto, o n resultante ter um rtulo incorreto.

Figura 3. Rtulo do n contendo caracteres no ASCII exibido incorretamente

O rtulo est incorreto porque o literal de sequncia em si foi convertido em uma sequncia ASCII pelo
Python.

22 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


O Python permite que literais de sequncia Unicode sejam especificados incluindo um prefixo de
caractere u antes do literal de sequncia:

Isso criar uma sequncia Unicode e o rtulo ser exibido corretamente.

Figura 4. Rtulo do n contendo caracteres no ASCII exibido corretamente

O uso do Python e Unicode um tpico grande que est alm do escopo deste documento. Muitos livros
e recursos online esto disponveis para abordar este tpico em mais detalhes.

Programao Orientada a Objetos


A programao orientada a objetos baseada na noo de criar um modelo do problema de destino em
seus programas. A programao orientada a objetos reduz os erros de programao e promove a
reutilizao de cdigo. O Python uma linguagem orientada a objetos. Os objetos definidos em Python
possuem os recursos a seguir:
v Identidade. Cada objeto deve ser distinto, e isso deve ser testvel. Os testes is e is not existem para
este propsito.
v Estado. Cada objeto deve ser capaz de armazenar estado. Atributos, como campos e variveis de
instncia, existem para este propsito.
v Comportamento. Cada objeto deve ser capaz de manipular seu estado. Mtodos existem para este
propsito.

O Python inclui os recursos a seguir para suportar programao orientada a objetos:


v Criao de objeto baseada em classe. Classes so modelos para a criao de objetos. Os objetos so
estruturas de dados com comportamento associado.
v Herana com polimorfismo. O Python suporta herana nica e mltipla. Todos os mtodos de
instncia Python so polimrficos e podem ser substitudos por subclasses.
v Encapsulamento com ocultao de dados. O Python permite que os atributos sejam ocultados. Quando
ocultos, os atributos podem ser acessados a partir de fora da classe apenas por meio de mtodos da
classe. As classes implementam mtodos para modificar os dados.

Definindo uma Classe


Em uma classe Python, variveis e mtodos podem ser definidos. Ao contrrio do Java, o Python permite
definir qualquer nmero de classes pblicas por arquivo de origem (ou mdulo). Portanto, um mdulo em
Python pode ser considerado semelhante a um pacote em Java.

No Python, as classes so definidas utilizando a instruo class. A instruo class tem o seguinte
formato:
class name (superclasses): statement

ou

Captulo 2. A Linguagem de Script 23


class name (superclasses):
assignment
.
.
funo
.
.

Ao definir uma classe, voc tem a opo de fornecer zero ou mais instrues de designao. Isso cria
atributos de classe que so compartilhados por todas as instncias da classe. Tambm possvel fornecer
zero ou mais definies de funo. Essas definies de funo criam mtodos. A lista de superclasses
opcional.

O nome de classe deve ser exclusivo no mesmo escopo, que est dentro de um mdulo, funo ou classe.
possvel definir diversas variveis para fazer referncia mesma classe.

Criando uma Instncia de Classe


Classes so utilizadas para reter atributos de classe (ou compartilhados) ou para criar instncias de classe.
Para criar uma instncia de uma classe, voc chama a classe como se ela fosse uma funo. Por exemplo,
considere a classe a seguir:
class MyClass:
pass

Aqui, a instruo pass utilizada porque uma instruo necessria para concluir a classe, mas nenhuma
ao necessria programaticamente.

A instruo a seguir cria uma instncia da classe MyClass:


x = MyClass()

Incluindo Atributos em uma Instncia de Classe


Ao contrrio de Java, nos clientes Python possvel incluir atributos em uma instncia de uma classe.
Apenas a instncia alterada. Por exemplo, para incluir atributos em uma instncia x, configure novos
valores nessa instncia:
x.attr1 = 1
x.attr2 = 2
.
.
x.attrN = n

Definindo Atributos e Mtodos de Classe


Qualquer varivel que ligada em uma classe um atributo de classe. Qualquer funo definida em uma
classe um mtodo. Os mtodos recebem uma instncia da classe, convencionalmente chamada self,
como o primeiro argumento. Por exemplo, para definir alguns atributos e mtodos de classe, possvel
inserir o seguinte cdigo:
class MyClass
attr1 = 10 #class attributes
attr2 = "hello"

def method1(self):
print MyClass.attr1 #reference the class attribute

def method2(self):
print MyClass.attr2 #reference the class attribute

def method3(self, text):


self.text = text #instance attribute
print text, self.text #print my argument and my attribute

method4 = method3 #make an alias for method3

Dentro de uma classe, deve-se qualificar todas as referncias a atributos de classe com o nome de classe;
por exemplo, MyClass.attr1. Todas as referncias a atributos de instncia devem ser qualificadas com a
varivel self; por exemplo, self.text. Fora da classe, deve-se qualificar todas as referncias a atributos

24 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


de classe com o nome da classe (por exemplo, MyClass.attr1) ou com uma instncia da classe (por
exemplo x.attr1, em que x uma instncia da classe). Fora da classe, todas as referncias a variveis de
instncia devem ser qualificadas com uma instncia da classe; por exemplo, x.text.

Variveis ocultas
Os dados podem ser ocultados ao criar Variveis Privadas. As variveis privadas podem ser acessadas
apenas pela prpria classe. Se voc declarar nomes no formato __xxx ou __xxx_yyy, ou seja, com dois
sublinhados precedentes, o analisador Python incluir automaticamente o nome da classe no nome
declarado, criando variveis ocultas, por exemplo:
class MyClass:
__attr = 10 #private class attribute

def method1(self):
passar

def method2(self, p1, p2):


passar

def __privateMethod(self, text):


self.__text = text #private attribute

Ao contrrio do Java, no Python todas as referncias s variveis de instncia devem ser qualificadas com
self, e no h nenhum uso implcito de this.

Herana
A capacidade de herdar a partir de classes fundamental para programao orientada a objetos. O
Python suporta herana nica e tambm diversas heranas. Herana nica significa que pode haver apenas
uma superclasse. Diversas heranas significam que pode haver mais de uma superclasse.

A herana implementada ao definir outras classes como subclasse. Qualquer nmero de classes Python
pode ser superclasses. Na implementao Jython do Python, apenas uma classe Java pode ser herdada
direta ou indiretamente. Ela no necessria para que uma superclasse seja fornecida.

Qualquer atributo ou mtodo em uma superclasse tambm est em qualquer subclasse e pode ser
utilizado pela prpria classe ou por qualquer cliente, desde que o atributo ou mtodo no esteja oculto.
Qualquer instncia de uma subclasse poder ser utilizada onde quer que a instncia de uma superclasse
possa ser utilizada; isso um exemplo de polimorfismo. Esses recursos permitem a reutilizao e a
facilidade da extenso.

Exemplo
class Class1: pass #no inheritance

class Class2: pass

class Class3(Class1): pass #single inheritance

class Class4(Class3, Class2): pass #multiple inheritance

Captulo 2. A Linguagem de Script 25


26 Guia de Script e Automao Python do IBM SPSS Modeler 17.1
Captulo 3. Criando Script em IBM SPSS Modeler
Tipos de scripts
No IBM SPSS Modeler existem trs tipos de script:
v Os Scripts de fluxo so utilizados para controlar a execuo de um fluxo nico e so armazenados no
fluxo.
v Os Scripts de SuperNode so utilizados para controlar o comportamento dos SuperNodes.
v Os Scripts independentes ou de sesso podem ser utilizados para coordenar a execuo atravs de um
nmero de fluxos diferentes.

Vrios mtodos esto disponveis para serem utilizados em scripts no IBM SPSS Modeler com a qual
possvel acessar uma ampla variedade de funcionalidade do SPSS Modeler. Esses mtodos tambm so
utilizados no Captulo 4, A API de Script, na pgina 37 para criar funes mais avanadas.

Fluxos, fluxos de SuperNode e diagramas


Na maioria das vezes, o termo stream significa a mesma coisa, independentemente se for um fluxo que
carregado a partir de um arquivo ou utilizado em um SuperNode. Geralmente significa uma coleo de
ns que so conectados entre si e que podem ser executados. No script, no entanto, nem todas as
operaes so suportadas em todos os locais, significando que um autor de script dever saber qual
variante de fluxo ele est utilizando.

Fluxos
Um fluxo o tipo de documento principal do IBM SPSS Modeler. Ele pode ser salvo, carregado, editado e
executado. Os fluxos tambm podem ter parmetros, valores globais, um script e outras informaes
associadas a ele.

Fluxos de SuperNode
Um fluxo de SuperNode o tipo de fluxo utilizado em um SuperNode. Assim como um fluxo normal, ele
contm ns que esto vinculados. Os fluxos de SuperNode possuem vrias diferenas de um fluxo
normal:
v Os parmetros e quaisquer scripts so associados ao SuperNode que possui o fluxo de SuperNode e
no ao prprio fluxo de SuperNode.
v Os fluxos de SuperNode possuem ns de conector de entrada e de sada adicionais, dependendo do
tipo de SuperNode. Esses ns de conector so utilizados para fluir informaes para dentro e fora do
fluxo do SuperNode e so criados automaticamente quando o SuperNode criado.

Diagramas
O termo diagrama abrange as funes que so suportadas pelos fluxos normal e SuperNode, como incluir
e remover ns e modificar conexes entre os ns.

Executando um fluxo
O exemplo a seguir executa todos os ns executveis no fluxo e o tipo mais simples de script de fluxo:
modeler.script.stream().runAll(None)

O exemplo a seguir tambm executa todos os ns executveis no fluxo:


stream = modeler.script.stream()
stream.runAll(None)

27
Neste exemplo, o fluxo armazenado em uma varivel denominada stream. Armazenar o fluxo em uma
varivel til porque um script normalmente utilizado para modificar o fluxo ou os ns dentro de um
fluxo. Criar uma varivel que armazena o fluxo resulta em um script mais conciso.

O contexto de script
O mdulo modeler.script fornece o contexto no qual um script executado. O mdulo
automaticamente importado em um script do SPSS Modeler no tempo de execuo. O mdulo define
quatro funes que fornecem um script com acesso ao seu ambiente de execuo.
v A funo session() retorna a sesso para o script. A sesso define informaes como o cdigo do
idioma e o SPSS Modeler de backend (um processo local ou um SPSS Modeler Server em rede) que
est sendo utilizado para executar quaisquer fluxos.
v A funo stream() pode ser utilizada com os scripts de fluxo e de SuperNode. Esta funo retorna o
fluxo que possui ou o script de fluxo ou o script de SuperNode que est sendo executado.
v A funo diagram() pode ser utilizada com o script de SuperNode. Esta funo retorna o diagrama no
SuperNode. Para outros tipos de script, esta funo retorna a mesma funo stream().
v A funo supernode() pode ser utilizada com scripts de SuperNode. Esta funo retorna o SuperNode
que possuir o script que est sendo executado.

As quatro funes e suas sadas so resumidas na tabela a seguir.


Tabela 9. Resumo das funes de modeler.script
Tipo de script session() stream() diagram() supernode()
Independente Retorna uma sesso Retorna o fluxo O mesmo para No aplicvel
gerenciado atual no stream()
momento em que o
script foi chamado
(por exemplo, o fluxo
transmitido por meio
da opo -stream do
modo em lote), ou
None.
Fluxos Retorna uma sesso Retorna um fluxo O mesmo para No aplicvel
stream()
Supern Retorna uma sesso Retorna um fluxo Retorna um fluxo de Retorna um
SuperNode SuperNode

O mdulo modeler.script tambm define uma forma de terminar o script com um cdigo de sada. A
funo exit(exit-code) interrompe a execuo do script e retorna o cdigo de sada de nmero inteiro
fornecido.

Um dos mtodos que definido para um fluxo runAll(Lista). Este mtodo executa todos os ns
executveis. Quaisquer modelos ou sadas que forem gerados executando os ns so includos na lista
fornecida.

Normalmente uma execuo de fluxo gera sadas, como modelos, grficos e outra sada. Para capturar
esta sada, um script pode fornecer uma varivel que seja inicializada para uma lista, por exemplo:
stream = modeler.script.stream()
results = []
stream.runAll(results)

Quando a execuo for concluda, quaisquer objetos que forem gerados pela execuo podem ser
acessados a partir da lista results.

28 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Referenciando ns existentes
Um fluxo geralmente pr-construdo com alguns parmetros que devem ser modificados antes do fluxo
ser executado. Modificar esses parmetros envolve as tarefas a seguir:
1. Localizar os ns no fluxo relevante.
2. Alterando as configuraes de n ou de fluxo (ou ambos).

Localizando ns
Os fluxos fornecem vrias maneiras de localizar um n existente. Esses mtodos so resumidos na tabela
a seguir.
Tabela 10. Mtodos para localizar um n existente
Mtodo Tipo de retorno Descrio
s.findAll(type, label) Coleo Retorna uma lista de todos os ns
com o tipo e rtulo especificados. O
tipo ou o rtulo pode ser None, caso
em que o outro parmetro
utilizado.
s.findAll(filter, recursive) Coleo Retorna uma coleo de todos os ns
que forem aceitos pelo filtro
especificado. Se o sinalizador
recursivo for True, quaisquer
SuperNodes no fluxo especificado
tambm sero procurados.
s.findByID(id) N Retorna o n com o ID fornecido ou
None se esse tipo no existir. A
procura limitada ao fluxo atual.
s.findByType(type, label) N Retorna o n com o tipo ou rtulo
fornecido, ou ambos. O tipo ou o n
pode ser None, caso em que o outro
parmetro utilizado. Se diversos
ns resultarem em uma
correspondncia, uma
correspondncia arbitrria ser
escolhida e retornada. Se nenhum n
resultar em uma correspondncia,
ento o valor de retorno ser None.
s.findDownstream(fromNodes) Coleo Procura a partir da lista de ns
fornecida e retorna o conjunto de ns
de recebimento de dados dos ns
fornecidos. A lista retornada inclui os
ns originalmente fornecidos.
s.findUpstream(fromNodes) Coleo Procura a partir da lista de ns
fornecida e retorna o conjunto de ns
de envio de dados dos ns
fornecidos. A lista retornada inclui os
ns originalmente fornecidos.

Como um exemplo, se o fluxo continha um n Filtro nico que o script precisava acessar, o n Filtro
poder ser localizado usando o script a seguir:
stream = modeler.script.stream()
node = stream.findByType("filter", None)
...

Captulo 3. Criando Script em IBM SPSS Modeler 29


Como alternativa, se o ID do n (conforme mostrado na guia Anotaes da caixa de dilogo do n) for
conhecido, o ID poder ser utilizado para localizar o n, por exemplo:
stream = modeler.script.stream()
node = stream.findByID("id32FJT71G2") # the filter node ID
...

Configurando propriedades
Os ns, fluxos, modelos e sadas possuem propriedades que podem ser acessadas e, na maioria dos casos,
configuradas. As propriedades geralmente so utilizadas para modificar o comportamento ou a aparncia
do objeto. Os mtodos que esto disponveis para acessar e configurar as propriedades do objeto so
resumidos na tabela a seguir.
Tabela 11. Mtodos para acessar e configurar propriedades de objeto
Mtodo Tipo de retorno Descrio
p.getPropertyValue(propertyName) Object Retorna o valor da propriedade
nomeada ou None se essa propriedade
no existir.
p.setPropertyValue(propertyName, No aplicvel Configura o valor da propriedade
value) nomeada.
p.setPropertyValues(properties) No aplicvel Configura os valores das
propriedades nomeadas. Cada
entrada no mapa de propriedades
consiste em uma chave que
representa o nome da propriedade e
o valor que deve ser designado a
essa propriedade.
p.getKeyedPropertyValue( Object Retorna o valor da propriedade
propertyName, keyName) nomeada e a chave associada ou None
se essa propriedade ou chave no
existir.
p.setKeyedPropertyValue( No aplicvel Configura o valor da propriedade
propertyName, keyName, value) nomeada e da chave.

Por exemplo, se desejar configurar o valor de um n Arquivo da Varivel no incio de um fluxo, ser
possvel utilizar o seguinte script:
stream = modeler.script.stream()
node = stream.findByType("variablefile", None)
node.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")
...

Como alternativa, voc pode querer filtrar um campo a partir de um n Filtro. Nesse caso, o valor
tambm chaveado no nome do campo, por exemplo:
stream = modeler.script.stream()
# Locate the filter node ...
node = stream.findByType("filter", None)
# ... and filter out the "Na" field
node.setKeyedPropertyValue("include", "Na", False)

Criando ns e modificando fluxos


Em algumas situaes, voc pode querer incluir novos ns em fluxos existentes. Incluir ns em fluxos
existentes geralmente envolve as tarefas a seguir:
1. Criando os ns.
2. Vinculando os ns no fluxo existente.

30 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Criando ns
Os fluxos fornecem vrias maneiras de criar ns. Esses mtodos so resumidos na tabela a seguir.
Tabela 12. Mtodos para criao de ns
Mtodo Tipo de retorno Descrio
s.create(nodeType, name) N Cria um n do tipo especificado e o
inclui no fluxo especificado.
s.createAt(nodeType, name, x, y) N Cria um n do tipo especificado e o
inclui no fluxo especificado no local
especificado. Se x < 0 ou y < 0,o local
no ser configurado.
s.createModelApplier(modelOutput, N Cria um n de aplicador de modelo
name) que derivado do objeto de sada do
modelo fornecido.

Por exemplo, para criar um novo n Tipo em um fluxo, possvel utilizar o script a seguir:
stream = modeler.script.stream()
# Create a new type node
node = stream.create("type", "My Type")

Vinculando e desvinculando ns
Quando um novo n criado dentro de um fluxo, ele deve ser conectado a uma sequncia de ns antes
de poder ser utilizado. Os fluxos fornecem vrios mtodos para vincular e desvincular ns. Esses
mtodos so resumidos na tabela a seguir.
Tabela 13. Mtodos para vincular e desvincular ns
Mtodo Tipo de retorno Descrio
s.link(source, target) No aplicvel Cria um novo link entre os ns de
origem e de destino.
s.link(source, targets) No aplicvel Cria novos links entre o n de
origem e cada n de destino na lista
fornecida.
s.linkBetween(inserted, source, No aplicvel Conecta um n entre duas outras
target) instncias do n (os ns de origem e
de destino) e configura a posio do
n inserido para que ele esteja entre
as instncias. Qualquer link direto
entre os ns de origem e de destino
removido inicialmente.
s.linkPath(path) No aplicvel Cria um novo caminho entre
instncias do n. O primeiro n
vinculado ao segundo, o segundo
vinculado ao terceiro, e assim por
diante.
s.unlink(source, target) No aplicvel Remove qualquer link direto entre
ns de origem e de destino.
s.unlink(source, targets) No aplicvel Remove quaisquer links diretos entre
o n de origem e cada objeto na lista
de destinos.
s.unlinkPath(path) No aplicvel Remove qualquer caminho que existir
entre instncias do n.

Captulo 3. Criando Script em IBM SPSS Modeler 31


Tabela 13. Mtodos para vincular e desvincular ns (continuao)
Mtodo Tipo de retorno Descrio
s.disconnect(node) No aplicvel Remove quaisquer links entre o n
fornecido e quaisquer outros ns no
fluxo especificado.
s.isValidLink(source, target) boolean Retorna true se for vlido criar um
link entre os ns de origem e de
destino especificados. Esse mtodo
verifica se ambos os objetos
pertencem ao fluxo especificado, se o
n de origem pode fornecer um link
e o n de destino pode receber um
link e se criar esse link no causar
uma circularidade no fluxo.

O script de exemplo a seguir executa estas cinco tarefas:


1. Cria um n de entrada Arquivo Varivel, um n Filtro e um n de sada Tabela.
2. Conecta os ns entre si.
3. Configura o nome de arquivo no n de entrada de Arquivo Varivel.
4. Filtra o campo "Drug" na sada resultante.
5. Executa o n Tabela.
stream = modeler.script.stream()
filenode = stream.createAt("variablefile", "My File Input ", 96, 64)
filternode = stream.createAt("filter", "Filter", 192, 64)
tablenode = stream.createAt("table", "Table", 288, 64)
stream.link(filenode, filternode)
stream.link(filternode, tablenode)
filenode.setPropertyValue("full_filename", "$CLEO_DEMOS/DRUG1n")
filternode.setKeyedPropertyValue("include", "Drug", False)
results = []
tablenode.run(results)

Importando, substituindo e excluindo ns


Assim como criar e conectar ns, normalmente necessrio substituir e excluir ns do fluxo. Os mtodos
que esto disponveis para importar, substituir e excluir ns so resumidos na tabela a seguir.
Tabela 14. Mtodos para importar, substituir e excluir ns
Mtodo Tipo de retorno Descrio
s.replace(originalNode, No aplicvel Substitui o n especificado a partir
replacementNode, discardOriginal) do fluxo especificado. Tanto o n
original quanto o n de substituio
devem pertencer ao fluxo
especificado.

32 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 14. Mtodos para importar, substituir e excluir ns (continuao)
Mtodo Tipo de retorno Descrio
s.insert(source, nodes, newIDs) Lista Insere cpias dos ns na lista
fornecida. Assume-se que todos os
ns na lista fornecida estejam
contidos no fluxo especificado. O
sinalizador newIDs indica se novos
IDs devem ser gerados para cada n
ou se o ID existente deve ser copiado
e usado. Assume-se que todos os ns
em um fluxo tenham um ID
exclusivo, portanto, este sinalizador
dever ser configurado como True se
o fluxo de origem for o mesmo que o
fluxo especificado. O mtodo retorna
a lista de ns recm-inseridos, em
que a ordem dos ns indefinida (ou
seja, a ordenao no
necessariamente a mesma dos ns na
lista de entrada).
s.delete(node) No aplicvel Exclui o n especificado do fluxo
especificado. O n deve pertencer ao
fluxo especificado.
s.deleteAll(nodes) No aplicvel Exclui todos os ns especificados do
fluxo especificado. Todos os ns na
coleo devem pertencer ao fluxo
especificado.
s.clear() No aplicvel Exclui todos os ns do fluxo
especificado.

Percorrendo os ns em um fluxo
Um requisito comum identificar os ns que forem envio ou recebimento de dados de um n especfico.
O fluxo fornece diversos mtodos que podem ser utilizados para identificar esses ns. Esses mtodos so
resumidos na tabela a seguir.
Tabela 15. Mtodos para identificar os ns de envio e de recebimento de dados
Mtodo Tipo de retorno Descrio
s.iterator() Agente Iterativo Retorna um agente iterativo sobre os
objetos de n que esto contidos no
fluxo especificado. Se o fluxo for
modificado entre as chamadas da
funo next(), o comportamento do
agente iterativo ser indefinido.
s.predecessorAt(node, index) N Retorna o predecessor imediato
especificado do n fornecido ou None
se o ndice estiver fora dos limites.
s.predecessorCount(node) int Retorna o nmero de predecessores
imediatos do n fornecido.
s.predecessors(node) Lista Retorna os predecessores imediatos
do n fornecido.
s.successorAt(node, index) N Retorna o sucessor imediato
especificado do n fornecido ou None
se o ndice estiver fora dos limites.

Captulo 3. Criando Script em IBM SPSS Modeler 33


Tabela 15. Mtodos para identificar os ns de envio e de recebimento de dados (continuao)
Mtodo Tipo de retorno Descrio
s.successorCount(node) int Retorna o nmero de sucessores
imediatos do n fornecido.
s.successors(node) Lista Retorna os sucessores imediatos do
n fornecido.

Limpando ou removendo itens


O script legado suporta vrios usos do comando clear, por exemplo:
v clear outputs Exclui todos os itens de sada da paleta do gerenciador.
v clear generated palette Limpa todos os nuggets do modelo a partir da paleta de Modelos.
v clear stream Remove o contedo de um fluxo.

O script Python suporta um conjunto semelhante de funes; o comando removeAll() utilizado para
limpar gerenciadores de Fluxos, Sadas e de Modelos, por exemplo:
v Para limpar o gerenciador de Fluxos:
session = modeler.script.session()
session.getStreamManager.removeAll()
v Para limpar o gerenciador de Sadas:
session = modeler.script.session()
session.getDocumentOutputManager().removeAll()
v Para limpar o gerenciador de Modelos:
session = modeler.script.session()
session.getModelOutputManager().removeAll()

Obtendo informaes sobre ns


Os ns se dividem em categorias diferentes, como ns de importao e exportao de dados, ns de
construo de modelo, e outros tipos de ns. Cada n fornece diversos mtodos que podem ser utilizados
para descobrir informaes sobre o n.

Os mtodos que podem ser utilizados para obter o ID, o nome e o rtulo de um n so resumidos na
tabela a seguir.
Tabela 16. Mtodos para obter o ID, o nome e o rtulo de um n
Mtodo Tipo de retorno Descrio
n.getLabel() string Retorna o rtulo de exibio do n
especificado. O rtulo ser o valor da
propriedade custom_name somente se
essa propriedade for uma sequncia
no vazia e a propriedade
use_custom_name no estiver
configurada, caso contrrio, o rtulo
ser o valor de getName().

34 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 16. Mtodos para obter o ID, o nome e o rtulo de um n (continuao)
Mtodo Tipo de retorno Descrio
n.setLabel(label) No aplicvel Configura o rtulo de exibio do n
especificado. Se o novo rtulo for
uma sequncia no vazia, ele ser
designado propriedade custom_name
e False ser designado propriedade
use_custom_name, de modo que o
rtulo especificado ter prioridade,
caso contrrio, uma sequncia vazia
ser designada propriedade
custom_name e True ser designado
propriedade use_custom_name.
n.getName() string Retorna o nome do n especificado.
n.getID() string Retorna o ID do n especificado. Um
novo ID criado sempre que um
novo n for criado. O ID persistido
com o n quando ele salvo como
parte de um fluxo, de modo que os
IDs de n sejam preservados quando
o fluxo for aberto. Entretanto, se um
n salvo for inserido em um fluxo, o
n inserido ser considerado um
novo objeto e ser alocado um novo
ID.

Os mtodos que podem ser utilizados para obter outras informaes sobre um n so resumidos na
tabela a seguir.
Tabela 17. Mtodos para obter informaes sobre um n
Mtodo Tipo de retorno Descrio
n.getTypeName() string Retorna o nome de script deste n.
Este o mesmo nome que pode ser
utilizado para criar uma nova
instncia deste n.
n.isInitial() Boolean Retornar True se este for um n
inicial, que aquele que ocorre no
incio de um fluxo.
n.isInline() Boolean Retornar True se este for um n
sequencial, que aquele que ocorre no
meio do fluxo.
n.isTerminal() Boolean Retornar True se este for um n
terminal, que aquele que ocorre no
trmino de um fluxo.
n.getXPosition() int Retorna o deslocamento da posio x
do n no fluxo.
n.getYPosition() int Retorna o deslocamento da posio y
do n no fluxo.
n.setXYPosition(x, y) No aplicvel Configura a posio do n no fluxo.
n.setPositionBetween(source, No aplicvel Configura a posio do n no fluxo
target) para que ele seja posicionado entre os
ns fornecidos.

Captulo 3. Criando Script em IBM SPSS Modeler 35


Tabela 17. Mtodos para obter informaes sobre um n (continuao)
Mtodo Tipo de retorno Descrio
n.isCacheEnabled() Boolean Retornar True se o cache estiver
ativado, caso contrrio, retornar
False.
n.setCacheEnabled(val) No aplicvel Ativa ou desativa o cache para este
objeto. Se o cache estiver cheio e o
armazenamento em cache estiver
desativado, o cache ser limpo.
n.isCacheFull() Boolean Retornar True se o cache estiver
cheio, caso contrrio, retornar False.
n.flushCache() No aplicvel Limpa o cache desse n. No ter
efeito se o cache no estiver ativado
ou no estiver cheio.

36 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Captulo 4. A API de Script
Introduo API de Script
A API de Script fornece acesso a uma ampla variedade de funcionalidade do SPSS Modeler. Todos os
mtodos descritos at o momento fazem parte da API e podem ser acessados implicitamente no script
sem importaes adicionais. No entanto, se desejar fazer referncia s classes de API, deve-se importar a
API explicitamente com a seguinte instruo:
import modeler.api

Esta instruo de importao necessria por muitos exemplos da API de Script.

Um guia completo para as classes, mtodos e parmetros que esto disponveis por meio da API de script
pode ser localizado no documento Guia de Referncia da API de Script Python do IBM SPSS Modeler 17.

Exemplo: procurando por ns utilizando um filtro customizado


A seo Localizando ns na pgina 29 inclui um exemplo de procura de um n em um fluxo utilizando
o nome do tipo do n como o critrio de procura. Em algumas situaes, uma procura mais genrica
necessria, que poder ser implementada utilizando a classe NodeFilter e o mtodo findAll() do fluxo.
Este tipo de procura envolve as duas etapas a seguir:
1. Criao de uma nova classe que estende NodeFilter e que implemente uma verso customizada do
mtodo accept().
2. Chamada do mtodo findAll() do fluxo com uma instncia dessa nova classe. Isso retorna todos os
ns que atenderem aos critrios definidos no mtodo accept().

O exemplo a seguir mostra como procurar por ns em um fluxo que tiver o cache de n ativado. A lista
de ns retornada pode ser utilizada para limpar ou desativar os caches desses ns.
import modeler.api

class CacheFilter(modeler.api.NodeFilter):
"""A node filter for nodes with caching enabled"""
def accept(this, node):
return node.isCacheEnabled()

cachingnodes = modeler.script.stream().findAll(CacheFilter(), False)

Metadados: Informaes sobre dados


Como os ns so conectados entre si em um fluxo, informaes sobre as colunas ou campos disponveis
em cada n so exibidas. Por exemplo, na IU do Modelador, isto permite selecionar os campos pelos
quais classificar ou agregar. Essas informaes so chamadas de modelo de dados.

Os scripts tambm podem acessar o modelo de dados ao consultar os campos que entram ou que saem
de um n. Para alguns ns, os modelos de dados de entrada e de sada so os mesmos, por exemplo, um
n Classificar apenas reordena os registros, mas no altera o modelo de dados. Alguns ns, como Derivar,
podem incluir novos campos. Outros, como o n Filtro, podem renomear ou remover campos.

No exemplo a seguir, o script utiliza o fluxo druglearn.str padro do IBM SPSS Modeler e, para cada
campo, constri um modelo com um dos campos de entrada eliminados. Ele faz isto ao:
1. Acessar o modelo de dados de sada do n Tipo.
2. Executar loop em cada campo no modelo de dados de sada.
3. Modificar o n Filtro para cada campo de entrada.
4. Alterar o nome do modelo que est sendo construdo.

37
5. Executar o n de construo de modelo.

Nota: Antes de executar o script no fluxo druglean.str, lembre-se de configurar a linguagem de script
para Python (o fluxo foi criado em uma verso anterior do IBM SPSS Modeler de modo que a linguagem
de script de fluxo configurada para Legacy).
import modeler.api

stream = modeler.script.stream()
filternode = stream.findByType("filter", None)
typenode = stream.findByType("type", None)
c50node = stream.findByType("c50", None)
# Always use a custom model name
c50node.setPropertyValue("use_model_name", True)

lastRemoved = None
fields = typenode.getOutputDataModel()
for field in fields:
# If this is the target field then ignore it
if field.getModelingRole() == modeler.api.ModelingRole.OUT:
continue

# Re-enable the field that was most recently removed


if lastRemoved != None:
filternode.setKeyedPropertyValue("include", lastRemoved, True)

# Remove the field


lastRemoved = field.getColumnName()
filternode.setKeyedPropertyValue("include", lastRemoved, False)

# Set the name of the new model then run the build
c50node.setPropertyValue("model_name", "Exclude " + lastRemoved)
c50node.run([])

O objeto DataModel fornece vrios mtodos para acessar informaes sobre os campos ou colunas no
modelo de dados. Esses mtodos so resumidos na tabela a seguir.
Tabela 18. Mtodos do objeto DataModel para acessar informaes sobre campos ou colunas
Mtodo Tipo de retorno Descrio
d.getColumnCount() int Retorna o nmero de colunas no
modelo de dados.
d.columnIterator() Agente Iterativo Retorna um agente iterativo que
retorna cada coluna na ordem de
insero "natural". O agente iterativo
retorna instncias de Coluna.
d.nameIterator() Agente Iterativo Retorna um agente iterativo que
retorna o nome de cada coluna na
ordem de insero "natural".
d.contains(name) Boolean Retornar True se uma coluna com o
nome fornecido existir neste
DataModel, caso contrrio, False.
d.getColumn(name) Coluna Retorna a coluna com o nome
especificado.
d.getColumnGroup(name) ColumnGroup Retorna o grupo de coluna nomeado
ou None se esse grupo de coluna no
existir.
d.getColumnGroupCount() int Retorna o nmero de grupos de
coluna nesse modelo de dados.
d.columnGroupIterator() Agente Iterativo Retorna um agente iterativo que
retorna cada grupo de colunas
sucessivamente.

38 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 18. Mtodos do objeto DataModel para acessar informaes sobre campos ou colunas (continuao)
Mtodo Tipo de retorno Descrio
d.toArray() Column[] Retorna o modelo de dados como
uma matriz de colunas. As colunas
so ordenadas em sua ordem de
insero "natural".

Cada campo (objeto da Coluna) inclui vrios mtodos para acessar informaes sobre a coluna. A tabela
abaixo mostra uma seleo deles.
Tabela 19. Mtodos de objetos Coluna para acessar informaes sobre a coluna
Mtodo Tipo de retorno Descrio
c.getColumnName() string Retorna o nome da coluna.
c.getColumnLabel() string Retorna o rtulo da coluna ou uma
sequncia de caracteres vazia se
nenhum rtulo estiver associado
coluna.
c.getMeasureType() MeasureType Retorna o tipo de medida para a
coluna.
c.getStorageType() StorageType Retorna o tipo de armazenamento
para a coluna.
c.isMeasureDiscrete() Boolean Retornar True se a coluna for
discreta. As colunas que forem um
conjunto ou um sinalizador so
consideradas discretas.
c.isModelOutputColumn() Boolean Retornar True se a coluna uma
coluna de sada do modelo.
c.isStorageDatetime() Boolean Retornar True se o armazenamento
da coluna for um valor de hora, data
ou registro de data e hora.
c.isStorageNumeric() Boolean Retornar True se o armazenamento
da coluna for um nmero inteiro ou
um nmero real.
c.isValidValue(value) Boolean Retornar True se o valor
especificado for vlido para esse
armazenamento e valid quando os
valores de coluna vlidos forem
conhecidos.
c.getModelingRole() ModelingRole Retorna o tipo de modelagem para a
coluna.
c.getSetValues() Object[] Retorna uma matriz de valores
vlidos para a coluna ou None se um
dos valores no for conhecido ou se a
coluna no for um conjunto.
c.getValueLabel(value) string Retorna o rtulo para o valor na
coluna ou uma sequncia vazia se
no houver nenhum rtulo associado
ao valor.
c.getFalseFlag() Object Retorna o valor de indicador "false"
para a coluna ou None se o valor no
for conhecido ou se a coluna no for
um sinalizador.

Captulo 4. A API de Script 39


Tabela 19. Mtodos de objetos Coluna para acessar informaes sobre a coluna (continuao)
Mtodo Tipo de retorno Descrio
c.getTrueFlag() Object Retorna o valor de indicador "true"
para a coluna ou None se o valor no
for conhecido ou se a coluna no for
um sinalizador.
c.getLowerBound() Object Retorna o valor de limite inferior
para os valores na coluna ou None se
o valor no for conhecido ou se a
coluna no for contnua.
c.getUpperBound() Object Retorna o valor de limite superior
para os valores na coluna ou None se
o valor no for conhecido ou se a
coluna no for contnua.

Observe que a maioria dos mtodos que acessam informaes sobre uma coluna possui mtodos
equivalentes definidos no prprio objeto DataModel. Por exemplo, as duas instrues a seguir so
equivalentes:
dataModel.getColumn("someName").getModelingRole()
dataModel.getModelingRole("someName")

Acessando Objetos Gerados


Executar um fluxo geralmente envolve produzir objetos de sada adicionais. Esses objetos adicionais
podem ser um novo modelo ou a uma parte da sada que fornece informaes a serem utilizadas em
execues subsequentes.

No exemplo abaixo, o fluxo druglearn.str utilizado novamente como o ponto de incio para o fluxo.
Neste exemplo, todos os ns no fluxo so executados e os resultados so armazenados em uma lista. Em
seguida, o script executa loop nos resultados e quaisquer sadas de modelo resultantes da execuo so
salvas como um arquivo (.gm) de modelo do IBM SPSS Modeler e o modelo exportado pelo PMML.
import modeler.api

stream = modeler.script.stream()

# Set this to an existing folder on your system.


# Include a trailing directory separator
modelFolder = "C:/temp/models/"

# Execute the stream


models = []
stream.runAll(models)

# Save any models that were created


taskrunner = modeler.script.session().getTaskRunner()
for model in models:
# If the stream execution built other outputs then ignore them
if not(isinstance(model, modeler.api.ModelOutput)):
continue

label = model.getLabel()
algorithm = model.getModelDetail().getAlgorithmName()

# save each model...


modelFile = modelFolder + label + algorithm + ".gm"
taskrunner.saveModelToFile(model, modelFile)

# ...and export each model PMML...


modelFile = modelFolder + label + algorithm + ".xml"
taskrunner.exportModelToFile(model, modelFile, modeler.api.FileFormat.XML)

A classe executora de tarefa fornece uma maneira conveniente de executar vrias tarefas comuns. Os
mtodos que esto disponveis nesta classe so resumidos na tabela a seguir.

40 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 20. Mtodos da classe executora de tarefas para executar tarefas comuns
Mtodo Tipo de retorno Descrio
t.createStream(name, autoConnect, Fluxos Cria e retorna um novo fluxo.
autoManage) Observe que o cdigo que deve criar
fluxos de modo privativo sem
torn-los visveis para o usurio deve
configurar o sinalizador autoManage
para False.
t.exportDocumentToFile( No aplicvel Exporta a descrio do fluxo em um
documentOutput, filename, arquivo utilizando o formato de
fileFormat) arquivo especificado.
t.exportModelToFile(modelOutput, No aplicvel Exporta o modelo em um arquivo
filename, fileFormat) utilizando o formato de arquivo
especificado.
t.exportStreamToFile(stream, No aplicvel Exporta o fluxo em um arquivo
filename, fileFormat) utilizando o formato de arquivo
especificado.
t.insertNodeFromFile(filename, N L e retorna um n a partir do
diagram) arquivo especificado, inserindo-o no
diagrama fornecido. Observe que isso
pode ser utilizado para ler ambos os
objetos de N e SuperNode.
t.openDocumentFromFile(filename, DocumentOutput L e retorna um documento a partir
autoManage) do arquivo especificado.
t.openModelFromFile(filename, ModelOutput L e retorna um documento a partir
autoManage) do arquivo especificado.
t.openStreamFromFile(filename, Fluxos L e retorna um fluxo a partir do
autoManage) arquivo especificado.
t.saveDocumentToFile( No aplicvel Salva o documento no local do
documentOutput, filename) arquivo especificado.
t.saveModelToFile(modelOutput, No aplicvel Salva o modelo no local do arquivo
filename) especificado.
t.saveStreamToFile(stream, No aplicvel Salva o fluxo no local do arquivo
filename) especificado.

Manipulando Erros
A linguagem Python fornece manipulao de erros por meio do bloco de cdigo try...except. Isso pode
ser utilizado dentro de scripts para capturar excees e manipular problemas que, de outra forma, fazem
com que o script seja finalizado.

No script de exemplo abaixo, uma tentativa feita para recuperar um modelo de um IBM SPSS
Collaboration and Deployment Services Repository. Essa operao pode fazer com que uma exceo seja
emitida, por exemplo, se as credenciais de login de repositrio no tiverem sido configuradas
corretamente ou se o caminho do repositrio estiver errado. No script, isso poder fazer com que uma
ModelerException seja emitida (todas as excees que so geradas pelo IBM SPSS Modeler so derivadas
de modeler.api.ModelerException).
import modeler.api

session = modeler.script.session()
try:
repo = session.getRepository()
m = repo.retrieveModel("/some-non-existent-path", None, None, True)

Captulo 4. A API de Script 41


# print goes to the Modeler UI script panel Debug tab
print "Everything OK"
except modeler.api.ModelerException, e:
print "An error occurred:", e.getMessage()

Nota: Algumas operaes de script podem fazer com que excees Java padro sejam emitidas; essas
excees no so derivadas de ModelerException. Para capturar essas excees, um bloco de exceo
adicional poder ser usado para capturar todas as excees Java, por exemplo:
import modeler.api

session = modeler.script.session()
try:
repo = session.getRepository()
m = repo.retrieveModel("/some-non-existent-path", None, None, True)
# print goes to the Modeler UI script panel Debug tab
print "Everything OK"
except modeler.api.ModelerException, e:
print "An error occurred:", e.getMessage()
except java.lang.Exception, e:
print "A Java exception occurred:", e.getMessage()

Parmetros de Fluxo, Sesso e SuperNode


Os parmetros fornecem uma maneira til de transmitir valores no tempo de execuo ao invs de
codific-los permanentemente direto em um script. Os parmetros e seus valores so definidos da mesma
maneira dos fluxos, ou seja, como entradas na tabela de parmetros de um fluxo ou SuperNode ou como
parmetros na linha de comandos. As classes de Fluxo e SuperNode implementam um conjunto de
funes definidas pelo objeto ParameterProvider conforme mostrado na tabela a seguir. A sesso fornece
uma chamada de getParameters() que retorna um objeto que define essas funes.
Tabela 21. Funes definidas pelo objeto ParameterProvider
Mtodo Tipo de retorno Descrio
p.parameterIterator() Agente Iterativo Retorna um agente iterativo de
nomes de parmetro para este objeto.
p.getParameterDefinition( ParameterDefinition Retorna a definio de parmetro
parameterName) para o parmetro com o nome
especificado ou None se esse
parmetro no existir nesse provedor.
O resultado poder ser uma captura
instantnea da definio no momento
em que o mtodo foi chamado e no
precisar refletir nenhuma
modificao subsequente feita no
parmetro por meio deste provedor.
p.getParameterLabel(parameterName) string Retorna o rtulo do parmetro
nomeado ou None se esse parmetro
no existir.
p.setParameterLabel(parameterName, No aplicvel Configura o rtulo do parmetro
label) nomeado.
p.getParameterStorage( ParameterStorage Retorna o armazenamento do
parameterName) parmetro nomeado ou None se esse
parmetro no existir.
p.setParameterStorage( No aplicvel Configura o armazenamento do
parameterName, storage) parmetro nomeado.
p.getParameterType(parameterName) ParameterType Retorna o tipo do parmetro
nomeado ou None se esse parmetro
no existir.
p.setParameterType(parameterName, No aplicvel Define o tipo do parmetro nomeado.
type)

42 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 21. Funes definidas pelo objeto ParameterProvider (continuao)
Mtodo Tipo de retorno Descrio
p.getParameterValue(parameterName) Objeto Retorna o valor do parmetro
nomeado ou None se esse parmetro
no existir.
p.setParameterValue(parameterName, No aplicvel Configura o valor do parmetro
value) nomeado.

No exemplo a seguir, o script agrega alguns dados do Telco para localizar qual regio possui os dados da
receita mdia mais baixa. Um parmetro de fluxo ento configurado com esta regio. Em seguida, esse
parmetro de fluxo utilizado em um n Selecionar para excluir essa regio dos dados antes que um
modelo de rotatividade seja construdo no restante.

O exemplo artificial porque o script gera o n Seleo em si e, portanto, pode ter gerado o valor correto
diretamente na expresso do n Seleo. No entanto, como os fluxos so normalmente pr-construdos,
configurar os parmetros dessa forma fornece um exemplo til.

A primeira parte do script de exemplo cria o parmetro de fluxo que conter a regio com a receita
mdia mais baixa. O script tambm cria os ns na ramificao de agregao e na ramificao de
construo de modelo e os conecta entre si.
import modeler.api

stream = modeler.script.stream()

# Initialize a stream parameter


stream.setParameterStorage("LowestRegion", modeler.api.ParameterStorage.INTEGER)

# First create the aggregation branch to compute the average income per region
statisticsimportnode = stream.createAt("statisticsimport", "SPSS File", 114, 142)
statisticsimportnode.setPropertyValue("full_filename", "$CLEO_DEMOS/telco.sav")
statisticsimportnode.setPropertyValue("use_field_format_for_storage", True)

aggregatenode = modeler.script.stream().createAt("aggregate", "Aggregate", 294, 142)


aggregatenode.setPropertyValue("keys", ["region"])
aggregatenode.setKeyedPropertyValue("aggregates", "income", ["Mean"])

tablenode = modeler.script.stream().createAt("table", "Table", 462, 142)

stream.link(statisticsimportnode, aggregatenode)
stream.link(aggregatenode, tablenode)

selectnode = stream.createAt("select", "Select", 210, 232)


selectnode.setPropertyValue("mode", "Discard")
# Reference the stream parameter in the selection
selectnode.setPropertyValue("condition", "region = $P-LowestRegion")

typenode = stream.createAt("type", "Type", 366, 232)


typenode.setKeyedPropertyValue("direction", "churn", "Target")

c50node = stream.createAt("c50", "C5.0", 534, 232)

stream.link(statisticsimportnode, selectnode)
stream.link(selectnode, typenode)
stream.link(typenode, c50node)

O script de exemplo cria o fluxo a seguir.

Captulo 4. A API de Script 43


Figura 5. Fluxo resultante do script de exemplo

A parte a seguir do script de exemplo executa o n Tabela no trmino da ramificao de agregao.


# First execute the table node
results = []
tablenode.run(results)

A parte a seguir do script de exemplo acessa a sada da tabela que foi gerada pela execuo do n Tabela.
O script ento itera atravs das linhas na tabela, procurando a regio com a receita mdia mais baixa.
# Running the table node should produce a single table as output
table = results[0]

# table output contains a RowSet so we can access values as rows and columns
rowset = table.getRowSet()
min_income = 1000000.0
min_region = None

# From the way the aggregate node is defined, the first column
# contains the region and the second contains the average income
row = 0
rowcount = rowset.getRowCount()
while row < rowcount:
if rowset.getValueAt(row, 1) < min_income:
min_income = rowset.getValueAt(row, 1)
min_region = rowset.getValueAt(row, 0)
row += 1

A parte a seguir do script utiliza a regio com a receita mdia mais baixa para configurar o parmetro de
fluxo "LowestRegion" que foi criado anteriormente. O script ento executa o construtor de modelo com a
regio especificada excluda dos dados de treinamento.
# Check that a value was assigned
if min_region != None:
stream.setParameterValue("LowestRegion", min_region)
else:
stream.setParameterValue("LowestRegion", -1)

# Finally run the model builder with the selection criteria


c50node.run([])

O script de exemplo completo mostrado abaixo.


import modeler.api

stream = modeler.script.stream()

# Create a stream parameter


stream.setParameterStorage("LowestRegion", modeler.api.ParameterStorage.INTEGER)

# First create the aggregation branch to compute the average income per region
statisticsimportnode = stream.createAt("statisticsimport", "SPSS File", 114, 142)
statisticsimportnode.setPropertyValue("full_filename", "$CLEO_DEMOS/telco.sav")
statisticsimportnode.setPropertyValue("use_field_format_for_storage", True)

aggregatenode = modeler.script.stream().createAt("aggregate", "Aggregate", 294, 142)


aggregatenode.setPropertyValue("keys", ["region"])
aggregatenode.setKeyedPropertyValue("aggregates", "income", ["Mean"])

44 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


tablenode = modeler.script.stream().createAt("table", "Table", 462, 142)

stream.link(statisticsimportnode, aggregatenode)
stream.link(aggregatenode, tablenode)

selectnode = stream.createAt("select", "Select", 210, 232)


selectnode.setPropertyValue("mode", "Discard")
# Reference the stream parameter in the selection
selectnode.setPropertyValue("condition", "region = $P-LowestRegion")

typenode = stream.createAt("type", "Type", 366, 232)


typenode.setKeyedPropertyValue("direction", "churn", "Target")

c50node = stream.createAt("c50", "C5.0", 534, 232)

stream.link(statisticsimportnode, selectnode)
stream.link(selectnode, typenode)
stream.link(typenode, c50node)

# First execute the table node


results = []
tablenode.run(results)

# Running the table node should produce a single table as output


table = results[0]

# table output contains a RowSet so we can access values as rows and columns
rowset = table.getRowSet()
min_income = 1000000.0
min_region = None

# From the way the aggregate node is defined, the first column
# contains the region and the second contains the average income
row = 0
rowcount = rowset.getRowCount()
while row < rowcount:
if rowset.getValueAt(row, 1) < min_income:
min_income = rowset.getValueAt(row, 1)
min_region = rowset.getValueAt(row, 0)
row += 1

# Check that a value was assigned


if min_region != None:
stream.setParameterValue("LowestRegion", min_region)
else:
stream.setParameterValue("LowestRegion", -1)

# Finally run the model builder with the selection criteria


c50node.run([])

Valores Globais
Os valores globais so utilizados para calcular vrias estatsticas de resumo para campos especificados.
Esses valores de resumo podem ser acessados em qualquer lugar dentro do fluxo. Os valores globais so
semelhantes aos parmetros de fluxo por eles serem acessados por nome atravs do fluxo. Eles diferem
dos parmetros de fluxo pelo fato de os valores associados serem atualizados automaticamente quando
um n Configurar Globais executado, ao invs de serem designados pelo script ou a partir da linha de
comandos. Os valores globais para um fluxo so acessados ao chamar o mtodo getGlobalValues() do
fluxo.

O objeto GlobalValues define as funes que so mostradas na tabela a seguir.


Tabela 22. Funes que so definidas pelo objeto GlobalValues
Mtodo Tipo de retorno Descrio
g.fieldNameIterator() Agente Iterativo Retorna um agente iterativo para
cada nome de campo com pelo
menos um valor global.

Captulo 4. A API de Script 45


Tabela 22. Funes que so definidas pelo objeto GlobalValues (continuao)
Mtodo Tipo de retorno Descrio
g.getValue(type, fieldName) Object Retorna o valor global para o tipo e
nome do campo especificados, ou
None se nenhum valor puder ser
localizado. Geralmente espera-se que
o valor retornado seja um nmero,
embora uma funcionalidade futura
possa retornar diferentes tipos de
valores.
g.getValues(fieldName) Mapa Retorna um mapa contendo as
entradas conhecidas para o nome do
campo especificado, ou None se no
houver entradas existentes para o
campo.

GlobalValues.Type define o tipo de estatsticas de resumo que esto disponveis. As estatsticas de


resumo a seguir esto disponveis:
v MAX: o valor mximo do campo.
v MEAN: o valor mdio do campo.
v MIN: o valor mnimo do campo.
v STDDEV: o desvio padro do campo.
v SUM: a soma dos valores no campo.

Por exemplo, o script a seguir acessa o valor mdio do campo "income", que calculado por um n
Configurar Globais:
import modeler.api

globals = modeler.script.stream().getGlobalValues()
mean_income = globals.getValue(modeler.api.GlobalValues.Type.MEAN, "income")

Trabalhando com Diversos Fluxos: Scripts Independentes


Para trabalhar com diversos fluxos, um script independente deve ser utilizado. O script independente
pode ser editado e executado dentro da IU do IBM SPSS Modeler ou transmitido como um parmetro da
linha de comandos no modo em lote.

O script independente a seguir abre dois fluxos. Um destes fluxos constri um modelo, ao passo que o
segundo fluxo representa a distribuio dos valores previstos.
# Change to the appropriate location for your system
demosDir = "C:/Program Files/IBM/SPSS/Modeler/17/DEMOS/streams/"

session = modeler.script.session()
tasks = session.getTaskRunner()

# Open the model build stream, locate the C5.0 node and run it
buildstream = tasks.openStreamFromFile(demosDir + "druglearn.str", True)
c50node = buildstream.findByType("c50", None)
results = []
c50node.run(results)

# Now open the plot stream, find the Na_to_K derive and the histogram
plotstream = tasks.openStreamFromFile(demosDir + "drugplot.str", True)
derivenode = plotstream.findByType("derive", None)
histogramnode = plotstream.findByType("histogram", None)

# Create a model applier node, insert it between the derive and histogram nodes
# then run the histgram
applyc50 = plotstream.createModelApplier(results[0], results[0].getName())
applyc50.setPositionBetween(derivenode, histogramnode)
plotstream.linkBetween(applyc50, derivenode, histogramnode)
histogramnode.setPropertyValue("color_field", "$C-Drug")

46 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


histogramnode.run([])

# Finally, tidy up the streams


buildstream.close()
plotstream.close()

Captulo 4. A API de Script 47


48 Guia de Script e Automao Python do IBM SPSS Modeler 17.1
Captulo 5. Dicas de Script
Esta seo fornece uma viso geral de dicas e tcnicas para utilizar scripts, incluindo modificao da
execuo de fluxo, uso de uma senha codificada em um script e acesso aos objetos no IBM SPSS
Collaboration and Deployment Services Repository.

Modificando a Execuo de Fluxo


Quando um fluxo executado, seus ns de terminal so executados em uma ordem otimizada para a
situao padro. Em alguns casos, voc pode preferir uma ordem de execuo diferente. Para modificar a
ordem de execuo de um fluxo, conclua as seguintes etapas a partir da guia Execuo da caixa de
dilogo de propriedades do fluxo:
1. Comece com um script vazio.
2. Clique no boto Anexar script padro na barra de ferramentas para incluir o script de fluxo padro.
3. Altere a ordem das instrues no script de fluxo padro para a ordem em que deseja que as
instrues sejam executadas.

Executando loop pelos Ns


possvel utilizar um loop for para executar loop em todos os ns em um fluxo. Por exemplo, os dois
exemplos de script a seguir executam loop em todos os ns e alteram os nomes de campo em quaisquer
ns Filtro para letras maisculas.

Este script poder ser utilizado em qualquer fluxo que possuir um n Filtro, mesmo se nenhum campo
estiver realmente filtrado. Basta incluir um n Filtro que transmita todos os campos para alterar os nomes
de campo para letras maisculas em todo o quadro.
# Alternative 1: using the data model nameIterator() function
stream = modeler.script.stream()
for node in stream.iterator():
if (node.getTypeName() == "filter"):
# nameIterator() returns the field names
for field in node.getInputDataModel().nameIterator():
newname = field.upper()
node.setKeyedPropertyValue("new_name", field, newname)
# Alternative 2: using the data model iterator() function
stream = modeler.script.stream()
for node in stream.iterator():
if (node.getTypeName() == "filter"):
# iterator() returns the field objects so we need
# to call getColumnName() to get the name
for field in node.getInputDataModel().iterator():
newname = field.getColumnName().upper()
node.setKeyedPropertyValue("new_name", field.getColumnName(), newname)

O script executa loop em todos os ns no fluxo atual e verifica se cada n um Filtro. Se isso ocorrer, o
script executar loop em cada campo no n e utilizar a funo field.upper() ou
field.getColumnName().upper() para alterar o nome para letras maisculas.

Acessando Objetos no IBM SPSS Collaboration and Deployment


Services Repository
Se voc tiver licenciado o IBM SPSS Collaboration and Deployment Services Repository, ser possvel
armazenar, recuperar, bloquear e desbloquear objetos a partir do repositrio usando comandos de script.
O repositrio permite gerenciar o ciclo de vida de modelos de minerao de dados e objetos preditivos
relacionados no contexto de aplicativos, ferramentas e solues corporativos.

49
Conectando-se ao IBM SPSS Collaboration and Deployment Services Repository

Para acessar o repositrio, deve-se primeiro configurar uma conexo vlida com ele, por meio do menu
Ferramentas da interface com o usurio do IBM SPSS Modeler ou por meio da linha de comandos.
(Consulte o tpico Argumentos de Conexo do IBM SPSS Collaboration and Deployment Services
Repository na pgina 65 para obter mais informaes). )

Armazenando e Recuperando Objetos

Em um script, os comandos retrieve e store permitem acessar vrios objetos, incluindo fluxos, modelos,
sada, ns e projetos. A sintaxe a seguinte:
store object as REPOSITORY_PATH {label LABEL}
store object as URI [#l.label]
retrieve object REPOSITORY_PATH {label LABEL | version VERSION}
retrieve object URI [(#m.marker | #l.label)]

O REPOSITORY_PATH fornece o local do objeto no repositrio. Deve-se colocar o caminho entre aspas e
utilizar barras como delimitadores. Ele no faz distino entre maisculas e minsculas.
store stream as "/folder_1/folder_2/mystream.str"
store model Drug as "/myfolder/drugmodel"
store model Drug as "/myfolder/drugmodel.gm" label "final"
store node DRUG1n as "/samples/drug1ntypenode"
store project as "/CRISPDM/DrugExample.cpj"
store output "Data Audit of [6 fields]" as "/my folder/My Audit"

Opcionalmente, uma extenso como .str ou .gm pode ser includa no nome do objeto, mas isso no
necessrio desde que o nome esteja consistente. Por exemplo, se um modelo estiver armazenado sem uma
extenso, ele dever ser recuperado pelo mesmo nome:
store model "/myfolder/drugmodel"
retrieve model "/myfolder/drugmodel"

versus:
store model "/myfolder/drugmodel.gm"
retrieve model "/myfolder/drugmodel.gm" version "0:2005-10-12 14:15:41.281"

Observe que ao recuperar objetos, a verso mais recente do objeto sempre retornada, a menos que voc
especifique uma verso ou rtulo. Ao recuperar um objeto de n, o n ser inserido automaticamente no
fluxo atual. Ao recuperar um objeto de fluxo, deve-se utilizar um script independente. No possvel
recuperar um objeto de fluxo de dentro de um script de fluxo.

Bloqueio e Desbloqueio de Objetos

A partir de um script, possvel bloquear um objeto para evitar que outros usurios atualizem qualquer
uma de suas verses existentes ou criem novas verses. Tambm possvel desbloquear um objeto que
voc bloqueou.

A sintaxe para bloquear e desbloquear um objeto :


lock REPOSITORY_PATH
lock URI

unlock REPOSITORY_PATH
unlock URI

Assim como ocorre com armazenamento e recuperao de objetos, o REPOSITORY_PATH fornece o local do
objeto no repositrio. Deve-se colocar o caminho entre aspas e utilizar barras como delimitadores. Ele no
faz distino entre maisculas e minsculas.
lock "/myfolder/Stream1.str

unlock "/myfolder/Stream1.str"

50 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Como alternativa, possvel utilizar um Identificador Uniforme de Recursos (URI) ao invs de um
caminho de repositrio para fornecer o local do objeto. O URI deve incluir o prefixo spsscr: e ser
totalmente colocado entre aspas. Apenas barras so permitidas como delimitadores de caminho e os
espaos devem ser codificados. Ou seja, utilize %20 ao invs de um espao no caminho. O URI no faz
distino entre maisculas e minsculas. Seguem alguns exemplos:
lock "spsscr:///myfolder/Stream1.str"

unlock "spsscr:///myfolder/Stream1.str"

Note que o bloqueio do objeto aplicado a todas as verses de um objeto - no possvel bloquear ou
desbloquear verses individuais.

Gerando uma Senha Codificada


Em determinados casos, poder ser necessrio incluir uma senha em um script; por exemplo, voc pode
querer acessar uma origem de dados protegida por senha. As senhas codificadas podem ser utilizadas
em:
v Propriedades do N para ns de Origem e de Sada do Banco de Dados
v Argumentos da linha de comandos para efetuar login no servidor
v Propriedades de conexo com o banco de dados armazenadas em um arquivo .par (o arquivo de
parmetro gerado na guia Publicao de um n de exportao)

Por meio da interface com o usurio, uma ferramenta est disponvel para gerar senhas codificadas com
base no algoritmo Blowfish (consulte http://www.schneier.com/blowfish.html para obter mais informaes).
Depois codificado, possvel copiar e armazenar a senha para os arquivos de script e argumentos de
linha de comandos. O n de propriedade epassword usado para databasenode e databaseexportnode
armazena a senha codificada.
1. Para gerar uma senha codificada, no menu Ferramentas, escolha:
Codificar Senha...
2. Especifique uma senha na caixa de texto Senha.
3. Clique em Codificar para gerar uma codificao aleatria de sua senha.
4. Clique no boto Copiar para copiar a senha codificada para a rea de Transferncia.
5. Cole a senha no script ou parmetro desejado.

Verificao de Script
possvel verificar rapidamente a sintaxe de todos os tipos de scripts clicando no boto de verificao
vermelho na barra de ferramentas da caixa de dilogo Script Independente.

Figura 6. cones da barra de ferramentas de script do fluxo

A verificao de script alerta para quaisquer erros em seu cdigo e faz recomendaes para melhoria.
Para visualizar a linha com erros, clique no feedback na metade inferior da caixa de dilogo. Isso
destacar o erro em vermelho.

Script a partir da Linha de Comandos


O script permite executar operaes que geralmente so executadas na interface com o usurio. Apenas
especifique e execute um fluxo independente na linha de comandos quando ativar o IBM SPSS Modeler.
Por exemplo:
client -script scores.txt -execute

Captulo 5. Dicas de Script 51


O sinalizador -script carrega o script especificado, ao passo que o sinalizador -execute executa todos os
comandos no arquivo de script.

Compatibilidade com Liberaes Anteriores


Os scripts criados em liberaes anteriores do IBM SPSS Modeler geralmente devem funcionar inalterados
na liberao atual. No entanto, os nuggets do modelo agora podem ser inseridos no fluxo
automaticamente (essa a configurao padro) e podem substituir ou complementar um nugget
existente desse tipo no fluxo. Se isso realmente ir acontecer ou no depender das configuraes das
opes Incluir modelo no fluxo e Substituir modelo anterior (Ferramentas > Opes > Opes do
Usurio > Notificaes). Poder ser necessrio, por exemplo, modificar um script a partir de uma
liberao anterior em que uma substituio de nugget manipulada ao excluir o nugget existente e
inserir o novo nugget.

Os scripts criados na liberao atual podem no funcionar em liberaes anteriores.

Se um script criado em uma liberao anterior utilizar um comando que foi substitudo (ou
descontinuado), o formato antigo ainda ser suportado, mas uma mensagem de aviso ser exibida. Por
exemplo, a palavra-chave generated antiga foi substituda por model e o comando clear generated foi
substitudo por clear generated palette. Os scripts que usam os formatos antigos ainda sero
executados, mas um aviso ser exibido.

Acessando Resultados da Execuo do Fluxo


Muitos ns do IBM SPSS Modeler produzem objetos de sada como modelos, grficos e dados tabulares.
Muitas dessas sadas contm valores teis que podem ser utilizados por scripts para orientar a execuo
subsequente. Esses valores so agrupados em contineres de contedo (referidos simplesmente como
contineres) que podem ser acessados utilizando tags ou IDs que identificam cada continer. A maneira
como esses valores so acessados depende do formato ou do "modelo de contedo" utilizado por esse
continer.

Por exemplo, muitas sadas de modelo preditivo utilizam uma variante do XML chamada PMML para
representar informaes sobre o modelo, como quais campos uma rvore de deciso utiliza em cada
diviso ou como os neurnios em uma rede neural so conectados e com que intensidade. As sadas de
modelo que utilizam o PMML fornecem um Modelo de Contedo XML que pode ser utilizado para
acessar essas informaes. Por exemplo:
stream = modeler.script.stream()
# Assume the stream contains a single C5.0 model builder node
# and that the datasource, predictors and targets have already been
# set up
modelbuilder = stream.findByType("c50", None)
results = []
modelbuilder.run(results)
modeloutput = results[0]

# Now that we have the C5.0 model output object, access the
# relevant content model
cm = modeloutput.getContentModel("PMML")

# The PMML content model is a generic XML-based content model that


# uses XPath syntax. Use that to find the names of the data fields.
# The call returns a list of strings match the XPath values
dataFieldNames = cm.getStringValues("/PMML/DataDictionary/DataField", "name")

O IBM SPSS Modeler suporta os modelos de contedo a seguir no script:


v O Modelo de contedo de tabela fornece acesso aos dados tabulares simples representados como
linhas e colunas
v O Modelo de contedo XML fornece acesso ao contedo armazenado em formato XML
v O Modelo de contedo JSON fornece acesso ao contedo armazenado em formato JSON

52 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


v O Modelo de contedo de estatsticas de coluna fornece acesso s estatsticas de resumo sobre um
campo especfico
v O Modelo de contedo de estatsticas de coluna de pares fornece acesso s estatsticas de resumo
entre dois campos ou valores entre dois campos separados

Modelo de Contedo de Tabela


O modelo de contedo da tabela fornece um modelo simples para acessar dados de linha e da coluna
simples. Todos os valores em uma coluna especfica devem ter o mesmo tipo de armazenamento (por
exemplo, sequncias ou nmeros inteiros).

API
Tabela 23. API
Retornar Mtodo Descrio
int getRowCount() Retorna o nmero de linhas nesta
tabela.
int getColumnCount() Retorna o nmero de colunas nesta
tabela.
Sequncia de caracteres getColumnName(int columnIndex) Retorna o nome da coluna no ndice
da coluna especificado. O ndice da
coluna inicia em 0.
StorageType getStorageType(int columnIndex) Retorna o tipo de armazenamento da
coluna no ndice especificado. O
ndice da coluna inicia em 0.
Objeto getValueAt(int rowIndex, int Retorna o valor no ndice de linha e
columnIndex) de coluna especificado. Os ndices de
linha e de coluna iniciam em 0.
void reset() Limpa qualquer armazenamento
interno associado a este modelo de
contedo.

Ns e sadas

Esta tabela lista os ns que constroem sadas que incluem esse tipo de modelo de contedo.
Tabela 24. Ns e sadas
Nome do n Nome de sada ID do Continer
table table "table"

Script de exemplo
stream = modeler.script.stream()
from modeler.api import StorageType

# Set up the variable file import node


varfilenode = stream.createAt("variablefile", "DRUG Data", 96, 96)
varfilenode.setPropertyValue("full_filename", "$CLEO_DEMOS/DRUG1n")

# Next create the aggregate node and connect it to the variable file node
aggregatenode = stream.createAt("aggregate", "Aggregate", 192, 96)
stream.link(varfilenode, aggregatenode)

# Configure the aggregate node


aggregatenode.setPropertyValue("keys", ["Drug"])
aggregatenode.setKeyedPropertyValue("aggregates", "Age", ["Min", "Max"])
aggregatenode.setKeyedPropertyValue("aggregates", "Na", ["Mean", "SDev"])

# Then create the table output node and connect it to the aggregate node
tablenode = stream.createAt("table", "Table", 288, 96)

Captulo 5. Dicas de Script 53


stream.link(aggregatenode, tablenode)

# Execute the table node and capture the resulting table output object
results = []
tablenode.run(results)
tableoutput = results[0]

# Access the table outputs content model


tablecontent = tableoutput.getContentModel("table")

# For each column, print column name, type and the first row
# of values from the table content
col = 0
while col < tablecontent.getColumnCount():
print tablecontent.getColumnName(col), \
tablecontent.getStorageType(col), \
tablecontent.getValueAt(0, col)
col = col + 1

A sada na guia Depurao de script ser semelhante a esta:


Age_Min Integer 15
Age_Max Integer 74
Na_Mean Real 0.730851098901
Na_SDev Real 0.116669731242
Drug String drugY
Record_Count Integer 91

Modelo de Contedo XML


O Modelo de Contedo XML fornece acesso ao contedo baseado em XML.

O Modelo de Contedo XML suporta a capacidade de acessar componentes com base em expresses
XPath. As expresses XPath so sequncias que definem quais elementos ou atributos so exigidos pelo
responsvel pela chamada. O Modelo de Contedo XML oculta os detalhes de vrios objetos de
construo e expresses de compilao que geralmente so necessrios pelo suporte ao XPath. Isso
simplifica a chamada do script Python.

O Modelo de Contedo XML inclui uma funo que retorna o documento XML como uma sequncia.
Isso permite que usurios do script Python utilizem sua biblioteca Python preferencial para analisar o
XML.

API
Tabela 25. API
Retornar Mtodo Descrio
String getXMLAsString() Retorna o XML como uma sequncia.
number getNumericValue(String xpath) Retorna o resultado da avaliao do
caminho com tipo de retorno
numrico (por exemplo, contagem do
nmero de elementos que
correspondem expresso de
caminho).
boolean getBooleanValue(String xpath) Retorna o resultado booleano da
avaliao da expresso de caminho
especificada.
String getStringValue(String xpath, Retorna o valor de atributo ou o
String attribute) valor do n XML que corresponde ao
caminho especificado.
List of strings getStringValues(String xpath, Retorna uma lista de todos os valores
String attribute) de atributos ou valores do n XML
que correspondem ao caminho
especificado.

54 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 25. API (continuao)
Retornar Mtodo Descrio
List of lists of strings getValuesList(String xpath, <List Retorna uma lista de todos os valores
of strings> attributes, boolean de atributos que correspondem ao
includeValue) caminho especificado junto com o
valor do n XML, se necessrio.
Hash table (key:string, value:list getValuesMap(String xpath, String Retorna uma hashtable que utiliza o
of string) keyAttribute, <List of strings> atributo-chave ou o valor do n XML
attributes, boolean includeValue) como chave, e a lista de valores de
atributos especificados como valores
da tabela.
boolean isNamespaceAware() Retorna se os analisadores XML
devem reconhecer namespaces. O
padro False.
void setNamespaceAware(boolean value) Configura se os analisadores XML
devem reconhecer namespaces. Isso
tambm chama reset() para
assegurar que as mudanas sejam
selecionadas por chamadas
subsequentes.
void reset() Esvazia qualquer armazenamento
interno associado a este modelo de
contedo (por exemplo, um objeto
DOM em cache).

Ns e sadas
Esta tabela lista os ns que constroem sadas que incluem esse tipo de modelo de contedo.
Tabela 26. Ns e sadas
Nome do n Nome de sada ID do Continer
Most model builders Most generated models "PMML"
"autodataprep" n/d "PMML"

Script de exemplo
O cdigo de script Python para acessar o contedo pode ser semelhante a este:
results = []
modelbuilder.run(results)
modeloutput = results[0]
cm = modeloutput.getContentModel("PMML")

dataFieldNames = cm.getStringValues("/PMML/DataDictionary/DataField", "name")


predictedNames = cm.getStringValues("//MiningSchema/MiningField[@usageType=predicted]", "name")

Modelo de Contedo JSON


O Modelo de Contedo JSON utilizado para fornecer suporte para o contedo do formato JSON. Isso
fornece uma API bsica para permitir que os responsveis pela chamada extraiam valores supondo que
eles saibam quais valores devem ser acessados.

Captulo 5. Dicas de Script 55


API
Tabela 27. API
Retornar Mtodo Descrio
String getJSONAsString() Retorna o contedo JSON como uma
sequncia.
Object getObjectAt(<List of cbjecta> Retorna o objeto no caminho
path, JSONArtifact artifact) especificado. O artefato raiz fornecido
throws Exception pode ser nulo no caso em que a raiz
do contedo utilizada. O valor
retornado pode ser uma sequncia de
caracteres literal, um nmero inteiro,
real ou booleano ou um artefato
JSON (um objeto JSON ou uma
matriz JSON).
Hash table (key:object, getChildValuesAt(<List of object> Retorna os valores-filhos do caminho
value:object> path, JSONArtifact artifact) especificado se o caminho levar a um
throws Exception objeto JSON, caso contrrio, retorna
nulo. As chaves na tabela so
sequncias, ao passo que o valor
associado pode ser uma sequncia de
caracteres literal, um nmero inteiro,
real ou booleano ou um artefato
JSON (um objeto JSON ou uma
matriz JSON).
List of objects getChildrenAt(<List of object> Retorna a lista de objetos no caminho
path path, JSONArtifact artifact) especificado se o caminho levar a
throws Exception uma matriz JSON, caso contrrio,
retorna nulo. Os valores retornados
podem ser uma sequncia de
caracteres literal, um nmero inteiro,
real ou booleano ou um artefato
JSON (um objeto JSON ou uma
matriz JSON).
void reset() Esvazia qualquer armazenamento
interno associado a este modelo de
contedo (por exemplo, um objeto
DOM em cache).

Script de exemplo

Se houver um n construtor de sada que cria a sada com base no formato JSON, o seguinte poder ser
utilizado para acessar informaes sobre um conjunto de manuais:
results = []
outputbuilder.run(results)
output = results[0]
cm = output.getContentModel("jsonContent")

bookTitle = cm.getObjectAt(["books", "ISIN123456", "title"], None)

# Alternatively, get the book object and use it as the root


# for subsequent entries
book = cm.getObjectAt(["books", "ISIN123456"], None)
bookTitle = cm.getObjectAt(["title"], book)

# Get all child values for aspecific book


bookInfo = cm.getChildValuesAt(["books", "ISIN123456"], None)

# Get the third book entry. Assumes the top-level "books" value
# contains a JSON array which can be indexed

56 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


bookInfo = cm.getObjectAt(["books", 2], None)

# Get a list of all child entries


allBooks = cm.getChildrenAt(["books"], None)

Modelo de Contedo de Estatsticas de Coluna e Modelo de Contedo


de Estatsticas de Pares
O modelo de contedo de estatsticas de coluna fornece acesso s estatsticas que podem ser calculadas
para cada campo (estatsticas univariadas). O modelo de contedo de estatsticas de pares fornece acesso
s estatsticas que podem ser calculadas entre pares de campos ou de valores em um campo.

As medidas de estatsticas possveis so:


v Count
v UniqueCount
v ValidCount
v Mean
v Sum
v Min
v Mx.
v Intervalo
v Variance
v StandardDeviation
v StandardErrorOfMean
v Skewness
v SkewnessStandardError
v Kurtosis
v KurtosisStandardError
v Mediana
v Modo
v Pearson
v Covariance
v TTest
v FTest

Alguns valores so apropriados apenas a partir de estatsticas de coluna nica, ao passo que outros so
apropriados apenas para estatsticas de pares.

Os ns que produziro esses so:


v O N de estatsticas produz estatsticas de coluna e pode produzir estatsticas de pares quando os
campos de correlao so especificados
v O N Auditoria de Dados produz estatsticas de coluna e pode produzir estatsticas de pares quando
um campo de sobreposio especificado.
v O N Mdias produz estatsticas de pares quando compara pares de campos ou compara os valores de
um campo com outras sumarizaes de campo.

As capacidades de um n especfico e tambm as configuraes no n determinaro quais modelos e


estatsticas de contedo estaro disponveis.

Captulo 5. Dicas de Script 57


API de ColumnStatsContentModel
Tabela 28. API de ColumnStatsContentModel.
Retornar Mtodo Descrio
List<StatisticType> getAvailableStatistics() Retorna as estatsticas disponveis
nesse modelo. Nem todos os campos
tero necessariamente valores para
todas as estatsticas.
List<String> getAvailableColumns() Retorna os nomes das colunas para
as quais as estatsticas foram
calculadas.
Processo Processo getStatistic(String column, Retorna os valores estatsticos
StatisticType statistic) associados coluna.
void reset() Limpa qualquer armazenamento
interno associado a este modelo de
contedo.

API PairwiseStatsContentModel
Tabela 29. API PairwiseStatsContentModel.
Retornar Mtodo Descrio
List<StatisticType> getAvailableStatistics() Retorna as estatsticas disponveis
nesse modelo. Nem todos os campos
tero necessariamente valores para
todas as estatsticas.
List<String> getAvailablePrimaryColumns() Retorna os nomes de colunas
primrias para as quais as estatsticas
foram calculadas.
List<Object> getAvailablePrimaryValues() Retorna os valores de colunas
primrias para as quais as estatsticas
foram calculadas.
List<String> getAvailableSecondaryColumns() Retorna os nomes de colunas
secundrias para as quais as
estatsticas foram calculadas.
Processo Processo getStatistic(String primaryColumn, Retorna os valores estatsticos
String secondaryColumn, associados s colunas.
StatisticType statistic)
Processo Processo getStatistic(String primaryColumn, Retorna os valores de estatstica
Object primaryValue, String associados ao valor da coluna
secondaryColumn, StatisticType primria e da coluna secundria.
statistic)
void reset() Limpa qualquer armazenamento
interno associado a este modelo de
contedo.

58 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Ns e sadas
Esta tabela lista os ns que constroem sadas que incluem esse tipo de modelo de contedo.
Tabela 30. Ns e sadas.
Nome do n Nome de sada ID do Continer Notas
"means" "means" "columnStatistics"
(n Mdias)
"means" "means" "pairwiseStatistics"
(n Mdias)
"dataaudit" "means" "columnStatistics"
(n Auditoria de Dados)
"statistics" "statistics" "columnStatistics" Gerado apenas quando
(n Estatsticas) campos especficos so
examinados.
"statistics" "statistics" "pairwiseStatistics" Gerado apenas quando
(n Estatsticas) campos especficos so
correlacionados.

Script de exemplo
from modeler.api import StatisticType
stream = modeler.script.stream()

# Set up the input data


varfile = stream.createAt("variablefile", "File", 96, 96)
varfile.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")

# Now create the statistics node. This can produce both


# column statistics and pairwise statistics
statisticsnode = stream.createAt("statistics", "Stats", 192, 96)
statisticsnode.setPropertyValue("examine", ["Age", "Na", "K"])
statisticsnode.setPropertyValue("correlate", ["Age", "Na", "K"])
stream.link(varfile, statisticsnode)

results = []
statisticsnode.run(results)
statsoutput = results[0]
statscm = statsoutput.getContentModel("columnStatistics")
if (statscm != None):
cols = statscm.getAvailableColumns()
stats = statscm.getAvailableStatistics()
print "Column stats:", cols[0], str(stats[0]), " = ", statscm.getStatistic(cols[0], stats[0])

statscm = statsoutput.getContentModel("pairwiseStatistics")
if (statscm != None):
pcols = statscm.getAvailablePrimaryColumns()
scols = statscm.getAvailableSecondaryColumns()
stats = statscm.getAvailableStatistics()
corr = statscm.getStatistic(pcols[0], scols[0], StatisticType.Pearson)
print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr

Captulo 5. Dicas de Script 59


60 Guia de Script e Automao Python do IBM SPSS Modeler 17.1
Captulo 6. Argumentos de Linha de Comandos
Chamando o Software
possvel usar a linha de comandos do seu sistema operacional para ativar o IBM SPSS Modeler da
seguinte forma:
1. Em um computador no qual o IBM SPSS Modeler est instalado, abra um DOS, um prompt de
comandos ou uma janela.
2. Para ativar a interface do IBM SPSS Modeler no modo interativo, digite o comando modelerclient
seguido pelos argumentos necessrios; por exemplo:
modelerclient -stream report.str -execute

Os argumentos (flags) disponveis permitem se conectar a um servidor, carregar fluxos, executar scripts
ou especificar outros parmetros conforme necessrio.

Utilizando Argumentos de Linha de Comandos


possvel anexar argumentos de linha de comandos (tambm referidos como sinalizadores) ao comando
inicial modelerclient para alterar a chamada do IBM SPSS Modeler.

Vrios tipos de argumentos de linha de comandos esto disponveis e so descritos posteriormente nesta
seo.
Tabela 31. Tipos de argumentos de linha de comandos.
Tipo de argumento Onde descrito
Argumentos do sistema Consulte o tpico Argumentos do sistema na pgina
62 para obter mais informaes.
Argumentos de parmetro Consulte o tpico Argumentos de Parmetros na
pgina 63 para obter mais informaes.
Argumentos de conexo do servidor Consulte o tpico Argumentos de Conexo do
Servidor na pgina 64 para obter mais informaes.
Argumentos de conexo do IBM SPSS Collaboration and Consulte o tpico Argumentos de Conexo do IBM
Deployment Services Repository SPSS Collaboration and Deployment Services Repository
na pgina 65 para obter mais informaes.
Argumentos de conexo do IBM SPSS Analytic Server Consulte o tpico Argumentos de Conexo do IBM
SPSS Analytic Server na pgina 65 para obter mais
informaes.

Por exemplo, possvel utilizar os sinalizadores -server, -stream e -execute para se conectar a um
servidor e, em seguida, carregar e executar um fluxo, conforme a seguir:
modelerclient -server -hostname myserver -port 80 -username dminer
-password 1234 -stream mystream.str -execute

Observe que ao executar com relao a uma instalao do cliente local, os argumentos de conexo do
servidor no so necessrios.

Os valores de parmetros que contiverem espaos podem ser colocados entre aspas duplas, por exemplo:
modelerclient -stream mystream.str -Pusername="Joe User" -execute

Tambm possvel executar os estados e scripts do IBM SPSS Modeler dessa maneira utilizando os
sinalizadores -state e -script, respectivamente.

61
Nota: Se voc utilizar um parmetro estruturado em um comando, deve-se preceder as aspas com uma
barra invertida. Isso evita que as aspas sejam removidas durante a interpretao da sequncia.

Depurando Argumentos de Linha de Comandos


Para depurar uma linha de comandos, utilize o comando modelerclient para ativar o IBM SPSS Modeler
com os argumentos desejados. Isso permite verificar se os comandos sero executados conforme o
esperado. Tambm possvel confirmar os valores de quaisquer parmetros transmitidos a partir da linha
de comandos na caixa de dilogo Parmetros da Sesso (menu Ferramentas, Configurar Parmetros da
Sesso).

Argumentos do sistema
A tabela a seguir descreve os argumentos do sistema disponveis para chamada da linha de comandos da
interface com o usurio.
Tabela 32. Argumentos do sistema
Argumento Comportamento/Descrio
@ <commandFile> O caractere @ seguido por um nome de arquivo especifica uma lista de comandos.
Quando modelerclient encontra um argumento que comea com @, ele opera nos
comandos nesse arquivo como se estivesse na linha de comandos. Consulte o tpico
Combinando Diversos Argumentos na pgina 66 para obter mais informaes.
-directory <dir> Configura o diretrio ativo padro. No modo local, esse diretrio utilizado para
ambos dados e tambm para sada. Exemplo: -directory c:/ ou -directory c:\\
-server_directory <dir> Configura o diretrio do servidor padro para dados. O diretrio ativo especificado
usando o sinalizador -directory utilizado para sada.
-execute Depois de iniciar, executa qualquer fluxo, estado ou script carregado na inicializao.
Se um script estiver carregado alm de um fluxo ou estado, apenas o script ser
executado.
-stream <stream> Na inicializao, carregue o fluxo especificado. Diversos fluxos podem ser
especificados, no entanto, o ltimo fluxo especificado ser configurado como o fluxo
atual.
-script <script> Na inicializao, carrega o script independente especificado. Isso pode ser
especificado alm de um fluxo ou estado conforme descrito abaixo, no entanto,
apenas um script pode ser carregado na inicializao.
-model <model> Na inicializao, carrega o modelo gerado (formato de arquivo .gm) especificado.
-state <state> Na inicializao, carrega o estado salvo especificado.
-project <project> Carrega o projeto especificado. Somente um projeto pode ser carregado na
inicializao.
-output <output> Na inicializao, carrega o objeto de sada salvo (formato de arquivo .cou).
-help Exibe uma lista de argumentos de linha de comandos. Quando essa opo
especificada, todos os outros argumentos so ignorados e a tela Ajuda exibida.
-P <name>=<value> Utilizado para configurar um parmetro de inicializao. Tambm pode ser utilizado
para configurar propriedades do n (parmetros do slot).

Nota: Diretrios padro tambm podem ser configurados na interface com o usurio. Para acessar as
opes, no menu Arquivo, escolha Configurar Diretrio Ativo ou Configurar Diretrio do Servidor.

Carregando Diversos Arquivos

Na linha de comandos, possvel carregar diversos fluxos, estados e sadas na inicializao ao repetir o
argumento relevante para cada objeto carregado. Por exemplo, para carregar e executar dois fluxos
chamados report.str e train.str, utilize o comando a seguir:

62 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


modelerclient -stream report.str -stream train.str -execute

Carregando Objetos a partir do IBM SPSS Collaboration and Deployment Services Repository

Como possvel carregar determinados objetos a partir de um arquivo ou a partir do IBM SPSS
Collaboration and Deployment Services Repository (se licenciado), o prefixo de nome de arquivo spsscr:,
e opcionalmente file: (para objetos no disco), informam ao IBM SPSS Modeler onde procurar pelo
objeto. O prefixo funciona com os seguintes sinalizadores:
v -stream
v -script
v -output
v -model
v -project

Use o prefixo para criar um URI que especifica o local do objeto, por exemplo, -stream
"spsscr:///folder_1/scoring_stream.str". A presena do prefixo spsscr: requer que uma conexo
vlida com o IBM SPSS Collaboration and Deployment Services Repository seja especificada no mesmo
comando. Portanto, por exemplo, o comando completo ser semelhante ao seguinte:
modelerclient -spsscr_hostname myhost -spsscr_port 8080
-spsscr_username myusername -spsscr_password mypassword
-stream "spsscr:///folder_1/scoring_stream.str" -execute

Observe que deve-se utilizar um URI na linha de comandos. O REPOSITORY_PATH mais simples no
suportado. (Ele funciona apenas dentro de scripts). Para obter mais detalhes sobre URIs para objetos no
IBM SPSS Collaboration and Deployment Services Repository, consulte o tpico Acessando Objetos no
IBM SPSS Collaboration and Deployment Services Repository na pgina 49.

Argumentos de Parmetros
Os parmetros podem ser utilizados como sinalizadores durante a execuo da linha de comandos do
IBM SPSS Modeler. Nos argumentos da linha de comandos, o sinalizador -P utilizado para denotar um
parmetro no formato -P <name>=<value>.

Os parmetros podem ser qualquer um dos seguintes:


v Parmetros simples (ou parmetros utilizados diretamente em expresses do CLEM).
v Parmetros de slot, tambm referidos como propriedades do n. Esses parmetros so utilizados para
modificar as configuraes de ns no fluxo. Consulte o tpico Viso Geral de Propriedades do N na
pgina 69 para obter informaes adicionais.
v Parmetros da linha de comandos, utilizados para alterar a chamada do IBM SPSS Modeler.

Por exemplo, possvel fornecer nomes de usurio e senhas de origem de dados como um sinalizador da
linha de comandos, conforme a seguir:
modelerclient -stream response.str -P:databasenode.datasource="{\"ORA 10gR2\", user1, mypsw,
true}"

O formato o mesmo que o parmetro datasource da propriedade do n databasenode. Para obter mais
informaes, consulte: Propriedades de databasenode na pgina 81.

Nota: Se o n for nomeado, deve-se colocar o nome do n entre aspas duplas e escapar as aspas com
uma barra invertida. Por exemplo, se o n da origem de dados no exemplo anterior possuir o nome
Source_ABC, a entrada ser a seguinte:
modelerclient -stream response.str -P:databasenode.\"Source_ABC\".datasource="{\"ORA 10gR2\",
user1, mypsw, true}"

Uma barra invertida tambm necessria na frente das aspas que identificam um parmetro estruturado,
como no exemplo de origem de dados do TM1 a seguir:

Captulo 6. Argumentos de Linha de Comandos 63


clemb -server -hostname 9.115.21.169 -port 28053 -username administrator
-execute -stream C:\Share\TM1_Script.str -P:tm1import.pm_host="http://9.115.21.163:9510/pmhub/pm"
-P:tm1import.tm1_connection={\"SData\",\"\",\"admin\",\"apple\"}
-P:tm1import.selected_view={\"SalesPriorCube\",\"salesmargin%\"}

Argumentos de Conexo do Servidor


O sinalizador -server informa ao IBM SPSS Modeler que ele deve se conectar a um servidor pblico e os
sinalizadores -hostname, -use_ssl, -port, -username, -password e -domain so utilizados para informar ao
IBM SPSS Modeler como conectar-se ao servidor pblico. Se nenhum argumento -server for especificado,
o servidor padro ou local ser utilizado.

Exemplos

Para conectar-se a um servidor pblico:


modelerclient -server -hostname myserver -port 80 -username dminer
-password 1234 -stream mystream.str -execute

Para conectar-se a um cluster de servidores:


modelerclient -server -cluster "QA Machines" \
-spsscr_hostname pes_host -spsscr_port 8080 \
-spsscr_username asmith -spsscr_epassword xyz

Observe que conectar-se a um cluster de servidores requer o Coordenador de Processos por meio do IBM
SPSS Collaboration and Deployment Services, portanto, o argumento -cluster dever ser usado em
combinao com as opes de conexo do repositrio (spsscr_*). Consulte o tpico Argumentos de
Conexo do IBM SPSS Collaboration and Deployment Services Repository na pgina 65 para obter mais
informaes.
Tabela 33. Argumentos de conexo do servidor.
Argumento Comportamento/Descrio
-server Executa o IBM SPSS Modeler no modo de servidor, conectando-se a um servidor
pblico utilizando os sinalizadores -hostname, -port, -username, -password, e
-domain.
-hostname <name> O nome do host da mquina servidor. Disponvel apenas no modo de servidor.
-use_ssl Especifica que a conexo deve usar SSL (Secure Sockets Layer). Esse sinalizador
opcional; a configurao padro no usar SSL.
-port <number> O nmero da porta do servidor especificado. Disponvel apenas no modo de
servidor.
-cluster <name> Especifica uma conexo com um cluster de servidores e no com um servidor
denominado; esse argumento uma alternativa para os argumentos hostname, port
e use_ssl. O nome o nome do cluster ou um URI exclusivo que identifica o
cluster no IBM SPSS Collaboration and Deployment Services Repository. O cluster
de servidores gerenciado pelo Coordenador de Processos por meio de IBM SPSS
Collaboration and Deployment Services. Consulte o tpico Argumentos de
Conexo do IBM SPSS Collaboration and Deployment Services Repository na
pgina 65 para obter mais informaes.
-username <name> O nome do usurio com o qual efetuar logon no servidor. Disponvel apenas no
modo de servidor.
-password <password> A senha com a qual efetuar logon no servidor. Disponvel apenas no modo de
servidor. Nota: Se o argumento -password no for utilizado, ser solicitado a
fornecer uma senha.
-epassword A senha codificada com a qual efetuar logon no servidor. Disponvel apenas no
<encodedpasswordstring> modo de servidor. Nota: Uma senha codificada pode ser gerada a partir do menu
Ferramentas do aplicativo IBM SPSS Modeler.
-domain <name> O domnio utilizado para efetuar logon no servidor. Disponvel apenas no modo
de servidor.

64 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 33. Argumentos de conexo do servidor (continuao).
Argumento Comportamento/Descrio
-P <name>=<value> Utilizado para configurar um parmetro de inicializao. Tambm pode ser
utilizado para configurar propriedades do n (parmetros do slot).

Argumentos de Conexo do IBM SPSS Collaboration and Deployment


Services Repository
Se desejar armazenar ou recuperar objetos a partir do IBM SPSS Collaboration and Deployment Services
por meio da linha de comandos, deve-se especificar uma conexo vlida com o IBM SPSS Collaboration
and Deployment Services Repository. Por exemplo:
modelerclient -spsscr_hostname myhost -spsscr_port 8080
-spsscr_username myusername -spsscr_password mypassword
-stream "spsscr:///folder_1/scoring_stream.str" -execute

A tabela a seguir lista os argumentos que podem ser utilizados para configurar a conexo.
Tabela 34. Argumentos de conexo do IBM SPSS Collaboration and Deployment Services Repository
Argumento Comportamento/Descrio
-spsscr_hostname <hostname or IP O nome do host ou o endereo IP do servidor no qual o IBM SPSS
address> Collaboration and Deployment Services Repository est instalado.
-spsscr_port <number> O nmero da porta na qual o IBM SPSS Collaboration and Deployment
Services Repository aceita conexes (geralmente 8080, por padro).
-spsscr_use_ssl Especifica que a conexo deve usar SSL (Secure Sockets Layer). Esse
sinalizador opcional; a configurao padro no usar SSL.
-spsscr_username <name> O nome de usurio com o qual efetuar logon no IBM SPSS Collaboration
and Deployment Services Repository.
-spsscr_password <password> A senha com a qual efetuar logon no IBM SPSS Collaboration and
Deployment Services Repository.
-spsscr_epassword <encoded password> A senha codificada com a qual efetuar logon no IBM SPSS Collaboration
and Deployment Services Repository.
-spsscr_domain <name> O domnio utilizado para efetuar logon no IBM SPSS Collaboration and
Deployment Services Repository. Esse sinalizador opcional - no o
utilize, a no ser que voc efetue logon utilizando o LDAP ou o Active
Directory.

Argumentos de Conexo do IBM SPSS Analytic Server


Se desejar armazenar ou recuperar objetos a partir do IBM SPSS Analytic Server por meio da linha de
comandos, deve-se especificar uma conexo vlida com o IBM SPSS Analytic Server.

Nota: O local do Analytic Server obtido a partir do SPSS Modeler Server e no pode ser alterado no
cliente.

A tabela a seguir lista os argumentos que podem ser utilizados para configurar a conexo.
Tabela 35. Argumentos de conexo do IBM SPSS Analytic Server
Argumento Comportamento/Descrio
-analytic_server_username O nome de usurio com o qual efetuar logon no IBM SPSS Analytic
Server.
-analytic_server_password A senha com a qual efetuar logon no IBM SPSS Analytic Server.

Captulo 6. Argumentos de Linha de Comandos 65


Tabela 35. Argumentos de conexo do IBM SPSS Analytic Server (continuao)
Argumento Comportamento/Descrio
-analytic_server_epassword A senha codificada com o qual efetuar logon no IBM SPSS Analytic
Server.
-analytic_server_credential As credenciais utilizadas para efetuar logon no IBM SPSS Analytic
Server.

Combinando Diversos Argumentos


Diversos argumentos podem ser combinados em um arquivo de comando nico especificado na chamada
utilizando o smbolo @ seguido pelo nome do arquivo. Isso permite reduzir a chamada da linha de
comandos e superar quaisquer limitaes do sistema operacional referentes ao comprimento de comando.
Por exemplo, o comando de inicializao a seguir usa argumentos especificados no arquivo referenciado
por <commandFileName>.
modelerclient @<commandFileName>

Coloque o nome do arquivo e o caminho para o arquivo de comando entre aspas se espaos forem
necessrios, conforme a seguir:
modelerclient @ "C:\Program Files\IBM\SPSS\Modeler\nn\scripts\my_command_file.txt"

O arquivo de comando pode conter todos os argumentos anteriormente especificados individualmente na


inicializao, com um argumento por linha. Por exemplo:
-stream report.str
-Porder.full_filename=APR_orders.dat
-Preport.filename=APR_report.txt
-execute

Ao gravar e fazer referncia a arquivos de comando, assegure-se de seguir estas restries:


v Utilize apenas um comando por linha.
v No integre um argumento @CommandFile dentro de um arquivo de comando.

66 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Captulo 7. Referncia de Propriedades
Viso Geral de Referncia de Propriedades
possvel especificar diversas propriedades diferentes para ns, fluxos, SuperNodes e projetos. Algumas
propriedades so comuns a todos os ns, como nome, anotao e dica de ferramenta, enquanto que
outras so especficas para determinados tipos de ns. Outras propriedades se referem a operaes de
fluxo de alto nvel, como o armazenamento em cache ou comportamento de SuperNode. As propriedades
podem ser acessadas por meio da interface com o usurio padro (por exemplo, quando abrir uma caixa
de dilogo para editar opes para um n) e tambm pode ser utilizadas de vrias maneiras diferentes.
v As propriedades podem ser modificadas por meio de scripts, conforme descrito nesta seo. Para obter
informaes adicionais, consulte Sintaxe para Propriedades.
v As propriedades do n podem ser utilizadas em parmetros de SuperNode.
v As propriedades do n tambm podem ser utilizadas como parte de uma opo de linha de comandos
(utilizando o sinalizador -P) ao iniciar o IBM SPSS Modeler.

No contexto de script dentro do IBM SPSS Modeler, as propriedades do n e do fluxo so geralmente


chamadas de parmetros de slot. Neste guia, elas so referidas como propriedades de n ou de fluxo.

Para obter mais informaes sobre a linguagem de script, consulte Linguagem de Script.

Sintaxe para Propriedades


As propriedades podem ser configuradas utilizando a sintaxe a seguir
OBJECT.setPropertyValue(PROPERTY, VALUE)

ou:
OBJECT.setKeyedPropertyValue(PROPERTY, KEY, VALUE)

O valor de propriedades pode ser recuperado utilizando a sintaxe a seguir:


VARIABLE = OBJECT.getPropertyValue(PROPERTY)

ou:
VARIABLE = OBJECT.getKeyedPropertyValue(PROPERTY, KEY)

em que OBJECT um n ou sada, PROPERTY o nome da propriedade do n que sua expresso referencia
e KEY o valor da chave para as propriedades definidas como chave. Por exemplo, a sintaxe a seguir
usada para localizar o n de filtro e, em seguida, configure o padro para incluir todos os campos e
filtrar o campo Age a partir dos dados de recebimento de dados:
filternode = modeler.script.stream().findByType("filter", None)
filternode.setPropertyValue("default_include", True)
filternode.setKeyedPropertyValue("include", "Age", False)

Todos os ns utilizados no IBM SPSS Modeler podem ser localizados utilizando a funo
findByType(TYPE, LABEL) do fluxo. Pelo menos um de TYPE ou LABEL deve ser especificado.

Propriedades Estruturadas
O script usa as propriedades estruturadas de duas maneiras para maior clareza durante a anlise:
v Para fornecer estrutura para os nomes de propriedades para ns complexos, como Tipo, Filtro ou
Balanceamento.
v Para fornecer um formato para especificar diversas propriedades de uma vez.

67
Estruturando para Interfaces Complexas

Os scripts para ns com tabelas e outras interfaces complexas (por exemplo, Tipo, Filtro e Balanceamento)
devem seguir uma estrutura especfica para que a anlise seja executada corretamente. Essas
propriedades precisam de um nome que seja mais complexo do que o nome para um identificador nico;
esse nome chamado de chave. Por exemplo, em um n Filtro, cada campo disponvel (em seu lado de
envio de dados) ativado ou desativado. Para fazer referncia a essas informaes, o n Filtro armazena
um item de informaes por campo (independentemente se cada campo for true ou false). Esta
propriedade pode ter (ou ter recebido) o valor True ou False. Suponha que um n Filtro denominado
mynode possua (em seu lado de envio de dados) um campo chamado Age. Para desativar isso, configure a
propriedade include, com a chave Age, para o valor False, conforme a seguir:
mynode.setKeyedPropertyValue("include", "Age", False)

Estruturando para Configurar Diversas Propriedades

Para muitos ns, possvel designar mais de uma propriedade de n ou de fluxo por vez. Isso referido
como o comando de multiconjunto ou bloco de conjunto.

Em alguns casos, uma propriedade estruturada pode ser muito complexa. Um exemplo o seguinte:
sortnode.setPropertyValue("keys", [["K", "Descending"], ["Age", "Ascending"], ["Na", "Descending"]])

Outra vantagem que as propriedades estruturadas possuem a capacidade de configurar vrias


propriedades em um n antes de o n se tornar estvel. Por padro, um multiconjunto configura todas as
propriedades no bloco antes de executar qualquer ao com base em uma configurao de propriedade
individual. Por exemplo, ao definir um n Arquivo Fixo, utilizar duas etapas para configurar as
propriedades do campo resultaria em erros porque o n no estar consistente at que ambas as
configuraes sejam vlidas. Definir propriedades como um multiconjunto evita esse problema ao
configurar as duas propriedades antes de atualizar o modelo de dados.

Abreviaes
Abreviaes padro so utilizadas em toda a sintaxe das propriedades do n. Aprender as abreviaes
til na construo de scripts.
Tabela 36. Abreviaes padro utilizadas em toda a sintaxe
Abreviao Significado
abs Valor absoluto
len Comprimento
mn. Mnimo
mx. Mximo
correl Correlao
covar Covarincia
num Nmero ou numrico
pct Percentual ou porcentagem
transp Transparncia
xval Validao cruzada
var Variao ou varivel (em ns de origem)

Exemplos de Propriedade de N e de Fluxo


As propriedades do n e de fluxo podem ser utilizadas de vrias maneiras com o IBM SPSS Modeler.
Elas so utilizadas com mais frequncia como parte de um script, seja um script independente utilizado
para automatizar diversos fluxos ou operaes ou um script de fluxo utilizado para automatizar os

68 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


processos dentro de um nico fluxo. Tambm possvel especificar parmetros do n usando as
propriedades do n no SuperNode. No nvel mais bsico, as propriedades tambm podem ser utilizadas
como uma opo de linha de comandos para iniciar o IBM SPSS Modeler. Usando o argumento -p como
parte da chamada da linha de comandos, possvel utilizar uma propriedade de fluxo para alterar uma
configurao no fluxo.
Tabela 37. Exemplos de propriedade de n e de fluxo
Propriedade Significado
s.max_size Refere-se propriedade max_size do n denominado s.
Refere-se propriedade max_size do n denominado s,
s:samplenode.max_size
que deve ser um n Amostra.
Refere-se propriedade max_size do n Amostra no
:samplenode.max_size
fluxo atual (deve haver apenas um n Amostra).
Refere-se propriedade max_size do n denominado s,
s:sample.max_size
que deve ser um n Amostra.
t.direction.Age Refere-se funo do campo Age no n Tipo t.
*** ILEGAL *** necessrio especificar o nome do n ou
:.max_size
o tipo de n.

O exemplo s:sample.max_size ilustra que no preciso digitar os tipos de n por completo.

O exemplo t.direction.Age ilustra que alguns nomes de slot podem ser estruturados por si s, nos casos
em que os atributos de um n forem mais complexos do que apenas slots individuais com valores
individuais. Esses slots so chamados de propriedades estruturadas ou complexas.

Viso Geral de Propriedades do N


Cada tipo de n possui seu prprio conjunto de propriedades legais e cada propriedade possui um tipo.
Este tipo pode ser um tipo geral nmero, sinalizador ou sequncia caso em que as configuraes da
propriedade so foradas para o tipo correto. Um erro ser gerado se elas no puderem ser foradas.
Como alternativa, a referncia de propriedade pode especificar o intervalo de valores legais, como
Discard, PairAndDiscard e IncludeAsText, caso em que um erro ser gerado se qualquer outro valor for
utilizado. As propriedades do sinalizador devem ser lidas ou configuradas utilizando valores true e
false. (Variaes incluindo Off, OFF, off, No, NO, no, n, N, f, F, false, False, FALSE ou 0 tambm so
reconhecidas ao configurar valores, mas podero causar erros ao ler os valores de propriedade em alguns
casos. Todos os outros valores so considerados como true. Utilizar true e false de modo consistente
evitar qualquer confuso). Nas tabelas de referncia desse guia, as propriedades estruturadas so
indicadas dessa forma na coluna Descrio da propriedade e seus formatos de uso so fornecidos.

Propriedades Comuns do N
Um nmero propriedades comum para todos os ns (incluindo SuperNodes) no IBM SPSS Modeler.
Tabela 38. Propriedades comuns do n.
Nome da propriedade Tipo de dados Descrio da propriedade
use_custom_name sinalizador
name string Propriedade somente leitura que l o
nome (automtico ou customizado)
para um n na tela.
custom_name string Especifica um nome customizado
para o n.
tooltip string

Captulo 7. Referncia de Propriedades 69


Tabela 38. Propriedades comuns do n (continuao).
Nome da propriedade Tipo de dados Descrio da propriedade
annotation string
keywords string Slot estruturado que especifica uma
lista de palavras-chave associadas ao
objeto (por exemplo, ["Keyword1"
"Keyword2"]).
cache_enabled sinalizador
node_type source_supernode Propriedade somente leitura utilizada
process_supernode para referenciar um n por tipo. Por
terminal_supernode exemplo, ao invs de referenciar um
todos os nomes de n conforme especificado
n apenaspara
por nome, como
script real_income, tambm possvel
especificar o tipo, como
userinputnode ou filternode.

Propriedades especficas do SuperNode so discutidas separadamente, assim como com todos os outros
ns. Consulte o tpico Captulo 19, Propriedades do SuperNode, na pgina 305 para obter mais
informaes.

70 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Captulo 8. Propriedades do Fluxo
Uma variedade de propriedades de fluxo pode ser controlada por script. Para referenciar as propriedades
do fluxo, deve-se configurar o mtodo de execuo para utilizar scripts:
stream = modeler.script.stream()
stream.setPropertyValue("execute_method", "Script")

Exemplo

A propriedade do n utilizada para referenciar os ns no fluxo atual. O script de fluxo a seguir fornece
um exemplo:
stream = modeler.script.stream()
annotation = stream.getPropertyValue("annotation")

annotation = annotation + "\n\nThis stream is called \"" + stream.getLabel() + "\" and


contains the following nodes:\n"

for node in stream.iterator():


annotation = annotation + "\n" + node.getTypeName() + " node called \"" + node.getLabel()
+ "\""

stream.setPropertyValue("annotation", annotation)

O exemplo acima utiliza a propriedade do n para criar uma lista de todos os ns no fluxo e gravar essa
lista nas anotaes de fluxo. A anotao produzida semelhante a esta:
This stream is called "druglearn" and contains the following nodes:

type node called "Define Types"


derive node called "Na_to_K"
variablefile node called "DRUG1n"
neuralnetwork node called "Drug"
c50 node called "Drug"
filter node called "Discard Fields"

As propriedades do fluxo so descritas na tabela a seguir.


Tabela 39. Propriedades do Fluxo.
Nome da propriedade Tipo de dados Descrio da propriedade
execute_method Normal
Script

Copyright IBM Corporation 1994, 2015 71


Tabela 39. Propriedades do Fluxo (continuao).
Nome da propriedade Tipo de dados Descrio da propriedade
date_format "DDMMYY"
"MMDDYY"
"YYMMDD"
"YYYYMMDD"
"YYYYDDD"
DAY
MONTH
"DD-MM-YY"
"DD-MM-YYYY"
"MM-DD-YY"
"MM-DD-YYYY"
"DD-MON-YY"
"DD-MON-YYYY"
"YYYY-MM-DD"
"DD.MM.YY"
"DD.MM.YYYY"
"MM.DD.YYYY"
"DD.MON.YY"
"DD.MON.YYYY"
"DD/MM/YY"
"DD/MM/YYYY"
"MM/DD/YY"
"MM/DD/YYYY"
"DD/MON/YY"
"DD/MON/YYYY"
MES AAAA
t T AAAA
ss SM AAAA
date_baseline number
date_2digit_baseline number
time_format "HHMMSS"
"HHMM"
"MMSS"
"HH:MM:SS"
"HH:MM"
"MM:SS"
"(H)H:(M)M:(S)S"
"(H)H:(M)M"
"(M)M:(S)S"
"HH.MM.SS"
"HH.MM"
"MM.SS"
"(H)H.(M)M.(S)S"
"(H)H.(M)M"
"(M)M.(S)S"
time_rollover sinalizador
import_datetime_as_string sinalizador
decimal_places number
decimal_symbol Default
Period
Comma
angles_in_radians sinalizador
use_max_set_size sinalizador
max_set_size number
ruleset_evaluation Voting
FirstHit

72 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 39. Propriedades do Fluxo (continuao).
Nome da propriedade Tipo de dados Descrio da propriedade
refresh_source_nodes sinalizador Utilize para atualizar os ns de
origem automaticamente aps a
execuo do fluxo.
script string
annotation string
name string Nota: Esta propriedade somente
leitura. Se desejar alterar o nome de
um fluxo, deve-se salv-lo com um
nome diferente.
parameters Utilize esta propriedade para
atualizar os parmetros de fluxo a
partir de dentro de um script
independente.
nodes Consulte as informaes detalhadas
abaixo.
encoding SystemDefault
"UTF-8"
stream_rewriting booleano
stream_rewriting_maximise_sql booleano

stream_rewriting_optimise_clem_ booleano
execuo

stream_rewriting_optimise_syntax_ booleano
execuo
enable_parallelism booleano
sql_generation booleano
database_caching booleano
sql_logging booleano
sql_generation_logging booleano
sql_log_native booleano
sql_log_prettyprint booleano
record_count_suppress_input booleano
record_count_feedback_interval integer
use_stream_auto_create_node_ boolean Se true, as configuraes especficas
configuraes do fluxo sero utilizadas, caso
contrrio, as preferncias do usurio
so utilizadas.
create_model_applier_for_new_ boolean Se true, quando um construtor de
modelos modelo cria um novo modelo e ele
no tiver links de atualizao ativos,
um novo aplicador de modelo ser
includo.
Nota: Se voc estiver utilizando o
IBM SPSS Modeler Batch verso 15,
deve-se incluir explicitamente o
aplicador de modelo em seu script.

Captulo 8. Propriedades do Fluxo 73


Tabela 39. Propriedades do Fluxo (continuao).
Nome da propriedade Tipo de dados Descrio da propriedade
create_model_applier_update_links createEnabled Define o tipo de link criado quando
createDisabled um n aplicador de modelo
doNotCreate includo automaticamente.
create_source_node_from_builders boolean Se true, quando um construtor de
origem cria uma nova sada de
origem e ele no tiver links de
atualizao ativos, um novo n de
origem ser includo.
create_source_node_update_links createEnabled Define o tipo de link criado quando
createDisabled um n de origem includo
doNotCreate automaticamente.
has_coordinate_system boolean Se true, aplica um sistema de
coordenadas no fluxo inteiro.
coordinate_system string O nome do sistema de coordenadas
projetadas selecionado.

74 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Captulo 9. Propriedades do N de Origem
Propriedades Comuns do N de Origem
Propriedades que so comuns a todos os ns de origem so listadas abaixo, com informaes sobre os
ns especficos nos tpicos a seguir.

Exemplo 1
varfilenode = modeler.script.stream().create("variablefile", "Var. File")
varfilenode.setPropertyValue("full_filename", "$CLEO_DEMOS/DRUG1n")
varfilenode.setKeyedPropertyValue("check", "Age", "None")
varfilenode.setKeyedPropertyValue("values", "Age", [1, 100])
varfilenode.setKeyedPropertyValue("type", "Age", "Range")
varfilenode.setKeyedPropertyValue("direction", "Age", "Input")

Exemplo 2

Este script assume que o arquivo de dados especificado contm um campo chamado Region que
representa uma sequncia de vrias linhas.
from modeler.api import StorageType
from modeler.api import MeasureType

# Create a Variable File node that reads the data set containing
# the "Region" field
varfilenode = modeler.script.stream().create("variablefile", "My Geo Data")
varfilenode.setPropertyValue("full_filename", "C:/mydata/mygeodata.csv")
varfilenode.setPropertyValue("treat_square_brackets_as_lists", True)

# Override the storage type to be a list...


varfilenode.setKeyedPropertyValue("custom_storage_type", "Region", StorageType.LIST)
# ...and specify the type if values in the list and the list depth
varfilenode.setKeyedPropertyValue("custom_list_storage_type", "Region", StorageType.INTEGER)
varfilenode.setKeyedPropertyValue("custom_list_depth", "Region", 2)

# Now change the measurement to indentify the field as a geospatial value...


varfilenode.setKeyedPropertyValue("measure_type", "Region", MeasureType.GEOSPATIAL)
# ...and finally specify the necessary information about the specific
# type of geospatial object
varfilenode.setKeyedPropertyValue("geo_type", "Region", "MultiLineString")
varfilenode.setKeyedPropertyValue("geo_coordinates", "Region", "2D")
varfilenode.setKeyedPropertyValue("has_coordinate_system", "Region", True)
varfilenode.setKeyedPropertyValue("coordinate_system", "Region",
"ETRS_1989_EPSG_Arctic_zone_5-47")

Tabela 40. Propriedades comuns do n de origem.


Nome da propriedade Tipo de dados Descrio da propriedade
direction Input Propriedade definida como chave para funes de
Target campo.
Both
None Formato de uso:
Partition NODE.direction.FIELDNAME
Split Nota: Os valores de In e Out esto agora
Frequency descontinuados. O suporte para eles poder ser retirado
RecordID em uma liberao futura.

75
Tabela 40. Propriedades comuns do n de origem (continuao).
Nome da propriedade Tipo de dados Descrio da propriedade
type Range Tipo de campo. Configurar essa propriedade como
Flag Default limpar qualquer configurao da propriedade
Set values e, se value_mode for configurado para Specify, ele
Typeless ser reconfigurado para Read. Se value_mode j estiver
Discrete configurado para Pass ou Read, ele no ser afetado pela
Ordered Set configurao type.
Default
Formato de uso:
NODE.type.FIELDNAME
storage Unknown Propriedade definida como chave somente leitura para
Sequncia de caracteres tipo de armazenamento de campo.
Nmero inteiro
Real Formato de uso:
Time NODE.storage.FIELDNAME
Data
Timestamp
check None Propriedade definida como chave para verificao de
Anular tipo e de intervalo de campo
Impor
Discard Formato de uso:
Avisar NODE.check.FIELDNAME
Abort
values [value value] Para um campo contnuo (intervalo), o primeiro valor
o mnimo e o ltimo valor o mximo. Para os campos
nominais (conjunto), especifique todos os valores. Para
campos de sinalizao, o primeiro valor representa false e
o ltimo valor representa true. Configurar esta
propriedade configura automaticamente a propriedade
value_mode para Specify. O armazenamento
determinado com base no primeiro valor na lista, por
exemplo, se o primeiro valor for uma string, ento o
armazenamento ser configurado como Sequncia.

Formato de uso:
NODE.values.FIELDNAME
value_mode Leitura Determina como os valores so configurados para um
Pass campo na prxima transmisso de dados.
Read+
Current Formato de uso:
Specify NODE.value_mode.FIELDNAME
Observe que no possvel configurar essa propriedade
para Specify diretamente; para utilizar valores especficos,
configure a propriedade values.
default_value_mode Leitura Especifica o mtodo padro para configurar valores para
Pass todos os campos.

Formato de uso:
NODE.default_value_mode

Esta configurao pode ser substituda para campos


especficos utilizando a propriedade value_mode.

76 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 40. Propriedades comuns do n de origem (continuao).
Nome da propriedade Tipo de dados Descrio da propriedade
extend_values sinalizador Aplica-se quando value_mode for configurado para Read.
Configure para T para incluir valores recm-lidos em
quaisquer valores existentes para o campo. Configure
para F para descartar valores existentes a favor dos
valores recm-lidos.

Formato de uso:
NODE.extend_values.FIELDNAME
value_labels string Utilizado para especificar um rtulo de valor. Observe
que os valores devem ser especificados primeiro.
enable_missing sinalizador Quando configurado para T, ativa o rastreamento de
valores omissos para o campo.

Formato de uso:
NODE.enable_missing.FIELDNAME
missing_values [value value ...] Especifica valores de dados que denotam dados
ausentes.

Formato de uso:
NODE.missing_values.FIELDNAME
range_missing sinalizador Quando esta propriedade configurada como T,
especifica se um intervalo de valores omissos (em
branco) definido para um campo.

Formato de uso:
NODE.range_missing.FIELDNAME
missing_lower string Quando range_missing for true, especifica o limite
inferior do intervalo de valores omissos.

Formato de uso:
NODE.missing_lower.FIELDNAME
missing_upper string Quando range_missing for true, especifica o limite
superior do intervalo de valores omissos.

Formato de uso:
NODE.missing_upper.FIELDNAME
null_missing sinalizador Quando esta propriedade configurada como T, valores
nulos (valores indefinidos que so exibidos como $null$
no software) so considerados valores omissos.

Formato de uso:
NODE.null_missing.FIELDNAME
whitespace_missing sinalizador Quando esta propriedade configurada como T, valores
que contm apenas espaos em branco (espaos,
tabulaes e novas linhas) so considerados valores
omissos.

Formato de uso:
NODE.whitespace_missing.FIELDNAME
description string Utilizado para especificar um rtulo ou descrio de
campo.

Captulo 9. Propriedades do N de Origem 77


Tabela 40. Propriedades comuns do n de origem (continuao).
Nome da propriedade Tipo de dados Descrio da propriedade
default_include sinalizador Propriedade definida como chave para especificar se o
comportamento padro transmitir ou filtrar os campos:
NODE.default_include

Exemplo:
set mynode:filternode.default_include = false
include sinalizador Propriedade definida como chave utilizada para
determinar se campos individuais so includos ou
filtrados:
NODE.include.FIELDNAME.
new_name string
measure_type Range / Essa propriedade definida como chave semelhante a
MeasureType.RANGE type por ela poder ser utilizada para definir a medida
Discrete / associada ao campo. A diferena que, no script Python,
MeasureType.DISCRETE a funo setter tambm pode transmitir um dos valores
Flag / MeasureType.FLAG de MeasureType, ao passo que a funo getter sempre
Set / MeasureType.SET retornar nos valores MeasureType.
OrderedSet /
MeasureType.ORDERED_SET
Typeless /
MeasureType.TYPELESS
Collection /
MeasureType.COLLECTION
Geospatial /
MeasureType.GEOSPATIAL
collection_measure Range / Para campos de coleo (listas com uma profundidade
MeasureType.RANGE 0), essa propriedade definida como chave define o tipo
Flag / MeasureType.FLAG de medio associado aos valores subjacentes.
Set / MeasureType.SET
OrderedSet /
MeasureType.ORDERED_SET
Typeless /
MeasureType.TYPELESS
geo_type Point Para campos geoespaciais, esta propriedade definida
MultiPoint como chave define o tipo de objeto geoespacial
LineString representado por este campo. Isso dever estar
MultiLineString consistente com a profundidade da lista dos valores.
Polgono
MultiPolygon
has_coordinate_system boolean Para campos geoespaciais, essa propriedade define se
esse campo tem um sistema de coordenadas
coordinate_system string Para campos geoespaciais, esta propriedade definida
como chave define o sistema de coordenadas para este
campo.

78 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 40. Propriedades comuns do n de origem (continuao).
Nome da propriedade Tipo de dados Descrio da propriedade
custom_storage_type Unknown / Essa propriedade definida como chave semelhante a
MeasureType.UNKNOWN custom_storage por ela poder ser utilizada para definir o
String / armazenamento de substituio para o campo. A
MeasureType.STRING diferena que, no script Python, a funo setter
Integer / tambm pode transmitir um dos valores de StorageType,
MeasureType.INTEGER ao passo que a funo getter sempre retornar nos
Real / MeasureType.REAL valores StorageType.
Time / MeasureType.TIME
Date / MeasureType.DATE
Timestamp /
MeasureType.TIMESTAMP
List / MeasureType.LIST
custom_list_storage_type String / Para campos de lista, esta propriedade definida como
MeasureType.STRING chave especifica o tipo de armazenamento dos valores
Integer / subjacentes.
MeasureType.INTEGER
Real / MeasureType.REAL
Time / MeasureType.TIME
Date / MeasureType.DATE
Timestamp /
MeasureType.TIMESTAMP
custom_list_depth integer Para campos de lista, esta propriedade definida como
chave especifica a profundidade do campo

Propriedades de asimport
A origem do Analytic Server permite executar um fluxo no Hadoop Distributed File System (HDFS).

Exemplo
node = stream.create("asimport", "My node")
node.setPropertyValue("data_source", "Drug1n")

Tabela 41. Propriedades de asimport.


Propriedades de asimport Tipo de dados Descrio da propriedade
data_source string O nome da origem de dados.

Propriedades do N cognosimport
O n de origem do IBM Cognos BI importa dados a partir de bancos de dados do Cognos BI.

Exemplo
node = stream.create("cognosimport", "My node")
node.setPropertyValue("cognos_connection", ["http://mycogsrv1:9300/p2pd/servlet/dispatch",
True, "", "", ""])
node.setPropertyValue("cognos_package_name", "/Public Folders/GOSALES")
node.setPropertyValue("cognos_items", ["[GreatOutdoors].[BRANCH].[BRANCH_CODE]", "[GreatOutdoors]
.[BRANCH].[COUNTRY_CODE]"])

Captulo 9. Propriedades do N de Origem 79


Tabela 42. Propriedades do n cognosimport.
Propriedades do n
cognosimport Tipo de dados Descrio da propriedade
mode Data Especifica se devem ser importados dados
Relatrios (padro) ou relatrios do Cognos BI.
cognos_connection ["string",flag,"string", Uma propriedade de lista que contm os
"string" ,"string"] detalhes de conexo com o servidor Cognos.
O formato : ["Cognos_server_URL",
login_mode, "namespace", "username",
"password"]

em que:
Cognos_server_URL a URL do servidor
Cognos que contm a origem.
login_mode indica se login annimo usado
e true ou false; se configurado para true,
os campos a seguir devero ser
configurados para "".
namespace especifica o provedor de
autenticao de segurana utilizado para
efetuar logon no servidor.
username e password so aqueles utilizados
para efetuar logon no servidor Cognos.

Ao invs de login_mode, os modos a seguir


tambm esto disponveis:
v anonymousMode. Por exemplo:
[Cognos_server_url, anonymousMode,
"namespace", "username", "password"]
v credentialMode. Por exemplo:
[Cognos_server_url,
credentialMode, "namespace",
"username", "password"]
v storedCredentialMode. Por exemplo:
[Cognos_server_url,
storedCredentialMode,
"stored_credential_name"]

Em que stored_credential_name o
nome de uma credencial do Cognos no
repositrio.
cognos_package_name string O caminho e o nome do pacote Cognos a
partir do qual voc est importando objetos
de dados, por exemplo:
/Public Folders/GOSALES
Nota: Apenas barras so vlidas.
cognos_items ["field","field", ... ,"field"] O nome de um ou mais objetos de dados a
serem importados. O formato de field
[namespace].[query_subject].[query_item]
cognos_filters campo O nome de um ou mais filtros para aplicar
antes de importar os dados.

80 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 42. Propriedades do n cognosimport (continuao).
Propriedades do n
cognosimport Tipo de dados Descrio da propriedade
cognos_data_parameters list Valores para parmetros de prompt para
dados. Os pares de nome e valor so
colocados entre colchetes, pares mltiplos
so separados por vrgulas e a sequncia
inteira colocada entre colchetes.

Formato:
[["param1", "value"],...,["paramN", "value"]]
cognos_report_directory campo O caminho do Cognos de uma pasta ou
pacote a partir do qual importar relatrios,
por exemplo:
/Public Folders/GOSALES
Nota: Apenas barras so vlidas.
cognos_report_name campo O caminho e o nome no local do relatrio
de um relatrio a ser importado.
cognos_report_parameters list Valores para parmetros de relatrio. Os
pares de nome e valor so colocados entre
colchetes, pares mltiplos so separados por
vrgulas e a sequncia inteira colocada
entre colchetes.

Formato:
[["param1", "value"],...,["paramN", "value"]]

Propriedades de databasenode
O n Banco de Dados pode ser utilizado para importar dados de uma variedade de outros
pacotes utilizando ODBC (Open Database Connectivity), incluindo Microsoft SQL Server, o
DB2, o Oracle e outros.

Exemplo
import modeler.api
stream = modeler.script.stream()
nnode = stream.create("database", "My node")
node.setPropertyValue("mode", "Table")
node.setPropertyValue("query", "SELECT * FROM drug1n")
node.setPropertyValue("datasource", "Drug1n_db")
node.setPropertyValue("username", "spss")
node.setPropertyValue("password", "spss")
node.setPropertyValue("tablename", ".Drug1n")

Tabela 43. Propriedades de databasenode.


Propriedades de databasenode Tipo de dados Descrio da propriedade
mode Table Especifique Table para conectar-se a uma tabela
Query de banco de dados utilizando os controles de
caixa de dilogo ou especifique Query para
consultar o banco de dados selecionado
utilizando SQL.
datasource string Nome do banco de dados (consulte tambm a
nota a seguir).
username string Detalhes de conexo com o banco de dados
(consulte tambm a nota a seguir).

Captulo 9. Propriedades do N de Origem 81


Tabela 43. Propriedades de databasenode (continuao).
Propriedades de databasenode Tipo de dados Descrio da propriedade
password string
credential string Nome da credencial armazenada no IBM SPSS
Collaboration and Deployment Services. Isso
pode ser utilizado ao invs das propriedades
username e password. O nome do usurio e a
senha da credencial devem corresponder ao
nome do usurio e senha necessrios para
acessar o banco de dados
use_credential Configure para True ou False.
epassword string Especifica uma senha codificada como uma
alternativa para codificar permanentemente
uma senha em um script.

Consulte o tpico Gerando uma Senha


Codificada na pgina 51 para obter mais
informaes. Esta propriedade somente
leitura durante a execuo.
tablename string Nome da tabela que deseja acessar.
strip_spaces None Opes para descartar espaos iniciais e finais
Left nas sequncias.
Right
Both
use_quotes AsNeeded Especifique se os nomes de tabelas e de
Always colunas so colocados entre aspas quando as
Never consultas so enviadas ao banco de dados (por
exemplo, se contiverem espaos ou pontuao).
query string Especifica o cdigo SQL para a consulta que
deseja enviar.

Nota: Se o nome do banco de dados (na propriedade datasource) contiver um ou mais espaos, pontos
(tambm conhecidos como um "ponto final") ou sublinhados, ser possvel utilizar o formato de "barra
invertida aspas duplas" para trat-la como uma sequncia. Por exemplo: "{\"db2v9.7.6_linux\"}" ou
"{\"TDATA 131\"}". Alm disso, sempre coloque os valores da sequncia datasource entre aspas duplas e
chaves, como no exemplo a seguir: "{\"SQL Server\",spssuser,abcd1234,false}".

Nota: Se o nome do banco de dados (na propriedade datasource) contiver espaos ao invs de
propriedades individuais para datasource, username e password, uma nica propriedade origem de dados
poder ser usada no formato a seguir:
Tabela 44. Propriedades de databasenode - especfica da origem de dados.
Propriedades de databasenode Tipo de dados Descrio da propriedade
datasource string Formato:
[database_name,username,password[,true |
false]]

O ltimo parmetro para uso com senhas


criptografadas. Se este for configurado como
true, a senha ser decriptografada antes de
usar.

82 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Utilize este formato se tambm estiver alterando a origem de dados, no entanto, se desejar alterar apenas
o nome de usurio ou a senha, ser possvel utilizar as propriedades username ou password.

Propriedades de datacollectionimportnode
O n Importao de Dados do IBM SPSS Data Collection importa dados de pesquisa de
opinio com base no Modelo de Dados do IBM SPSS Data Collection usado pelos produtos de
pesquisa de mercado do IBM Corp.. O IBM SPSS Data Collection Data Library deve ser
instalado para usar este n.

Figura 7. n
Importao de Dados
de Dimenses

Exemplo
node = stream.create("datacollectionimport", "My node")
node.setPropertyValue("metadata_name", "mrQvDsc")
node.setPropertyValue("metadata_file", "C:/Program Files/IBM/SPSS/DataCollection/DDL/Data/
Quanvert/Museum/museum.pkd")
node.setPropertyValue("casedata_name", "mrQvDsc")
node.setPropertyValue("casedata_source_type", "File")
node.setPropertyValue("casedata_file", "C:/Program Files/IBM/SPSS/DataCollection/DDL/Data/
Quanvert/Museum/museum.pkd")
node.setPropertyValue("import_system_variables", "Common")
node.setPropertyValue("import_multi_response", "MultipleFlags")

Tabela 45. Propriedades de datacollectionimportnode.


Propriedades de
datacollectionimportnode Tipo de dados Descrio da propriedade
metadata_name string O nome do MDSC. O valor especial
DimensionsMDD indica que o documento de
metadados padro do IBM SPSS Data
Collection deve ser utilizado. Outros valores
possveis incluem:
mrADODsc
mrI2dDsc
mrLogDsc
mrQdiDrsDsc
mrQvDsc
mrSampleReportingMDSC
mrSavDsc
mrSCDsc
mrScriptMDSC

O valor especial none indica que no h


nenhum MDSC.
metadata_file string Nome do arquivo no qual os metadados so
armazenados.

Captulo 9. Propriedades do N de Origem 83


Tabela 45. Propriedades de datacollectionimportnode (continuao).
Propriedades de
datacollectionimportnode Tipo de dados Descrio da propriedade
casedata_name string O nome do CDSC. Os valores possveis
incluem:
mrADODsc
mrI2dDsc
mrLogDsc
mrPunchDSC
mrQdiDrsDsc
mrQvDsc
mrRdbDsc2
mrSavDsc
mrScDSC
mrXmlDsc

O valor especial none indica que no h


nenhum CDSC.
casedata_source_type Unknown Indica o tipo de origem do CDSC.
File
Folder
UDL
DSN
casedata_file string Quando casedata_source_type for File,
especifica o arquivo que contm os dados do
caso.
casedata_folder string Quando casedata_source_type for Folder,
especifica a pasta que contm os dados do
caso.
casedata_udl_string string Quando casedata_source_type for UDL,
especifica a sequncia de conexes com o
OLD-DB para a origem de dados que contm
os dados do caso.
casedata_dsn_string string Quando casedata_source_type for DSN,
especifica a sequncia de conexes com o
ODBC para a origem de dados.
casedata_project string Ao ler os dados do caso a partir de um banco
de dados do IBM SPSS Data Collection,
possvel inserir o nome do projeto. Para todos
os outros tipos de dados do caso, essa
configurao dever ser deixada em branco.
version_import_mode All Define como as verses devem ser
Mais recente manipuladas.
Specify
specific_version string Quando version_import_mode for Specify,
define a verso dos dados do caso a serem
importados.
use_language string Define se os rtulos de um idioma especfico
devem ser utilizados.
language string Se use_language for true, define o cdigo de
idioma a ser utilizado na importao. O
cdigo de idioma deve ser um dos cdigos
disponveis nos dados do caso.

84 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 45. Propriedades de datacollectionimportnode (continuao).
Propriedades de
datacollectionimportnode Tipo de dados Descrio da propriedade
use_context string Define se um contexto especfico deve ser
importado. Os contextos so utilizados para
variar a descrio associada s respostas.
contexto string Se use_context for true, define o contexto a
ser importado. O contexto deve ser um dos
contextos disponveis nos dados do caso.
use_label_type string Define se um tipo especfico de rtulo deve ser
importado.
label_type string Se use_label_type for true, define o tipo de
rtulo a ser importado. O tipo de rtulo deve
ser um dos tipos disponveis nos dados do
caso.
user_id string Para bancos de dados que requerem um login
explcito, possvel fornecer um ID de usurio
e senha para acessar a origem de dados.
password string
import_system_variables Common Especifica quais variveis do sistema so
None importadas.
All
import_codes_variables sinalizador
import_sourcefile_variables sinalizador
import_multi_response MultipleFlags
Single

Propriedades de excelimportnode
O n Importao do Excel importa dados do Microsoft Excel no formato de arquivo .xlsx.
Uma origem de dados ODBC no necessria.

Exemplos
#To use a named range:
node = stream.create("excelimport", "My node")
node.setPropertyValue("excel_file_type", "Excel2007")
node.setPropertyValue("full_filename", "C:/drug.xlsx")
node.setPropertyValue("use_named_range", True)
node.setPropertyValue("named_range", "DRUG")
node.setPropertyValue("read_field_names", True)

#To use an explicit range:


node = stream.create("excelimport", "My node")
node.setPropertyValue("excel_file_type", "Excel2007")
node.setPropertyValue("full_filename", "C:/drug.xlsx")
node.setPropertyValue("worksheet_mode", "Name")
node.setPropertyValue("worksheet_name", "Drug")
node.setPropertyValue("explicit_range_start", "A1")
node.setPropertyValue("explicit_range_end", "F300")

Tabela 46. Propriedades de excelimportnode.


Propriedades de excelimportnode Tipo de dados Descrio da propriedade
excel_file_type Excel2007

Captulo 9. Propriedades do N de Origem 85


Tabela 46. Propriedades de excelimportnode (continuao).
Propriedades de excelimportnode Tipo de dados Descrio da propriedade
full_filename string O nome do arquivo completo, incluindo o
caminho.
use_named_range booleano Especifica se um intervalo nomeado deve ser
usado. Se true, a propriedade named_range ser
utilizada para especificar o intervalo a ser lido
e as outras configuraes de planilha e de
intervalo de dados sero ignoradas.
named_range string
worksheet_mode Index Especifica se a planilha definida por ndice
Nome ou nome.
worksheet_index integer O ndice da planilha a ser lido, comeando
com 0 para a primeira planilha, 1 para a
segunda, e assim por diante.
worksheet_name string O nome da planilha a ser lida.
data_range_mode FirstNonBlank Especifica como o intervalo deve ser
ExplicitRange determinado.
blank_rows StopReading Quando data_range_mode FirstNonBlank,
ReturnBlankRows especifica como as linhas em branco devem ser
tratadas.
explicit_range_start string Quando data_range_mode ExplicitRange,
especifica o ponto de incio do intervalo a ser
lido.
explicit_range_end string
read_field_names booleano Especifica se a primeira linha no intervalo
especificado deve ser utilizada como nomes de
campo (coluna).

Propriedades de evimportnode
O n Visualizao Corporativa cria uma conexo com um IBM SPSS Collaboration and
Deployment Services Repository, permitindo ler dados da Visualizao Corporativa em um
fluxo e empacotar um modelo em um cenrio que possa ser acessado a partir do repositrio
por outros usurios.
Nota: O n Visualizao Corporativa foi substitudo no SPSS Modeler 16.0 pelo n
Visualizao de Dados. Para fluxos salvos em liberaes anteriores, o n Visualizao
Corporativa ainda suportado. No entanto, ao atualizar ou criar novos fluxos, recomenda-se
utilizar o n Visualizao de Dados.

Exemplo
node = stream.create("evimport", "My node")
node.setPropertyValue("connection", ["Training data","/Application views/Marketing","LATEST",
"Analytic", "/Data Providers/Marketing"])
node.setPropertyValue("tablename", "cust1")

86 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 47. Propriedades de evimportnode.
Propriedades de evimportnode Tipo de dados Descrio da propriedade
connection lista Propriedade estruturada -- lista de
parmetros que compem uma
conexo de Visualizao Corporativa.

Formato de uso:
evimportnode.connection =
[description,app_view_path,
app_view_version_label,
environment,DPD_path]
tablename string O nome de uma tabela na
Visualizao do Aplicativo.

Propriedades de fixedfilenode
O n Arquivo Fixo importa dados de arquivos de texto de campo fixo, ou seja, arquivos cujos
campos no so delimitados, mas iniciam na mesma posio e tm um comprimento fixo.
Dados gerados por mquina ou legados so frequentemente armazenados em formato de
campo fixo.

Exemplo
node = stream.create("fixedfile", "My node")
node.setPropertyValue("full_filename", "$CLEO_DEMOS/DRUG1n")
node.setPropertyValue("record_len", 32)
node.setPropertyValue("skip_header", 1)
node.setPropertyValue("fields", [["Age", 1, 3], ["Sex", 5, 7], ["BP", 9, 10], ["Cholesterol",
12, 22], ["Na", 24, 25], ["K", 27, 27], ["Drug", 29, 32]])
node.setPropertyValue("decimal_symbol", "Period")
node.setPropertyValue("lines_to_scan", 30)

Tabela 48. Propriedades de fixedfilenode.


Propriedades de fixedfilenode Tipo de dados Descrio da propriedade
record_len number Especifica o nmero de caracteres em cada
registro.
line_oriented sinalizador Ignora o caractere de nova linha no trmino de
cada registro.
decimal_symbol Default O tipo de separador decimal utilizado em sua
Comma origem de dados.
Period
skip_header number Especifica o nmero de linhas a serem
ignoradas no incio do primeiro registro. til
para ignorar cabealhos da coluna.
auto_recognize_datetime sinalizador Especifica se datas ou horas so identificadas
automaticamente nos dados de origem.
lines_to_scan number
fields lista Propriedade estruturada.
full_filename string Nome completo do arquivo a ser lido,
incluindo o diretrio.
strip_spaces None Descarta espaos direita e esquerda nas
Left sequncias na importao.
Right
Both

Captulo 9. Propriedades do N de Origem 87


Tabela 48. Propriedades de fixedfilenode (continuao).
Propriedades de fixedfilenode Tipo de dados Descrio da propriedade
invalid_char_mode Discard Remove caracteres invlidos (nulo, 0 ou
Replace qualquer caractere inexistente na codificao
atual) da entrada de dados ou substitui
caracteres invlidos pelo smbolo do caractere
um especificado.
invalid_char_replacement string
use_custom_values sinalizador
custom_storage Unknown
Sequncia de caracteres
Nmero inteiro
Real
Time
Date
Timestamp
custom_date_format "DDMMYY" Esta propriedade se aplicar apenas se um
"MMDDYY" armazenamento customizado tiver sido
"YYMMDD" especificado.
"YYYYMMDD"
"YYYYDDD"
DAY
MONTH
"DD-MM-YY"
"DD-MM-YYYY"
"MM-DD-YY"
"MM-DD-YYYY"
"DD-MON-YY"
"DD-MON-YYYY"
"YYYY-MM-DD"
"DD.MM.YY"
"DD.MM.YYYY"
"MM.DD.YY"
"MM.DD.YYYY"
"DD.MON.YY"
"DD.MON.YYYY"
"DD/MM/YY"
"DD/MM/YYYY"
"MM/DD/YY"
"MM/DD/YYYY"
"DD/MON/YY"
"DD/MON/YYYY"
MES AAAA
t T AAAA
ww WK YYYY

88 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 48. Propriedades de fixedfilenode (continuao).
Propriedades de fixedfilenode Tipo de dados Descrio da propriedade
custom_time_format "HHMMSS" Esta propriedade se aplicar apenas se um
"HHMM" armazenamento customizado tiver sido
"MMSS" especificado.
"HH:MM:SS"
"HH:MM"
"MM:SS"
"(H)H:(M)M:(S)S"
"(H)H:(M)M"
"(M)M:(S)S"
"HH.MM.SS"
"HH.MM"
"MM.SS"
"(H)H.(M)M.(S)S"
"(H)H.(M)M"
"(M)M.(S)S"
custom_decimal_symbol campo Aplicvel apenas se um armazenamento
customizado tiver sido especificado.
encoding StreamDefault Especifica o mtodo de codificao de texto.
SystemDefault
"UTF-8"

Propriedades do N gsdata_import
Utilize o n de origem Geoespacial para exibir dados de mapa ou espaciais na sesso de
minerao de dados.

Tabela 49. Propriedades do n gsdata_import


Propriedades do n gsdata_import Tipo de dados Descrio da propriedade
full_filename string Insere o caminho de arquivo para o arquivo .shp
que deseja carregar.
map_service_URL string Insere a URL de servio de mapa qual
conectar-se.
map_name string Apenas se map_service_URL for usado, isso contm
a estrutura da pasta de nvel superior do servio de
mapa.

Propriedades de sasimportnode
O n Importao SAS importa dados do SAS no IBM SPSS Modeler.

Exemplo
node = stream.create("sasimport", "My node")
node.setPropertyValue("format", "Windows")
node.setPropertyValue("full_filename", "C:/data/retail.sas7bdat")

Captulo 9. Propriedades do N de Origem 89


node.setPropertyValue("member_name", "Test")
node.setPropertyValue("read_formats", False)
node.setPropertyValue("full_format_filename", "Test")
node.setPropertyValue("import_names", True)

Tabela 50. Propriedades de sasimportnode.


Propriedades de sasimportnode Tipo de dados Descrio da propriedade
format Windows O formato do arquivo a ser importado.
UNIX
Transport
SAS7
SAS8
SAS9
full_filename string O nome completo do arquivo que voc inserir,
incluindo o caminho.
member_name string Especifica o membro a ser importado a partir
do arquivo de transporte SAS especificado.
read_formats sinalizador L os formatos de dados (como rtulos de
variveis) a partir do arquivo de formato
especificado.
full_format_filename string
import_names NamesAndLabels Especifica o mtodo para o mapeamento de
LabelsasNames nomes de variveis e de rtulos na importao.

Propriedades de simgennode
O n Gerar Simulao fornece uma maneira fcil de gerar dados simulados, seja desde o
incio utilizando distribuies de estatsticas especificadas pelo usurio ou automaticamente
utilizando as distribuies obtidas da execuo de um n Ajuste de Simulao em dados
histricos existentes. Isso til quando quiser avaliar o resultado de um modelo preditivo
quando houver incerteza nas entradas do modelo.

Tabela 51. Propriedades de simgennode.


Propriedades de simgennode Tipo de dados Descrio da propriedade
campos Propriedade estruturada Veja o exemplo
correlations Propriedade estruturada Veja o exemplo
keep_min_max_setting boolean
refit_correlations boolean
max_cases integer O valor mnimo 1000 e o valor mximo
2.147.483.647
create_iteration_field boolean
iteration_field_name string
replicate_results boolean
random_seed integer
parameter_xml string Retorna o parmetro Xml como uma
sequncia

Exemplo de campos
Este um parmetro de slot estruturado com a sintaxe a seguir:

90 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


simgennode.setPropertyValue("fields", [
[field1, storage, locked, [distribution1], min, max],
[field2, storage, locked, [distribution2], min, max],
[field3, storage, locked, [distribution3], min, max]
])

O distribution uma declarao do nome de distribuio seguida por uma lista contendo pares de
nomes e valores de atributos. Cada distribuio definida da seguinte maneira:
[distributionname, [[par1], [par2], [par3]]]

simgennode = modeler.script.stream().createAt("simgen", u"Sim Gen", 726, 322)


simgennode.setPropertyValue("fields", [["Age", "integer", False, ["Uniform",[["min","1"],["max","2"]]], "", ""]])

Por exemplo, para criar um n que gera um campo nico com uma distribuio binomial, possvel
utilizar o script a seguir:
simgen_node1 = modeler.script.stream().createAt("simgen", u"Sim Gen", 200, 200)
simgen_node1.setPropertyValue("fields", [["Education", "Real", False, ["Binomial", [["n", 32],
["prob", 0.7]]], "", ""]])

A distribuio binomial utiliza 2 parmetros: n e prob. Como o binomial no suporta valores mnimos e
mximos, eles so fornecidos como uma sequncia vazia.

Nota: No possvel configurar o distribution diretamente porque ele usado junto com a propriedade
fields.

Os exemplos a seguir mostram todos os tipos de distribuio possveis. Observe que o limite inserido
como thresh em NegativeBinomialFailures e tambm em NegativeBinomialTrial.
stream = modeler.script.stream()

simgennode = stream.createAt("simgen", u"Sim Gen", 200, 200)

beta_dist = ["Field1", "Real", False, ["Beta",[["shape1","1"],["shape2","2"]]], "", ""]


binomial_dist = ["Field2", "Real", False, ["Binomial",[["n" ,"1"],["prob","1"]]], "", ""]
categorical_dist = ["Field3", "String", False, ["Categorical", [["A",0.3],["B",0.5],["C",0.2]]], "", ""]
dice_dist = ["Field4", "Real", False, ["Dice", [["1" ,"0.5"],["2","0.5"]]], "", ""]
exponential_dist = ["Field5", "Real", False, ["Exponential", [["scale","1"]]], "", ""]
fixed_dist = ["Field6", "Real", False, ["Fixed", [["value","1" ]]], "", ""]
gamma_dist = ["Field7", "Real", False, ["Gamma", [["scale","1"],["shape"," 1"]]], "", ""]
lognormal_dist = ["Field8", "Real", False, ["Lognormal", [["a","1"],["b","1" ]]], "", ""]
negbinomialfailures_dist = ["Field9", "Real", False, ["NegativeBinomialFailures",[["prob","0.5"],["thresh","1"]]], "", ""]
negbinomialtrial_dist = ["Field10", "Real", False, ["NegativeBinomialTrials",[["prob","0.2"],["thresh","1"]]], "", ""]
normal_dist = ["Field11", "Real", False, ["Normal", [["mean","1"] ,["stddev","2"]]], "", ""]
poisson_dist = ["Field12", "Real", False, ["Poisson", [["mean","1"]]], "", ""]
range_dist = ["Field13", "Real", False, ["Range", [["BEGIN","[1,3]"] ,["END","[2,4]"],["PROB","[[0.5],[0.5]]"]]], "", ""]
triangular_dist = ["Field14", "Real", False, ["Triangular", [["min","0"],["max","1"],["mode","1"]]], "", ""]
uniform_dist = ["Field15", "Real", False, ["Uniform", [["min","1"],["max","2"]]], "", ""]
weibull_dist = ["Field16", "Real", False, ["Weibull", [["a","0"],["b","1 "],["c","1"]]], "", ""]
simgennode.setPropertyValue("fields", [\
beta_dist, \
binomial_dist, \
categorical_dist, \
dice_dist, \
exponential_dist, \
fixed_dist, \
gamma_dist, \
lognormal_dist, \
negbinomialfailures_dist, \
negbinomialtrial_dist, \
normal_dist, \
poisson_dist, \
range_dist, \
triangular_dist, \
uniform_dist, \
weibull_dist
])

Exemplo de correlaes
Este um parmetro de slot estruturado com a sintaxe a seguir:

Captulo 9. Propriedades do N de Origem 91


simgennode.setPropertyValue("correlations", [
[field1, field2, correlation],
[field1, field3, correlation],
[field2, field3, correlation]
])

A correlao pode ser qualquer nmero entre +1 e -1. possvel especificar quantas correlaes desejar.
As correlaes no especificadas so configuradas para zero. Se algum campo for desconhecido, o valor
da correlao dever ser configurado na matriz de correlao (ou tabela) e mostrado em texto vermelho.
Quando houver campos desconhecidos, no ser possvel executar o n.

Propriedades de statisticsimportnode
O n do arquivo IBM SPSS Statistics l dados do formato de arquivo .sav usado pelo IBM
SPSS Statistics, bem como arquivos de cache salvos em IBM SPSS Modeler que tambm
utilizam o mesmo formato.

As propriedades desse n so descritas em Propriedades de statisticsimportnode na pgina 301.

Propriedades do N tm1import
O n de origem do IBM Cognos TM1 importa dados a partir de bancos de dados do Cognos
TM1.

Tabela 52. Propriedades do n tm1import.


Propriedades do n tm1import Tipo de dados Descrio da propriedade
pm_host string Nota: Somente para as verses 16.0 e 17.0

O nome do host. Por exemplo:


TM1_import.setPropertyValue("pm_host",
http://9.191.86.82:9510/pmhub/pm)
tm1_connection ["field","field", ... Nota: Somente para as verses 16.0 e 17.0
,"field"]
Uma propriedade de lista que contm os detalhes
da conexo com o servidor TM1. O formato : [
"TM1_Server_Name","tm1_ username","tm1_
password"]

Por exemplo:
TM1_import.setPropertyValue("tm1_connection",
[Planning Sample, "admin", "apple"])
admin_host string Nota: Somente a partir da verso 17.1

A URL para o nome do host da API REST.


server_name string Nota: Somente a partir da verso 17.1

O nome do servidor TM1 selecionado a partir do


admin_host.

92 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 52. Propriedades do n tm1import (continuao).
Propriedades do n tm1import Tipo de dados Descrio da propriedade
selected_view ["field" "field"] Uma propriedade de lista contendo os detalhes do
cubo do TM1 selecionado e o nome da visualizao
de cubo a partir do qual os dados sero
importados no SPSS. Por exemplo:
TM1_import.setPropertyValue("selected_view",
[plan_BudgetPlan, Goal Input])

Propriedades de userinputnode
O n Entrada do Usurio fornece uma maneira fcil de criar dados sintticos, seja desde o
incio ou alterando dados existentes. Isso til, por exemplo, quando desejar criar um
conjunto de dados de teste para modelagem.

Exemplo
node = stream.create("userinput", "My node")
node.setPropertyValue("names", ["test1", "test2"])
node.setKeyedPropertyValue("data", "test1", "2, 4, 8")
node.setKeyedPropertyValue("custom_storage", "test1", "Integer")
node.setPropertyValue("data_mode", "Ordered")

Tabela 53. Propriedades de userinputnode.


Propriedades de userinputnode Tipo de dados Descrio da propriedade
data
names Slot estruturado que configura ou retorna uma
lista de nomes de campo gerados pelo n.
custom_storage Unknown Slot chaveado que configura ou retorna o
Sequncia de caracteres armazenamento para um campo.
Nmero inteiro
Real
Time
Data
Timestamp
data_mode Combined Se Combined for especificado, os registros sero
Ordered gerados para cada combinao de valores
configurados e valores mn-mx. O nmero de
registros gerados igual ao produto do
nmero de valores em cada campo. Se Ordered
for especificado, um valor ser obtido de cada
coluna para cada registro para gerar uma linha
de dados. O nmero de registros gerados
igual ao nmero maior de valores associados a
um campo. Quaisquer campos com menos
valores de dados sero preenchidos com
valores nulos.
values Nota: Essa propriedade foi descontinuada a
favor de userinputnode.data e no deve mais
ser utilizada.

Captulo 9. Propriedades do N de Origem 93


Propriedades de variablefilenode
O n Arquivo Varivel l arquivos de texto de campo livre, ou seja, arquivos cujos registros
contm um nmero constante dos campos, mas um nmero variado de caracteres. Esse n
tambm til para arquivos com texto de cabealho de comprimento fixo e certos tipos de
anotaes.

Exemplo
node = stream.create("variablefile", "My node")
node.setPropertyValue("full_filename", "$CLEO_DEMOS/DRUG1n")
node.setPropertyValue("read_field_names", True)
node.setPropertyValue("delimit_other", True)
node.setPropertyValue("other", ",")
node.setPropertyValue("quotes_1", "Discard")
node.setPropertyValue("decimal_symbol", "Comma")
node.setPropertyValue("invalid_char_mode", "Replace")
node.setPropertyValue("invalid_char_replacement", "|")
node.setKeyedPropertyValue("use_custom_values", "Age", True)
node.setKeyedPropertyValue("direction", "Age", "Input")
node.setKeyedPropertyValue("type", "Age", "Range")
node.setKeyedPropertyValue("values", "Age", [1, 100])

Tabela 54. Propriedades de variablefilenode.


Propriedades de variablefilenode Tipo de dados Descrio da propriedade
skip_header number Especifica o nmero de caracteres a serem
ignorados no incio do primeiro registro.
num_fields_auto sinalizador Determina o nmero de campos em cada
registro automaticamente. Os registros devem
ser finalizados com um caractere de nova
linha.
num_fields number Especifica manualmente o nmero de campos
em cada registro.
delimit_space sinalizador Especifica o caractere utilizado para delimitar
limites de campo no arquivo.
delimit_tab sinalizador
delimit_new_line sinalizador
delimit_non_printing sinalizador
delimit_comma sinalizador Nos casos em que a vrgula o delimitador de
campo e tambm o separador decimal dos
fluxos, configure delimit_other para true e
especifique uma vrgula como o delimitador
utilizando a propriedade other.
delimit_other sinalizador Permite especificar um delimitador
customizado utilizando a propriedade other.
other string Especifica o delimitador utilizado quando
delimit_other true.
decimal_symbol Default Especifica o separador decimal utilizado na
Comma origem de dados.
Period
multi_blank sinalizador Trata diversos caracteres delimitadores em
branco adjacentes como um delimitador nico.
read_field_names sinalizador Trata a primeira linha no arquivo de dados
como rtulos para a coluna.

94 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 54. Propriedades de variablefilenode (continuao).
Propriedades de variablefilenode Tipo de dados Descrio da propriedade
strip_spaces None Descarta espaos direita e esquerda nas
Left sequncias na importao.
Right
Both
invalid_char_mode Discard Remove caracteres invlidos (nulo, 0 ou
Replace qualquer caractere inexistente na codificao
atual) da entrada de dados ou substitui
caracteres invlidos pelo smbolo do caractere
um especificado.
invalid_char_replacement string
break_case_by_newline sinalizador Especifica que o delimitador de linha o
caractere de nova linha.
lines_to_scan number Especifica quantas linhas devem ser varridas
para tipos de dados especificados.
auto_recognize_datetime sinalizador Especifica se datas ou horas so identificadas
automaticamente nos dados de origem.
quotes_1 Discard Especifica como as aspas simples so tratadas
PairAndDiscard na importao.
IncludeAsText
quotes_2 Discard Especifica como as aspas duplas so tratadas
PairAndDiscard na importao.
IncludeAsText
full_filename string Nome completo do arquivo a ser lido,
incluindo o diretrio.
use_custom_values sinalizador
custom_storage Unknown
Sequncia de caracteres
Nmero inteiro
Real
Time
Data
Timestamp

Captulo 9. Propriedades do N de Origem 95


Tabela 54. Propriedades de variablefilenode (continuao).
Propriedades de variablefilenode Tipo de dados Descrio da propriedade
custom_date_format "DDMMYY" Aplicvel apenas se um armazenamento
"MMDDYY" customizado tiver sido especificado.
"YYMMDD"
"YYYYMMDD"
"YYYYDDD"
DAY
MONTH
"DD-MM-YY"
"DD-MM-YYYY"
"MM-DD-YY"
"MM-DD-YYYY"
"DD-MON-YY"
"DD-MON-YYYY"
"YYYY-MM-DD"
"DD.MM.YY"
"DD.MM.YYYY"
"MM.DD.YY"
"MM.DD.YYYY"
"DD.MON.YY"
"DD.MON.YYYY"
"DD/MM/YY"
"DD/MM/YYYY"
"MM/DD/YY"
"MM/DD/YYYY"
"DD/MON/YY"
"DD/MON/YYYY"
MES AAAA
t T AAAA
ww WK YYYY
custom_time_format "HHMMSS" Aplicvel apenas se um armazenamento
"HHMM" customizado tiver sido especificado.
"MMSS"
"HH:MM:SS"
"HH:MM"
"MM:SS"
"(H)H:(M)M:(S)S"
"(H)H:(M)M"
"(M)M:(S)S"
"HH.MM.SS"
"HH.MM"
"MM.SS"
"(H)H.(M)M.(S)S"
"(H)H.(M)M"
"(M)M.(S)S"
custom_decimal_symbol campo Aplicvel apenas se um armazenamento
customizado tiver sido especificado.
encoding StreamDefault Especifica o mtodo de codificao de texto.
SystemDefault
"UTF-8"

96 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de xmlimportnode
O n de origem XML importa dados no formato XML para o fluxo. possvel importar um
nico arquivo ou todos os arquivos em um diretrio. possvel, opcionalmente, especificar
um arquivo de esquema a partir do qual a estrutura XML lida.

Exemplo
node = stream.create("xmlimport", "My node")
node.setPropertyValue("full_filename", "c:/import/ebooks.xml")
node.setPropertyValue("records", "/author/name")

Tabela 55. Propriedades de xmlimportnode.


Propriedades de xmlimportnode Tipo de dados Descrio da propriedade
read single L um arquivo de dados nico (padro) ou
directory todos os arquivos XML em um diretrio.
recurse sinalizador Especifica se deve tambm ler arquivos XML a
partir de todos os subdiretrios do diretrio
especificado.
full_filename string (necessrio) Caminho e nome do arquivo
completos do arquivo XML a ser importado (se
read = single).
directory_name string (necessrio) Caminho e nome do diretrio a
partir do qual importar arquivos XML (se read
= directory).
full_schema_filename string Caminho e nome de arquivo completos do
arquivo XSD ou DTD a partir do qual ler a
estrutura XML. Se voc omitir esse parmetro,
a estrutura ser lida a partir do arquivo de
origem XML.
records string Expresso XPath (por exemplo, /author/name)
para definir o limite do registro. Um novo
registro ser criado toda vez que este elemento
for encontrado.
mode read L todos os dados (padro) ou especifica quais
specify itens sero lidos.
fields Lista de itens (elementos e atributos) a serem
importados. Cada item na lista uma
expresso XPath.

Propriedades de dataviewimport
O n Visualizao de Dados importa dados da Visualizao de Dados no IBM SPSS Modeler.

Exemplo
stream = modeler.script.stream()

dvnode = stream.createAt("dataviewimport", "Data View", 96, 96)


dvnode.setPropertyValue("analytic_data_source",
["","/folder/adv", "LATEST"])
dvnode.setPropertyValue("table_name", ["","com.ibm.spss.Table"])

Captulo 9. Propriedades do N de Origem 97


dvnode.setPropertyValue("data_access_plan",
["","DataAccessPlan"])
dvnode.setPropertyValue("optional_attributes",
[["","NewDerivedAttribute"]])
dvnode.setPropertyValue("include_xml", True)
dvnode.setPropertyValue("include_xml_field", "xml_data")

Tabela 56. Propriedades de dataviewimport


Propriedades de dataviewimport Tipo de dados Descrio da propriedade
analytic_data_source string O objeto de Visualizao de Dados Analticos
armazenado no IBM SPSS Collaboration and
Deployment Services. O nome do caminho e o
rtulo de verso para a verso a ser utilizada.
["Object ID","Full path", "Version"]
table_name string A tabela de visualizao de dados utilizada na
Visualizao de Dados Analticos. O nome da
tabela deve ser qualificado como pacote.
possvel obter o pacote ao exportar o BOM a
partir do cliente IBM SPSS Collaboration and
Deployment Services Deployment Manager e
procurar no arquivo default.bom no archive
zip exportado. O nome do pacote deve ser
sempre o mesmo, a menos que o BOM tenha
sido importado do IBM Operational Decision
Management (iLOG).
["Object ID", "Name"]
data_access_plan string O plano de acesso a dados utilizado para
fornecer os dados para a Visualizao de
Dados Analticos.
["Object ID","Name"]
optional_attributes string Uma lista de atributos derivados a ser includa.
[["ID1","Name1"], ["ID2", "Name2"]]
include_xml boolean True se um campo com dados de instncia
XOM tiver que ser includo. A menos que os
ns do IBM Analytical Decision Management
iLOG sejam utilizados, a configurao
recomendada false. Ativar isso pode incluir
muito processamento extra.
include_xml_field string O nome do campo para incluir quando
include_xml for configurado como true.

98 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Captulo 10. Propriedades do N de Operaes de Registro
Propriedades de appendnode
O n Anexar concatena conjuntos de registros. Ele til para combinar conjuntos de dados
com estruturas semelhantes, porm dados diferentes.

Example
node = stream.create("append", "My node")
node.setPropertyValue("match_by", "Name")
node.setPropertyValue("match_case", True)
node.setPropertyValue("include_fields_from", "All")
node.setPropertyValue("create_tag_field", True)
node.setPropertyValue("tag_field_name", "Append_Flag")

Tabela 57. Propriedades de appendnode.


Propriedades de appendnode Tipo de dados Descrio da propriedade
match_by Posio possvel anexar conjuntos de dados com base
Nome na posio dos campos na origem de dados
principal ou no nome dos campos nos conjuntos
de dados de entrada.
match_case sinalizador Ativa a sensibilidade de maisculas e minsculas
ao corresponder nomes de campo.
include_fields_from Main
All
create_tag_field sinalizador
tag_field_name string

Propriedades de aggregatenode
O n Agregado substitui uma sequncia de registros de entrada por registros de sada
resumidos e agregados.

Exemplo
node = stream.create("aggregate", "My node")
# dbnode is a configured database import node
stream.link(dbnode, node)
node.setPropertyValue("contiguous", True)
node.setPropertyValue("keys", ["Drug"])
node.setKeyedPropertyValue("aggregates", "Age", ["Sum", "Mean"])
node.setPropertyValue("inc_record_count", True)
node.setPropertyValue("count_field", "index")
node.setPropertyValue("extension", "Aggregated_")
node.setPropertyValue("add_as", "Prefix")

99
Tabela 58. Propriedades de aggregatenode.
Propriedades de aggregatenode Tipo de dados Descrio da propriedade
keys list Lista campos que podem ser utilizados como
chaves para agregao. Por exemplo, se Sex e
Region forem os campos-chave, cada combinao
exclusiva de M e F com regies N e S (quatro
combinaes exclusivas) ter um registro
agregado.
contiguous sinalizao Selecione essa opo se voc souber que todos os
registros com os mesmos valores da chave so
agrupados na entrada (por exemplo, se a entrada
for classificada nos campos-chave). Fazer isso
poder melhorar o desempenho.
aggregates Propriedade estruturada que lista os campos
numricos cujos valores sero agregados, bem
como os modos de agregao selecionados.
aggregate_exprs Propriedade definida como chave que define
uma chave para o nome de campo derivado com
a expresso agregada usada para calcular essa
chave. Por exemplo:
aggregatenode.setKeyedPropertyValue
("aggregate_exprs", "Na_MAX", "MAX(Na)")
extension string Especifica um prefixo ou sufixo para duplicar
campos agregados (amostra abaixo).
add_as Sufixo
Prefix
inc_record_count sinalizao Cria um campo extra que especifica quantos
registros de entrada foram agregados para
formar cada registro agregado.
count_field string Especifica o nome do campo de contagem de
registros.
allow_approximation Booleano Permite aproximao de estatsticas de pedido
quando a agregao executada no Analytic
Server
bin_count integer Especifica o nmero de categorias a serem
utilizadas na aproximao

Propriedades de balancenode
O n Balanceamento corrige desbalanceamentos em um conjunto de dados, para que ele
esteja em conformidade com uma condio especificada. A diretiva de balanceamento ajusta a
proporo de registros onde uma condio for true pelo fator especificado.

Example
node = stream.create("balance", "My node")
node.setPropertyValue("training_data_only", True)
node.setPropertyValue("directives", [[1.3, "Age > 60"], [1.5, "Na > 0.5"]])

100 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 59. Propriedades de balancenode.
Propriedades de balancenode Tipo de dados Descrio da propriedade
directives Propriedade estruturada para balancear a
proporo dos valores de campo com base em
um nmero especificado (consulte o exemplo a
seguir).
training_data_only sinalizador Especifica que apenas os dados de treinamento
devem ser balanceados. Se nenhum campo de
partio estiver presente no fluxo, essa opo
ser ignorada.

Esta propriedade do n usa o formato:

[[ number, string ] \ [ number, string] \ ... [number, string ]].

Nota: Se sequncias (utilizando aspas duplas) forem integradas na expresso, elas devero ser precedidas
pelo caractere de escape " \ ". O caractere " \ " tambm o caractere de continuao de linha que pode
ser usado para alinhar os argumentos para maior clareza.

Propriedades de derive_stbnode
O n Space-Time-Boxes deriva Space-Time-Boxes a partir de campos de latitude, longitude e
de registro de data e hora. Tambm possvel identificar Space-Time-Boxes frequentes como
hangouts.

Exemplo
node = modeler.script.stream().createAt("derive_stb", "My node", 96, 96)

# Individual Records mode


node.setPropertyValue("mode", "IndividualRecords")
node.setPropertyValue("latitude_field", "Latitude")
node.setPropertyValue("longitude_field", "Longitude")
node.setPropertyValue("timestamp_field", "OccurredAt")
node.setPropertyValue("densities", ["STB_GH7_1HOUR", "STB_GH7_30MINS"])
node.setPropertyValue("add_extension_as", "Prefix")
node.setPropertyValue("name_extension", "stb_")

# Hangouts mode
node.setPropertyValue("mode", "Hangouts")
node.setPropertyValue("hangout_density", "STB_GH7_30MINS")
node.setPropertyValue("id_field", "Event")
node.setPropertyValue("qualifying_duration", "30MINUTES")
node.setPropertyValue("min_events", 4)
node.setPropertyValue("qualifying_pct", 65)

Tabela 60. Propriedades do n Space-Time-Boxes


Propriedades de derive_stbnode Tipo de dados Descrio da propriedade
mode IndividualRecords
Hangouts
latitude_field campo
longitude_field campo
timestamp_field campo
hangout_density density Uma nica densidade. Consulte densities para
obter valores de densidade vlidos.

Captulo 10. Propriedades do N de Operaes de Registro 101


Tabela 60. Propriedades do n Space-Time-Boxes (continuao)
Propriedades de derive_stbnode Tipo de dados Descrio da propriedade
densities [density,density,..., density] Cada densidade uma sequncia, por exemplo,
STB_GH8_1DAY.
Nota: H limites para os quais as densidades so
vlidas. Para valores geohash, os valores de GH1 a
GH15 podem ser utilizados. Para a parte temporal,
os valores a seguir podem ser utilizados:
EVER
1YEAR
1MONTH
1DAY
12HOURS
8HOURS
6HOURS
4HOURS
3HOURS
2HOURS
1HOUR
30MINS
15MINS
10MINS
5MINS
2MINS
1MIN
30SECS
15SECS
10SECS
5SECS
2SECS
1SEC
id_field campo
qualifying_duration 1DAY Deve ser uma sequncia.
12HOURS
8HOURS
6HOURS
4HOURS
3HOURS
2Hours
1HOUR
30MIN
15MIN
10MIN
5MIN
2MIN
1MIN
30SECS
15SECS
10SECS
5SECS
2SECS
1SECS
min_events integer O valor de nmero inteiro vlido mnimo 2.
qualifying_pct integer Deve estar no intervalo de 1 a 100.
add_extension_as Prefixo
Sufixo
name_extension string

102 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de distinctnode
O n Distinto remove registros duplicados seja transmitindo o primeiro registro distinto para
o fluxo de dados ou descartando o primeiro registro e transmitindo quaisquer duplicatas para
o fluxo de dados.

Exemplo
node = stream.create("distinct", "My node")
node.setPropertyValue("mode", "Include")
node.setPropertyValue("fields", ["Age" "Sex"])
node.setPropertyValue("keys_pre_sorted", True)

Tabela 61. Propriedades de distinctnode.


Propriedades de distinctnode Tipo de dados Descrio da propriedade
mode Include possvel incluir o primeiro registro distinto no
Discard fluxo de dados ou descartar o primeiro registro
distinto e transmitir quaisquer registros
duplicados para o fluxo de dados.
grouping_fields list Lista campos utilizados para determinar se os
registros so idnticos.
Nota: Esta propriedade descontinuada a partir
do IBM SPSS Modeler 16.
composite_value Slot estruturado Consulte o exemplo abaixo.
composite_values Slot estruturado Consulte o exemplo abaixo.
inc_record_count sinalizador Cria um campo extra que especifica quantos
registros de entrada foram agregados para
formar cada registro agregado.
count_field string Especifica o nome do campo de contagem de
registros.
sort_keys Slot estruturado. Nota: Esta propriedade descontinuada a partir
do IBM SPSS Modeler 16.
default_ascending sinalizador
low_distinct_key_count sinalizador Especifica que voc tem apenas um pequeno
nmero de registros e/ou um pequeno nmero
de valores exclusivos de um ou mais
campos-chave.
keys_pre_sorted sinalizador Especifica que todos os registros com os mesmos
valores da chave so agrupados na entrada.
disable_sql_generation sinalizador

Exemplo para propriedade composite_value

A propriedade composite_value tem a seguinte forma geral:


node.setKeyedPropertyValue("composite_value", FIELD, FILLOPTION)

FILLOPTION has the form [ FillType, Option1, Option2, ...].

Exemplos:
node.setKeyedPropertyValue("composite_value", "Age", ["First"])
node.setKeyedPropertyValue("composite_value", "Age", ["last"])
node.setKeyedPropertyValue("composite_value", "Age", ["Total"])
node.setKeyedPropertyValue("composite_value", "Age", ["Average"])
node.setKeyedPropertyValue("composite_value", "Age", ["Min"])

Captulo 10. Propriedades do N de Operaes de Registro 103


node.setKeyedPropertyValue("composite_value", "Age", ["Max"])
node.setKeyedPropertyValue("composite_value", "Date", ["Earliest"])
node.setKeyedPropertyValue("composite_value", "Date", ["Latest"])
node.setKeyedPropertyValue("composite_value", "Code", ["FirstAlpha"])
node.setKeyedPropertyValue("composite_value", "Code", ["LastAlpha"])

As opes customizadas requerem mais de um argumento que so includos como uma lista, por
exemplo:
node.setKeyedPropertyValue("composite_value", "Name", ["MostFrequent", "FirstRecord"])
node.setKeyedPropertyValue("composite_value", "Date", ["LeastFrequent", "LastRecord"])
node.setKeyedPropertyValue("composite_value", "Pending", ["IncludesValue", "T", "F"])
node.setKeyedPropertyValue("composite_value", "Marital", ["FirstMatch", "Married", "Divorced", "Separated"])
node.setKeyedPropertyValue("composite_value", "Code", ["Concatenate"])
node.setKeyedPropertyValue("composite_value", "Code", ["Concatenate", "Space"])
node.setKeyedPropertyValue("composite_value", "Code", ["Concatenate", "Comma"])
node.setKeyedPropertyValue("composite_value", "Code", ["Concatenate", "UnderScore"])

Exemplo para a propriedade composite_values

A propriedade composite_values tem a seguinte forma geral:


node.setPropertyValue("composite_values", [
[FIELD1, [FILLOPTION1]],
[FIELD2, [FILLOPTION2]],
.
.
])

Exemplo:
node.setPropertyValue("composite_values", [
["Age", ["First"]],
["Name", ["MostFrequent", "First"]],
["Pending", ["IncludesValue", "T"]],
["Marital", ["FirstMatch", "Married", "Divorced", "Separated"]],
["Code", ["Concatenate", "Comma"]]
])

Propriedades de mergenode
O n Mesclagem seleciona diversos registros de entrada e cria um registro de sada nico
contendo alguns ou todos os campos de entrada. Ele til para mesclar dados de diferentes
origens, como dados do cliente internos e dados demogrficos adquiridos.

Exemplo
node = stream.create("merge", "My node")
# assume customerdata and salesdata are configured database import nodes
stream.link(customerdata, node)
stream.link(salesdata, node)
node.setPropertyValue("method", "Keys")
node.setPropertyValue("key_fields", ["id"])
node.setPropertyValue("common_keys", True)
node.setPropertyValue("join", "PartialOuter")
node.setKeyedPropertyValue("outer_join_tag", "2", True)
node.setKeyedPropertyValue("outer_join_tag", "4", True)
node.setPropertyValue("single_large_input", True)
node.setPropertyValue("single_large_input_tag", "2")
node.setPropertyValue("use_existing_sort_keys", True)
node.setPropertyValue("existing_sort_keys", [["id", "Ascending"]])

104 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 62. Propriedades de mergenode.
Propriedades de mergenode Tipo de dados Descrio da propriedade
method Order Especifique se os registros so mesclados na
Keys ordem em que eles so listados nos arquivos de
Condition dados, se um ou mais campos-chave sero
Rankedcondition utilizados para mesclar os registros com o
mesmo valor nos campos-chave, se os registros
sero mesclados se uma condio especificada
for satisfeita ou se cada pareamento de linha nos
conjuntos de dados primrio e em todos os
conjuntos secundrios deve ser mesclado;
utilizando a expresso de classificao para
classificar diversas correspondncias na ordem
de baixo para cima.
condition string Se method for configurado para Condition,
especifica a condio para incluir ou descartar
registros.
key_fields list
common_keys sinalizador
join Inner
FullOuter
PartialOuter
Anti
outer_join_tag.n sinalizador Nesta propriedade, n o nome da tag conforme
exibido na caixa de dilogo Selecionar Conjunto
de Dados. Observe que diversos nomes de tag
podem ser especificados, j que qualquer
nmero de conjuntos de dados pode contribuir
com registros incompletos.
single_large_input sinalizador Especifica se a otimizao para ter uma entrada
relativamente grande em comparao com as
outras entradas ser utilizada.
single_large_input_tag string Especifica o nome da tag conforme exibido na
caixa de dilogo Selecionar Conjunto de Dados
Grande. Observe que o uso desta propriedade
um pouco diferente da propriedade
outer_join_tag (sinalizador versus sequncia)
porque somente um conjunto de dados de
entrada pode ser especificado.
use_existing_sort_keys sinalizador Especifica se as entradas j esto classificadas
por um ou mais campos-chave.
existing_sort_keys [['string', Ascending] \ Especifica os campos que j estiverem
['string'', Descending]] classificados e a direo na qual eles so
classificados.
primary_dataset string Se method for Rankedcondition, selecione o
conjunto de dados primrio na mesclagem. Isso
pode ser considerado como o lado esquerdo de
uma mesclagem de juno externa.
add_tag_duplicate Boolean Se method for Rankedcondition, e este for
configurado para Y, se o conjunto de dados
mesclado resultante contiver diversos campos
com o mesmo nome a partir de diferentes
origens de dados, as respectivas tags das origens
de dados sero includas no incio dos
cabealhos de coluna do campo.

Captulo 10. Propriedades do N de Operaes de Registro 105


Tabela 62. Propriedades de mergenode (continuao).
Propriedades de mergenode Tipo de dados Descrio da propriedade
merge_condition string
ranking_expression string
Num_matches integer O nmero de correspondncias a serem
retornadas, com base no merge_condition e no
ranking_expression. Mnimo 1, mximo 100.

Propriedades de rfmaggregatenode
O n Recency, Frequency, Monetary (RFM) Aggregate permite selecionar os dados
transacionais histricos dos clientes, eliminar quaisquer dados no utilizados e combinar
todos os dados da transao restantes dos clientes em uma nica linha que lista quando eles
interagiram pela ltima vez com voc, quantas transaes eles realizaram e o valor monetrio
total dessas transaes.

Exemplo
node = stream.create("rfmaggregate", "My node")
node.setPropertyValue("relative_to", "Fixed")
node.setPropertyValue("reference_date", "2007-10-12")
node.setPropertyValue("id_field", "CardID")
node.setPropertyValue("date_field", "Date")
node.setPropertyValue("value_field", "Amount")
node.setPropertyValue("only_recent_transactions", True)
node.setPropertyValue("transaction_date_after", "2000-10-01")

Tabela 63. Propriedades de rfmaggregatenode.


Propriedades de
rfmaggregatenode Tipo de dados Descrio da propriedade
relative_to Fixed Especifique a data a partir da qual a recncia das
Today transaes ser calculada.
reference_date date Disponvel apenas se Fixed for escolhido em
relative_to.
contiguous sinalizador Se seus dados forem pr-classificados de forma
que todos os registros com o mesmo ID
apaream juntos no fluxo de dados, selecionar
esta opo acelera o processamento.
id_field campo Especifique o campo a ser utilizado para
identificar o cliente e suas transaes.
date_field campo Especifique o campo de data a ser utilizado para
calcular a recncia.
value_field campo Especifique o campo a ser utilizado para calcular
o valor monetrio.
extension string Especifique um prefixo ou sufixo para duplicar
campos agregados.
add_as Sufixo Especifique se extension deve ser includo como
Prefix um sufixo ou um prefixo.
discard_low_value_records sinalizador Ativa o uso da configurao
discard_records_below.

106 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 63. Propriedades de rfmaggregatenode (continuao).
Propriedades de
rfmaggregatenode Tipo de dados Descrio da propriedade
discard_records_below number Especifica um valor mnimo abaixo do qual
quaisquer detalhes da transao no sero
utilizados ao calcular os totais de RFM. As
unidades de valor relacionadas ao campo value
selecionado.
only_recent_transactions sinalizador Ativa a utilizao das configuraes de
specify_transaction_date ou
transaction_within_last.
specify_transaction_date sinalizador
transaction_date_after date Disponvel apenas se specify_transaction_date
for selecionado. Especifique a data da transao
aps a qual os registros sero includos em sua
anlise.
transaction_within_last number Disponvel apenas se transaction_within_last
for selecionado. Especifique o nmero e o tipo de
perodos (dias, semanas, meses ou anos) desde
Calcular Recncia relativa at a data aps a qual
os registros sero includos em sua anlise.
transaction_scale Days Disponvel apenas se transaction_within_last
Weeks for selecionado. Especifique o nmero e o tipo de
Months perodos (dias, semanas, meses ou anos) desde
Years Calcular Recncia relativa at a data aps a qual
os registros sero includos em sua anlise.
save_r2 sinalizador Exibe a data da segunda transao mais recente
para cada cliente.
save_r3 sinalizador Disponvel apenas se save_r2 for selecionado.
Exibe a data da terceira transao mais recente
para cada cliente.

Propriedades de Rprocessnode
O n Transformao R permite obter dados de um fluxo
do IBM(r) SPSS(r) Modeler e modific-los usando seu
prprio script R customizado. Aps os dados serem
modificados, eles sero retornados para o fluxo.

Exemplo
node = stream.create("rprocess", "My node")
node.setPropertyValue("custom_name", "my_node")
node.setPropertyValue("syntax", """day<-as.Date(modelerData$dob, format="%Y-%m-%d")
next_day<-day + 1
modelerData<-cbind(modelerData,next_day)
var1<-c(fieldName="Next day",fieldLabel="",fieldStorage="date",fieldMeasure="",fieldFormat="",
fieldRole="")
modelerDataModel<-data.frame(modelerDataModel,var1)""")
node.setPropertyValue("convert_datetime", "POSIXct")

Tabela 64. Propriedades de Rprocessnode.


Propriedades de Rprocessnode Tipo de dados Descrio da propriedade
syntax string
convert_flags StringsAndDoubles
LogicalValues

Captulo 10. Propriedades do N de Operaes de Registro 107


Tabela 64. Propriedades de Rprocessnode (continuao).
Propriedades de Rprocessnode Tipo de dados Descrio da propriedade
convert_datetime sinalizador
convert_datetime_class POSIXct
POSIXlt
convert_missing sinalizador
use_batch_size sinalizador Ativar uso do processamento em lote
batch_size integer Especifique o nmero de registros de dados a
serem includos em cada lote

Propriedades de samplenode
O n Amostra seleciona um subconjunto de registros. Diversos tipos de amostra so
suportados, incluindo amostras estratificadas, em cluster e no aleatrias (estruturadas). A
amostragem pode ser til para melhorar o desempenho e para selecionar grupos de registros
ou transaes relacionados para anlise.

Exemplo
/* Create two Sample nodes to extract
different samples from the same data */

node = stream.create("sample", "My node")


node.setPropertyValue("method", "Simple")
node.setPropertyValue("mode", "Include")
node.setPropertyValue("sample_type", "First")
node.setPropertyValue("first_n", 500)

node = stream.create("sample", "My node")


node.setPropertyValue("method", "Complex")
node.setPropertyValue("stratify_by", ["Sex", "Cholesterol"])
node.setPropertyValue("sample_units", "Proportions")
node.setPropertyValue("sample_size_proportions", "Custom")
node.setPropertyValue("sizes_proportions", [["M", "High", "Default"], ["M", "Normal", "Default"],
["F", "High", 0.3], ["F", "Normal", 0.3]])

Tabela 65. Propriedades de samplenode.


Propriedades de samplenode Tipo de dados Descrio da propriedade
method Simples

Complexo
mode Include Inclui ou descarta registros que atendem a uma
Discard condio especfica.
sample_type First Especifica o mtodo de amostragem.
OneInN
RandomPct
first_n integer Registros at o ponto de corte especificado a
serem includos ou descartados.
one_in_n number Inclui ou descarta a cada n registro.
rand_pct number Especifique a porcentagem de registros a incluir
ou descartar.
use_max_size sinalizador Ativar o uso da configurao de maximum_size.
maximum_size integer Especifica a maior amostra a ser includa ou
descartada do fluxo de dados. Esta opo
redundante e, portanto, desativada quando First
e Include forem especificados.

108 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 65. Propriedades de samplenode (continuao).
Propriedades de samplenode Tipo de dados Descrio da propriedade
set_random_seed sinalizador Permite o uso da configurao de valor inicial
aleatrio.
random_seed integer Especifica o valor utilizado como um valor inicial
aleatrio.
complex_sample_type Random
Systematic
sample_units Propores
Contagens
sample_size_proportions Fixed
Custom
Variable
sample_size_counts Fixed
Custom
Variable
fixed_proportions number
fixed_counts integer
variable_proportions campo
variable_counts campo
use_min_stratum_size sinalizador
minimum_stratum_size integer Essa opo se aplica apenas quando uma
amostra Complexa obtida com Sample
units=Proportions.
use_max_stratum_size sinalizador
maximum_stratum_size integer Essa opo se aplica apenas quando uma
amostra Complexa obtida com Sample
units=Proportions.
clusters campo
stratify_by [field1 ... fieldN]
specify_input_weight sinalizador
input_weight campo
new_output_weight string
sizes_proportions [[string string value][string Se sample_units=proportions e
string value]...] sample_size_proportions=Custom, especifica um
valor para cada combinao possvel de valores
de campo de estratificao.
default_proportion number
sizes_counts [[string string value][string Especifica um valor para cada combinao
string value]...] possvel de valores de campo de estratificao.
Uso semelhante a sizes_proportions, mas
especificando um nmero inteiro ao invs de
uma proporo.
default_count number

Captulo 10. Propriedades do N de Operaes de Registro 109


Propriedades de selectnode
O n Selecionar seleciona ou descartar um subconjunto de registros do fluxo de dados com
base em uma condio especfica. Por exemplo, possvel selecionar os registros que
pertencerem a uma regio de vendas especfica.

Exemplo
node = stream.create("select", "My node")
node.setPropertyValue("mode", "Include")
node.setPropertyValue("condition", "Age < 18")

Tabela 66. Propriedades de selectnode.


Propriedades de selectnode Tipo de dados Descrio da propriedade
mode Include Especifica se os registros selecionados devem ser
Discard includos ou descartados.
condition string Condio para incluir ou descartar de registros.

Propriedades de sortnode
O n Classificar classifica os registros em ordem crescente ou decrescente com base nos
valores de um ou mais campos.

Exemplo
node = stream.create("sort", "My node")
node.setPropertyValue("keys", [["Age", "Ascending"], ["Sex", "Descending"]])
node.setPropertyValue("default_ascending", False)
node.setPropertyValue("use_existing_keys", True)
node.setPropertyValue("existing_keys", [["Age", "Ascending"]])

Tabela 67. Propriedades de sortnode.


Propriedades de sortnode Tipo de dados Descrio da propriedade
keys list Especifica os campos com relao aos quais voc
deseja classificar. Se nenhuma direo for
especificada, o padro ser utilizado.
default_ascending sinalizador Especifica a ordem de classificao padro.
use_existing_keys sinalizador Especifica se a classificao otimizada
utilizando a ordem de classificao anterior para
campos que j estiverem classificados.
existing_keys Especifica os campos que j estiverem
classificados e a direo na qual eles so
classificados. Utiliza o mesmo formato que a
propriedade keys.

Propriedades de streamingts
O n TS de Fluxo constri e escora os modelos de sries temporais em uma etapa, sem a
necessidade de um n Intervalos de Tempo.

110 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Exemplo
node = stream.create("streamingts", "My node")
node.setPropertyValue("deployment_force_rebuild", True)
node.setPropertyValue("deployment_rebuild_mode", "Count")
node.setPropertyValue("deployment_rebuild_count", 3)
node.setPropertyValue("deployment_rebuild_pct", 11)
node.setPropertyValue("deployment_rebuild_field", "Year")

Tabela 68. Propriedades de streamingts.


Propriedades de streamingts Tipo de dados Descrio da propriedade
custom_fields sinalizador Se custom_fields=false, as configuraes de
um n Tipo de envio de dados so utilizadas.
Se custom_fields=true, ento targets e inputs
devero ser especificados.
targets [field1...fieldN]
inputs [field1...fieldN]
method ExpertModeler
Exsmooth
Arima
calculate_conf sinalizador
conf_limit_pct real
use_time_intervals_node sinalizador Se use_time_intervals_node=true, as
configuraes de um n Intervalos de Tempo de
envio de dados so utilizadas. Se
use_time_intervals_node=false,
interval_offset_position, ento
interval_offset e interval_type devero ser
especificados.
interval_offset_position LastObservation LastObservation refere-se ltima observao
LastRecord vlida. LastRecord refere-se a Contagem de
volta a partir do ltimo registro.
interval_offset nmero
interval_type Periods
Years
Quarters
Months
WeeksNonPeriodic
DaysNonPeriodic
HoursNonPeriodic
MinutesNonPeriodic
SecondsNonPeriodic
events campos
expert_modeler_method AllModels
Exsmooth
Arima
consider_seasonal sinalizador
detect_outliers sinalizador
expert_outlier_additive sinalizador
expert_outlier_level_shift sinalizador
expert_outlier_innovational sinalizador
expert_outlier_transient sinalizador
expert_outlier_seasonal_additive sinalizador
expert_outlier_local_trend sinalizador

Captulo 10. Propriedades do N de Operaes de Registro 111


Tabela 68. Propriedades de streamingts (continuao).
Propriedades de streamingts Tipo de dados Descrio da propriedade
expert_outlier_additive_patch sinalizador
exsmooth_model_type Simple
HoltsLinearTrend
BrownsLinearTrend
DampedTrend
SimpleSeasonal
WintersAdditive
WintersMultiplicative
exsmooth_transformation_type Nenhum
SquareRoot
NaturalLog
arima_p integer Mesma propriedade do n de modelagem de
Sries Temporais
arima_d integer Mesma propriedade do n de modelagem de
Sries Temporais
arima_q integer Mesma propriedade do n de modelagem de
Sries Temporais
arima_sp integer Mesma propriedade do n de modelagem de
Sries Temporais
arima_sd integer Mesma propriedade do n de modelagem de
Sries Temporais
arima_sq integer Mesma propriedade do n de modelagem de
Sries Temporais
arima_transformation_type Nenhum Mesma propriedade do n de modelagem de
SquareRoot Sries Temporais
NaturalLog
arima_include_constant sinalizador Mesma propriedade do n de modelagem de
Sries Temporais
tf_arima_p.fieldname integer Mesma propriedade do n de modelagem de
Sries Temporais. Para funes de transferncia.
tf_arima_d.fieldname integer Mesma propriedade do n de modelagem de
Sries Temporais. Para funes de transferncia.
tf_arima_q.fieldname integer Mesma propriedade do n de modelagem de
Sries Temporais. Para funes de transferncia.
tf_arima_sp.fieldname integer Mesma propriedade do n de modelagem de
Sries Temporais. Para funes de transferncia.
tf_arima_sd.fieldname integer Mesma propriedade do n de modelagem de
Sries Temporais. Para funes de transferncia.
tf_arima_sq.fieldname integer Mesma propriedade do n de modelagem de
Sries Temporais. Para funes de transferncia.
tf_arima_delay.fieldname integer Mesma propriedade do n de modelagem de
Sries Temporais. Para funes de transferncia.
tf_arima_transformation_type. Nenhum
fieldname SquareRoot
NaturalLog
arima_detect_outlier_mode Nenhum
Automtico
arima_outlier_additive sinalizador
arima_outlier_level_shift sinalizador

112 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 68. Propriedades de streamingts (continuao).
Propriedades de streamingts Tipo de dados Descrio da propriedade
arima_outlier_innovational sinalizador
arima_outlier_transient sinalizador
arima_outlier_seasonal_additive sinalizador
arima_outlier_local_trend sinalizador
arima_outlier_additive_patch sinalizador
deployment_force_rebuild sinalizador
deployment_rebuild_mode Contagem
Porcentagem
deployment_rebuild_count nmero
deployment_rebuild_pct nmero
deployment_rebuild_field <campo>

Captulo 10. Propriedades do N de Operaes de Registro 113


114 Guia de Script e Automao Python do IBM SPSS Modeler 17.1
Captulo 11. Propriedades do N de Operaes de Campo
Propriedades de anonymizenode
O n Anonimizar transforma a maneira com que os nomes e valores de campo so
representados no recebimento de dados, ocultando, assim, os dados originais. Isto poder ser
til se desejar permitir que outros usurios construam modelos utilizando dados sensveis,
como nomes de cliente ou outros detalhes.

Example
stream = modeler.script.stream()
varfilenode = stream.createAt("variablefile", "File", 96, 96)
varfilenode.setPropertyValue("full_filename", "$CLEO/DEMOS/DRUG1n")
node = stream.createAt("anonymize", "My node", 192, 96)
# Anonymize node requires the input fields while setting the values
stream.link(varfilenode, node)
node.setKeyedPropertyValue("enable_anonymize", "Age", True)
node.setKeyedPropertyValue("transformation", "Age", "Random")
node.setKeyedPropertyValue("set_random_seed", "Age", True)
node.setKeyedPropertyValue("random_seed", "Age", 123)
node.setKeyedPropertyValue("enable_anonymize", "Drug", True)
node.setKeyedPropertyValue("use_prefix", "Drug", True)
node.setKeyedPropertyValue("prefix", "Drug", "myprefix")

Tabela 69. Propriedades de anonymizenode


Propriedades de anonymizenode Tipo de dados Descrio da propriedade
enable_anonymize sinalizador Quando configurado para True, ativa a anonimizao de
valores de campo (equivalente a selecionar em Sim para esse
campo na coluna Valores Anonimizados).
use_prefix sinalizador Quando configurado para True, um prefixo customizado ser
utilizado se um tiver sido especificado. Aplica-se aos campos
que sero anonimizados pelo mtodo Hash e equivalente a
escolher o boto de opes Customizado na caixa de dilogo
Substituir Valores para esse campo.
prefix string Equivalente a digitar um prefixo na caixa de texto na caixa de
dilogo Substituir Valores. O prefixo padro ser o valor
padro se nada mais foi especificado.
transformation Random Determina se os parmetros de transformao para um campo
Fixed anonimizado pelo mtodo Transformao sero aleatrios ou
fixos.
set_random_seed sinalizador Quando configurado para True, o valor inicial especificado
utilizado (se transformation tambm for configurado para
Random).
random_seed integer Quando set_random_seed configurado para True, esse o
valor inicial para o nmero aleatrio.
escala nmero Quando transformation configurado para Fixed, esse valor
usado para "scale by". O valor mximo da escala normalmente
10, mas poder ser reduzido para evitar estouro.
traduzir nmero Quando transformation configurado para Fixed, esse valor
usado para "translate". O valor mximo da converso
normalmente 1000, mas poder ser reduzido para evitar
estouro.

115
Propriedades de autodataprepnode
O n Automated Data Preparation (ADP) pode analisar seus dados e identificar correes,
selecionar campos que so problemticos ou que provavelmente no sero teis, derivar
novos atributos quando apropriado e aprimorar o desempenho por meio de tcnicas de
triagem e de amostragem inteligentes. possvel utilizar o n de forma totalmente
automatizada, permitindo que o n escolha e aplique correes, ou possvel visualizar as
mudanas antes que elas sejam feitas e aceit-las, rejeit-las ou modific-las conforme
desejado.

exemplo
node = stream.create("autodataprep", "My node")
node.setPropertyValue("objective", "Balanced")
node.setPropertyValue("excluded_fields", "Filter")
node.setPropertyValue("prepare_dates_and_times", True)
node.setPropertyValue("compute_time_until_date", True)
node.setPropertyValue("reference_date", "Today")
node.setPropertyValue("units_for_date_durations", "Automatic")

Tabela 70. Propriedades de autodataprepnode


Propriedades de autodataprepnode Tipo de dados Descrio da propriedade
objective Balanced
Speed
Accuracy
Custom
custom_fields flag Se true, permite especificar campos de
destino, de entrada e outros campos para o n
atual. Se false, as configuraes atuais de um
n Tipo de envio de dados sero utilizadas.
target campo Especifica um campo de destino nico.
inputs [field1 ... fieldN] Campos de entrada ou de preditores usados
pelo modelo.
use_frequency flag
frequency_field campo
use_weight flag
weight_field field
excluded_fields Filter
None
if_fields_do_not_match StopExecution
ClearAnalysis
prepare_dates_and_times flag Controla o acesso a todos os campos de data
e hora
compute_time_until_date flag
reference_date Today
Fixed
fixed_date date
units_for_date_durations Automatic
Fixed
fixed_date_units Years
Months
Days
compute_time_until_time flag

116 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 70. Propriedades de autodataprepnode (continuao)
Propriedades de autodataprepnode Tipo de dados Descrio da propriedade
reference_time CurrentTime
Fixed
fixed_time time
units_for_time_durations Automatic
Fixed
fixed_date_units Hours
Minutes
Seconds
extract_year_from_date flag
extract_month_from_date flag
extract_day_from_date flag
extract_hour_from_time flag
extract_minute_from_time flag
extract_second_from_time flag
exclude_low_quality_inputs flag
exclude_too_many_missing flag
maximum_percentage_missing number
exclude_too_many_categories flag
maximum_number_categories number
exclude_if_large_category flag
maximum_percentage_category number
prepare_inputs_and_target flag
adjust_type_inputs flag
adjust_type_target flag
reorder_nominal_inputs flag
reorder_nominal_target flag
replace_outliers_inputs flag
replace_outliers_target flag
replace_missing_continuous_inputs flag
replace_missing_continuous_target flag
replace_missing_nominal_inputs flag
replace_missing_nominal_target flag
replace_missing_ordinal_inputs flag
replace_missing_ordinal_target flag
maximum_values_for_ordinal number
minimum_values_for_continuous number
outlier_cutoff_value number
outlier_method Replace
Excluir
rescale_continuous_inputs flag
rescaling_method MinMax
ZScore

Captulo 11. Propriedades do N de Operaes de Campo 117


Tabela 70. Propriedades de autodataprepnode (continuao)
Propriedades de autodataprepnode Tipo de dados Descrio da propriedade
min_max_minimum number
min_max_maximum number
z_score_final_mean number
z_score_final_sd number
rescale_continuous_target flag
target_final_mean number
target_final_sd number
transform_select_input_fields flag
maximize_association_with_target flag
p_value_for_merging number
merge_ordinal_features flag
merge_nominal_features flag
minimum_cases_in_category number
bin_continuous_fields flag
p_value_for_binning number
perform_feature_selection flag
p_value_for_selection number
perform_feature_construction flag
transformed_target_name_extension string
transformed_inputs_name_extension string
constructed_features_root_name string
years_duration_ name_extension string
months_duration_ name_extension string
days_duration_ name_extension string
hours_duration_ name_extension string
minutes_duration_ name_extension string
seconds_duration_ name_extension string
year_cyclical_name_extension string
month_cyclical_name_extension string
day_cyclical_name_extension string
hour_cyclical_name_extension string
minute_cyclical_name_extension string
second_cyclical_name_extension string

118 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de astimeintervalsnode
O n Intervalos de Tempo original no compatvel com o Analytic Server (AS). O n
Intervalos de Tempo do AS (novo no SPSS Modeler release 17.0) contm um subconjunto das
funes do n Intervalos de Tempo existente que pode ser usado com o Analytic Server.

Utilize o n Intervalos de Tempo do AS para especificar intervalos e derivar um novo campo


de tempo para estimativa ou previso. Uma variedade completa de intervalos de tempo
suportada, desde segundos at anos.

Tabela 71. Propriedades de astimeintervalsnode


Propriedades de astimeintervalsnode Tipo de dados Descrio da propriedade
time_field campo Pode aceitar apenas um nico campo
contnuo. Esse campo utilizado pelo n
como a chave de agregao para converter o
intervalo. Se um campo de nmero inteiro for
utilizado aqui, ele ser considerado como um
ndice de tempo.
dimensions [field1 field2 ... fieldn] Estes campos so usados para criar sries
temporais individuais com base nos valores
do campo.
fields_to_aggregate [field1 field2 ... fieldn] Esses campos so agregados como parte da
mudana do perodo do campo de tempo.
Todos os campos no includos nesse
selecionador so filtrados dos dados que saem
do n.

Propriedades de binningnode
O n Categorizao cria automaticamente novos campos nominais (conjunto) com base nos
valores de um ou mais campos existente contnuos (intervalo numrico). Por exemplo,
possvel transformar um campo de receita contnuo em um novo campo categrico contendo
grupos de receitas como desvios da mdia. Depois de criar categorias para o novo campo,
possvel gerar um n Derivar com base nos pontos de corte.

Example
node = stream.create("binning", "My node")
node.setPropertyValue("fields", ["Na", "K"])
node.setPropertyValue("method", "Rank")
node.setPropertyValue("fixed_width_name_extension", "_binned")
node.setPropertyValue("fixed_width_add_as", "Suffix")
node.setPropertyValue("fixed_bin_method", "Count")
node.setPropertyValue("fixed_bin_count", 10)
node.setPropertyValue("fixed_bin_width", 3.5)
node.setPropertyValue("tile10", True)

Tabela 72. Propriedades de binningnode


Propriedades de binningnode Tipo de dados Descrio da propriedade
fields [field1 field2 ... fieldn] Transformao pendente de campos contnuos
(intervalo numrico). possvel categorizar
diversos campos simultaneamente.
method FixedWidth Mtodo utilizado para determinar os pontos
EqualCount de corte para novas categorias de campo
Rank (categorias).
SDev
timo

Captulo 11. Propriedades do N de Operaes de Campo 119


Tabela 72. Propriedades de binningnode (continuao)
Propriedades de binningnode Tipo de dados Descrio da propriedade
rcalculate_bins Always Especifica se as categorias so recalculadas e
IfNecessary se os dados so colocados na categoria
relevante toda vez que o n for executado ou
se os dados so includos apenas nas
categorias existentes e em quaisquer novas
categorias que foram includas.
fixed_width_name_extension string A extenso padro _BIN.
fixed_width_add_as Suffix Especifica se a extenso includa no trmino
Prefix (sufixo) do nome do campo ou no incio
(prefixo). A extenso padro income_BIN.
fixed_bin_method Width
Count
fixed_bin_count integer Especifica um nmero inteiro utilizado para
determinar o nmero de bins (categorias) de
largura fixa para o(s) novo(s) campo(s).
fixed_bin_width real Valor (nmero inteiro ou real) para calcular a
largura da categoria.
equal_count_name_ string A extenso padro _TILE.
extension
equal_count_add_as Suffix Especifica uma extenso, seja um prefixo ou
Prefix sufixo, utilizada para o nome do campo
gerado usando p-tiles padro. A extenso
padro _TILE e N, em que N o nmero do
ladrilho.
tile4 sinalizador Gera quatro categorias de quantil, cada uma
contendo 25% dos casos.
tile5 sinalizador Gera cinco categorias de quintil.
tile10 sinalizador Gera 10 categorias de decil.
tile20 sinalizador Gera 20 categorias de vingtile.
tile100 sinalizador Gera 100 categorias de percentil.
use_custom_tile sinalizador
custom_tile_name_extension string A extenso padro _TILEN.
custom_tile_add_as Sufixo
Prefixo
custom_tile integer
equal_count_method RecordCount O mtodo RecordCount visa designar um
ValueSum nmero igual de registros para cada categoria,
ao passo que ValueSum designa registros para
que a soma dos valores em cada categoria seja
igual.
tied_values_method Next Especifica em qual categoria os dados de
Current valor empatado devem ser colocados.
Aleatria
rank_order Ascendente Essa propriedade inclui Ascending (o valor
Descending mais baixo marcado como 1) ou Descending
(o valor mais alto marcado como 1).

120 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 72. Propriedades de binningnode (continuao)
Propriedades de binningnode Tipo de dados Descrio da propriedade
rank_add_as Sufixo Essa opo se aplica classificao,
Prefix classificao fracional e classificao de
porcentagem.
rank sinalizador
rank_name_extension string A extenso padro _RANK.
rank_fractional sinalizador Classifica casos em que o valor do novo
campo igual classificao dividido pela
soma dos pesos dos casos no desconhecidos.
As classificaes fracionrias entram no
intervalo de 0 a 1.
rank_fractional_name_ string A extenso padro _F_RANK.
extension
rank_pct sinalizador Cada classificao dividida pelo nmero de
registros com valores vlidos e multiplicada
por 100. A porcentagem das classificaes
fracionrias entra no intervalo de 1 a 100.
rank_pct_name_extension string A extenso padro _P_RANK.
sdev_name_extension string
sdev_add_as Sufixo
Prefix
sdev_count Um
Dois
rvore
optimal_name_extension string A extenso padro _OPTIMAL.
optimal_add_as Sufixo
Prefix
optimal_supervisor_field campo O campo escolhido como o campo de
superviso para o qual os campos
selecionados para a categorizao esto
relacionados.
optimal_merge_bins sinalizador Especifica que quaisquer categorias com
contagens de caso pequenas sero includas
em uma categoria vizinha maior.
optimal_small_bin_threshold integer
optimal_pre_bin sinalizador Indica que a pr-categorizao do conjunto de
dados deve ocorrer.
optimal_max_bins integer Especifica um limite superior para evitar a
criao de um grande nmero de categorias
excessivamente.
optimal_lower_end_point Inclusive
Exclusive
optimal_first_bin Unbounded
Bounded
optimal_last_bin Unbounded
Bounded

Captulo 11. Propriedades do N de Operaes de Campo 121


Propriedades de derivenode
O n Derivar modifica valores de dados ou cria novos campos a partir de um ou mais
campos existentes. Ele cria campos do tipo frmula, sinalizador, nominal, estado, contagem e
condicional.

Exemplo 1
# Create and configure a Flag Derive field node
node = stream.create("derive", "My node")
node.setPropertyValue("new_name", "DrugX_Flag")
node.setPropertyValue("result_type", "Flag")
node.setPropertyValue("flag_true", "1")
node.setPropertyValue("flag_false", "0")
node.setPropertyValue("flag_expr", "Drug == \"drugX\"")

# Create and configure a Conditional Derive field node


node = stream.create("derive", "My node")
node.setPropertyValue("result_type", "Conditional")
node.setPropertyValue("cond_if_cond", "@OFFSET(\"Age\", 1) = \"Age\"")
node.setPropertyValue("cond_then_expr", "(@OFFSET(\"Age\", 1) = \"Age\" >< @INDEX")
node.setPropertyValue("cond_else_expr", "\"Age\"")

Exemplo 2

Este script supe que h duas colunas numricas chamadas XPos e YPos que representam as coordenadas
X e Y de um ponto (por exemplo, onde um evento ocorreu). O script cria um n Derivar que calcula uma
coluna geoespacial das coordenadas X e Y que representam esse ponto em um sistema de coordenadas
especficas:
stream = modeler.script.stream()
# Other stream configuration code
node = stream.createAt("derive", "Location", 192, 96)
node.setPropertyValue("new_name", "Location")
node.setPropertyValue("formula_expr", "[XPos, YPos]")
node.setPropertyValue("formula_type", "Geospatial")
# Now we have set the general measurement type, define the
# specifics of the geospatial object
node.setPropertyValue("geo_type", "Point")
node.setPropertyValue("has_coordinate_system", True)
node.setPropertyValue("coordinate_system", "ETRS_1989_EPSG_Arctic_zone_5-47")

Tabela 73. Propriedades de derivenode


Propriedades de derivenode Tipo de dados Descrio da propriedade
new_name string Nome do novo campo.
mode Single Especifica campos nicos ou mltiplos.
Multiple
campos list Usado no modo Multiple apenas para
selecionar diversos campos.
name_extension string Especifica a extenso para um ou mais
novos nomes do campo.
add_as Suffix Inclui a extenso como um prefixo (no
Prefix incio) ou como um sufixo (no trmino)
do nome do campo.
result_type Formula Os seis tipos de novos campos que
Flag podem ser criados.
Set
State
Count
Conditional
formula_expr string A expresso para calcular um novo valor
de campo em um n Derivar.

122 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 73. Propriedades de derivenode (continuao)
Propriedades de derivenode Tipo de dados Descrio da propriedade
flag_expr string
flag_true string
flag_false string
set_default string
set_value_cond string Estruturada para fornecer a condio
associada a um determinado valor.
state_on_val string Especifica o valor para o novo campo
quando a condio On for atendida.
state_off_val string Especifica o valor para o novo campo
quando a condio Off for atendida.
state_on_expression string
state_off_expression string
state_initial On Designa a cada registro do novo campo
Desligado um valor inicial de On ou Off. Este valor
pode alterar conforme cada condio for
atendida.
count_initial_val string
count_inc_condition string
count_inc_expression string
count_reset_condition string
cond_if_cond string
cond_then_expr string
cond_else_expr string
formula_measure_type Range / MeasureType.RANGE Essa propriedade pode ser utilizada para
Discrete / MeasureType.DISCRETE definir a medida associada ao campo
Flag / MeasureType.FLAG derivado. A funo setter pode ser
Set / MeasureType.SET transmitida para uma sequncia ou para
OrderedSet / MeasureType.ORDERED_SET um dos valores MeasureType. A funo
Typeless / MeasureType.TYPELESS getter sempre retornar nos valores
Collection / MeasureType.COLLECTION MeasureType.
Geospatial / MeasureType.GEOSPATIAL
collection_measure Range / MeasureType.RANGE Para campos de coleta (listas com uma
Flag / MeasureType.FLAG profundidade 0), essa propriedade
Set / MeasureType.SET define o tipo de medio associado aos
OrderedSet / MeasureType.ORDERED_SET valores subjacentes.
Typeless / MeasureType.TYPELESS
geo_type Point Para campos geoespaciais, essa
MultiPoint propriedade define o tipo de objeto
LineString geoespacial representado por este
MultiLineString campo. Isso deve ser consistente com a
Polgono profundidade da lista dos valores
MultiPolygon
has_coordinate_system boolean Para campos geoespaciais, essa
propriedade define se esse campo tem
um sistema de coordenadas
coordinate_system string Para campos geoespaciais, essa
propriedade define o sistema de
coordenadas para este campo

Captulo 11. Propriedades do N de Operaes de Campo 123


Propriedades de ensemblenode
O n Combinao combina dois ou mais nuggets do modelo para obter predies mais
precisas do que pode ser obtido a partir de qualquer modelo individual.

Exemplo
# Create and configure an Ensemble node
# Use this node with the models in demos\streams\pm_binaryclassifier.str
node = stream.create("ensemble", "My node")
node.setPropertyValue("ensemble_target_field", "response")
node.setPropertyValue("filter_individual_model_output", False)
node.setPropertyValue("flag_ensemble_method", "ConfidenceWeightedVoting")
node.setPropertyValue("flag_voting_tie_selection", "HighestConfidence")

Tabela 74. Propriedades de ensemblenode.


Propriedades de ensemblenode Tipo de dados Descrio da propriedade
ensemble_target_field campo Especifica o campo de destino para
todos os modelos usados na
combinao.
filter_individual_model_output sinalizador Especifica se os resultados da
escoragem de modelos individuais
devem ser suprimidos.
flag_ensemble_method Voting Especifica o mtodo utilizado para
ConfidenceWeightedVoting determinar o escore de combinao.
RawPropensityWeightedVoting Essa configurao se aplicar apenas
AdjustedPropensityWeightedVoting se o destino selecionado for um
HighestConfidence campo de sinalizao.
AverageRawPropensity
AverageAdjustedPropensity
set_ensemble_method Voting Especifica o mtodo utilizado para
ConfidenceWeightedVoting determinar o escore de combinao.
HighestConfidence Essa configurao se aplicar apenas
se o destino selecionado for um
campo nominal.
flag_voting_tie_selection Random Se um mtodo de votao for
HighestConfidence selecionado, especifica como os
RawPropensity empates sero resolvidos. Essa
AdjustedPropensity configurao se aplicar apenas se o
destino selecionado for um campo de
sinalizao.
set_voting_tie_selection Random Se um mtodo de votao for
HighestConfidence selecionado, especifica como os
empates sero resolvidos. Essa
configurao se aplicar apenas se o
destino selecionado for um campo
nominal.
calculate_standard_error sinalizador Se o campo de destino for contnuo,
um clculo de erro padro
executado por padro para calcular a
diferena entre os valores medidos ou
estimados e os valores reais e para
mostrar a proximidade com que essas
estimativas corresponderam.

124 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedadades de fillernode
O n de Preenchimento substitui valores do campo altera o armazenamento. possvel optar
por substituir valores baseados em uma condio de CLEM, como @BLANK(@FIELD). Como
alternativa, possvel optar por substituir todos os espaos em branco ou valores nulos por
um valor especfico. Um n de Preenchimento geralmente utilizado em conjunto com um n
Tipo para substituir valores omissos.

Exemplo
node = stream.create("filler", "My node")
node.setPropertyValue("fields", ["Age"])
node.setPropertyValue("replace_mode", "Always")
node.setPropertyValue("condition", "(\"Age\" > 60) and (\"Sex\" = \"M\"")
node.setPropertyValue("replace_with", "\"old man\"")

Tabela 75. Propriedadades de fillernode


Propriedades de fillernode Tipo de dados Descrio da propriedade
campos list Campos do conjunto de dados cujos valores
sero examinados e substitudos.
replace_mode Always possvel substituir todos os valores, valores
Conditional em branco ou valores nulos ou substituir com
Blank base em uma condio especificada.
Null
BlankAndNull
condition string
replace_with string

Propriedades de filternode
O n Filtro filtra (descarta) os campos, renomeia-os e mapeia-os de um n de origem para
outro.

Exemplo
node = stream.create("filter", "My node")
node.setPropertyValue("default_include", True)
node.setKeyedPropertyValue("new_name", "Drug", "Chemical")
node.setKeyedPropertyValue("include", "Drug", False)

Utilizando a propriedade default_include. Observe que configurar o valor da propriedade


default_include no inclui ou exclui automaticamente todos os campos, apenas determina o padro para
a seleo atual. Isso funcionalmente equivalente a clicar no boto Incluir campos por padro na caixa
de dilogo do n Filtro. Por exemplo, suponha que voc execute o script a seguir:
node = modeler.script.stream().create("filter", "Filter")
node.setPropertyValue("default_include", False)
# Include these two fields in the list
for f in ["Age", "Sex"]:
node.setKeyedPropertyValue("include", f, True)

Isso far com que o n transmita os campos Age e Sex e descarte todos os outros. Agora suponha que
voc execute o mesmo script novamente, mas nomeando dois campos diferentes:

Captulo 11. Propriedades do N de Operaes de Campo 125


node = modeler.script.stream().create("filter", "Filter")
node.setPropertyValue("default_include", False)
# Include these two fields in the list
for f in ["BP", "Na"]:
node.setKeyedPropertyValue("include", f, True)

Isso incluir mais dois campos no filtro, transmitindo um total de quatro campos (Age, Sex, BP e Na). Em
outras palavras, reconfigurar o valor de default_include para False no reconfigura automaticamente
todos os campos.

Como alternativa, se agora voc alterar default_include para True, seja utilizando um script ou na caixa
de dilogo do n Filtro, isso inverter o comportamento fazendo que os quatro campos listados acima
sejam descartados ao invs de includos. Quando estiver em dvida, experimentar os controles na caixa
de dilogo do n Filtro poder ser til para entender essa interao.
Tabela 76. Propriedades de filternode
Propriedades de filternode Tipo de dados Descrio da propriedade
default_include sinalizador Propriedade definida como chave para
especificar se o comportamento padro
transmitir ou filtrar os campos:

Observe que configurar essa propriedade no


inclui ou exclui automaticamente todos os
campos, apenas determina se os campos
selecionados so includos ou excludos por
padro. Consulte o exemplo abaixo para obter
comentrios adicionais.
include sinalizador Propriedade definida como chave para
incluso e remoo de campo.
new_name string

Propriedades de historynode
O n Histrico cria novos campos contendo dados de campos em registros anteriores. Os ns
Histricos so mais frequentemente utilizados para dados sequenciais, como dados de sries
temporais. Antes de utilizar um n Histrico, voc pode querer classificar os dados utilizando
um n Classificar.

Exemplo
node = stream.create("history", "My node")
node.setPropertyValue("fields", ["Drug"])
node.setPropertyValue("offset", 1)
node.setPropertyValue("span", 3)
node.setPropertyValue("unavailable", "Discard")
node.setPropertyValue("fill_with", "undef")

Tabela 77. Propriedades de historynode


Propriedades de historynode Tipo de dados Descrio da propriedade
campos list Campos para os quais voc deseja um
histrico.
offset nmero Especifica o registro mais recente (anterior ao
registro atual) a partir do qual voc deseja
extrair os valores de campo de histrico.
span nmero Especifica o nmero de registros anteriores a
partir do qual voc deseja extrair os valores.

126 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 77. Propriedades de historynode (continuao)
Propriedades de historynode Tipo de dados Descrio da propriedade
unavailable Discard Para manipular registros que no possuem
Leave valores histricos, geralmente referenciando
Fill os vrios primeiros registros (na parte
superior do conjunto de dados) para os quais
no h registros anteriores para uso como um
histrico.
fill_with Sequncia de Especifica um valor ou uma sequncia a ser
caracteres utilizada para registros nos quais nenhum
Processo Processo valor histrico est disponvel.

Propriedades de partitionnode
O n Partio gera um campo de partio que divide os dados em subconjuntos separados
para o treinamento, teste e estgios de validao de construo de modelo.

Exemplo
node = stream.create("partition", "My node")
node.setPropertyValue("create_validation", True)
node.setPropertyValue("training_size", 33)
node.setPropertyValue("testing_size", 33)
node.setPropertyValue("validation_size", 33)
node.setPropertyValue("set_random_seed", True)
node.setPropertyValue("random_seed", 123)
node.setPropertyValue("value_mode", "System")

Tabela 78. Propriedades de partitionnode


Propriedades de partitionnode Tipo de dados Descrio da propriedade
new_name string Nome do campo de partio gerado pelo n.
create_validation sinalizador Especifica se uma partio de validao deve ser
criada.
training_size integer Porcentagem de registros (0 a 100) a ser alocada
para a partio de treinamento.
testing_size integer Porcentagem de registros (0 a 100) a ser alocada
para a partio de teste.
validation_size integer Porcentagem de registros (0 a 100) a ser alocada
para a partio de validao. Ignorado se uma
partio de validao no for criada.
training_label string Rtulo para a partio de treinamento.
testing_label string Rtulo para a partio de teste.
validation_label string Rtulo para a partio de validao. Ignorado se
uma partio de validao no for criada.
value_mode System Especifica os valores utilizados para representar
SystemAndLabel cada partio nos dados. Por exemplo, a amostra
Rtulo de treinamento pode ser representada pelo
nmero inteiro do sistema 1, pelo rtulo
Training ou por uma combinao dos dois,
1_Training.
set_random_seed Boolean Especifica se um valor inicial aleatrio
especificado pelo usurio deve ser utilizado.

Captulo 11. Propriedades do N de Operaes de Campo 127


Tabela 78. Propriedades de partitionnode (continuao)
Propriedades de partitionnode Tipo de dados Descrio da propriedade
random_seed integer Um valor inicial aleatrio especificados pelo
usurio. Para este valor a ser utilizado,
set_random_seed deve ser configurado para True.
enable_sql_generation Boolean Especifica se o SQL pushback deve ser usado
para designar registros para parties.
unique_field Especifica o campo de entrada utilizado para
assegurar que os registros sejam designados a
parties em um modo aleatrio, porm
repetitivo. Para que este valor seja utilizado,
enable_sql_generation dever ser configurado
como True.

Propriedades de reclassifynode
O n Reclassificar transforma um conjunto de valores categricos em outro. A reclassificao
til para reduzir as categorias ou para reagrupar dados para anlise.

Exemplo
node = stream.create("reclassify", "My node")
node.setPropertyValue("mode", "Multiple")
node.setPropertyValue("replace_field", True)
node.setPropertyValue("field", "Drug")
node.setPropertyValue("new_name", "Chemical")
node.setPropertyValue("fields", ["Drug", "BP"])
node.setPropertyValue("name_extension", "reclassified")
node.setPropertyValue("add_as", "Prefix")
node.setKeyedPropertyValue("reclassify", "drugA", True)
node.setPropertyValue("use_default", True)
node.setPropertyValue("default", "BrandX")
node.setPropertyValue("pick_list", ["BrandX", "Placebo", "Generic"])

Tabela 79. Propriedades de reclassifynode


Propriedades de reclassifynode Tipo de dados Descrio da propriedade
mode Single Simple reclassifica as categorias para um
Multiple campo. Multiple ativa opes permitindo
transformao de mais de um campo por vez.
replace_field sinalizador
campo string Usado apenas no modo Single.
new_name string Usado apenas no modo Single.
campos [field1 field2 ... fieldn] Usado apenas no modo Multiple.
name_extension string Usado apenas no modo Multiple.
add_as Suffix Usado apenas no modo Multiple.
Prefix
reclassify string Propriedade estruturada para valores de
campo.
use_default sinalizador Utiliza o valor padro.
default string Especifica um valor padro.

128 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 79. Propriedades de reclassifynode (continuao)
Propriedades de reclassifynode Tipo de dados Descrio da propriedade
pick_list [string string ... string] Permite que um usurio importe uma lista de
novos valores conhecidos para preencher a
lista suspensa na tabela.

Propriedades de reordernode
O n Reordenar Campo define a ordem natural utilizada para exibir campos de recebimento
de dados. Esta ordem afeta a exibio de campos em uma variedade de locais, como tabelas,
listas e o Seletor de Campo. Esta operao til ao trabalhar com conjuntos de dados grandes
para tornar os campos de interesse mais visveis.

Exemplo
node = stream.create("reorder", "My node")
node.setPropertyValue("mode", "Custom")
node.setPropertyValue("sort_by", "Storage")
node.setPropertyValue("ascending", False)
node.setPropertyValue("start_fields", ["Age", "Cholesterol"])
node.setPropertyValue("end_fields", ["Drug"])

Tabela 80. Propriedades de reordernode


Propriedades de reordernode Tipo de dados Descrio da propriedade
mode Custom possvel classificar valores automaticamente
Automtico ou especificar uma ordem customizada.
sort_by Nome
Tipo
Armazenamento
ascending sinalizador
start_fields [field1 field2 ... fieldn] Novos campos so inseridos aps esses
campos.
end_fields [field1 field2 ... fieldn] Novos campos so inseridos antes desses
campos.

Propriedades de reprojectnode
No SPSS Modeler, itens como as funes espaciais do Construtor de Expresses, o n
Spatio-Temporal Prediction (STP), e o n Visualizao de Mapa usam o sistema de
coordenadas projetado. Utilize o n Reprojetar para alterar o sistema de coordenadas de
quaisquer dados que importar que utilizam um sistema de coordenadas geogrficas.

Tabela 81. Propriedades de reprojectnode


Propriedades de reprojectnode Tipo de dados Descrio da propriedade
reproject_fields [field1 field2 ... fieldn] Lista todos os campos que devem ser
reprojetados.
reproject_type Streamdefault Escolha como deseja reprojetar os campos.
Especificar
coordinate_system string O nome do sistema de coordenadas a ser
aplicado aos campos. Exemplo:
set reprojectnode.coordinate_system =
WGS_1984_World_Mercator

Captulo 11. Propriedades do N de Operaes de Campo 129


Propriedades de restructurenode
O n Reestruturar converte um campo nominal ou sinalizador em um grupo de campos que
podem ser preenchidos com os valores do outro campo. Por exemplo, dado um campo
chamado tipo de pagamento com valores de crdito, dinheiro e dbito, trs novos campos seriam
criados (crdito, dinheiro e dbito), cada um dos quais podendo conter o valor do pagamento
real feito.

Exemplo
node = stream.create("restructure", "My node")
node.setKeyedPropertyValue("fields_from", "Drug", ["drugA", "drugX"])
node.setPropertyValue("include_field_name", True)
node.setPropertyValue("value_mode", "OtherFields")
node.setPropertyValue("value_fields", ["Age", "BP"])

Tabela 82. Propriedades de restructurenode


Propriedades de restructurenode Tipo de dados Descrio da propriedade
fields_from [category category
category]
all
include_field_name sinalizador Indica se o nome do campo deve ser usado no
nome do campo reestruturado.
value_mode OtherFields Indica o modo para especificar os valores para
Flags os campos reestruturados. Com OtherFields,
deve-se especificar quais campos deseja
utilizar (veja abaixo). Com Flags, os valores
so sinalizadores numricos.
value_fields list Necessrio se value_mode for OtherFields.
Especifica quais campos deseja utilizar como
campos de valor.

Propriedades de rfmanalysisnode
O n Recency, Frequency, Monetary (RFM) Analysis permite determinar de modo quantitativo
quais podem ser seus melhores clientes ao examinar quando foi a ltima vez que eles
compraram de voc (recncia), com que frequncia eles compraram (frequncia) e quanto eles
gastaram em todas as transaes (monetrio).

Exemplo
node = stream.create("rfmanalysis", "My node")
node.setPropertyValue("recency", "Recency")
node.setPropertyValue("frequency", "Frequency")
node.setPropertyValue("monetary", "Monetary")
node.setPropertyValue("tied_values_method", "Next")
node.setPropertyValue("recalculate_bins", "IfNecessary")
node.setPropertyValue("recency_thresholds", [1, 500, 800, 1500, 2000, 2500])

Tabela 83. Propriedades de rfmanalysisnode


Propriedades de rfmanalysisnode Tipo de dados Descrio da propriedade
recency campo Especifica o campo de recncia. Isso pode ser
uma data, um registro de data e hora ou
nmero simples.
frequency campo Especifica o campo de frequncia.
monetary campo Especifica o campo monetrio.

130 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 83. Propriedades de rfmanalysisnode (continuao)
Propriedades de rfmanalysisnode Tipo de dados Descrio da propriedade
recency_bins integer Especifica o nmero de categorias de recncia a
serem geradas.
recency_weight nmero Especifica o peso a ser aplicado aos dados de
recncia. O padro 100.
frequency_bins integer Especifica o nmero de categorias de frequncia
a serem geradas.
frequency_weight nmero Especifica o peso a ser aplicado aos dados de
frequncia. O padro 10.
monetary_bins integer Especifica o nmero de categorias monetrias a
serem geradas.
monetary_weight nmero Especifica o peso a ser aplicado aos dados
monetrios. O padro 1.
tied_values_method Next Especifica em qual categoria os dados de valor
Current vinculados devem ser colocados.

recalculate_bins Always
IfNecessary
add_outliers sinalizador Disponvel apenas se recalculate_bins for
configurado para IfNecessary. Se configurado,
os registros que estiverem em uma categoria
inferior sero includos na categoria inferior e os
registros acima da categoria mais alta sero
includos na categoria mais alta.
binned_field Recency
Frequency
Monetrio
recency_thresholds valor valor Disponvel apenas se recalculate_bins for
configurado para Always. Especifique os limites
superior e inferior para as categorias de
recncia. O limite superior de uma categoria
utilizado como o limite inferior da prxima
categoria, por exemplo, [10 30 60] define duas
categorias, a primeira categoria com limites
superior e inferior de 10 e 30 e a segunda
categoria com limites de 30 e 60.
frequency_thresholds valor valor Disponvel apenas se recalculate_bins for
configurado para Always.
monetary_thresholds valor valor Disponvel apenas se recalculate_bins for
configurado para Always.

Propriedades de settoflagnode
O n Configurar para Sinalizador deriva diversos campos de sinalizao com base nos
valores categricos definidos para um ou mais campos nominais.

Exemplo

Captulo 11. Propriedades do N de Operaes de Campo 131


node = stream.create("settoflag", "My node")
node.setKeyedPropertyValue("fields_from", "Drug", ["drugA", "drugX"])
node.setPropertyValue("true_value", "1")
node.setPropertyValue("false_value", "0")
node.setPropertyValue("use_extension", True)
node.setPropertyValue("extension", "Drug_Flag")
node.setPropertyValue("add_as", "Suffix")
node.setPropertyValue("aggregate", True)
node.setPropertyValue("keys", ["Cholesterol"])

Tabela 84. Propriedades de settoflagnode


Propriedades de settoflagnode Tipo de dados Descrio da propriedade
fields_from [category category
category]
all
true_value string Especifica o valor true utilizado pelo n ao
configurar um sinalizador. O padro T.
false_value string Especifica o valor false utilizado pelo n ao
configurar um sinalizador. O padro F.
use_extension sinalizador Utiliza uma extenso como um sufixo ou
prefixo para o novo campo de sinalizao.
extension string
add_as Sufixo Especifica se a extenso includa como um
Prefix prefixo ou sufixo.
aggregate sinalizador Agrupa registros com base em campos-chave.
Todos os campos de sinalizao em um grupo
sero ativados se algum registro for
configurado como true.
keys list Campos-chave.

Propriedades de statisticstransformnode
O n Transformao de Estatsticas executa uma seleo de comandos de sintaxe do IBM
SPSS Statistics com relao s origens de dados no IBM SPSS Modeler. Esse n requer uma
cpia licenciada do IBM SPSS Statistics.

As propriedades desse n so descritas em Propriedades de statisticstransformnode na pgina 301.

Propriedades de timeintervalsnode
O n Intervalos de Tempo especifica os intervalos e cria rtulos (se necessrio) para modelar
dados de sries temporais. Se os valores no forem uniformemente espaados, o n poder
preencher ou agregar valores conforme necessrio para gerar um intervalo uniforme entre os
registros.

Exemplo
node = stream.create("timeintervals", "My node")
node.setPropertyValue("interval_type", "SecondsPerDay")
node.setPropertyValue("days_per_week", 4)
node.setPropertyValue("week_begins_on", "Tuesday")
node.setPropertyValue("hours_per_day", 10)
node.setPropertyValue("day_begins_hour", 7)
node.setPropertyValue("day_begins_minute", 5)
node.setPropertyValue("day_begins_second", 17)
node.setPropertyValue("mode", "Label")
node.setPropertyValue("year_start", 2005)

132 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


node.setPropertyValue("month_start", "January")
node.setPropertyValue("day_start", 4)
node.setKeyedPropertyValue("pad", "AGE", "MeanOfRecentPoints")
node.setPropertyValue("agg_mode", "Specify")
node.setPropertyValue("agg_set_default", "Last")

Tabela 85. Propriedades de timeintervalsnode.


Propriedades de timeintervalsnode Tipo de dados Descrio da propriedade
interval_type None
Periods
CyclicPeriods
Years
Quarters
Months
DaysPerWeek
DaysNonPeriodic
HoursPerDay
HoursNonPeriodic
MinutesPerDay
MinutesNonPeriodic
SecondsPerDay
SecondsNonPeriodic
mode Label Especifica se voc deseja rotular os registros
Create de modo consecutivo ou construir a srie
com base em um campo de data, de registro
de data e hora ou de tempo especificado.
field campo Ao construir a srie a partir dos dados,
especifica o campo que indica a data e hora
de cada registro.
period_start integer Especifica o intervalo inicial para perodos
ou perodos cclicos
cycle_start integer Ciclo inicial para perodos cclicos.
year_start integer Para tipos de intervalo onde aplicvel, o ano
em que cai o primeiro intervalo.
quarter_start integer Para tipos de intervalo onde aplicvel, o
trimestre em que cai o primeiro intervalo.
month_start Janeiro
Fevereiro
Maro
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
day_start integer
hour_start integer
minute_start integer
second_start integer
periods_per_cycle integer Para perodos cclicos, nmero dentro de
cada ciclo.

Captulo 11. Propriedades do N de Operaes de Campo 133


Tabela 85. Propriedades de timeintervalsnode (continuao).
Propriedades de timeintervalsnode Tipo de dados Descrio da propriedade
fiscal_year_begins Janeiro Para intervalos trimestrais, especifica o ms
Fevereiro em que o ano fiscal comea.
Maro
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
week_begins_on Sunday Para intervalos peridicos (dias por semana,
Monday horas por dia, minutos por dia e segundos
Tuesday por dia), especifica o dia em que a semana
Wednesday comea.
Thursday
Friday
Saturday
Sunday
day_begins_hour integer Para intervalos peridicos (horas por dia,
minutos por dia, segundos por dia),
especifica a hora em que o dia comea. Pode
ser utilizado em combinao com o
day_begins_minute e day_begins_second
para especificar um horrio exato, como
8:05:01. Consulte o exemplo de uso abaixo.
day_begins_minute integer Para intervalos peridicos (horas por dia,
minutos por dia e segundos por dia),
especifica o minuto em que o dia comea
(por exemplo, o 5 em 8:05).
day_begins_second integer Para intervalos peridicos (horas por dia,
minutos por dia e segundos por dia),
especifica o segundo em que o dia comea
(por exemplo, o 17 em 8:05:17).
days_per_week integer Para intervalos peridicos (dias por semana,
horas por dia, minutos por dia e segundos
por dia), especifica o nmero de dias por
semana.
hours_per_day integer Para intervalos peridicos (horas por dia,
minutos por dia e segundos por dia),
especifica o nmero de horas no dia.
interval_increment 1 Para minutos por dia e segundos por dia,
2 especifica o nmero de minutos ou de
3 segundos para incrementar para cada
4 registro.
5
6
10
15
20
30
field_name_extension string
field_name_extension_as_prefix sinalizador

134 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 85. Propriedades de timeintervalsnode (continuao).
Propriedades de timeintervalsnode Tipo de dados Descrio da propriedade
date_format "DDMMYY"
"MMDDYY"
"YYMMDD"
"YYYYMMDD"
"YYYYDDD"
DAY
MONTH
"DD-MM-YY"
"DD-MM-YYYY"
"MM-DD-YY"
"MM-DD-YYYY"
"DD-MON-YY"
"DD-MON-YYYY"
"YYYY-MM-DD"
"DD.MM.YY"
"DD.MM.YYYY"
"MM.DD.YYYY"
"DD.MON.YY"
"DD.MON.YYYY"
"DD/MM/YY"
"DD/MM/YYYY"
"MM/DD/YY"
"MM/DD/YYYY"
"DD/MON/YY"
"DD/MON/YYYY"
MES AAAA
t T AAAA
ss SM AAAA
time_format "HHMMSS"
"HHMM"
"MMSS"
"HH:MM:SS"
"HH:MM"
"MM:SS"
"(H)H:(M)M:(S)S"
"(H)H:(M)M"
"(M)M:(S)S"
"HH.MM.SS"
"HH.MM"
"MM.SS"
"(H)H.(M)M.(S)S"
"(H)H.(M)M"
"(M)M.(S)S"
aggregate Mdia Especifica o mtodo de agregao para um
Sum campo.
Modo
Min
Max
First
Last
TrueIfAnyTrue
pad Blank Especifica o mtodo de preenchimento para
MeanOfRecentPoints um campo.
True
False
agg_mode All Especifica se deseja agregar ou preencher
Specify todos os campos com funes padro
conforme necessrio ou especificar os
campos e funes a serem utilizados.

Captulo 11. Propriedades do N de Operaes de Campo 135


Tabela 85. Propriedades de timeintervalsnode (continuao).
Propriedades de timeintervalsnode Tipo de dados Descrio da propriedade
agg_range_default Mdia Especifica a funo padro a ser utilizada ao
Sum agregar os campos contnuos.
Modo
Min
Max
agg_set_default Modo Especifica a funo padro a ser utilizada ao
First agregar os campos nominais.
Last
agg_flag_default TrueIfAnyTrue
Modo
First
Last
pad_range_default Blank Especifica a funo padro a ser utilizada ao
MeanOfRecentPoints preencher campos contnuos.
pad_set_default Blank
MostRecentValue
pad_flag_default Blank
True
False
max_records_to_create integer Especifica o nmero mximo de registros a
serem criados ao preencher a srie.
estimation_from_beginning sinalizador
estimation_to_end sinalizador
estimation_start_offset integer
estimation_num_holdouts integer
create_future_records sinalizador
num_future_records integer
create_future_field sinalizador
future_field_name string

Propriedades de transposenode
O n Transpor troca os dados em linhas e colunas para que os registros se tornem campos e
os campos se tornem registros.

Exemplo
node = stream.create("transpose", "My node")
node.setPropertyValue("transposed_names", "Read")
node.setPropertyValue("read_from_field", "TimeLabel")
node.setPropertyValue("max_num_fields", "1000")
node.setPropertyValue("id_field_name", "ID")

136 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 86. Propriedades de transposenode
Propriedades de transposenode Tipo de dados Descrio da propriedade
transposed_names Prefix Novos nomes de campos podem ser gerados
Leitura automaticamente com base em um prefixo
especificado ou podem ser lidos a partir de um
campo existente nos dados.
prefix string
num_new_fields integer Ao utilizar um prefixo, especifica o nmero
mximo de novos campos a serem criados.
read_from_field campo Campo a partir do qual os nomes so lidos. Este
deve ser um campo instanciado ou ocorrer um
erro quando o n for executado.
max_num_fields integer Ao ler nomes de um campo, especifica um
limite superior para evitar a criao de um
grande de campos excessivamente.
transpose_type Numeric Por padro, apenas os campos contnuos
Sequncia de caracteres (intervalo numrico) so transpostos, no entanto,
Custom possvel escolher um subconjunto customizado
de campos numricos ou transpor todos os
campos de sequncia.
transpose_fields list Especifica os campos a serem transpostos
quando a opo Custom for utilizada.
id_field_name campo

Propriedades de typenode
O n Tipo especifica metadados e propriedades de campo. Por exemplo, possvel especificar
um nvel de medio (contnua, nominal, ordinal ou sinalizador) para cada campo, configurar
opes para manipular valores omissos e nulos do sistema, configurar a funo de um campo
para fins de modelagem, especificar rtulos de campo e de valor e especificar valores para
um campo.

Exemplo
node = stream.createAt("type", "My node", 50, 50)
node.setKeyedPropertyValue("check", "Cholesterol", "Coerce")
node.setKeyedPropertyValue("direction", "Drug", "Input")
node.setKeyedPropertyValue("type", "K", "Range")
node.setKeyedPropertyValue("values", "Drug", ["drugA", "drugB", "drugC", "drugD", "drugX",
"drugY", "drugZ"])
node.setKeyedPropertyValue("null_missing", "BP", False)
node.setKeyedPropertyValue("whitespace_missing", "BP", False)
node.setKeyedPropertyValue("description", "BP", "Blood Pressure")
node.setKeyedPropertyValue("value_labels", "BP", [["HIGH", "High Blood Pressure"],
["NORMAL", "normal blood pressure"]])

Observe que, em alguns casos, poder ser necessrio instanciar totalmente o n Tipo para outros ns para
funcionar corretamente, como a propriedade fields from do n Configurar para Sinalizador. possvel
simplesmente conectar um n Tabela e execut-lo para instanciar os campos:
tablenode = stream.createAt("table", "Table node", 150, 50)
stream.link(node, tablenode)
tablenode.run(None)
stream.delete(tablenode)

Captulo 11. Propriedades do N de Operaes de Campo 137


Tabela 87. Propriedades de typenode.
Propriedades de
typenode Tipo de dados Descrio da propriedade
direction Input Propriedade definida como chave para
Target funes de campo.
Both Nota: Os valores de In e Out esto agora
None descontinuados. O suporte para eles poder
Partition ser retirado em uma liberao futura.
Split
Frequency
RecordID
type Range Nvel de medio do campo (anteriormente
Flag chamado de "tipo" de campo). Configurar o Type para
Set Default limpar qualquer configurao do parmetro values
Sem tipo e, se value_mode possuir o valor
Discreto Specify, ele ser reconfigurado para Read.
OrderedSet Se value_mode for configurado para Pass ou Read,
Default configurar o type no afetar value_mode.
Nota: Os tipos de dados utilizados
internamente diferem dos tipos visveis no n
de tipo. A correspondncia a seguinte:
Intervalo -> Conjunto Contnuo - >
OrderedSet Nominal-> Discreto Ordinal- >
Categrico
storage Unknown Propriedade definida como chave somente
Sequncia de caracteres leitura para tipo de armazenamento de campo.
Nmero inteiro
Real
Time
Date
Registro de data e hora
check None Propriedade definida como chave para
Nullify verificao de tipo e de intervalo de campo
Coerce
Discard
Warn
Abort
values [value value] Para campos contnuos, o primeiro valor o
mnimo e o ltimo valor o mximo. Para os
campos nominais, especifique todos os
valores. Para campos de sinalizao, o
primeiro valor representa false e o ltimo valor
representa true. Configurar esta propriedade
configura automaticamente a propriedade
value_mode para Specify.
value_mode Leitura Determina como os valores so configurados.
Pass Observe que no possvel configurar essa
Read+ propriedade para Specify diretamente; para
Current utilizar valores especficos, configure a
Specify propriedade values.
extend_values sinalizador Aplica-se quando value_mode for configurado
para Read. Configure para T para incluir
valores recm-lidos em quaisquer valores
existentes para o campo. Configure para F
para descartar valores existentes a favor dos
valores recm-lidos.

138 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 87. Propriedades de typenode (continuao).
Propriedades de
typenode Tipo de dados Descrio da propriedade
enable_missing sinalizador Quando configurado para T, ativa o
rastreamento de valores omissos para o
campo.
missing_values [value value ...] Especifica valores de dados que denotam
dados ausentes.
range_missing sinalizador Especifica se um intervalo de valores omissos
(em branco) definido para um campo.
missing_lower string Quando range_missing for true, especifica o
limite inferior do intervalo de valores omissos.
missing_upper string Quando range_missing for true, especifica o
limite superior do intervalo de valores
omissos.
null_missing sinalizador Quando configurado para T, nulos (valores
indefinidos que so exibidos como $null$ no
software) so considerados valores omissos.
whitespace_ sinalizador Quando configurado para T, os valores
missing contendo apenas espaos em branco (espaos,
tabulaes e novas linhas) so considerados
valores omissos.
description string Especifica a descrio de um campo.
value_labels [[Value LabelString] [ Value LabelString] ...] Utilizado para especificar rtulos para pares
de valores.
display_places integer Configura o nmero de casas decimais para o
campo quando exibido (aplica-se apenas aos
campos com armazenamento REAL). Um valor
de -1 utilizar o padro de fluxo.
export_places integer Configura o nmero de casas decimais para o
campo quando exportado (aplica-se apenas
aos campos com armazenamento REAL). Um
valor de -1 utilizar o padro de fluxo.
decimal_separator DEFAULT Configura o separador decimal para o campo
PERIOD (aplica-se apenas aos campos com
COMMA armazenamento REAL).

Captulo 11. Propriedades do N de Operaes de Campo 139


Tabela 87. Propriedades de typenode (continuao).
Propriedades de
typenode Tipo de dados Descrio da propriedade
date_format "DDMMYY" Configura o formato de data para o campo
"MMDDYY" (aplica-se apenas aos campos com
"YYMMDD" armazenamento DATE ou TIMESTAMP).
"YYYYMMDD"
"YYYYDDD"
DAY
MONTH
"DD-MM-YY"
"DD-MM-YYYY"
"MM-DD-YY"
"MM-DD-YYYY"
"DD-MON-YY"
"DD-MON-YYYY"
"YYYY-MM-DD"
"DD.MM.YY"
"DD.MM.YYYY"
"MM.DD.YYYY"
"DD.MON.YY"
"DD.MON.YYYY"
"DD/MM/YY"
"DD/MM/YYYY"
"MM/DD/YY"
"MM/DD/YYYY"
"DD/MON/YY"
"DD/MON/YYYY"
MES AAAA
t T AAAA
ss SM AAAA
time_format "HHMMSS" Configura o formato de hora para o campo
"HHMM" (aplica-se apenas aos campos com
"MMSS" armazenamento TIME ou TIMESTAMP).
"HH:MM:SS"
"HH:MM"
"MM:SS"
"(H)H:(M)M:(S)S"
"(H)H:(M)M"
"(M)M:(S)S"
"HH.MM.SS"
"HH.MM"
"MM.SS"
"(H)H.(M)M.(S)S"
"(H)H.(M)M"
"(M)M.(S)S"
number_format DEFAULT Configura o formato de exibio de nmero
STANDARD para o campo.
SCIENTIFIC
CURRENCY
standard_places integer Configura o nmero de casas decimais para o
campo quando exibido em formato padro.
Um valor de -1 utilizar o padro de fluxo.
Observe que o slot display_places existente
tambm altera isso, mas agora foi
descontinuado.
scientific_places integer Configura o nmero de casas decimais para o
campo quando exibido no formato cientfico.
Um valor de -1 utilizar o padro de fluxo.

140 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 87. Propriedades de typenode (continuao).
Propriedades de
typenode Tipo de dados Descrio da propriedade
currency_places integer Configura o nmero de casas decimais para o
campo quando exibido no formato de moeda.
Um valor de -1 utilizar o padro de fluxo.
grouping_symbol DEFAULT Configura o smbolo de agrupamento para o
NONE campo.
LOCALE
PERIOD
COMMA
SPACE
column_width integer Configura a largura da coluna para o campo.
Um valor de -1 configurar a largura da
coluna para Auto.
justify AUTO Configura a justificao da coluna para o
CENTER campo.
LEFT
RIGHT
measure_type Range / MeasureType.RANGE Essa propriedade definida como chave
Discrete / MeasureType.DISCRETE semelhante a type por ela poder ser utilizada
Flag / MeasureType.FLAG para definir a medida associada ao campo. A
Set / MeasureType.SET diferena que, no script Python, a funo
OrderedSet / MeasureType.ORDERED_SET setter tambm pode transmitir um dos valores
Typeless / MeasureType.TYPELESS de MeasureType, ao passo que a funo getter
Collection / MeasureType.COLLECTION sempre retornar nos valores MeasureType.
Geospatial / MeasureType.GEOSPATIAL
collection_ Range / MeasureType.RANGE Para campos de coleo (listas com uma
measure Flag / MeasureType.FLAG profundidade 0), essa propriedade definida
Set / MeasureType.SET como chave define o tipo de medio
OrderedSet / MeasureType.ORDERED_SET associado aos valores subjacentes.
Typeless / MeasureType.TYPELESS
geo_type Point Para campos geoespaciais, esta propriedade
MultiPoint definida como chave define o tipo de objeto
LineString geoespacial representado por este campo. Isso
MultiLineString dever estar consistente com a profundidade
Polgono da lista dos valores.
MultiPolygon
has_coordinate_ boolean Para campos geoespaciais, essa propriedade
system define se esse campo tem um sistema de
coordenadas
coordinate_system string Para campos geoespaciais, esta propriedade
definida como chave define o sistema de
coordenadas para este campo.
custom_storage_ Unknown / MeasureType.UNKNOWN Essa propriedade definida como chave
type String / MeasureType.STRING semelhante a custom_storage por ela poder
Integer / MeasureType.INTEGER ser utilizada para definir o armazenamento de
Real / MeasureType.REAL substituio para o campo. A diferena que,
Time / MeasureType.TIME no script Python, a funo setter tambm pode
Date / MeasureType.DATE transmitir um dos valores de StorageType, ao
Timestamp / MeasureType.TIMESTAMP passo que a funo getter sempre retornar
List / MeasureType.LIST nos valores StorageType.

Captulo 11. Propriedades do N de Operaes de Campo 141


Tabela 87. Propriedades de typenode (continuao).
Propriedades de
typenode Tipo de dados Descrio da propriedade
custom_list_ String / MeasureType.STRING Para campos de lista, esta propriedade
storage_type Integer / MeasureType.INTEGER definida como chave especifica o tipo de
Real / MeasureType.REAL armazenamento dos valores subjacentes.
Time / MeasureType.TIME
Date / MeasureType.DATE
Timestamp / MeasureType.TIMESTAMP
custom_list_depth integer Para campos de lista, esta propriedade
definida como chave especifica a
profundidade do campo

142 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Captulo 12. Propriedades do N de Grfico
Propriedades Comuns do N Grfico
Esta seo descreve as propriedades disponveis para os ns de grfico, incluindo propriedades comuns e
as propriedades que so especficas para cada tipo de n.
Tabela 88. Propriedades comuns do n de grfico
Propriedades comuns do n de
grfico Tipo de dados Descrio da propriedade
title string Especifica o ttulo. Exemplo: "Este um ttulo".
caption string Especifica a legenda. Exemplo: "Esta uma legenda".
output_mode Screen Especifica se a sada do n de grfico exibida ou
File gravada em um arquivo.
output_format BMP Especifica o tipo de sada. O tipo exato de sada
JPEG permitido para cada n varia.
PNG
HTML
output (.cou)
full_filename string Especifica o caminho de destino e o nome de arquivo
para a sada gerada a partir do n de grfico.
use_graph_size sinalizador Controla se o grfico ser dimensionado
explicitamente, utilizando as propriedades de largura
e altura abaixo. Isso afeta apenas os grficos que
forem gerados para a tela. No disponvel para o n
Distribuio.
graph_width nmero Quando use_graph_size for True, configura a largura
do grfico em pixels.
graph_height nmero Quando use_graph_size for True, configura a altura
do grfico em pixels.

Desativando campos opcionais


Campos opcionais, como um campo de sobreposio para grficos, podem ser desativados ao configurar
o valor da propriedade para " " (sequncia vazia), conforme mostrado no exemplo a seguir:
plotnode.setPropertyValue("color_field", "")

Especificando cores
As cores de ttulos, legendas, planos de fundo e rtulos podem ser especificadas utilizando as sequncias
hexadecimais comeando com o smbolo hash (#). Por exemplo, para configurar o plano de fundo do
grfico para azul-celeste, a seguinte instruo utilizada:
mygraphnode.setPropertyValue("graph_background", "#87CEEB")

Aqui, os dois primeiros dgitos, 87, especificam o contedo em vermelho; os dois dgitos do meio, CE,
especificam o contedo em verde e os dois ltimos dgitos, EB, especificam o contedo em azul. Cada
dgito pode ter um valor no intervalo de 0 a 9 ou A a F. Juntos, esses valores podem especificar uma cor
vermelho-verde-azul, ou RGB.

143
Nota: Ao especificar cores em RGB, possvel usar o Seletor de Campo na interface com o usurio para
determinar o cdigo de cor correto. Basta passar o mouse sobre a cor para ativar uma ToolTip com as
informaes desejadas.

Propriedades de collectionnode
O n de Coleo mostra a distribuio de valores para um campo numrico com relao aos
valores de outro campo. (Ele cria grficos semelhantes a histogramas). Ele til para ilustrar
uma varivel ou campo cujos valores se alteram ao longo do tempo. Usando um grfico 3D,
tambm possvel incluir um eixo simblico exibindo distribuies por categoria.

Exemplo
node = stream.create("collection", "My node")
# "Plot" tab
node.setPropertyValue("three_D", True)
node.setPropertyValue("collect_field", "Drug")
node.setPropertyValue("over_field", "Age")
node.setPropertyValue("by_field", "BP")
node.setPropertyValue("operation", "Sum")
# "Overlay" section
node.setPropertyValue("color_field", "Drug")
node.setPropertyValue("panel_field", "Sex")
node.setPropertyValue("animation_field", "")
# "Options" tab
node.setPropertyValue("range_mode", "Automatic")
node.setPropertyValue("range_min", 1)
node.setPropertyValue("range_max", 100)
node.setPropertyValue("bins", "ByNumber")
node.setPropertyValue("num_bins", 10)
node.setPropertyValue("bin_width", 5)

Tabela 89. Propriedades de collectionnode


Propriedades de collectionnode Tipo de dados Descrio da propriedade
over_field campo
over_label_auto sinalizador
over_label string
collect_field campo
collect_label_auto sinalizador
collect_label string
three_D sinalizador
by_field campo
by_label_auto sinalizador
by_label string
operation Sum
Mdia
Min
Max
SDev
color_field string
panel_field string
animation_field string
range_mode Automtico
UserDefined
range_min nmero
range_max nmero

144 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 89. Propriedades de collectionnode (continuao)
Propriedades de collectionnode Tipo de dados Descrio da propriedade
bins ByNumber
ByWidth
num_bins nmero
bin_width nmero
use_grid sinalizador
graph_background cor As cores do grfico padro so descritas no incio
desta seo.
page_background cor As cores do grfico padro so descritas no incio
desta seo.

Propriedades de distributionnode
O n Distribuio mostra a ocorrncia de valores simblicos (categricos), como tipo ou
gnero da hipoteca. O n Distribuio pode ser usado geralmente para mostrar
desbalanceamentos nos dados, que podero ento ser corrigidos utilizando um n
Balanceamento antes de criar um modelo.

Exemplo
node = stream.create("distribution", "My node")
# "Plot" tab
node.setPropertyValue("plot", "Flags")
node.setPropertyValue("x_field", "Age")
node.setPropertyValue("color_field", "Drug")
node.setPropertyValue("normalize", True)
node.setPropertyValue("sort_mode", "ByOccurence")
node.setPropertyValue("use_proportional_scale", True)

Tabela 90. Propriedades de distributionnode


Propriedades de distributionnode Tipo de dados Descrio da propriedade
plotar SelectedFields
Flags
x_field campo
color_field campo Campo de sobreposio.
normalize sinalizador
sort_mode ByOccurence
Alfabtico
use_proportional_scale sinalizador

Propriedades de evaluationnode
O n Avaliao ajuda a avaliar e comparar modelos preditivos. O grfico de avaliao mostra
quo bem os modelos preveem resultados especficos. Ele classifica os registros com base no
valor previsto e na confiana da predio. Ele divide os registros em grupos de tamanhos
iguais (quantis) e, em seguida, representa o valor do critrio de negcios para cada quantil
do mais alto para o mais baixo. Diversos modelos so mostrados como linhas separadas na
representao.

Exemplo

Captulo 12. Propriedades do N de Grfico 145


node = stream.create("evaluation", "My node")
# "Plot" tab
node.setPropertyValue("chart_type", "Gains")
node.setPropertyValue("cumulative", False)
node.setPropertyValue("field_detection_method", "Name")
node.setPropertyValue("inc_baseline", True)
node.setPropertyValue("n_tile", "Deciles")
node.setPropertyValue("style", "Point")
node.setPropertyValue("point_type", "Dot")
node.setPropertyValue("use_fixed_cost", True)
node.setPropertyValue("cost_value", 5.0)
node.setPropertyValue("cost_field", "Na")
node.setPropertyValue("use_fixed_revenue", True)
node.setPropertyValue("revenue_value", 30.0)
node.setPropertyValue("revenue_field", "Age")
node.setPropertyValue("use_fixed_weight", True)
node.setPropertyValue("weight_value", 2.0)
node.setPropertyValue("weight_field", "K")

Tabela 91. Propriedades de evaluationnode.


Propriedades de evaluationnode Tipo de dados Descrio da propriedade
chart_type Gains
Response
Lift
Profit
ROI
ROC
inc_baseline sinalizador
field_detection_method Metadata
Nome
use_fixed_cost sinalizador
cost_value number
cost_field string
use_fixed_revenue sinalizador
revenue_value number
revenue_field string
use_fixed_weight sinalizador
weight_value number
weight_field campo
n_tile Quartis
Quintles
Decis
Vintis
Percentis
1000-tiles
cumulative sinalizador
style Line
Point

146 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 91. Propriedades de evaluationnode (continuao).
Propriedades de evaluationnode Tipo de dados Descrio da propriedade
point_type Retngulo
Ponto
Tringulo
Hexgono
Mais
Pentgono
Estrela
BowTie
HorizontalDash
VerticalDash
IronCross
Factory
Casa
Catedral
OnionDome
ConcaveTriangle
OblateGlobe
CatEye
FourSidedPillow
RoundRectangle
Ventilador
export_data sinalizador
data_filename string
delimiter string
new_line sinalizador
inc_field_names sinalizador
inc_best_line sinalizador
inc_business_rule sinalizador
business_rule_condition string
plot_score_fields sinalizador
score_fields [field1 ... fieldN]
target_field campo
use_hit_condition sinalizador
hit_condition string
use_score_expression sinalizador
score_expression string
caption_auto sinalizador

Propriedades de graphboardnode
O n Elemento do Grfico oferece muitos tipos diferentes de grficos em um nico n.
Utilizando esse n, possvel escolher os campos de dados que desejar explorar e, em
seguida, selecionar um grfico a partir dos disponveis para os dados selecionados. O n filtra
automaticamente todos os tipos de grficos que no funcionariam com as opes de campo.

Nota: Se voc configurar uma propriedade que no for vlida para o tipo de grfico (por exemplo,
especificar y_field para um histograma), essa propriedade ser ignorada.

Captulo 12. Propriedades do N de Grfico 147


Nota: Na IU, na guia Detalhado de muitos tipos de grficos diferentes, h um campo Summary que no
atualmente suportado pelo script.

Exemplo
node = stream.create("graphboard", "My node")
node.setPropertyValue("graph_type", "Line")
node.setPropertyValue("x_field", "K")
node.setPropertyValue("y_field", "Na")

Tabela 92. Propriedades de graphboardnode


Propriedades de
graphboard Tipo de dados Descrio da propriedade
graph_type 2DDotplot Identifica o tipo de grfico.
3DArea
3DBar
3DDensity
3DHistogram
3DPie
3DScatterplot
Area
ArrowMap
Bar
BarCounts
BarCountsMap
BarMap
BinnedScatter
Boxplot
Bubble
ChoroplethMeans
ChoroplethMedians
ChoroplethSums
ChoroplethValues
ChoroplethCounts
CoordinateMap
CoordinateChoroplethMeans
CoordinateChoroplethMedians
CoordinateChoroplethSums
CoordinateChoroplethValues
CoordinateChoroplethCounts
Dotplot
Heatmap
HexBinScatter
Histogram
Line
LineChartMap
LineOverlayMap
Parallel
Path
Pie
PieCountMap
PieCounts
PieMap
PointOverlayMap
PolygonOverlayMap
Ribbon
Scatterplot
SPLOM
Surface
x_field campo Especifica um rtulo customizado para o
eixo x. Disponvel apenas para rtulos.

148 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 92. Propriedades de graphboardnode (continuao)
Propriedades de
graphboard Tipo de dados Descrio da propriedade
y_field campo Especifica um rtulo customizado para o
eixo y. Disponvel apenas para rtulos.
z_field campo Usado em alguns grficos 3D.
color_field campo Usado nos mapas de utilizao.
size_field campo Utilizado em grficos de bolha.
categories_field campo
values_field campo
rows_field campo
columns_field campo
campos campo
start_longitude_field campo Usado com setas em um mapa de
referncia
end_longitude_field campo
start_latitude_field campo
end_latitude_field campo
data_key_field campo Usado em vrios mapas.
panelrow_field string
panelcol_field string
animation_field string
longitude_field campo Usado com coordenadas em mapas.
latitude_field campo
map_color_field campo

Propriedades de histogramnode
O n Histograma mostra a ocorrncia de valores para campos numricos. Ele normalmente
utilizado para explorar os dados antes de manipulaes e construes de modelo. Semelhante
ao n Distribuio, o n Histograma revela frequentemente desequilbrios nos dados.

Exemplo
node = stream.create("histogram", "My node")
# "Plot" tab
node.setPropertyValue("field", "Drug")
node.setPropertyValue("color_field", "Drug")
node.setPropertyValue("panel_field", "Sex")
node.setPropertyValue("animation_field", "")
# "Options" tab
node.setPropertyValue("range_mode", "Automatic")
node.setPropertyValue("range_min", 1.0)
node.setPropertyValue("range_max", 100.0)
node.setPropertyValue("num_bins", 10)
node.setPropertyValue("bin_width", 10)
node.setPropertyValue("normalize", True)
node.setPropertyValue("separate_bands", False)

Tabela 93. Propriedades de histogramnode


Propriedades de histogramnode Tipo de dados Descrio da propriedade
campo campo

Captulo 12. Propriedades do N de Grfico 149


Tabela 93. Propriedades de histogramnode (continuao)
Propriedades de histogramnode Tipo de dados Descrio da propriedade
color_field campo
panel_field campo
animation_field campo
range_mode Automtico
UserDefined
range_min nmero
range_max nmero
bins ByNumber
ByWidth
num_bins nmero
bin_width nmero
normalize sinalizador
separate_bands sinalizador
x_label_auto sinalizador
x_label string
y_label_auto sinalizador
y_label string
use_grid sinalizador
graph_background cor As cores do grfico padro so descritas no incio
desta seo.
page_background cor As cores do grfico padro so descritas no incio
desta seo.
normal_curve sinalizador Indica se a curva de distribuio normal deve ser
mostrada na sada.

Propriedades de multiplotnode
O n Multigrficos cria uma representao que exibe diversos campos Y em um nico campo
X. Os campos Y so representados como linhas coloridas, em que cada linha equivalente a
um n Grfico com Estilo configurado para Linha e o Modo X configurado para Classificar.
Os multigrficos so teis quando desejar explorar a flutuao de diversas variveis ao longo
do tempo.

Exemplo
node = stream.create("multiplot", "My node")
# "Plot" tab
node.setPropertyValue("x_field", "Age")
node.setPropertyValue("y_fields", ["Drug", "BP"])
node.setPropertyValue("panel_field", "Sex")
# "Overlay" section
node.setPropertyValue("animation_field", "")
node.setPropertyValue("tooltip", "test")
node.setPropertyValue("normalize", True)
node.setPropertyValue("use_overlay_expr", False)
node.setPropertyValue("overlay_expression", "test")
node.setPropertyValue("records_limit", 500)
node.setPropertyValue("if_over_limit", "PlotSample")

150 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 94. Propriedades de multiplotnode
Propriedades de multiplotnode Tipo de dados Descrio da propriedade
x_field campo
y_fields list
panel_field campo
animation_field campo
normalize sinalizador
use_overlay_expr sinalizador
overlay_expression string
records_limit nmero
if_over_limit PlotBins
PlotSample
PlotAll
x_label_auto sinalizador
x_label string
y_label_auto sinalizador
y_label string
use_grid sinalizador
graph_background cor As cores do grfico padro so descritas no incio
desta seo.
page_background cor As cores do grfico padro so descritas no incio
desta seo.

Propriedades de plotnode
O n Grfico mostra o relacionamento entre os campos numricos. possvel criar um grfico
utilizando pontos (grfico de disperso) ou linhas.

Exemplo
node = stream.create("plot", "My node")
# "Plot" tab
node.setPropertyValue("three_D", True)
node.setPropertyValue("x_field", "BP")
node.setPropertyValue("y_field", "Cholesterol")
node.setPropertyValue("z_field", "Drug")
# "Overlay" section
node.setPropertyValue("color_field", "Drug")
node.setPropertyValue("size_field", "Age")
node.setPropertyValue("shape_field", "")
node.setPropertyValue("panel_field", "Sex")
node.setPropertyValue("animation_field", "BP")
node.setPropertyValue("transp_field", "")
node.setPropertyValue("style", "Point")
# "Output" tab
node.setPropertyValue("output_mode", "File")
node.setPropertyValue("output_format", "JPEG")
node.setPropertyValue("full_filename", "C:/temp/graph_output/plot_output.jpeg")

Tabela 95. Propriedades de plotnode.


Propriedades de plotnode Tipo de dados Descrio da propriedade
x_field campo Especifica um rtulo customizado para o eixo x.
Disponvel apenas para rtulos.

Captulo 12. Propriedades do N de Grfico 151


Tabela 95. Propriedades de plotnode (continuao).
Propriedades de plotnode Tipo de dados Descrio da propriedade
y_field campo Especifica um rtulo customizado para o eixo y.
Disponvel apenas para rtulos.
three_D sinalizador Especifica um rtulo customizado para o eixo y.
Disponvel apenas para os rtulos nos grficos 3D.
z_field campo
color_field campo Campo de sobreposio.
size_field campo
shape_field campo
panel_field campo Especifica um campo nominal ou de sinalizao
para uso ao criar um grfico separado para cada
categoria. Os grficos so agrupados em painis em
uma janela de sada.
animation_field campo Especifica um campo nominal ou de sinalizao
para ilustrar categorias de valores de dados ao
criar uma srie de grficos exibidos em sequncia
utilizando animao.
transp_field campo Especifica um campo para ilustrar as categorias de
valores de dados usando um nvel diferente de
transparncia para cada categoria. No disponvel
para grficos de linha.
overlay_type None Especifica se uma funo de sobreposio ou um
Alisador suavizador LOESS exibido.
Function
overlay_expression string Especifica a expresso usada quando overlay_type
for configurado para Function.
style Point
Line
point_type Retngulo
Ponto
Tringulo
Hexgono
Mais
Pentgono
Estrela
BowTie
HorizontalDash
VerticalDash
IronCross
Factory
Casa
Catedral
OnionDome
ConcaveTriangle
OblateGlobe
CatEye
FourSidedPillow
RoundRectangle
Ventilador
x_mode Classificar
Overlay
AsRead
x_range_mode Automatic
UserDefined

152 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 95. Propriedades de plotnode (continuao).
Propriedades de plotnode Tipo de dados Descrio da propriedade
x_range_min number
x_range_max number
y_range_mode Automatic
UserDefined
y_range_min number
y_range_max number
z_range_mode Automatic
UserDefined
z_range_min number
z_range_max number
jitter sinalizador
records_limit number
if_over_limit PlotBins
PlotSample
PlotAll
x_label_auto sinalizador
x_label string
y_label_auto sinalizador
y_label string
z_label_auto sinalizador
z_label string
use_grid sinalizador
graph_background color As cores do grfico padro so descritas no incio
desta seo.
page_background color As cores do grfico padro so descritas no incio
desta seo.
use_overlay_expr sinalizador Descontinuado a favor de overlay_type.

Propriedades de timeplotnode
O n Grfico de Tempo exibe um ou mais conjuntos de dados de sries temporais.
Geralmente, um n Intervalos de Tempo dever ser usado primeiro para criar um campo
TimeLabel que ser utilizado para rotular o eixo x.

Exemplo
node = stream.create("timeplot", "My node")
node.setPropertyValue("y_fields", ["sales", "men", "women"])
node.setPropertyValue("panel", True)
node.setPropertyValue("normalize", True)
node.setPropertyValue("line", True)
node.setPropertyValue("smoother", True)
node.setPropertyValue("use_records_limit", True)
node.setPropertyValue("records_limit", 2000)
# Appearance settings
node.setPropertyValue("symbol_size", 2.0)

Captulo 12. Propriedades do N de Grfico 153


Tabela 96. Propriedades de timeplotnode.
Propriedades de timeplotnode Tipo de dados Descrio da propriedade
plot_series Series
Models
use_custom_x_field sinalizador
x_field campo
y_fields list
panel sinalizador
normalize sinalizador
line sinalizador
points sinalizador
point_type Retngulo
Ponto
Tringulo
Hexgono
Mais
Pentgono
Estrela
BowTie
HorizontalDash
VerticalDash
IronCross
Factory
Casa
Catedral
OnionDome
ConcaveTriangle
OblateGlobe
CatEye
FourSidedPillow
RoundRectangle
Ventilador
smoother sinalizador Ser possvel incluir suavizadores no grfico
somente se voc configurar panel para True.
use_records_limit sinalizador
records_limit integer
symbol_size number Especifica um tamanho do smbolo.
panel_layout Horizontal
Vertical

Propriedades de webnode
O n Web ilustra a intensidade do relacionamento entre os valores de dois ou mais campos
simblicos (categricos). O grfico utiliza linhas de vrias larguras para indicar a intensidade
da conexo. O n Web pode ser usado, por exemplo, para explorar o relacionamento entre a
compra de um conjunto de itens em um site de e-commerce.

Exemplo
node = stream.create("web", "My node")
# "Plot" tab
node.setPropertyValue("use_directed_web", True)
node.setPropertyValue("to_field", "Drug")
node.setPropertyValue("fields", ["BP", "Cholesterol", "Sex", "Drug"])
node.setPropertyValue("from_fields", ["BP", "Cholesterol", "Sex"])

154 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


node.setPropertyValue("true_flags_only", False)
node.setPropertyValue("line_values", "Absolute")
node.setPropertyValue("strong_links_heavier", True)
# "Options" tab
node.setPropertyValue("max_num_links", 300)
node.setPropertyValue("links_above", 10)
node.setPropertyValue("num_links", "ShowAll")
node.setPropertyValue("discard_links_min", True)
node.setPropertyValue("links_min_records", 5)
node.setPropertyValue("discard_links_max", True)
node.setPropertyValue("weak_below", 10)
node.setPropertyValue("strong_above", 19)
node.setPropertyValue("link_size_continuous", True)
node.setPropertyValue("web_display", "Circular")

Tabela 97. Propriedades de webnode


Propriedades de webnode Tipo de dados Descrio da propriedade
use_directed_web sinalizador
campos list
to_field campo
from_fields list
true_flags_only sinalizador
line_values Absolute
OverallPct
PctLarger
PctSmaller
strong_links_heavier sinalizador
num_links ShowMaximum
ShowLinksAbove
ShowAll
max_num_links nmero
links_above nmero
discard_links_min sinalizador
links_min_records nmero
discard_links_max sinalizador
links_max_records nmero
weak_below nmero
strong_above nmero
link_size_continuous sinalizador
web_display Circular
Rede
Directed
Grid
graph_background cor As cores do grfico padro so descritas no incio
desta seo.
symbol_size nmero Especifica um tamanho do smbolo.

Captulo 12. Propriedades do N de Grfico 155


156 Guia de Script e Automao Python do IBM SPSS Modeler 17.1
Captulo 13. Propriedades do N de Modelagem
Propriedades Comuns do N de Modelagem
As propriedades a seguir so comuns a alguns ou todos os ns de modelagem. Todas as excees sero
observadas na documentao de ns de modelagem individuais conforme apropriado.
Tabela 98. Propriedades comuns do n de modelagem
Propriedade Valores Descrio da propriedade
custom_fields sinalizador Se true, permite especificar campos de
destino, de entrada e outros campos para o
n atual. Se false, as configuraes atuais
de um n Tipo de envio de dados sero
utilizadas.
target field Especifica um nico campo de destino ou
ou em diversos campos de destino dependendo do
targets ou tipo de modelo.
[field1 ... fieldN]
inputs [field1 ... fieldN] Campos de entrada ou de preditores
usados pelo modelo.
partition campo
use_partitioned_data sinalizador Se um campo de partio for definido, essa
opo assegurar que apenas os dados da
partio de treinamento sejam utilizados
para construir o modelo.
use_split_data sinalizador
splits [field1 ... fieldN] Especifica o campo ou campos a serem
utilizados para modelagem de diviso.
Efetivo apenas se use_split_data estiver
configurado para True.
use_frequency sinalizador Os campos de peso e de frequncia so
usados por modelos especficos, conforme
observado para cada tipo de modelo.
frequency_field campo
use_weight sinalizador
weight_field campo
use_model_name sinalizador
model_name string Nome customizado para o novo modelo.
mode Simple
Expert

Propriedades de anomalydetectionnode
O n de Deteco de Anomalias identifica casos incomuns, ou valores discrepantes, que no
esto em conformidade com os padres de dados normais. Com esse n, possvel
identificar valores discrepantes, mesmo que eles no se ajustem a nenhum padro conhecido
anteriormente e mesmo que voc no esteja certo do que est procurando exatamente.

157
Example
node = stream.create("anomalydetection", "My node")
node.setPropertyValue("anomaly_method", "PerRecords")
node.setPropertyValue("percent_records", 95)
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("peer_group_num_auto", True)
node.setPropertyValue("min_num_peer_groups", 3)
node.setPropertyValue("max_num_peer_groups", 10)

Tabela 99. Propriedades de anomalydetectionnode


Propriedades de anomalydetectionnode Valores Descrio da propriedade
inputs [field1 ... fieldN] Os modelos de Deteco de Anomalias
selecionam registros com base nos
campos de entrada especificados. Eles
no usam um campo de destino. Os
campos de peso e de frequncia tambm
no so utilizados. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter
mais informaes.
mode Expert
Simple
anomaly_method IndexLevel Especifica o mtodo utilizado para
PerRecords determinar o valor de corte para
NumRecords sinalizar registros como anmalos.
index_level nmero Especifica o valor mnimo de corte para
sinalizar anomalias.
percent_records nmero Configura o limite para sinalizar
registros com base na porcentagem de
registros nos dados de treinamento.
num_records nmero Configura o limite para sinalizar
registros com base no nmero de
registros nos dados de treinamento.
num_fields integer O nmero de campos para relatar cada
registro anmalo.
impute_missing_values sinalizador
adjustment_coeff nmero Valor utilizado para balancear o peso
relativo fornecido para campos contnuos
e categricos no clculo da distncia.
peer_group_num_auto sinalizador Calcula automaticamente o nmero de
grupos de peers.
min_num_peer_groups integer Especifica o nmero mnimo de grupos
de peers utilizados quando
peer_group_num_auto for configurado
para True.
max_num_per_groups integer Especifica o nmero mximo de grupos
de peers.
num_peer_groups integer Especifica o nmero de grupos de peers
utilizados quando peer_group_num_auto
for configurado para False.
noise_level nmero Determina como os valores discrepantes
so tratados durante o armazenamento
em cluster. Especifique um valor entre 0
e 0,5.

158 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 99. Propriedades de anomalydetectionnode (continuao)
Propriedades de anomalydetectionnode Valores Descrio da propriedade
noise_ratio nmero Especifica a parte da memria alocada
para o componente que deve ser
utilizado para o armazenamento em
buffer de rudo. Especifique um valor
entre 0 e 0,5.

Propriedades de apriorinode
O n A Priori extrai um conjunto de regras dos dados, removendo as regras com o contedo
de informaes mais alto. A Priori oferece cinco mtodos diferentes de seleo de regras e usa
um esquema de indexao sofisticado para processar conjuntos de dados grandes com
eficincia. Para grandes problemas, o A Priori geralmente mais rpido para treinar; ele no
tem um limite arbitrrio no nmero de regras que podem ser retidas e pode manipular regras
com at 32 condies prvias. O A Priori requer que os campos de entrada e sada sejam
todos categricos, mas entrega melhor desempenho por ser otimizado para esse tipo de dado.

Example
node = stream.create("apriori", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("partition", "Test")
# For non-transactional
node.setPropertyValue("use_transactional_data", False)
node.setPropertyValue("consequents", ["Age"])
node.setPropertyValue("antecedents", ["BP", "Cholesterol", "Drug"])
# For transactional
node.setPropertyValue("use_transactional_data", True)
node.setPropertyValue("id_field", "Age")
node.setPropertyValue("contiguous", True)
node.setPropertyValue("content_field", "Drug")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Apriori_bp_choles_drug")
node.setPropertyValue("min_supp", 7.0)
node.setPropertyValue("min_conf", 30.0)
node.setPropertyValue("max_antecedents", 7)
node.setPropertyValue("true_flags", False)
node.setPropertyValue("optimize", "Memory")
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("evaluation", "ConfidenceRatio")
node.setPropertyValue("lower_bound", 7)

Tabela 100. Propriedades de apriorinode


Propriedades de apriorinode Valores Descrio da propriedade
consequents campo Os modelos a priori utilizam Subsequentes e
Antecedentes ao invs dos campos de destino e
de entrada padro. Os campos de peso e de
frequncia no so utilizados. Consulte o
tpico Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
antecedents [field1 ... fieldN]
min_supp nmero
min_conf nmero
max_antecedents nmero
true_flags sinalizador

Captulo 13. Propriedades do N de Modelagem 159


Tabela 100. Propriedades de apriorinode (continuao)
Propriedades de apriorinode Valores Descrio da propriedade
optimize Speed
Memory
use_transactional_data sinalizador
contiguous sinalizador
id_field string
content_field string
mode Simple
Expert
evaluation RuleConfidence
DifferenceToPrior
ConfidenceRatio
InformationDifference
NormalizedChiSquare
lower_bound nmero
optimize Velocidade Use para especificar se a construo de modelo
Memory deve ser otimizada para velocidade ou para
memria.

Propriedades de associationrulesnode
O n de Regras de Associao semelhante ao n A Priori; no entanto, ao contrrio do A
Priori, o n de Regras de Associao pode processar dados de lista. Alm disso, o n de
Regras de Associao pode ser usado com IBM SPSS Analytic Server para processar Big Data
e aproveitar a vantagem do processamento paralelo mais rpido.

Tabela 101. Propriedades de associationrulesnode


Propriedades de
associationrulesnode Tipo de dados Descrio da propriedade
predictions campo Os campos nessa lista podem aparecer apenas
como um preditor de uma regra
conditions [field1...fieldN] Os campos nesta lista podem aparecer apenas
como uma condio de uma regra
max_rule_conditions integer O nmero mximo de condies que podem ser
includas em uma nica regra. Mnimo 1,
mximo 9.
max_rule_predictions integer O nmero mximo de predies que podem ser
includas em uma nica regra. Mnimo 1,
mximo 5.
max_num_rules integer O nmero mximo de regras que podem ser
consideradas parte da construo de regra.
Mnimo 1, mximo 10.000.
rule_criterion_top_n Confidence O critrio de regra que determina o valor pelo
Rulesupport qual as "N" principais regras no modelo so
Lift escolhidas.
Conditionsupport
Implementabilidade

160 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 101. Propriedades de associationrulesnode (continuao)
Propriedades de
associationrulesnode Tipo de dados Descrio da propriedade
true_flags Boolean Configurar como Y determina que somente os
valores reais para os campos de sinalizao so
considerados durante a construo de regras.
rule_criterion Boolean Configurar como Y determina se os valores de
critrios de regra so utilizados para excluso de
regras durante a construo de modelo.
min_confidence nmero 0,1 a 100 - o valor de porcentagem para o nvel
de confiana mnimo necessrio para uma regra
produzida pelo modelo. Se o modelo produzir
uma regra com um nvel de confiana menor que
o valor especificado aqui, a regra ser descartada.
min_rule_support nmero 0,1 a 100 - o valor de porcentagem para o
suporte de regra mnimo necessrio para uma
regra produzida pelo modelo. Se o modelo
produzir uma regra com um nvel de suporte de
regra menor que o valor especificado, a regra
ser descartada.
min_condition_support nmero 0,1 a 100 o valor de porcentagem para o
suporte de condio mnimo necessrio para uma
regra produzida pelo modelo. Se o modelo
produzir uma regra com um nvel de suporte de
condio menor que o valor especificado, a regra
ser descartada.
min_lift integer 1 a 10 representa a elevao mnima necessria
para uma regra produzida pelo modelo. Se o
modelo produzir uma regra com um nvel de
elevao menor que o valor especificado, a regra
ser descartada.
exclude_rules Boolean Utilizado para selecionar uma lista de campos
relacionados a partir da qual voc no deseja que
o modelo crie regras.

Exemplo: set :gsarsnode.exclude_rules =


[[[field1,field2, field3]],[[field4, field5]]] - em que
cada lista de campos separados por [] uma
linha na tabela.
num_bins integer Configura o nmero de categorias automticas
para os quais os campos contnuos so
categorizados. Mnimo 2, mximo 10.
max_list_length integer Aplica-se a todos os campos da lista para os
quais o comprimento mximo no conhecido.
Os elementos na lista at o nmero especificado
aqui so includos na construo de modelo e
quaisquer elementos adicionais so descartados.
Mnimo 1, mximo 100.
output_confidence Boolean
output_rule_support Boolean
output_lift Boolean
output_condition_support Boolean
output_deployability Boolean

Captulo 13. Propriedades do N de Modelagem 161


Tabela 101. Propriedades de associationrulesnode (continuao)
Propriedades de
associationrulesnode Tipo de dados Descrio da propriedade
rules_to_display upto O nmero mximo de regras para exibir nas
all tabelas de sada.
display_upto integer Se upto for configurado em rules_to_display,
configure o nmero de regras para exibir nas
tabelas de sada. Mnimo 1.
field_transformations Boolean
records_summary Boolean
rule_statistics Boolean
most_frequent_values Boolean
most_frequent_fields Boolean
word_cloud Boolean
word_cloud_sort Confidence
Rulesupport
Lift
Conditionsupport
Implementabilidade
word_cloud_display integer Minimum 1, maximum 20
max_predictions integer O nmero mximo de regras que podem ser
aplicadas a cada entrada na escoragem.
criterion Confidence Seleciona a medida usada para determinar a
Rulesupport fora das regras.
Lift
Conditionsupport
Implementabilidade
allow_repeats Boolean Determina se regras com a mesma predio so
includas na escoragem.
check_input NoPredictions
Predictions
NoCheck

Propriedades de autoclassifiernode
O n Previsor Categrico Automtico cria e compara inmeros modelos diferentes para
resultados binrios (sim ou no, perda de clientes ou no, e assim por diante), permitindo
escolher a melhor abordagem para uma determinada anlise. Vrios algoritmos de
modelagem so suportados, possibilitando a seleo dos mtodos que voc deseja usar, as
opes especficas para cada e os critrios para comparar os resultados. O n gera um
conjunto de modelos com base nas opes especificadas e ranqueia os melhores candidatos de
acordo com os critrios especificados.

Example
node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)

162 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 102. Propriedades de autoclassifiernode.
Propriedades de autoclassifiernode Valores Descrio da propriedade
target field Para destinos de sinalizador, o n
Classificador Automtico requer um
nico campo de destino e um ou mais
campos de entrada. Os campos de
peso e de frequncia tambm podem
ser especificados. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter
mais informaes.
ranking_measure Accuracy
Area_under_curve
Lucro
Lift
Num_variables
ranking_dataset Training
Teste
number_of_models integer Nmero de modelos a serem includos
no nugget do modelo. Especifique um
nmero inteiro entre 1 e 100.
calculate_variable_importance sinalizador
enable_accuracy_limit sinalizador
accuracy_limit integer Nmero inteiro entre 0 e 100.
enable_ area_under_curve _limit sinalizador
area_under_curve_limit number Nmero real entre 0,0 e 1,0.
enable_profit_limit sinalizador
profit_limit number Nmero inteiro maior que 0.
enable_lift_limit sinalizador
lift_limit number Nmero real maior que 1,0.
enable_number_of_variables_limit sinalizador
number_of_variables_limit number Nmero inteiro maior que 0.
use_fixed_cost sinalizador
fixed_cost number Nmero real maior que 0,0.
variable_cost field
use_fixed_revenue sinalizador
fixed_revenue number Nmero real maior que 0,0.
variable_revenue field
use_fixed_weight sinalizador
fixed_weight number Nmero real maior que 0,0.
variable_weight field
lift_percentile number Nmero inteiro entre 0 e 100.
enable_model_build_time_limit sinalizador
model_build_time_limit number Nmero inteiro configurado para o
nmero de minutos para limitar o
tempo gasto para construir cada
modelo individual.

Captulo 13. Propriedades do N de Modelagem 163


Tabela 102. Propriedades de autoclassifiernode (continuao).
Propriedades de autoclassifiernode Valores Descrio da propriedade
enable_stop_after_time_limit sinalizador
stop_after_time_limit number Nmero real configurado para o
nmero de horas para limitar o tempo
decorrido geral para uma execuo de
classificador automtico.
enable_stop_after_valid_model_produced sinalizador
use_costs sinalizador
<algorithm> sinalizador Ativa ou desativa o uso de um
algoritmo especfico.
<algorithm>.<property> string Configura um valor da propriedade
para um algoritmo especfico.
Consulte o tpico Configurando
Propriedades de Algoritmo para
obter mais informaes.

Configurando Propriedades de Algoritmo


Para os ns Classificador Automtico, Numerao Automtica e Cluster Automtico, as propriedades
para algoritmos especficos utilizados pelo n podem ser configuradas utilizando o formato geral:
autonode.setKeyedPropertyValue(<algorithm>, <property>, <value>)

Por exemplo:
node.setKeyedPropertyValue("neuralnetwork", "method", "MultilayerPerceptron")

Os nomes de algoritmo para o n Classificador Automtico so cart, chaid, quest, c50, logreg,
decisionlist, bayesnet, discriminant, svm e knn.

Os nomes de algoritmo para o n Numerao Automtica so cart, chaid, neuralnetwork, genlin, svm,
regression, linear e knn.

Os nomes de algoritmo para o n Cluster Automtico so twostep, k-means e kohonen.

Os nomes da propriedade so padro, conforme documentado para cada n de algoritmo.

As propriedades de algoritmo que contiverem pontos ou outra escoragem devem ser agrupadas entre
aspas simples, por exemplo:
node.setKeyedPropertyValue("logreg", "tolerance", "1.0E-5")

Diversos valores tambm podem ser designados para a propriedade, por exemplo:
node.setKeyedPropertyValue("decisionlist", "search_direction", ["Up", "Down"])

Para ativar ou desativar o uso de um algoritmo especfico:


node.setPropertyValue("chaid", True)

Nota: Nos casos em que determinadas opes de algoritmo no estiverem disponveis no n


Classificador Automtico, ou quando apenas um nico valor puder ser especificado ao invs de um
intervalo de valores, os mesmos limites se aplicam ao script como quando acessar o n de maneira
padro.

164 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de autoclusternode
O n Cluster Automtico estima e compara modelos de armazenamento em cluster, que
identificam grupos de registros com caractersticas semelhantes. O n trabalha da mesma
maneira que outros ns de modelagem automatizados, permitindo experimentar vrias
combinaes de opes em uma nica passagem de modelagem. Modelos podem ser
comparados usando medidas bsicas com as quais voc tentar filtrar e ranquear a utilidade
dos modelos de cluster e fornecer uma medida baseada na importncia de determinados
campos.

Example
node = stream.create("autocluster", "My node")
node.setPropertyValue("ranking_measure", "Silhouette")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_silhouette_limit", True)
node.setPropertyValue("silhouette_limit", 5)

Tabela 103. Propriedades de autoclusternode


Propriedades de autoclusternode Valores Descrio da propriedade
evaluation campo Nota: Somente n Cluster Automtico
Identifica o campo para o qual um valor de
importncia ser calculado. Como
alternativa, pode ser utilizado para
identificar quo bem o cluster diferencia o
valor deste campo e, portanto, quo bem o
modelo ir prever este campo.
ranking_measure Silhueta
Num_clusters
Size_smallest_cluster
Size_largest_cluster
Smallest_to_largest
Importncia
ranking_dataset Training
Teste
summary_limit integer Nmero de modelos para lista no relatrio.
Especifique um nmero inteiro entre 1 e
100.
enable_silhouette_limit sinalizador
silhouette_limit integer Nmero inteiro entre 0 e 100.
enable_number_less_limit sinalizador
number_less_limit nmero Nmero real entre 0,0 e 1,0.
enable_number_greater_limit sinalizador
number_greater_limit nmero Nmero inteiro maior que 0.
enable_smallest_cluster_limit sinalizador
smallest_cluster_units Percentage
Counts
smallest_cluster_limit_percentage nmero
smallest_cluster_limit_count integer Nmero inteiro maior que 0.
enable_largest_cluster_limit sinalizador
largest_cluster_units Percentage
Contagens
largest_cluster_limit_percentage nmero

Captulo 13. Propriedades do N de Modelagem 165


Tabela 103. Propriedades de autoclusternode (continuao)
Propriedades de autoclusternode Valores Descrio da propriedade
largest_cluster_limit_count integer
enable_smallest_largest_limit sinalizador
smallest_largest_limit nmero
enable_importance_limit sinalizador
importance_limit_condition Greater_than
Less_than
importance_limit_greater_than nmero Nmero inteiro entre 0 e 100.
importance_limit_less_than nmero Nmero inteiro entre 0 e 100.
<algorithm> sinalizador Ativa ou desativa o uso de um algoritmo
especfico.
<algorithm>.<property> string Configura um valor da propriedade para
um algoritmo especfico. Consulte o tpico
Configurando Propriedades de Algoritmo
na pgina 164 para obter mais informaes.

Propriedades de autonumericnode
O n Previsor Contnuo Automtico estima e compara modelos para resultados de intervalos
numricos contnuos usando vrios mtodos diferentes. O n trabalha da mesma maneira que
o n Previsor Categrico Automtico, permitindo escolher os algoritmos para usar e
experimentar com vrias combinaes de opes em uma nica passagem de modelagem. Os
algoritmos suportados incluem redes neurais, rvore C e R, algoritmo Detector de Interao
Automtico Chi-quadrado, regresso linear, regresso linear generalizada e Support Vector
Machines (SVM). Os modelos podem ser comparados com base em correlao, erro relativo
ou nmero de variveis usadas.

Exemplo
node = stream.create("autonumeric", "My node")
node.setPropertyValue("ranking_measure", "Correlation")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_correlation_limit", True)
node.setPropertyValue("correlation_limit", 0.8)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("neuralnetwork", True)
node.setPropertyValue("chaid", False)

Tabela 104. Propriedades de autonumericnode


Propriedades de autonumericnode Valores Descrio da propriedade
custom_fields sinalizador Se True, as configuraes de campo
customizado sero usadas ao invs das
configuraes do n de tipo.
target campo O n Numerao Automtica requer um
nico campo de destino e um ou mais
campos de entrada. Os campos de peso e
de frequncia tambm podem ser
especificados. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter
mais informaes.
inputs [field1 ... field2]
partition campo

166 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 104. Propriedades de autonumericnode (continuao)
Propriedades de autonumericnode Valores Descrio da propriedade
use_frequency sinalizador
frequency_field campo
use_weight sinalizador
weight_field campo
use_partitioned_data sinalizador Se um campo de partio for definido,
somente os dados de treinamento so
utilizados para construo de modelo.
ranking_measure Correlao
NumberOfFields
ranking_dataset Test
Training
number_of_models integer Nmero de modelos a serem includos no
nugget do modelo. Especifique um nmero
inteiro entre 1 e 100.
calculate_variable_importance sinalizador
enable_correlation_limit sinalizador
correlation_limit integer
enable_number_of_fields_limit sinalizador
number_of_fields_limit integer
enable_relative_error_limit sinalizador
relative_error_limit integer
enable_model_build_time_limit sinalizador
model_build_time_limit integer
enable_stop_after_time_limit sinalizador
stop_after_time_limit integer
stop_if_valid_model sinalizador
<algorithm> sinalizador Ativa ou desativa o uso de um algoritmo
especfico.
<algorithm>.<property> string Configura um valor da propriedade para
um algoritmo especfico. Consulte o tpico
Configurando Propriedades de
Algoritmo na pgina 164 para obter mais
informaes.

Propriedades de bayesnetnode
O n de Rede Bayesiana permite construir um modelo de probabilidade combinando
evidncias observadas e registradas com conhecimento do mundo real para estabelecer a
probabilidade de ocorrncias. O n foca nas redes Tree Augmented Nave Bayes (TAN) e
Markov Blanket que so usadas principalmente para classificao.

Example
node = stream.create("bayesnet", "My node")
node.setPropertyValue("continue_training_existing_model", True)
node.setPropertyValue("structure_type", "MarkovBlanket")
node.setPropertyValue("use_feature_selection", True)

Captulo 13. Propriedades do N de Modelagem 167


# Expert tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("independence", "Pearson")

Tabela 105. Propriedades de bayesnetnode


Propriedades de bayesnetnode Valores Descrio da propriedade
inputs [field1 ... fieldN] Os modelos de rede bayesiana utilizam
um nico campo de destino e um ou
mais campos de entrada. Os campos
contnuos so automaticamente
categorizados. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter
mais informaes.
continue_training_existing_model sinalizador
structure_type TAN Selecione a estrutura a ser utilizada ao
MarkovBlanket construir a rede bayesiana.
use_feature_selection sinalizador
parameter_learning_method Likelihood Especifica o mtodo utilizado para
Bayes estimar as tabelas de probabilidade
condicional entre os ns nos quais os
valores dos pais so conhecidos.
mode Expert
Simple
missing_values sinalizador
all_probabilities sinalizador
independence Likelihood Especifica o mtodo usado para
Pearson determinar se as observaes
emparelhadas nas duas variveis so
independentes entre si.
significance_level nmero Especifica o valor de corte para
determinar a independncia.
maximal_conditioning_set nmero Configura o nmero mximo de
variveis de condicionamento a serem
utilizadas para teste de independncia.
inputs_always_selected [field1 ... fieldN] Especifica quais campos do conjunto de
dados devem sempre ser utilizados
durante a construo da rede bayesiana.
Nota: O campo de destino sempre
selecionado.
maximum_number_inputs nmero Especifica o nmero mximo de campos
de entrada a serem utilizados na
construo da rede bayesiana.
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Test
Validation

168 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de buildr
O n Construo R permite inserir script R customizado
para executar construo e escoragem de modelo
implementado no IBM SPSS Modeler.

Exemplo
node = stream.create("buildr", "My node")
node.setPropertyValue("score_syntax", """
result<-predict(modelerModel,newdata=modelerData)
modelerData<-cbind(modelerData,result)
var1<-c(fieldName="NaPrediction",fieldLabel="",fieldStorage="real",fieldMeasure="",
fieldFormat="",fieldRole="")
modelerDataModel<-data.frame(modelerDataModel,var1)""")

Tabela 106. Propriedades de buildr.


Propriedades de buildr Valores Descrio da propriedade
build_syntax string Sintaxe do script R para construo de
modelo.
score_syntax string Sintaxe do script R para escoragem de
modelo.
convert_flags StringsAndDoubles Opo para converter os campos de
LogicalValues sinalizao.
convert_datetime sinalizador Opo para converter variveis com os
formatos de data ou data/hora em
formatos de data/hora R.
convert_datetime_class POSIXct Opes para especificar em qual formato as
POSIXlt variveis com os formatos de data ou
data/hora sero convertidas.
convert_missing sinalizador Opo para converter valores omissos em
valor NA R.
output_html sinalizador Opo para exibir grficos em uma guia no
nugget do modelo R.
output_text sinalizador Opo para gravar a sada de texto do
console R em uma guia no nugget do
modelo R.

Propriedades de c50node
O n C5.0 constri uma rvore de deciso ou um conjunto de regras. O modelo trabalha
dividindo a amostra com base no campo que fornece o mximo de informaes obtidas em
cada nvel. O campo de resposta deve ser categrico. Divises mltiplas em mais de dois
subgrupos so permitidas.

Example
node = stream.create("c50", "My node")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "C5_Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("output_type", "DecisionTree")
node.setPropertyValue("use_xval", True)
node.setPropertyValue("xval_num_folds", 3)
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("favor", "Generality")

Captulo 13. Propriedades do N de Modelagem 169


node.setPropertyValue("min_child_records", 3)
# "Costs" tab
node.setPropertyValue("use_costs", True)
node.setPropertyValue("costs", [["drugA", "drugX", 2]])

Tabela 107. Propriedades de c50node


Propriedades de c50node Valores Descrio da propriedade
target campo Os modelos C50 utilizam um nico campo
de destino e um ou mais campos de
entrada. Um campo de ponderao tambm
pode ser especificado. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
output_type DecisionTree
RuleSet
group_symbolics sinalizador
use_boost sinalizador
boost_num_trials nmero
use_xval sinalizador
xval_num_folds nmero
mode Simples
Expert
favor Accuracy Favorece a preciso ou a generalidade.
Generality
expected_noise nmero
min_child_records nmero
pruning_severity nmero
use_costs sinalizador
costs estruturado Esta uma propriedade estruturada.
use_winnowing sinalizador
use_global_pruning sinalizador On (True), por padro
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Teste
Validao

Propriedades de carmanode
O modelo CARMA extrai um conjunto de regras dos dados sem requerer a especificao de
campos de entrada ou sada. Em contraste com o A Priori o n CARMA oferece configuraes
de construo para suporte de regra (suporte para antecedente e consequente) em vez de
apenas suporte antecedente. Isso significa que as regras geradas podem ser usadas para uma
variedade maior de aplicativospor exemplo, para localizar uma lista de produtos ou
servios (antecedentes) cujo consequente o item que voc deseja promover nesta temporada
de frias.

Example

170 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


node = stream.create("carma", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("use_transactional_data", True)
node.setPropertyValue("inputs", ["BP", "Cholesterol", "Drug"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "age_bp_drug")
node.setPropertyValue("use_partitioned_data", False)
node.setPropertyValue("min_supp", 10.0)
node.setPropertyValue("min_conf", 30.0)
node.setPropertyValue("max_size", 5)
# Expert Options
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("use_pruning", True)
node.setPropertyValue("pruning_value", 300)
node.setPropertyValue("vary_support", True)
node.setPropertyValue("estimated_transactions", 30)
node.setPropertyValue("rules_without_antecedents", True)

Tabela 108. Propriedades de carmanode


Propriedades de carmanode Valores Descrio da propriedade
inputs [field1 ... fieldn] Os modelos de CARMA utilizam uma lista
de campos de entrada, mas no de destino.
Os campos de peso e de frequncia no so
utilizados. Consulte o tpico Propriedades
Comuns do N de Modelagem na pgina
157 para obter mais informaes.
id_field campo Campo utilizado como o campo de ID para
construo de modelo.
contiguous sinalizador Utilizado para especificar se os IDs no
campo ID so contguos.
use_transactional_data sinalizador
content_field campo
min_supp number(percent) Relaciona ao suporte da regra ao invs de
ao suporte da antecedent. O padro 20%.
min_conf number(percent) O padro 20%.
max_size nmero O padro 10.
mode Simples O padro Simple.
Expert
exclude_multiple sinalizador Exclui regras com diversos subsequentes. O
padro False.
use_pruning sinalizador O padro False.
pruning_value nmero O padro 500.
vary_support sinalizador
estimated_transactions integer
rules_without_antecedents sinalizador

Captulo 13. Propriedades do N de Modelagem 171


Propriedades de cartnode
O n Classificao e Regresso (C e R) gera uma rvore de deciso que permite prever ou
classificar futuras observaes. O mtodo usa particionamento recursivo para dividir os
registros de treinamento em segmentos, minimizando as impurezas de cada passo, em que
um n na rvore considerado puro se 100% dos casos no n estiverem dentro de uma
categoria especfica do campo de resposta. Os campos de entrada e resposta podem ser
intervalos numricos ou categricos (nominal, ordinal ou flags); todas as divises so binrias
(somente dois subgrupos).

Example
node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")

Tabela 109. Propriedades de cartnode


Propriedades de cartnode Values Descrio da propriedade
target campo Os modelos de rvore C&R requerem um
nico campo de destino e um ou mais
campos de entrada. Um campo de
frequncia tambm pode ser especificado.
Consulte o tpico Propriedades Comuns
do N de Modelagem na pgina 157 para
obter mais informaes.
continue_training_existing_model sinalizador
objective Standard O psm utilizado para conjuntos de dados
Boosting muito grandes e requer uma conexo com
Bagging o Servidor.
psm
model_output_type Single
InteractiveBuilder
use_tree_directives sinalizador

172 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 109. Propriedades de cartnode (continuao)
Propriedades de cartnode Values Descrio da propriedade
tree_directives string Especificar diretivas para o crescimento da
rvore. As diretivas podem ser agrupadas
entre aspas triplas para evitar escape de
novas linhas ou de aspas. Observe que as
diretivas podem ser altamente sensveis a
pequenas mudanas nos dados ou nas
opes de modelagem e podem no
generalizar a outros conjuntos de dados.

use_max_depth Default
Custom
max_depth integer Profundidade mxima da rvore, de 0 a
1000. Usado apenas se use_max_depth =
Custom.
prune_tree sinalizador Poda a rvore para evitar super ajuste.
use_std_err sinalizador Utiliza a diferena mxima em risco (nos
Erros Padro).
std_err_multiplier nmero Diferena mxima.
max_surrogates nmero Mximo de substitutos.
use_percentage sinalizador
min_parent_records_pc nmero
min_child_records_pc nmero
min_parent_records_abs nmero
min_child_records_abs nmero
use_costs sinalizador
costs estruturado Propriedade estruturada.
priors Data
Equal
Custom
custom_priors estruturado Propriedade estruturada.
adjust_priors sinalizador
trails nmero Nmero de modelos de componente para
boosting ou bagging.
set_ensemble_method Voting Regra de combinao padro para variveis
HighestProbability resposta categrica.
HighestMeanProbability
range_ensemble_method Mdia Regra de combinao padro para variveis
Median resposta contnua.
large_boost sinalizador Aplica boosting em conjuntos de dados
muito grandes.
min_impurity nmero
impurity_measure Gini
Twoing
Ordered
train_pct nmero Conjunto de preveno ao super ajuste
set_random_seed sinalizador Replica a opo de resultados.

Captulo 13. Propriedades do N de Modelagem 173


Tabela 109. Propriedades de cartnode (continuao)
Propriedades de cartnode Values Descrio da propriedade
seed nmero
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Test
Validation

Propriedades de chaidnode
O n CHAID gera rvores de deciso usando estatsticas qui-quadrado para identificar as
divises ideais. Ao contrrio dos ns rvore C e R e QUEST, o CHAID pode gerar rvores
no binrias, o que significa que algumas divises tm mais de duas ramificaes. Os campos
de entrada e de resposta podem ser intervalos numricos (contnuos) ou categricos. CHAID
exaustivo uma modificao de CHAID que executa uma tarefa mais completa de exame de
todas as divises possveis, mas que leva mais tempo para ser calculada.

Example
filenode = stream.createAt("variablefile", "My node", 100, 100)
filenode.setPropertyValue("full_filename", "$CLEO_DEMOS/DRUG1n")
node = stream.createAt("chaid", "My node", 200, 100)
stream.link(filenode, node)

node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "Na", "K", "Cholesterol", "BP"])
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "CHAID")
node.setPropertyValue("method", "Chaid")
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", "Test")
node.setPropertyValue("split_alpha", 0.03)
node.setPropertyValue("merge_alpha", 0.04)
node.setPropertyValue("chi_square", "Pearson")
node.setPropertyValue("use_percentage", False)
node.setPropertyValue("min_parent_records_abs", 40)
node.setPropertyValue("min_child_records_abs", 30)
node.setPropertyValue("epsilon", 0.003)
node.setPropertyValue("max_iterations", 75)
node.setPropertyValue("split_merged_categories", True)
node.setPropertyValue("bonferroni_adjustment", True)

Tabela 110. Propriedades de chaidnode


Propriedades de chaidnode Values Descrio da propriedade
target campo Os modelos CHAID requerem um nico
campo de destino e um ou mais campos de
entrada. Um campo de frequncia tambm
pode ser especificado. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
continue_training_existing_model sinalizador
objective Standard O psm utilizado para conjuntos de dados
Boosting muito grandes e requer uma conexo com
Bagging o Servidor.
psm

174 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 110. Propriedades de chaidnode (continuao)
Propriedades de chaidnode Values Descrio da propriedade
model_output_type Single
InteractiveBuilder
use_tree_directives sinalizador
tree_directives string
method Chaid
ExhaustiveChaid
use_max_depth Default
Custom
max_depth integer Profundidade mxima da rvore, de 0 a
1000. Usado apenas se use_max_depth =
Custom.
use_percentage sinalizador
min_parent_records_pc nmero
min_child_records_pc nmero
min_parent_records_abs nmero
min_child_records_abs nmero
use_costs sinalizador
costs estruturado Propriedade estruturada.
trails nmero Nmero de modelos de componente para
boosting ou bagging.
set_ensemble_method Voting Regra de combinao padro para variveis
HighestProbability resposta categrica.
HighestMeanProbability
range_ensemble_method Mdia Regra de combinao padro para variveis
Mediana resposta contnua.
large_boost sinalizador Aplica boosting em conjuntos de dados
muito grandes.
split_alpha nmero Nvel de significncia para diviso.
merge_alpha nmero Nvel de significncia para mesclagem.
bonferroni_adjustment sinalizador Ajusta valores de significncia usando o
mtodo de Bonferroni.
split_merged_categories sinalizador Permite rediviso de categorias mescladas.
chi_square Pearson Mtodo utilizado para calcular a estatstica
LR chi-quadrada: Razo de Verossimilhana ou
Pearson
epsilon nmero Mudana mnima nas frequncias de clula
esperadas.
max_iterations nmero Iteraes mximas para convergncia.
set_random_seed integer
seed nmero
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador

Captulo 13. Propriedades do N de Modelagem 175


Tabela 110. Propriedades de chaidnode (continuao)
Propriedades de chaidnode Values Descrio da propriedade
adjusted_propensity_partition Test
Validation
maximum_number_of_models integer

Propriedades de coxregnode
O n de Regresso de Cox permite construir um modelo de sobrevivncia para dados de
sobrevivncia na presena de registros censurados. O modelo produz uma funo de
sobrevivncia que prev a probabilidade de o evento de interesse ter ocorrido em um
determinado momento (t) para determinados valores das variveis de entrada.

Exemplo
node = stream.create("coxreg", "My node")
node.setPropertyValue("survival_time", "tenure")
node.setPropertyValue("method", "BackwardsStepwise")
# Expert tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("removal_criterion", "Conditional")
node.setPropertyValue("survival", True)

Tabela 111. Propriedades de coxregnode


Propriedades de coxregnode Valores Descrio da propriedade
survival_time campo Os modelos de regresso de Cox
requerem um nico campo contendo os
tempos de sobrevivncia.
target campo Os modelos de regresso de Cox
requerem um nico campo de destino e
um ou mais campos de entrada.
Consulte o tpico Propriedades Comuns
do N de Modelagem na pgina 157
para obter mais informaes.
method Inserir
Stepwise
BackwardsStepwise
groups campo
model_type MainEffects
Custom
custom_terms ["BP*Sex" "BP*Age"]
mode Expert
Simple
max_iterations nmero
p_converge 1.0E-4
1.0E-5
1.0E-6
1.0E-7
1.0E-8
0

176 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 111. Propriedades de coxregnode (continuao)
Propriedades de coxregnode Valores Descrio da propriedade
p_converge 1.0E-4
1.0E-5
1.0E-6
1.0E-7
1.0E-8
0
l_converge 1.0E-1
1.0E-2
1.0E-3
1.0E-4
1.0E-5
0
removal_criterion LR
Wald
Condicional
probability_entry nmero
probability_removal nmero
output_display EachStep
LastStep
ci_enable sinalizador
ci_value 90
95
99
correlation sinalizador
display_baseline sinalizador
survival sinalizador
hazard sinalizador
log_minus_log sinalizador
one_minus_survival sinalizador
separate_line campo
value number ou string Se nenhum valor for especificado para
um campo, a opo padro "Mean" ser
utilizada para esse campo.

Propriedades de decisionlistnode
O n Lista de Deciso identifica subgrupos, ou segmentos, que mostram uma probabilidade
maior ou menor de um determinado resultado binrio relativo populao geral. Por
exemplo, voc pode examinar os clientes com menor probabilidade de migrarem para o
concorrente ou com maior probabilidade de responderem a uma campanha de forma
favorvel. possvel incorporar seu conhecimento de negcios no modelo incluindo seus
prprios segmentos customizados e visualizando modelos alternativos lado a lado para
comparar os resultados. Os modelos de Lista de Deciso consistem em uma lista de regras na
qual cada regra tem uma condio e um resultado. Regras so aplicadas em ordem, e a
primeira regra correspondente determina o resultado.

Exemplo

Captulo 13. Propriedades do N de Modelagem 177


node = stream.create("decisionlist", "My node")
node.setPropertyValue("search_direction", "Down")
node.setPropertyValue("target_value", 1)
node.setPropertyValue("max_rules", 4)
node.setPropertyValue("min_group_size_pct", 15)

Tabela 112. Propriedades de decisionlistnode


Propriedades de decisionlistnode Valores Descrio da propriedade
target campo Os modelos de Lista de Deciso utilizam
um nico campo de destino e um ou mais
campos de entrada. Um campo de
frequncia tambm pode ser especificado.
Consulte o tpico Propriedades Comuns
do N de Modelagem na pgina 157 para
obter mais informaes.
model_output_type Modelo
InteractiveBuilder
search_direction Up Relaciona para localizar segmentos, em que
Down UP o equivalente de Alta Probabilidade e
Down equivalente a Baixa Probabilidade.
target_value string Se no for especificado, ser assumido o
valor true para sinalizadores.
max_rules integer O nmero mximo de segmentos, exceto o
restante.
min_group_size integer Tamanho mnimo do segmento.
min_group_size_pct nmero Tamanho mnimo do segmento como uma
porcentagem.
confidence_level nmero O limite mnimo que um campo de entrada
deve melhorar a probabilidade de resposta
(fornecer a elevao), para que valha a
pena inclui-lo em uma definio do
segmento.
max_segments_per_rule integer
mode Simples
Expert
bin_method EqualWidth
EqualCount
bin_count nmero
max_models_per_cycle integer Procura largura para listas.
max_rules_per_cycle integer Procura largura para regras de segmento.
segment_growth nmero
include_missing sinalizador
final_results_only sinalizador
reuse_fields sinalizador Permite que atributos (campos de entrada
que aparecem nas regras) sejam
reutilizados.
max_alternatives integer
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Test
Validation

178 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de discriminantnode
A anlise discriminante faz suposies mais rigorosas que a regresso logstica, mas pode ser
uma alternativa de valor ou um suplemento para uma anlise de regresso logstica quando
essas suposies so atendidas.

Exemplo
node = stream.create("discriminant", "My node")
node.setPropertyValue("target", "custcat")
node.setPropertyValue("use_partitioned_data", False)
node.setPropertyValue("method", "Stepwise")

Tabela 113. Propriedades de discriminantnode


Propriedades de discriminantnode Valores Descrio da propriedade
target campo Os modelos discriminantes requerem um
nico campo de destino e um ou mais
campos de entrada. Os campos de peso e
de frequncia no so utilizados. Consulte
o tpico Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
method Inserir
Stepwise
mode Simples
Expert
prior_probabilities AllEqual
ComputeFromSizes
covariance_matrix WithinGroups
SeparateGroups
means sinalizador Opes de estatsticas na caixa de dilogo
Sada Avanada.
univariate_anovas sinalizador
box_m sinalizador
within_group_covariance sinalizador
within_groups_correlation sinalizador
separate_groups_covariance sinalizador
total_covariance sinalizador
fishers sinalizador
unstandardized sinalizador
casewise_results sinalizador Opes de classificao na caixa de dilogo
Sada Avanada.
limit_to_first nmero O valor padro 10.
summary_table sinalizador
leave_one_classification sinalizador
combined_groups sinalizador
separate_groups_covariance sinalizador Opo de matrizes de Covarincia de
grupos separados.
territorial_map sinalizador

Captulo 13. Propriedades do N de Modelagem 179


Tabela 113. Propriedades de discriminantnode (continuao)
Propriedades de discriminantnode Valores Descrio da propriedade
combined_groups sinalizador Opo de grfico Grupos combinados.
separate_groups sinalizador Opo de grfico Grupos separados.
summary_of_steps sinalizador
F_pairwise sinalizador
stepwise_method WilksLambda
UnexplainedVariance
MahalanobisDistance
SmallestF
RaosV
V_to_enter nmero
criteria UseValue
UseProbability
F_value_entry nmero O valor padro 3,84.
F_value_removal nmero O valor padro 2,71.
probability_entry nmero O valor padro 0,05.
probability_removal nmero O valor padro 0,10.
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Test
Validation

Propriedades de factornode
O n PCA/Factor fornece tcnicas poderosas de reduo de dados para reduzir a
complexidade de seus dados. A anlise de componentes principais (PCA) localiza
combinaes lineares dos campos de entrada que realizam as melhores tarefas de captura de
varincia no conjunto de campos inteiro, no qual os componentes so ortogonais
(perpendiculares) uns aos outros. A anlise fatorial tenta identificar os fatores subjacentes que
explicam o padro de correlaes dentro de um conjunto observado de campos. Para ambas
as abordagens, o objetivo localizar um pequeno nmero de campos derivados que
sumarizam efetivamente as informaes no conjunto de campos original.

Exemplo
node = stream.create("factor", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["BP", "Na", "K"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Factor_Age")
node.setPropertyValue("use_partitioned_data", False)
node.setPropertyValue("method", "GLS")
# Expert options
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("complete_records", True)
node.setPropertyValue("matrix", "Covariance")
node.setPropertyValue("max_iterations", 30)
node.setPropertyValue("extract_factors", "ByFactors")
node.setPropertyValue("min_eigenvalue", 3.0)
node.setPropertyValue("max_factor", 7)
node.setPropertyValue("sort_values", True)
node.setPropertyValue("hide_values", True)

180 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


node.setPropertyValue("hide_below", 0.7)
# "Rotation" section
node.setPropertyValue("rotation", "DirectOblimin")
node.setPropertyValue("delta", 0.3)
node.setPropertyValue("kappa", 7.0)

Tabela 114. Propriedades de factornode


Propriedades de factornode Valores Descrio da propriedade
inputs [field1 ... fieldN] Os modelos de PCA/Fator utilizam uma
lista de campos de entrada, mas no de
destino. Os campos de peso e de frequncia
no so utilizados. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
method PC
ULS
GLS
ML
PAF
Alfa
Imagem
mode Simple
Expert
max_iterations nmero
complete_records sinalizador
matrix Correlao
Covarincia
extract_factors ByEigenvalues
ByFactors
min_eigenvalue nmero
max_factor nmero
rotation None
Varimax
DirectOblimin
Equamax
Quartimax
Proporo mxima
delta nmero Se voc selecionar DirectOblimin como seu
tipo de dados de rotao, ser possvel
especificar um valor para delta.

Se voc no especificar um valor, o valor


padro para delta ser utilizado.
kappa nmero Se voc selecionar Promax como seu tipo de
dados de rotao, ser possvel especificar
um valor para kappa.

Se voc no especificar um valor, o valor


padro para kappa ser utilizado.
sort_values sinalizador
hide_values sinalizador
hide_below nmero

Captulo 13. Propriedades do N de Modelagem 181


Propriedades de featureselectionnode
O n de Seleo de Varivel exibe campos de entrada para remoo com base em um
conjunto de critrios (como porcentagem de valores omissos); depois ele ranqueia a
importncia das entradas restantes relativas a uma resposta especificada. Por exemplo, dado
um conjunto de dados com centenas de entradas potenciais, quais tm maior probabilidade
de serem teis na modelagem de resultados de pacientes?

Exemplo
node = stream.create("featureselection", "My node")
node.setPropertyValue("screen_single_category", True)
node.setPropertyValue("max_single_category", 95)
node.setPropertyValue("screen_missing_values", True)
node.setPropertyValue("max_missing_values", 80)
node.setPropertyValue("criteria", "Likelihood")
node.setPropertyValue("unimportant_below", 0.8)
node.setPropertyValue("important_above", 0.9)
node.setPropertyValue("important_label", "Check Me Out!")
node.setPropertyValue("selection_mode", "TopN")
node.setPropertyValue("top_n", 15)

Para obter um exemplo mais detalhado que cria e aplica um modelo de Seleo de Recursos, consulte
Exemplo de Script Independente: Gerando um Modelo de Seleo de Varivel na pgina 4.
Tabela 115. propriedades de featureselectionnode
Propriedades de featureselectionnode Valores Descrio da propriedade
target campo Os modelos de Seleo de Recurso
classificam preditores com relao ao
destino especificado. Os campos de peso
e de frequncia no so utilizados.
Consulte o tpico Propriedades Comuns
do N de Modelagem na pgina 157
para obter mais informaes.
screen_single_category sinalizador Se True, seleciona campos que tiverem
muitos registros que caem na mesma
categoria com relao ao nmero total de
registros.
max_single_category nmero Especifica o limite utilizado quando
screen_single_category True.
screen_missing_values sinalizador Se True, seleciona campos com muitos
valores ausentes, expresso como uma
porcentagem do nmero total de
registros.
max_missing_values nmero
screen_num_categories sinalizador Se True, seleciona campos com muitas
categorias com relao ao nmero total
de registros.
max_num_categories nmero
screen_std_dev sinalizador Se True, seleciona campos com um
desvio padro menor ou igual ao
mnimo especificado.
min_std_dev nmero
screen_coeff_of_var sinalizador Se True, seleciona campos com um
coeficiente de variao menor ou igual
ao mnimo especificado.
min_coeff_of_var nmero

182 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 115. propriedades de featureselectionnode (continuao)
Propriedades de featureselectionnode Valores Descrio da propriedade
criteria Pearson Ao classificar preditores categricos com
Likelihood relao a uma varivel resposta
CramersV categrica, especifica a medida na qual o
Lambda valor de importncia baseado.
unimportant_below nmero Especifica o limite de valores p utilizados
para classificar variveis como
importantes, marginais ou
insignificantes. Aceita valores de 0,0 a
1,0.
important_above nmero Aceita valores de 0,0 a 1,0.
unimportant_label string Especifica o rtulo para a classificao
no importante.
marginal_label string
important_label string
selection_mode ImportanceLevel
ImportanceValue
TopN
select_important sinalizador Quando selection_mode for configurado
para ImportanceLevel, especifica se
campos importantes devem ser
selecionados.
select_marginal sinalizador Quando selection_mode for configurado
para ImportanceLevel, especifica se
campos marginais devem ser
selecionados.
select_unimportant sinalizador Quando selection_mode for configurado
para ImportanceLevel, especifica se
campos no importantes devem ser
selecionados.
importance_value nmero Quando selection_mode for configurado
para ImportanceValue, especifica o valor
de corte a ser utilizado. Aceita valores de
0 a 100.
top_n integer Quando selection_mode for configurado
para TopN, especifica o valor de corte a
ser utilizado. Aceita valores de 0 a 1000.

Propriedades de genlinnode
O Modelo Linear Generalizado expande o modelo linear geral para que a varivel
dependente esteja linearmente relacionada aos fatores e s covariveis por meio de uma
funo de ligao especificada. Alm disso, o modelo permite que a varivel dependente
tenha uma distribuio no normal. Ele cobre a funcionalidade de um amplo nmero de
modelos estatsticos, incluindo regresso linear, regresso logstica, modelos log-linear para
dados de contagem e modelos de sobrevivncia censurados por intervalo.

Exemplo
node = stream.create("genlin", "My node")
node.setPropertyValue("model_type", "MainAndAllTwoWayEffects")
node.setPropertyValue("offset_type", "Variable")
node.setPropertyValue("offset_field", "Claimant")

Captulo 13. Propriedades do N de Modelagem 183


Tabela 116. Propriedades de genlinnode
Propriedades de genlinnode Valores Descrio da propriedade
target campo Os modelos lineares generalizados
requerem um nico campo de destino que
deve ser um campo nominal ou de
sinalizao e um ou mais campos de
entrada. Um campo de ponderao
tambm pode ser especificado. Consulte o
tpico Propriedades Comuns do N de
Modelagem na pgina 157 para obter
mais informaes.
use_weight sinalizador
weight_field campo O tipo de campo apenas contnuo.
target_represents_trials sinalizador
trials_type Variable
FixedValue
trials_field campo O tipo de campo contnuo, de sinalizao
ou ordinal.
trials_number nmero O valor padro 10.
model_type MainEffects
MainAndAllTwoWayEffects
offset_type Variable
FixedValue
offset_field campo O tipo de campo apenas contnuo.
offset_value nmero Deve ser um nmero real.
base_category Last
First

include_intercept sinalizador
mode Simples
Expert
distribuio BINOMIAL IGAUSS: Gaussiana inversa.
GAMMA NEGBIN: Binomial negativo.
IGAUSS
NEGBIN
NORMAL
POISSON
TWEEDIE
MULTINOMIAL
negbin_para_type Specify
Estimate
negbin_parameter nmero O valor padro 1. Deve conter um
nmero real no negativo.
tweedie_parameter nmero

184 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 116. Propriedades de genlinnode (continuao)
Propriedades de genlinnode Valores Descrio da propriedade
link_function IDENTITY CLOGLOG: Log-log complementar.
CLOGLOG LOGC: Complemento de log.
LOG NEGBIN: Binomial negativo.
LOGC NLOGLOG: Log-log negativo.
LOGIT CUMCAUCHIT: Cauchit acumulativo.
NEGBIN CUMCLOGLOG: Log-log complementar
NLOGLOG acumulativo.
ODDSPOWER CUMLOGIT: Logit acumulativo.
PROBIT CUMNLOGLOG: Log-log negativo acumulativo.
POWER CUMPROBIT: Probito acumulativo.
CUMCAUCHIT
CUMCLOGLOG
CUMLOGIT
CUMNLOGLOG
CUMPROBIT
power nmero O valor deve ser um nmero real diferente
de zero.
method Hbrido
Fisher
NewtonRaphson
max_fisher_iterations nmero O valor padro 1; somente nmeros
inteiros positivos so permitidos.
scale_method MaxLikelihoodEstimate
Deviance
PearsonChiSquare
FixedValue
scale_value nmero O valor padro 1; deve ser maior que 0.
covariance_matrix ModelEstimator
RobustEstimator
max_iterations nmero O valor padro 100; somente nmeros
inteiros no negativos.
max_step_halving nmero O valor padro 5; somente nmeros
inteiros positivos.
check_separation sinalizador
start_iteration nmero O valor padro 20; somente nmeros
inteiros positivos so permitidos.
estimates_change sinalizador
estimates_change_min nmero O valor padro 1E-006; somente nmeros
positivos so permitidos.
estimates_change_type Absolute
Relativo
loglikelihood_change sinalizador
loglikelihood_change_min nmero Apenas nmeros positivos permitidos.
loglikelihood_change_type Absolute
Relativo
hessian_convergence sinalizador
hessian_convergence_min nmero Apenas nmeros positivos permitidos.
hessian_convergence_type Absolute
Relative

Captulo 13. Propriedades do N de Modelagem 185


Tabela 116. Propriedades de genlinnode (continuao)
Propriedades de genlinnode Valores Descrio da propriedade
case_summary sinalizador
contrast_matrices sinalizador
descriptive_statistics sinalizador
estimable_functions sinalizador
model_info sinalizador
iteration_history sinalizador
goodness_of_fit sinalizador
print_interval nmero O valor padro 1; deve ser um nmero
inteiro positivo.
model_summary sinalizador
lagrange_multiplier sinalizador
parameter_estimates sinalizador
include_exponential sinalizador
covariance_estimates sinalizador
correlation_estimates sinalizador
analysis_type TypeI
TypeIII
TypeIAndTypeIII
statistics Wald
LR
citype Wald
Perfil
tolerancelevel nmero O valor padro 0,0001.
confidence_interval nmero O valor padro 95.
loglikelihood_function Full
Kernel
singularity_tolerance 1E-007
1E-008
1E-009
1E-010
1E-011
1E-012
value_order Ascending
Descending
DataOrder
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Test
Validation

186 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de glmmnode
Um modelo linear generalizado misto (GLMM) estende o modelo linear para que a resposta
possa ter uma distribuio no normal, esteja linearmente relacionada aos fatores e s
covariveis via uma funo de ligao especificada e para que as observaes possam ser
correlacionadas. Modelos lineares generalizados mistos cobrem uma grande variedade de
modelos, de regresso linear simples a modelos multinvel complexos para dados
longitudinais no normais.

Tabela 117. Propriedades de glmmnode.


Propriedades de glmmnode Values Descrio da propriedade
residual_subject_spec structured A combinao de valores dos campos
categricos especificados que definem
exclusivamente assuntos no conjunto de
dados
repeated_measures structured Campos utilizados para identificar
observaes repetidas.
residual_group_spec [field1 ... fieldN] Campos que definem conjuntos
independentes de parmetros de
covarincia de efeitos repetidos.
residual_covariance_type Diagonal Especifica a estrutura de covarincias para
AR1 residuais.
ARMA11
COMPOUND_SYMMETRY
IDENTITY
TOEPLITZ
UNSTRUCTURED
VARIANCE_COMPONENTS
custom_target sinalizador Indica se deve ser utilizado um destino
definido no n de envio de dados (false)
ou um destino customizado especificado
por target_field (true).
target_field campo Campo a ser utilizado como destino se
custom_target for true.
use_trials sinalizador Indica se um campo ou um valor adicional
que especifica o nmero de avaliaes deve
ser utilizado quando a resposta de destino
for um nmero de eventos que ocorrem em
um conjunto de avaliaes. O padro
false.
use_field_or_value Field Indica se um campo (padro) ou um valor
Value utilizado para especificar o nmero de
avaliaes.
trials_field campo Campo a ser utilizado para especificar o
nmero de avaliaes.
trials_value integer Valor a ser utilizado para especificar o
nmero de avaliaes. Se especificado, o
valor mnimo 1.
use_custom_target_reference sinalizador Indica se a categoria de referncia
customizada deve ser utilizada para uma
varivel resposta categrica. O padro
false.

Captulo 13. Propriedades do N de Modelagem 187


Tabela 117. Propriedades de glmmnode (continuao).
Propriedades de glmmnode Values Descrio da propriedade
target_reference_value string Categoria de referncia a ser utilizada se
use_custom_target_reference for true.
dist_link_combination Nominal Modelos comuns para a distribuio de
Logit valores para o destino. Escolha Custom para
GammaLog especificar uma distribuio a partir da lista
BinomialLogit fornecida pelo target_distribution.
PoissonLog
BinomialProbit
NegbinLog
BinomialLogC
Custom
target_distribution Normal Distribuio de valores para o destino
Binomial quando dist_link_combination for Custom.
Multinomial
Gamma
Inverse
NegativeBinomial
Poisson
link_function_type Identidade Funo Link para relacionar valores de destino para preditor
LogC Se target_distribution for
Log Binomial ser possvel usar qualquer
CLOGLOG uma das funes de ligao listadas.
Logit Se target_distribution for
NLOGLOG Multinomial, ser possvel utilizar
PROBIT CLOGLOG, CAUCHIT, LOGIT,
POWER NLOGLOG ou PROBIT.
CAUCHIT Se target_distribution for
algo diferente de Binomial ou
Multinomial, ser possvel utilizar
IDENTITY, LOG ou POWER.
link_function_param number Valor do parmetro da funo de ligao a
ser utilizado. Aplicvel apenas se
normal_link_function ou
link_function_type for POWER.
use_predefined_inputs sinalizador Indica se os campos de efeito fixo devem
ser aqueles campos de envio de dados
definidos como campos de entrada (true)
ou aqueles a partir de fixed_effects_list
(false). O padro false.
fixed_effects_list structured Se use_predefined_inputs for false,
especifica os campos de entrada a serem
usados como campos de efeito fixo.
use_intercept sinalizador Se true (padro), inclui a interceptao no
modelo.
random_effects_list structured Lista de campos para especificar como
efeitos aleatrios.
regression_weight_field campo Campo a ser utilizado como campo de
ponderao da anlise.
use_offset None Indica como o deslocamento for
offset_value especificado. O valor None significa que
offset_field nenhum deslocamento utilizado.

188 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 117. Propriedades de glmmnode (continuao).
Propriedades de glmmnode Values Descrio da propriedade
offset_value number Valor a ser utilizado para deslocamento se
use_offset for configurado para
offset_value.
offset_field campo Campo a ser utilizado para o valor de
deslocamento se use_offset for
configurado para offset_field.
target_category_order Ascending Ordenao de classificao para variveis
Descending resposta categrica. O valor Data especifica
Data usar a ordem de classificao localizada nos
dados. O padro Ascending.
inputs_category_order Ascending Ordenao de classificao para preditores
Descending categricos. O valor Data especifica usar a
Data ordem de classificao localizada nos
dados. O padro Ascending.
max_iterations integer Nmero mximo de iteraes que o
algoritmo executar. Um nmero inteiro
no negativo; o padro 100.
confidence_level integer O nvel de confiana utilizado para calcular
estimativas de intervalo dos coeficientes do
modelo. Um nmero inteiro no negativo; o
mximo 100 e o padro 95.
degrees_of_freedom_method Fixed Especifica como os graus de liberdade so
Varied calculados para teste de significncia.
test_fixed_effects_coeffecients Modelo Mtodo para calcular a matriz de
Robust covarincia de estimativa de parmetro.
use_p_converge sinalizador Opo para a convergncia de parmetro.
p_converge nmero Em branco, ou qualquer valor positivo.
p_converge_type Absoluto
Relativo
use_l_converge sinalizador Opo para convergncia de log da
verossimilhana.
l_converge nmero Em branco, ou qualquer valor positivo.
l_converge_type Absoluto
Relativo
use_h_converge sinalizador Opo para convergncia da Hessiana.
h_converge nmero Em branco, ou qualquer valor positivo.
h_converge_type Absoluto
Relativo
max_fisher_steps integer
singularity_tolerance nmero
use_model_name sinalizador Indica se deve especificar um nome
customizado para o modelo (true) ou
utilizar o nome gerado pelo sistema
(false). O padro false.
model_name string Se use_model_name for true, especifica o
nome do modelo a ser utilizado.

Captulo 13. Propriedades do N de Modelagem 189


Tabela 117. Propriedades de glmmnode (continuao).
Propriedades de glmmnode Values Descrio da propriedade
confidence onProbability Base para calcular o valor de confiana de
onIncrease escoragem: a probabilidade prevista mais
alta ou a diferena entre as probabilidades
mais altas e a segunda probabilidade mais
alta prevista.
score_category_probabilities sinalizador Se true, produz probabilidades previstas
para variveis resposta categrica. O
padro false.
max_categories integer Se score_category_probabilities for true,
especifica o nmero mximo de categorias a
serem salvas.
score_propensity sinalizador Se true, produz escores de propenso para
campos de destino de sinalizao que
indicam a probabilidade do resultado "true"
para o campo.
emeans structure Para cada campo categrico na lista de
efeitos fixos, especifica se deve produzir
mdias marginais estimadas.
covariance_list structure Para cada campo contnuo da lista de
efeitos fixos, especifica se deve ser utilizada
a mdia ou um valor customizado quando
calcular mdias marginais estimadas.
mean_scale Original Especifica se mdias marginais estimadas
Transformed devem ser calculadas com base na escala
original do destino (padro) ou na
transformao da funo de ligao.
comparison_adjustment_method LSD Mtodo de ajuste a ser utilizado ao
SEQBONFERRONI executar testes de hiptese com diversos
SEQSIDAK contrastes.

Propriedades gle
O n GLE estar disponvel somente se voc tiver uma conexo com IBM SPSS Analytic
Server. Um GLE estende o modelo linear para que o destino possa ter uma distribuio no
normal, esteja linearmente relacionado aos fatores e covariveis por meio de uma funo de
ligao especificada, e para que as observaes possam ser correlacionadas. Os modelos
lineares generalizados mistos abrangem uma ampla variedade de modelos, desde regresso
linear simples at modelos multinveis complexos para dados longitudinais no normais.

Tabela 118. Propriedades gle


Propriedades gle Valores Descrio da propriedade
custom_target flag Indica se deve ser utilizado um destino definido
no n de envio de dados (false) ou um destino
customizado especificado por target_field
(true).
target_field field Campo a ser utilizado como destino se
custom_target for true.

190 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 118. Propriedades gle (continuao)
Propriedades gle Valores Descrio da propriedade
use_trials flag Indica se um campo ou um valor adicional que
especifica o nmero de avaliaes deve ser
utilizado quando a resposta de destino for um
nmero de eventos que ocorrem em um conjunto
de avaliaes. O padro false.
use_trials_field_or_value Field Indica se um campo (padro) ou um valor
Value utilizado para especificar o nmero de avaliaes.
trials_field field Campo a ser utilizado para especificar o nmero
de avaliaes.
trials_value integer Valor a ser utilizado para especificar o nmero de
avaliaes. Se especificado, o valor mnimo 1.
use_custom_target_reference flag Indica se a categoria de referncia customizada
deve ser utilizada para uma varivel resposta
categrica. O padro false.
target_reference_value string Categoria de referncia a ser utilizada se
use_custom_target_reference for true.
dist_link_combination NormalIdentity Modelos comuns para a distribuio de valores
GammaLog para o destino.
PoissonLog
NegbinLog Escolha CUSTOM para especificar uma distribuio a
TweedieIdentity partir da lista fornecida por target_distribution.
NominalLogit
BinomialLogit
BinomialProbit
BinomialLogC
CUSTOM
target_distribution Normal Distribuio de valores para o destino quando
Binomial dist_link_combination for Custom.
Multinomial
Gamma
INVERSE_GAUSS
NEG_BINOMIAL
Poisson
TWEEDIE
UNKNOWN

Captulo 13. Propriedades do N de Modelagem 191


Tabela 118. Propriedades gle (continuao)
Propriedades gle Valores Descrio da propriedade
link_function_type UNKNOWN Funo Link para relacionar valores de destino
IDENTITY para preditores. Se target_distribution for
LOG Binomial ser possvel usar:
LOGIT UNKNOWN
PROBIT IDENTITY
COMPL_LOG_LOG LOG
POWER LOGIT
LOG_COMPL PROBIT
NEG_LOG_LOG COMPL_LOG_LOG
ODDS_POWER POWER
NEG_BINOMIAL LOG_COMPL
GEN_LOGIT NEG_LOG_LOG
CUMUL_LOGIT ODDS_POWER
CUMUL_PROBIT
CUMUL_COMPL_LOG_LOG Se target_distribution for NEG_BINOMIAL ser
CUMUL_NEG_LOG_LOG possvel usar:
CUMUL_CAUCHIT NEG_BINOMIAL.

Se target_distribution for UNKNOWN, ser possvel


usar:
GEN_LOGIT
CUMUL_LOGIT
CUMUL_PROBIT
CUMUL_COMPL_LOG_LOG
CUMUL_NEG_LOG_LOG
CUMUL_CAUCHIT
link_function_param nmero O valor de parmetro tweedie a ser usado.
Aplicvel apenas se normal_link_function ou
link_function_type for POWER.
tweedie_param nmero Valor do parmetro da funo de ligao a ser
utilizado. Somente se aplicar se
dist_link_combination for configurado como
TweedieIdentity ou se link_function_type for
TWEEDIE.
use_predefined_inputs flag Indica se os campos de efeito de modelo devem
ser aqueles definidos no envio de dados como
campos de entrada (true) ou aqueles a partir de
fixed_effects_list (false).
model_effects_list estruturado Se use_predefined_inputs for false, especifica os
campos de entrada a serem usados como campos
de efeito de modelo.
use_intercept flag Se true (padro), inclui a interceptao no
modelo.
regression_weight_field field Campo a ser utilizado como campo de
ponderao da anlise.
use_offset None Indica como o deslocamento for especificado. O
Value valor None significa que nenhum deslocamento
Variable utilizado.
offset_value nmero Valor a ser utilizado para deslocamento se
use_offset for configurado para offset_value.
offset_field field Campo a ser utilizado para o valor de
deslocamento se use_offset for configurado para
offset_field.

192 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 118. Propriedades gle (continuao)
Propriedades gle Valores Descrio da propriedade
target_category_order Ascending Ordenao de classificao para variveis resposta
Descending categrica. O padro Ascending.
inputs_category_order Ascending Ordenao de classificao para preditores
Descending categricos. O padro Ascending.
max_iterations integer Nmero mximo de iteraes que o algoritmo
executar. Um nmero inteiro no negativo; o
padro 100.
confidence_level nmero O nvel de confiana utilizado para calcular
estimativas de intervalo dos coeficientes do
modelo. Um nmero inteiro no negativo; o
mximo 100 e o padro 95.
test_fixed_effects_coeffecients Modelo Mtodo para calcular a matriz de covarincia de
Robust estimativa de parmetro.
detect_outliers flag Quando true, o algoritmo localiza valores
discrepantes influentes para todas as distribuies,
exceto a distribuio multinomial.
conduct_trend_analysis flag Quando true, o algoritmo conduz a anlise de
tendncia para o grfico de disperso.
estimation_method FISHER_SCORING Especifique o algoritmo de estimao de mxima
NEWTON_RAPHSON verossimilhana.
HYBRID
max_fisher_iterations integer Se estiver usando o FISHER_SCORING
estimation_method, o nmero mximo de
iteraes. Mnimo 0, mximo 20.
scale_parameter_method MLE Especifique o mtodo a ser usado para a
FIXED estimao do parmetro de escala.
DEVIANCE
PEARSON_CHISQUARE
scale_value nmero Somente se aplicar se scale_parameter_method
for configurado como Fixed.
negative_binomial_method MLE Especifique o mtodo a ser usado para a
FIXED estimao do parmetro auxiliar de binomial
negativa.
negative_binomial_value nmero Somente estar disponvel se
negative_binomial_method for configurado como
Fixed.
use_p_converge flag Opo para a convergncia de parmetro.
p_converge nmero Em branco, ou qualquer valor positivo.
p_converge_type flag True = absoluto, False = relativo
use_l_converge flag Opo para convergncia de log da
verossimilhana.
l_converge nmero Em branco, ou qualquer valor positivo.
l_converge_type flag True = absoluto, False = relativo
use_h_converge flag Opo para convergncia da Hessiana.
h_converge nmero Em branco, ou qualquer valor positivo.
h_converge_type flag True = absoluto, False = relativo

Captulo 13. Propriedades do N de Modelagem 193


Tabela 118. Propriedades gle (continuao)
Propriedades gle Valores Descrio da propriedade
max_iterations integer Nmero mximo de iteraes que o algoritmo
executar. Um nmero inteiro no negativo; o
padro 100.
sing_tolerance integer
use_model_selection flag Ativa os controles de limite de parmetro e de
mtodo de seleo do modelo.
method LASSO Determina o mtodo de seleo do modelo ou, se
ELASTIC_NET estiver usando Ridge, o mtodo de regularizao
FORWARD_STEPWISE usado.
RIDGE
detect_two_way_interactions flag Quando True, o modelo detectar
automaticamente as interaes de dois fatores
entre campos de entrada.

Esse controle somente dever ser ativado se o


modelo for somente de efeitos principais (ou seja,
quando o usurio no tiver criado outros efeitos
de ordem superior) e se o method selecionado for
Forward Stepwise, Lasso ou Elastic Net.
automatic_penalty_params flag Somente se aplicar se o method de seleo de
modelo for Lasso ou Elastic Net.

Use esta funo para inserir parmetros de


penalidade associados aos mtodos de seleo de
variveis Lasso ou Elastic Net.

Se True, valores padro so usados. Se False, os


parmetros de penalidade so ativados e valores
customizados podem ser inseridos.
lasso_penalty_param nmero Somente estar disponvel se o method de seleo
de modelo for Lasso ou Elastic Net e se
automatic_penalty_params for False. Especifique
o valor de parmetro de penalidade para Lasso.
elastic_net_penalty_param1 nmero Somente estar disponvel se o method de seleo
de modelo for Lasso ou Elastic Net e se
automatic_penalty_params for False. Especifique
o valor de parmetro de penalidade para
parmetro 1 do Elastic Net.
elastic_net_penalty_param2 nmero Somente estar disponvel se o method de seleo
de modelo for Lasso ou Elastic Net e se
automatic_penalty_params for False. Especifique
o valor de parmetro de penalidade para
parmetro 2 de Elastic Net.
probability_entry nmero Somente estar disponvel se o method selecionado
for Forward Stepwise. Especifique o nvel de
significncia do critrio de estatstica f para
incluso de efeito.
probability_removal nmero Somente estar disponvel se o method selecionado
for Forward Stepwise. Especifique o nvel de
significncia do critrio de estatstica f para
remoo do efeito.

194 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 118. Propriedades gle (continuao)
Propriedades gle Valores Descrio da propriedade
use_max_effects flag Somente estar disponvel se o method selecionado
for Forward Stepwise.

Ativa o controle max_effects.

Quando False, o nmero padro de efeitos


includos deve ser igual ao nmero total de
efeitos fornecidos ao modelo, menos a
interceptao.
max_effects integer Especifique o nmero mximo de efeitos ao usar
o mtodo de construo forward stepwise.
use_max_steps flag Ativa o controle max_steps.

Quando False, o nmero padro de etapas deve


ser igual a trs vezes o nmero de efeitos
fornecidos ao modelo, excluindo a interceptao.
max_steps integer Especifique o nmero mximo de etapas a serem
executadas ao usar o method de construo
Forward Stepwise.
use_model_name flag Indica se deve especificar um nome customizado
para o modelo (true) ou utilizar o nome gerado
pelo sistema (false). O padro false.
model_name string Se use_model_name for true, especifica o nome do
modelo a ser utilizado.
usePI flag Se for true, a importncia do preditor ser
calculada.

Propriedades de kmeansnode
O n K-mdias armazena em cluster os dados configurados em grupos distintos (ou clusters).
O mtodo define um nmero fixo de clusters, designa registros aos clusters iterativamente e
ajusta os centros de cluster at que os refinamentos adicionais no possam mais melhorar o
modelo. Em vez de tentar prever um resultado, o k-mdias usa um processo conhecido como
aprendizado no supervisionado para descobrir padres no conjunto de campos de entrada.

Exemplo
node = stream.create("kmeans", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Cholesterol", "BP", "Drug", "Na", "K", "Age"])
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Kmeans_allinputs")
node.setPropertyValue("num_clusters", 9)
node.setPropertyValue("gen_distance", True)
node.setPropertyValue("cluster_label", "Number")
node.setPropertyValue("label_prefix", "Kmeans_")
node.setPropertyValue("optimize", "Speed")
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("stop_on", "Custom")
node.setPropertyValue("max_iterations", 10)
node.setPropertyValue("tolerance", 3.0)
node.setPropertyValue("encoding_value", 0.3)

Captulo 13. Propriedades do N de Modelagem 195


Tabela 119. Propriedades de kmeansnode
Propriedades de kmeansnode Valores Descrio da propriedade
inputs [field1 ... fieldN] Os modelos de K-mdias executam a
anlise de cluster em um conjunto de
campos de entrada, mas no utilizam um
campo de destino. Os campos de peso e de
frequncia no so utilizados. Consulte o
tpico Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
num_clusters nmero
gen_distance sinalizador
cluster_label Sequncia de caracteres
Processo Processo
label_prefix string
mode Simple
Expert
stop_on Default
Custom
max_iterations nmero
tolerance nmero
encoding_value nmero
optimize Velocidade Use para especificar se a construo de
Memory modelo deve ser otimizada para velocidade
ou para memria.

Propriedades de knnnode
O n k-Nearest Neighbor (KNN) associa um novo caso categoria ou valor dos objetos k
mais prximos dele no espao do preditor, em que k um nmero inteiro. Casos semelhantes
ficam prximos uns dos outros e os casos diferentes ficam distantes uns dos outros.

Exemplo
node = stream.create("knn", "My node")
# Objectives tab
node.setPropertyValue("objective", "Custom")
# Settings tab - Neighbors panel
node.setPropertyValue("automatic_k_selection", False)
node.setPropertyValue("fixed_k", 2)
node.setPropertyValue("weight_by_importance", True)
# Settings tab - Analyze panel
node.setPropertyValue("save_distances", True)

Tabela 120. Propriedades de knnnode


Propriedades de knnnode Valores Descrio da propriedade
anlise PredictTarget
IdentifyNeighbors
objective Balance
Velocidade
Accuracy
Custom
normalize_ranges sinalizador

196 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 120. Propriedades de knnnode (continuao)
Propriedades de knnnode Valores Descrio da propriedade
use_case_labels sinalizador Caixa de seleo para ativar a prxima
opo.
case_labels_field campo
identify_focal_cases sinalizador Caixa de seleo para ativar a prxima
opo.
focal_cases_field campo
automatic_k_selection sinalizador
fixed_k integer Ativado somente se automatic_k_selectio
for False.
minimum_k integer Ativado somente se automatic_k_selectio
for True.
maximum_k integer
distance_computation Euclidean
CityBlock
weight_by_importance sinalizador
range_predictions Mdia
Mediana
perform_feature_selection sinalizador
forced_entry_inputs [field1 ... fieldN]
stop_on_error_ratio sinalizador
number_to_select integer
minimum_change nmero
validation_fold_assign_by_field sinalizador
number_of_folds integer Ativado somente se
validation_fold_assign_by_field for
False.
set_random_seed sinalizador
random_seed nmero
folds_field campo Ativado somente se
validation_fold_assign_by_field for True.
all_probabilities sinalizador
save_distances sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Test
Validation

Captulo 13. Propriedades do N de Modelagem 197


Propriedades de kohonennode
O n Kohonen gera um tipo de rede neural que pode ser usado para armazenar o conjunto
de dados em cluster em grupos distintos. Quando a rede estiver totalmente treinada, os
registros semelhantes devero estar prximos no mapa de sada, enquanto os registros
diferentes devero ficar mais afastados. possvel consultar o nmero de observaes
capturadas por cada unidade no nugget do modelo para identificar as unidades fortes. Isso
lhe dar uma noo do nmero apropriado de clusters.

Exemplo
node = stream.create("kohonen", "My node")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Symbolic Cluster")
node.setPropertyValue("stop_on", "Time")
node.setPropertyValue("time", 1)
node.setPropertyValue("set_random_seed", True)
node.setPropertyValue("random_seed", 12345)
node.setPropertyValue("optimize", "Speed")
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("width", 3)
node.setPropertyValue("length", 3)
node.setPropertyValue("decay_style", "Exponential")
node.setPropertyValue("phase1_neighborhood", 3)
node.setPropertyValue("phase1_eta", 0.5)
node.setPropertyValue("phase1_cycles", 10)
node.setPropertyValue("phase2_neighborhood", 1)
node.setPropertyValue("phase2_eta", 0.2)
node.setPropertyValue("phase2_cycles", 75)

Tabela 121. Propriedades de kohonennode


Propriedades de kohonennode Valores Descrio da propriedade
inputs [field1 ... fieldN] Os modelos de Kohonen utilizam uma lista
de campos de entrada, mas no de destino.
Os campos de frequncia e de ponderao
no so utilizados. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
continue sinalizador
show_feedback sinalizador
stop_on Default
Time
time nmero
optimize Velocidade Use para especificar se a construo de
Memory modelo deve ser otimizada para velocidade
ou para memria.
cluster_label sinalizador
mode Simple
Expert
width nmero
length nmero
decay_style Linear
Exponential
phase1_neighborhood nmero
phase1_eta nmero

198 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 121. Propriedades de kohonennode (continuao)
Propriedades de kohonennode Valores Descrio da propriedade
phase1_cycles nmero
phase2_neighborhood nmero
phase2_eta nmero
phase2_cycles nmero

Propriedades de linearnode
Os modelos de regresso linear preveem uma varivel resposta contnua baseada em
relacionamentos lineares entre a resposta e um ou mais preditores.

Exemplo
node = stream.create("linear", "My node")
# Build Options tab - Objectives panel
node.setPropertyValue("objective", "Standard")
# Build Options tab - Model Selection panel
node.setPropertyValue("model_selection", "BestSubsets")
node.setPropertyValue("criteria_best_subsets", "ASE")
# Build Options tab - Ensembles panel
node.setPropertyValue("combining_rule_categorical", "HighestMeanProbability")

Tabela 122. Propriedades de linearnode.


Propriedades de linearnode Valores Descrio da propriedade
target campo Especifica um campo de destino nico.

inputs [field1 ... fieldN] Campos do preditor utilizados pelo


modelo.
continue_training_existing_model sinalizador
objective Standard O psm utilizado para conjuntos de dados
Bagging muito grandes e requer uma conexo com
Boosting o Servidor.
psm
use_auto_data_preparation sinalizador
confidence_level number
model_selection ForwardStepwise
BestSubsets
None
criteria_forward_stepwise AICC
Fstatistics
AdjustedRSquare
ASE
probability_entry number
probability_removal number
use_max_effects sinalizador
max_effects number
use_max_steps sinalizador

Captulo 13. Propriedades do N de Modelagem 199


Tabela 122. Propriedades de linearnode (continuao).
Propriedades de linearnode Valores Descrio da propriedade
max_steps number
criteria_best_subsets AICC
AdjustedRSquare
ASE
combining_rule_continuous Mdia
Median
component_models_n number
use_random_seed sinalizador
random_seed number
use_custom_model_name sinalizador
custom_model_name string
use_custom_name sinalizador
custom_name string
tooltip string
keywords string
annotation string

Propriedades de linearasnode
Os modelos de regresso linear preveem uma varivel resposta contnua baseada em
relacionamentos lineares entre a resposta e um ou mais preditores.

Tabela 123. Propriedades de linearasnode


Propriedades de linearasnode Valores Descrio da propriedade
target campo Especifica um campo de destino nico.

inputs [field1 ... fieldN] Campos do preditor utilizados pelo


modelo.
weight_field campo Campo de anlise utilizado pelo modelo.
custom_fields sinalizador O valor padro TRUE.
intercept sinalizador O valor padro TRUE.
detect_2way_interaction sinalizador Especifica se uma interao bilateral deve
ser considerada ou no. O valor padro
TRUE.
cin nmero O intervalo de confiana usado para
calcular estimativas dos coeficientes do
modelo. Especifique um valor maior que 0
e menor que 100. O valor padro 95.
factor_order ascending A ordem de classificao para preditores
descending categricos. O valor padro ascending.

200 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 123. Propriedades de linearasnode (continuao)
Propriedades de linearasnode Valores Descrio da propriedade
var_select_method ForwardStepwise O mtodo de seleo do modelo a ser
BestSubsets utilizado. O valor padro
nenhum ForwardStepwise.
criteria_for_forward_stepwise AICC A estatstica utilizada para determinar se
Fstatistics um efeito deve ser includo ou removido
AdjustedRSquare do modelo. O valor padro
ASE AdjustedRSquare.
pin nmero O efeito que possuir o menor valor-p
inferior a esse limite de pin especificado
ser includo no modelo. O valor padro
0.05.
pout nmero Quaisquer efeitos no modelo com um
valor-p maior que esse limite de pout
especificado so removidos. O valor padro
0.10.
use_custom_max_effects sinalizador Especifica se o nmero mximo de efeitos
deve ser usado no modelo final. O valor
padro FALSE.
max_effects nmero O nmero mximo de efeitos a ser usado
no modelo final. O valor padro 1.
use_custom_max_steps sinalizador Especifica se o nmero mximo de etapas
deve ser usado. O valor padro FALSE.
max_steps nmero O nmero mximo de etapas antes de o
algoritmo stepwise parar. O valor padro
1.
criteria_for_best_subsets AICC O modo de critrios a ser usado. O valor
AdjustedRSquare padro AdjustedRSquare.
ASE

Propriedades de logregnode
A regresso logstica uma tcnica estatstica para ordenar registros com base em valores de
campos de entrada. Ela anloga regresso linear, mas usa um campo de varivel resposta
categrica em vez de um intervalo numrico.

Exemplo Multinomial
node = stream.create("logreg", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["BP", "Cholesterol", "Age"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Log_reg Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("method", "Stepwise")
node.setPropertyValue("logistic_procedure", "Multinomial")
node.setPropertyValue("multinomial_base_category", "BP")
node.setPropertyValue("model_type", "FullFactorial")
node.setPropertyValue("custom_terms", [["BP", "Sex"], ["Age"], ["Na", "K"]])
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("scale", "Pearson")

Captulo 13. Propriedades do N de Modelagem 201


node.setPropertyValue("scale_value", 3.0)
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("tolerance", "1.0E-7")
# "Convergence..." seo
node.setPropertyValue("max_iterations", 50)
node.setPropertyValue("max_steps", 3)
node.setPropertyValue("l_converge", "1.0E-3")
node.setPropertyValue("p_converge", "1.0E-7")
node.setPropertyValue("delta", 0.03)
# "Output..." seo
node.setPropertyValue("summary", True)
node.setPropertyValue("likelihood_ratio", True)
node.setPropertyValue("asymptotic_correlation", True)
node.setPropertyValue("goodness_fit", True)
node.setPropertyValue("iteration_history", True)
node.setPropertyValue("history_steps", 3)
node.setPropertyValue("parameters", True)
node.setPropertyValue("confidence_interval", 90)
node.setPropertyValue("asymptotic_covariance", True)
node.setPropertyValue("classification_table", True)
# "Stepping" options
node.setPropertyValue("min_terms", 7)
node.setPropertyValue("use_max_terms", True)
node.setPropertyValue("max_terms", 10)
node.setPropertyValue("probability_entry", 3)
node.setPropertyValue("probability_removal", 5)
node.setPropertyValue("requirements", "Containment")

Exemplo Binomial
node = stream.create("logreg", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Cholesterol")
node.setPropertyValue("inputs", ["BP", "Drug", "Age"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Log_reg Cholesterol")
node.setPropertyValue("multinomial_base_category", "BP")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("binomial_method", "Forwards")
node.setPropertyValue("logistic_procedure", "Binomial")
node.setPropertyValue("binomial_categorical_input", "Sex")
node.setKeyedPropertyValue("binomial_input_contrast", "Sex", "Simple")
node.setKeyedPropertyValue("binomial_input_category", "Sex", "Last")
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("scale", "Pearson")
node.setPropertyValue("scale_value", 3.0)
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("tolerance", "1.0E-7")
# "Convergence..." seo
node.setPropertyValue("max_iterations", 50)
node.setPropertyValue("l_converge", "1.0E-3")
node.setPropertyValue("p_converge", "1.0E-7")
# "Output..." section
node.setPropertyValue("binomial_output_display", "at_each_step")
node.setPropertyValue("binomial_goodness_of_fit", True)
node.setPropertyValue("binomial_iteration_history", True)
node.setPropertyValue("binomial_parameters", True)
node.setPropertyValue("binomial_ci_enable", True)
node.setPropertyValue("binomial_ci", 85)
# "Stepping" options
node.setPropertyValue("binomial_removal_criterion", "LR")
node.setPropertyValue("binomial_probability_removal", 0.2)

Tabela 124. Propriedades de logregnode.


Propriedades de logregnode Valores Descrio da propriedade
target campo Os modelos de regresso logstica
requerem um nico campo de destino e
um ou mais campos de entrada. Os
campos de frequncia e de ponderao no
so utilizados. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter
mais informaes.

202 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 124. Propriedades de logregnode (continuao).
Propriedades de logregnode Valores Descrio da propriedade
logistic_procedure Binomial
Multinomial
include_constant sinalizador
mode Simple
Expert
method Inserir
Stepwise
Avanar
Backwards
BackwardsStepwise
binomial_method Inserir
Avanar
Backwards
model_type MainEffects Quando FullFactorial especificado
FullFactorial como o tipo de modelo, os mtodos de
Custom progresso no sero executados, mesmo se
especificados. Ao invs disso, Enter ser o
mtodo utilizado.

Se o tipo de modelo for configurado para


Custom, mas nenhum campo customizado
estiver especificado, um modelo de efeitos
principal ser construdo.
custom_terms [[BP Sex][BP][Age]]
multinomial_base_category string Especifica como a categoria de referncia
determinada.
binomial_categorical_input string
binomial_input_contrast Indicador Propriedade definida como chave para
Simples entrada categrica que especifica como o
Difference contraste determinado.
Helmert
Repetido
Polynomial
Deviation
binomial_input_category First Propriedade definida como chave para
Last entrada categrica que especifica como a
categoria de referncia determinada.

scale None
UserDefined
Pearson
Deviance
scale_value number
all_probabilities sinalizador
tolerance 1.0E-5
1.0E-6
1.0E-7
1.0E-8
1.0E-9
1.0E-10

Captulo 13. Propriedades do N de Modelagem 203


Tabela 124. Propriedades de logregnode (continuao).
Propriedades de logregnode Valores Descrio da propriedade
min_terms number
use_max_terms sinalizador
max_terms number
entry_criterion Score
LR
removal_criterion LR
Wald
probability_entry number
probability_removal number
binomial_probability_entry number
binomial_probability_removal number
requirements HierarchyDiscrete HierarchyAll
Containment
None
max_iterations number
max_steps number
p_converge 1.0E-4
1.0E-5
1.0E-6
1.0E-7
1.0E-8
0
l_converge 1.0E-1
1.0E-2
1.0E-3
1.0E-4
1.0E-5
0
delta number
iteration_history sinalizador
history_steps number
summary sinalizador
likelihood_ratio sinalizador
asymptotic_correlation sinalizador
goodness_fit sinalizador
parameters sinalizador
confidence_interval number
asymptotic_covariance sinalizador
classification_table sinalizador
stepwise_summary sinalizador
info_criteria sinalizador
monotonicity_measures sinalizador
binomial_output_display at_each_step
at_last_step

204 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 124. Propriedades de logregnode (continuao).
Propriedades de logregnode Valores Descrio da propriedade
binomial_goodness_of_fit sinalizador
binomial_parameters sinalizador
binomial_iteration_history sinalizador
binomial_classification_plots sinalizador
binomial_ci_enable sinalizador
binomial_ci number
binomial_residual outliers
all
binomial_residual_enable sinalizador
binomial_outlier_threshold number
binomial_classification_cutoff number
binomial_removal_criterion LR
Wald
Conditional
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador

Propriedades de lsvmnode
O n Support Vector Machine (LSVM) linear permite ordenar dados em um de dois grupos
sem causar super ajuste. O LSVM linear e trabalha bem com conjuntos de dados grandes,
como aqueles com um nmero muito grande de registros. O n LSVM executado quando
conectado ao IBM SPSS Analytic Server.

Tabela 125. Propriedades de lsvmnode


Propriedades de lsvmnode Valores Descrio da propriedade
intercept sinalizao Inclui o intercepto no modelo. O valor
padro True.
target_order Ascending Especifica a ordem de classificao
Descending para a varivel resposta categrica.
Ignorado para variveis resposta
contnuas. O padro Ascending.
precision number Utilizado apenas se o nvel de
medio do campo de destino for
Continuos. Especifica o parmetro
relacionado sensibilidade de perda
para regresso. O mnimo 0 e no h
um mximo. O valor padro 0.1.
exclude_missing_values sinalizao Quando True, um registro ser
excludo se qualquer valor nico
estiver omisso. O valor padro
False.
penalty_function L1 Especifica o tipo de funo de
L2 penalidade usada. O valor padro
L2.
lambda number Parmetro de penalidade
(regularizao).

Captulo 13. Propriedades do N de Modelagem 205


Tabela 125. Propriedades de lsvmnode (continuao)
Propriedades de lsvmnode Valores Descrio da propriedade
calculate_variable_importance sinalizao Para modelos que produzem uma
medida de importncia apropriada,
esta opo exibe um grfico que
indica a importncia relativa de cada
preditor na estimativa do modelo.
Observe que a importncia varivel
pode demorar mais tempo para
calcular para alguns modelos,
particularmente ao trabalhar com
conjuntos de dados grandes, e est
desativada por padro para alguns
modelos como um resultado. A
importncia varivel no est
disponvel para modelos de lista de
deciso.

Propriedades de neuralnetnode
Cuidado: Uma verso mais recente do n de modelagem Rede Neural, com recursos aprimorados, est
disponvel nesta liberao e descrita na prxima seo (neuralnetwork). Embora ainda seja possvel criar
e escorar um modelo com a verso anterior, recomenda-se atualizar seus scripts para utilizar a nova
verso. Os detalhes da verso anterior so mantidos aqui para referncia.

Exemplo
node = stream.create("neuralnet", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("targets", ["Drug"])
node.setPropertyValue("inputs", ["Age", "Na", "K", "Cholesterol", "BP"])
# "Model" tab
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("method", "Dynamic")
node.setPropertyValue("train_pct", 30)
node.setPropertyValue("set_random_seed", True)
node.setPropertyValue("random_seed", 12345)
node.setPropertyValue("stop_on", "Time")
node.setPropertyValue("accuracy", 95)
node.setPropertyValue("cycles", 200)
node.setPropertyValue("time", 3)
node.setPropertyValue("optimize", "Speed")
# "Multiple Method Expert Options" section
node.setPropertyValue("m_topologies", "5 30 5; 2 20 3, 1 10 1")
node.setPropertyValue("m_non_pyramids", False)
node.setPropertyValue("m_persistence", 100)

Tabela 126. Propriedades de neuralnetnode


Propriedades de neuralnetnode Valores Descrio da propriedade
targets [field1 ... fieldN] O n Rede Neural espera um ou mais
campos de destino e um ou mais campos
de entrada. Os campos de frequncia e de
ponderao so ignorados. Consulte o
tpico Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
method Rpido
Dinmico
Multiple
Podar
ExhaustivePrune
RBFN

206 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 126. Propriedades de neuralnetnode (continuao)
Propriedades de neuralnetnode Valores Descrio da propriedade
prevent_overtrain sinalizador
train_pct nmero
set_random_seed sinalizador
random_seed nmero
mode Simple
Expert
stop_on Default Modo de parada.
Accuracy
Ciclos
Time
accuracy nmero Preciso da parada.
cycles nmero Ciclos para treinamento.
time nmero Tempo de treinamento (minutos).
continue sinalizador
show_feedback sinalizador
binary_encode sinalizador
use_last_model sinalizador
gen_logfile sinalizador
logfile_name string
alpha nmero
initial_eta nmero
high_eta nmero
low_eta nmero
eta_decay_cycles nmero
hid_layers Um
Dois
rvore
hl_units_one nmero
hl_units_two nmero
hl_units_three nmero
persistence nmero
m_topologies string
m_non_pyramids sinalizador
m_persistence nmero
p_hid_layers Um
Dois
rvore
p_hl_units_one nmero
p_hl_units_two nmero
p_hl_units_three nmero
p_persistence nmero
p_hid_rate nmero

Captulo 13. Propriedades do N de Modelagem 207


Tabela 126. Propriedades de neuralnetnode (continuao)
Propriedades de neuralnetnode Valores Descrio da propriedade
p_hid_pers nmero
p_inp_rate nmero
p_inp_pers nmero
p_overall_pers nmero
r_persistence nmero
r_num_clusters nmero
r_eta_auto sinalizador
r_alpha nmero
r_eta nmero
optimize Velocidade Use para especificar se a construo de
Memory modelo deve ser otimizada para velocidade
ou para memria.
calculate_variable_importance sinalizador Nota: A propriedade sensitivity_analysis
utilizada em liberaes anteriores foi
descontinuada a favor desta propriedade. A
propriedade antiga ainda suportada,
porm calculate_variable_importance
recomendado.
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Test
Validation

Propriedades de neuralnetworknode
O n Rede Neural utiliza um modelo simplificado da maneira com que o crebro humano
processa informaes. Ele funciona ao simular um grande nmero de unidades de
processamento interconectadas que lembram verses de neurnios abstratas. As redes neurais
so estimadores de funo geral poderosos que requerem conhecimento mnimo em estatstica
ou matemtica para treinamento ou aplicao.

Exemplo
node = stream.create("neuralnetwork", "My node")
# Build Options tab - Objectives panel
node.setPropertyValue("objective", "Standard")
# Build Options tab - Ensembles panel
node.setPropertyValue("combining_rule_categorical", "HighestMeanProbability")

Tabela 127. Propriedades de neuralnetworknode


Propriedades de neuralnetworknode Valores Descrio da propriedade
destino [field1 ... fieldN] Especifica campos de destino.
inputs [field1 ... fieldN] Campos do preditor utilizados pelo
modelo.
splits [field1 ... fieldN Especifica o campo ou campos a serem
utilizados para modelagem de diviso.

208 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 127. Propriedades de neuralnetworknode (continuao)
Propriedades de neuralnetworknode Valores Descrio da propriedade
use_partition sinalizador Se um campo de partio for definido, essa
opo assegurar que apenas os dados da
partio de treinamento sejam utilizados
para construir o modelo.
continue sinalizador Continua treinando o modelo existente.
objective Standard O psm utilizado para conjuntos de dados
Bagging muito grandes e requer uma conexo com
Boosting o Servidor.
psm
method MultilayerPerceptron
RadialBasisFunction
use_custom_layers sinalizador
first_layer_units nmero
second_layer_units nmero
use_max_time sinalizador
max_time nmero
use_max_cycles sinalizador
max_cycles nmero
use_min_accuracy sinalizador
min_accuracy nmero
combining_rule_categorical Voting
HighestProbability
HighestMeanProbability
combining_rule_continuous Mdia
Median

component_models_n nmero
overfit_prevention_pct nmero
use_random_seed sinalizador
random_seed nmero
missing_values listwiseDeletion
missingValueImputation
use_model_name boolean
model_name string
confiana onProbability
onIncrease
score_category_probabilities sinalizador
max_categories nmero
score_propensity sinalizador
use_custom_name sinalizador
custom_name string
tooltip string
palavras-chave string

Captulo 13. Propriedades do N de Modelagem 209


Tabela 127. Propriedades de neuralnetworknode (continuao)
Propriedades de neuralnetworknode Valores Descrio da propriedade
annotation string

Propriedades de questnode
O n QUEST fornece um mtodo de classificao binrio para construir rvores de deciso,
projetadas para reduzir o tempo de processamento necessrio para grandes anlises de C e R,
enquanto tambm reduz a tendncia localizada nos mtodos de rvore de classificao para
favorecer entradas que permitam mais divises. Campos de entrada podem ser intervalos
numricos (contnuos), mas o campo de resposta deve ser categrico. Todas as divises so
binrias.

Exemplo
node = stream.create("quest", "My node")
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "Na", "K", "Cholesterol", "BP"])
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("max_surrogates", 5)
node.setPropertyValue("split_alpha", 0.03)
node.setPropertyValue("use_percentage", False)
node.setPropertyValue("min_parent_records_abs", 40)
node.setPropertyValue("min_child_records_abs", 30)
node.setPropertyValue("prune_tree", True)
node.setPropertyValue("use_std_err", True)
node.setPropertyValue("std_err_multiplier", 3)

Tabela 128. Propriedades de questnode


Propriedades de questnode Values Descrio da propriedade
target campo Os modelos QUEST requerem um nico
campo de destino e um ou mais campos de
entrada. Um campo de frequncia tambm
pode ser especificado. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
continue_training_existing_model sinalizador
objective Standard O psm utilizado para conjuntos de dados
Boosting muito grandes e requer uma conexo com
Bagging o Servidor.
psm
model_output_type Single
InteractiveBuilder
use_tree_directives sinalizador
tree_directives string
use_max_depth Default
Custom
max_depth integer Profundidade mxima da rvore, de 0 a
1000. Usado apenas se use_max_depth =
Custom.
prune_tree sinalizador Poda a rvore para evitar super ajuste.
use_std_err sinalizador Utiliza a diferena mxima em risco (nos
Erros Padro).

210 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 128. Propriedades de questnode (continuao)
Propriedades de questnode Values Descrio da propriedade
std_err_multiplier nmero Diferena mxima.
max_surrogates nmero Mximo de substitutos.
use_percentage sinalizador
min_parent_records_pc nmero
min_child_records_pc nmero
min_parent_records_abs nmero
min_child_records_abs nmero
use_costs sinalizador
costs estruturado Propriedade estruturada.
priors Data
Equal
Custom
custom_priors estruturado Propriedade estruturada.
adjust_priors sinalizador
trails nmero Nmero de modelos de componente para
boosting ou bagging.
set_ensemble_method Voting Regra de combinao padro para variveis
HighestProbability resposta categrica.
HighestMeanProbability
range_ensemble_method Mdia Regra de combinao padro para variveis
Mediana resposta contnua.
large_boost sinalizador Aplica boosting em conjuntos de dados
muito grandes.
split_alpha nmero Nvel de significncia para diviso.
train_pct nmero Conjunto de preveno ao super ajuste
set_random_seed sinalizador Replica a opo de resultados.
seed nmero
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador
adjusted_propensity_partition Test
Validation

Captulo 13. Propriedades do N de Modelagem 211


Propriedades de randomtrees
O n rvores aleatrias somente estar disponvel se houver uma conexo com o IBM SPSS
Analytic Server. Esse n semelhante ao n do C&RT existente, no entanto, o n rvores
aleatrias projetado para processar Big Data a fim de criar uma nica rvore e ele exibe o
modelo resultante no visualizador de sada que foi includo no SPSS Modeler verso 17. O n
rvores aleatrias gera uma rvore de deciso usada para prever ou classificar observaes
futuras. O mtodo usa particionamento recursivo para dividir os registros de treinamento em
segmentos, minimizando as impurezas de cada passo, em que um n na rvore ser
considerado puro se 100% dos casos no n estiverem dentro de uma categoria especfica do
campo de destino. Os campos de entrada e resposta podem ser intervalos numricos ou
categricos (nominal, ordinal ou flags); todas as divises so binrias (somente dois
subgrupos).

Tabela 129. Propriedades de randomtrees


Propriedades de randomtrees Valores Descrio da propriedade
target campo No n rvores aleatrias, os modelos
requerem um nico destino e um ou mais
campos de entrada. Um campo de
frequncia tambm pode ser especificado.
Consulte o tpico Propriedades Comuns
do N de Modelagem na pgina 157 para
obter mais informaes.
number_of_models integer Determina o nmero de modelos a serem
construdos como parte da modelagem de
combinao.
sample_size number Reduza esse valor para melhorar o
desempenho quando processar conjuntos
de dados muito grandes.
handle_imbalanced_data sinalizao Se o destino do modelo for um resultado
de flag especfico e a razo do resultado
desejado para um resultado no desejado
for muito pequena, os dados esto
desbalanceados e a amostragem de
bootstrap que conduzida pelo modelo
poder afetar a preciso do modelo. Ative a
manipulao de dados desbalanceados para
que o modelo capture uma proporo
maior do resultado desejado e gere um
modelo mais forte.
use_weighted_sampling sinalizao Quando False, as variveis de cada n so
selecionadas aleatoriamente com a mesma
probabilidade. Quando True, as variveis
so ponderadas e selecionadas de modo
apropriado.
use_stepwise sinalizao Determina se a construo de modelo
stepwise utilizada.
max_node_number integer Nmero mximo de ns permitidos em
rvores individuais. Se o nmero exceder
na prxima diviso, o crescimento da
rvore ser interrompido.
max_depth integer Profundidade mxima da rvore antes de o
crescimento parar.

212 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 129. Propriedades de randomtrees (continuao)
Propriedades de randomtrees Valores Descrio da propriedade
min_child_node_size integer Determina o nmero mnimo de registros
permitidos em um n-filho aps o n pai
ser dividido. Se um n-filho contiver menos
registros do que o especificado aqui, o n
pai no ser dividido.
use_costs sinalizao
costs estruturado Propriedade estruturada. O formato uma
lista de 3 valores: o valor real, o valor
previsto e o custo se esta predio estiver
errada. Por exemplo:
tree.setPropertyValue("costs", [["drugA",
"drugB", 3.0], ["drugX", "drugY", 4.0]])
default_cost_increase none Nota: Ativado somente para destinos
linear ordinais.
square
custom Configure os valores padro na matriz de
custos.
max_pct_missing integer Se a porcentagem de valores omissos em
qualquer entrada for maior que o valor
especificado aqui, a entrada ser excluda.
Mnimo 0, mximo 100.
exclude_single_cat_pct integer Se um valor de categoria representar uma
porcentagem de registros maior que a
especificada aqui, o campo inteiro ser
excludo da construo de modelo. Mnimo
1, mximo 99.
max_category_number integer Se o nmero de categorias em um campo
exceder esse valor, o campo ser excludo
da construo de modelo. O mnimo 2.
min_field_variation number Se o coeficiente de variao de um campo
contnuo for menor que esse valor, o campo
ser excludo da construo de modelo.
num_bins integer Utilizado apenas se os dados forem
compostos de entradas contnuas.
Configure o nmero de categorias de
frequncia igual a ser utilizado para as
entradas; as opes so: 2, 4, 5, 10, 20, 25,
50, ou 100.

Propriedades de regressionnode
A regresso linear uma tcnica de estatstica comum para resumir dados e fazer predies
ao ajustar uma linha ou superfcie reta que minimiza as discrepncias entre os valores de
sada previstos e reais.

Nota: O n Regresso dever ser substitudo pelo n Linear em uma liberao futura. Recomenda-se usar
Modelos Lineares para regresso linear de agora em diante.

Exemplo

Captulo 13. Propriedades do N de Modelagem 213


node = stream.create("regression", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Age")
node.setPropertyValue("inputs", ["Na", "K"])
node.setPropertyValue("partition", "Test")
node.setPropertyValue("use_weight", True)
node.setPropertyValue("weight_field", "Drug")
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Regression Age")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("method", "Stepwise")
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("complete_records", False)
node.setPropertyValue("tolerance", "1.0E-3")
# "Stepping..." seo
node.setPropertyValue("stepping_method", "Probability")
node.setPropertyValue("probability_entry", 0.77)
node.setPropertyValue("probability_removal", 0.88)
node.setPropertyValue("F_value_entry", 7.0)
node.setPropertyValue("F_value_removal", 8.0)
# "Output..." seo
node.setPropertyValue("model_fit", True)
node.setPropertyValue("r_squared_change", True)
node.setPropertyValue("selection_criteria", True)
node.setPropertyValue("descriptives", True)
node.setPropertyValue("p_correlations", True)
node.setPropertyValue("collinearity_diagnostics", True)
node.setPropertyValue("confidence_interval", True)
node.setPropertyValue("covariance_matrix", True)
node.setPropertyValue("durbin_watson", True)

Tabela 130. Propriedades de regressionnode


Propriedades de regressionnode Valores Descrio da propriedade
target campo Os modelos de regresso requerem um
nico campo de destino e um ou mais
campos de entrada. Um campo de
ponderao tambm pode ser especificado.
Consulte o tpico Propriedades Comuns
do N de Modelagem na pgina 157 para
obter mais informaes.
method Inserir
Stepwise
Backwards
Avanar
include_constant sinalizador
use_weight sinalizador
weight_field campo
mode Simple
Expert
complete_records sinalizador
tolerance 1.0E-1 Utiliza aspas duplas para argumentos.
1.0E-2
1.0E-3
1.0E-4
1.0E-5
1.0E-6
1.0E-7
1.0E-8
1.0E-9
1.0E-10
1.0E-11
1.0E-12

214 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 130. Propriedades de regressionnode (continuao)
Propriedades de regressionnode Valores Descrio da propriedade
stepping_method useP useP : usa a probabilidade de F
useF useF: utiliza o valor F
probability_entry nmero
probability_removal nmero
F_value_entry nmero
F_value_removal nmero
selection_criteria sinalizador
confidence_interval sinalizador
covariance_matrix sinalizador
collinearity_diagnostics sinalizador
regression_coefficients sinalizador
exclude_fields sinalizador
durbin_watson sinalizador
model_fit sinalizador
r_squared_change sinalizador
p_correlations sinalizador
descriptives sinalizador
calculate_variable_importance sinalizador

Propriedades de sequencenode
O n de Sequncia descobre regras de associao em dados sequenciais ou orientados por
tempo. Uma sequncia uma lista de conjuntos de itens que tende a ocorrer em uma ordem
previsvel. Por exemplo, um cliente que compra um aparelho de barbear e uma loo
ps-barba pode comprar um creme de barbear na prxima compra. O n de Sequncia
baseado no algoritmo das regras de associao CARMA, que usa um mtodo eficiente de dois
passos para localizar sequncias.

Exemplo
node = stream.create("sequence", "My node")
# "Fields" tab
node.setPropertyValue("id_field", "Age")
node.setPropertyValue("contiguous", True)
node.setPropertyValue("use_time_field", True)
node.setPropertyValue("time_field", "Date1")
node.setPropertyValue("content_fields", ["Drug", "BP"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Sequence_test")
node.setPropertyValue("use_partitioned_data", False)
node.setPropertyValue("min_supp", 15.0)
node.setPropertyValue("min_conf", 14.0)
node.setPropertyValue("max_size", 7)
node.setPropertyValue("max_predictions", 5)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("use_max_duration", True)
node.setPropertyValue("max_duration", 3.0)
node.setPropertyValue("use_pruning", True)
node.setPropertyValue("pruning_value", 4.0)
node.setPropertyValue("set_mem_sequences", True)

Captulo 13. Propriedades do N de Modelagem 215


node.setPropertyValue("mem_sequences", 5.0)
node.setPropertyValue("use_gaps", True)
node.setPropertyValue("min_item_gap", 20.0)
node.setPropertyValue("max_item_gap", 30.0)

Tabela 131. Propriedades de sequencenode


Propriedades de sequencenode Valores Descrio da propriedade
id_field campo Para criar um modelo de Sequncia,
necessrio especificar um campo de ID, um
campo de tempo opcional e um ou mais
campos de contedo. Os campos de peso e
de frequncia no so utilizados. Consulte
o tpico Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
time_field campo
use_time_field sinalizador
content_fields [field1 ... fieldn]
contiguous sinalizador
min_supp nmero
min_conf nmero
max_size nmero
max_predictions nmero
mode Simple
Expert
use_max_duration sinalizador
max_duration nmero
use_gaps sinalizador
min_item_gap nmero
max_item_gap nmero
use_pruning sinalizador
pruning_value nmero
set_mem_sequences sinalizador
mem_sequences integer

Propriedades de slrmnode
O n Self-Learning Response Model (SLRM) permite construir um modelo no qual um nico
novo caso, ou um pequeno nmero de novos casos, pode ser usado para estimar novamente
o modelo sem precisar treinar o modelo outra vez usando todos os dados.

Exemplo
node = stream.create("slrm", "My node")
node.setPropertyValue("target", "Offer")
node.setPropertyValue("target_response", "Response")
node.setPropertyValue("inputs", ["Cust_ID", "Age", "Ave_Bal"])

216 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 132. Propriedades de slrmnode
Propriedades de slrmnode Valores Descrio da propriedade
target campo O campo de destino deve ser um campo
nominal ou de sinalizao. Um campo de
frequncia tambm pode ser especificado.
Consulte o tpico Propriedades Comuns
do N de Modelagem na pgina 157 para
obter mais informaes.
target_response campo O Tipo deve ser sinalizador.
continue_training_existing_model sinalizador
target_field_values sinalizador Utiliza tudo: Usa todos os valores da
origem.

Especifique: Selecione valores necessrios.


target_field_values_specify [field1 ... fieldN]
include_model_assessment sinalizador
model_assessment_random_seed nmero Deve ser um nmero real.
model_assessment_sample_size nmero Deve ser um nmero real.
model_assessment_iterations nmero Nmero de iteraes.
display_model_evaluation sinalizador
max_predictions nmero
randomization nmero
scoring_random_seed nmero
sort Ascending Especifica se ofertas com as escoragens
Descending mais altas ou mais baixas sero exibidas
primeiro.
model_reliability sinalizador
calculate_variable_importance sinalizador

Propriedades de statisticsmodelnode
O n Modelo de Estatsticas permite analisar e trabalhar com seus dados executando os
procedimentos do IBM SPSS Statistics que produzem o PMML. Esse n requer uma cpia
licenciada do IBM SPSS Statistics.

As propriedades desse n so descritas em Propriedades de statisticsmodelnode na pgina 302.

Propriedades de stpnode
O n Spatio-Temporal Prediction (STP) usa dados que contm dados de localizao, campos
de entrada para previso (preditores), um campo de tempo e um campo de resposta. Cada
localizao tem inmeras linhas nos dados que representam os valores de cada preditor em
cada momento da medio. Aps os dados serem analisados, eles podem ser usados para
prever valores de resposta em qualquer localizao dentro dos dados de forma usados na
anlise.

Captulo 13. Propriedades do N de Modelagem 217


Tabela 133. Propriedades de stpnode
Propriedades de stpnode Tipo de dados Descrio da propriedade
Guia Campos
target campo Este o campo de destino.
location campo O campo de local para o modelo.
Apenas campos geoespaciais so
permitidos.
location_label campo O campo categrico a ser utilizado na
sada para rotular os locais escolhidos
em local
time_field campo O campo de tempo para o modelo.
Apenas os campos com medio
contnua so permitidos e o tipo de
armazenamento deve ser hora, data,
registro de data e hora ou nmero
inteiro.
inputs [field1 ... fieldN] Uma lista de campos de entrada.
Guia Intervalos de Tempo
interval_type_timestamp Years
Quarters
Months
Weeks
Days
Hours
Minutes
Seconds
interval_type_date Years
Quarters
Months
Weeks
Days
interval_type_time Hours Limita o nmero de dias por semana
Minutes que so levados em conta ao criar o
Seconds ndice de tempo que o STP utiliza
para o clculo
interval_type_integer Periods O intervalo no qual o conjunto de
(Apenas campos de ndice de dados ser convertido. A seleo
tempo, armazenamento Nmero disponvel depende do tipo de
Inteiro) armazenamento do campo que
escolhido como o time_field para o
modelo.
period_start integer
start_month Janeiro O ms em que o modelo iniciar a
Fevereiro indexao (por exemplo, se
Maro configurado para March, mas o
Abril primeiro registro no conjunto de
May dados for January, o modelo ignorar
Junho os dois primeiros registros e iniciar a
July indexao em maro.
August
September
October
November
December

218 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 133. Propriedades de stpnode (continuao)
Propriedades de stpnode Tipo de dados Descrio da propriedade
week_begins_on Sunday O ponto de incio para o ndice de
Monday tempo criado pelo STP a partir dos
Tuesday dados
Wednesday
Thursday
Friday
Saturday
days_per_week integer O mnimo 1 e o mximo 7, em
incrementos de 1.
hours_per_day integer O nmero de horas que o modelo
conta para um dia. Se isto for
configurado para 10, o modelo
comear a indexar no horrio
day_begins_at e continuar a
indexao por 10 horas, em seguida,
ir para o prximo valor que
corresponder ao valor de
day_begins_at, e assim por diante.
day_begins_at 00:00 Configura o valor de hora na qual o
01:00 modelo inicia a indexao.
02:00
03:00
...
23:00
interval_increment 1 Essa configurao de incremento
2 para minutos ou segundos. Isso
3 determina onde o modelo cria ndices
4 dos dados. Assim, com um incremento
5 de 30 e um tipo de intervalo seconds,
6 o modelo criar um ndice dos dados
10 a cada 30 segundos.
12
15
20
30
data_matches_interval Boolean Se configurado como N, a converso
dos dados para o interval_type
regular ocorre antes de o modelo ser
construdo.

Se seus dados j estiverem no formato


correto, e se o interval_type e
quaisquer configuraes associadas
corresponderem aos seus dados,
configure isto como Y para evitar a
converso ou agregao de seus
dados.

Configurar isso como Y desativa todos


os controles de Agregao.

Captulo 13. Propriedades do N de Modelagem 219


Tabela 133. Propriedades de stpnode (continuao)
Propriedades de stpnode Tipo de dados Descrio da propriedade
agg_range_default Sum Isto determina o mtodo de agregao
Mdia padro utilizado para campos
Min contnuos. Todos os campos contnuos
Mx. que no estiverem especificamente
Mediana includos na agregao customizada
1stQuartile sero agregados utilizando o mtodo
3rdQuartile especificado aqui.
custom_agg [[field, aggregation Propriedade estruturada:
method],[]..]
Script parameter: custom_agg
Demo:
[[x5 FirstQuartile][x4 Por exemplo:
Sum]] set :stpnode.custom_agg = [
[field1 function]
[field2 function]
]

Em que function a funo de


agregao a ser utilizada com esse
campo.
Guia Configuraes Bsicas
include_intercept sinalizador
max_autoregressive_lag integer O mnimo 1 e o mximo 5, em
incrementos de 1. Este o nmero de
registros anteriores necessrios para
uma predio. Portanto, se
configurado para 5, por exemplo, os 5
registros anteriores sero utilizados
para criar uma nova previso. O
nmero de registros especificado aqui
a partir dos dados de construo
incorporado no modelo e, portanto, o
usurio no precisa fornecer os dados
novamente quando escorar o modelo.
estimation_method Parametric O mtodo para modelar a matriz de
Nonparametric covarincias espacial
parametric_model Gaussian Parmetro de ordem para o modelo
Exponential de covarincia espacial Parametric
PoweredExponential
exponential_power nmero Nvel de energia para o modelo
PoweredExponential. Mnimo 1,
mximo 2.
Guia Avanado
max_missing_values integer A porcentagem mxima permitida de
registros com valores ausentes no
modelo.
significance nmero O nvel de significncia para teste de
hipteses na construo de modelo.
Especifica o valor de significncia para
todos os testes na estimativa do
modelo do STP, incluindo dois testes
de Qualidade do ajuste, testes de
Efeito F e testes de coeficiente t.

220 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 133. Propriedades de stpnode (continuao)
Propriedades de stpnode Tipo de dados Descrio da propriedade
Guia Sada
model_specifications sinalizador
temporal_summary sinalizador
location_summary sinalizador Determina se a tabela Resumo do
Local includa na sada do modelo.
model_quality sinalizador
test_mean_structure sinalizador
mean_structure_coefficients sinalizador
autoregressive_coefficients sinalizador
test_decay_space sinalizador
parametric_spatial_covariance sinalizador
correlations_heat_map sinalizador
correlations_map sinalizador
location_clusters sinalizador
similarity_threshold nmero O limite no qual os clusters de sada
so considerados semelhantes o
suficiente para serem mesclados em
um nico cluster.
max_number_clusters integer O limite superior para o nmero de
clusters que podem ser includos na
sada do modelo.
Guia Opes de Modelo
use_model_name sinalizador
model_name string
uncertainty_factor nmero Mnimo 0, mximo 100. Determina o
aumento de incerteza (erro) aplicado
s predies no futuro. Ele representa
os limites superior e inferior para as
predies.

Propriedades de svmnode
O n Support Vector Machine (SVM) permite ordenar dados em dois grupos sem super
ajuste. SVM trabalha bem com conjuntos de dados grandes, como aqueles com um nmero
muito grande de campos de entrada.

Exemplo
node = stream.create("svm", "My node")
# Expert tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("kernel", "Polynomial")
node.setPropertyValue("gamma", 1.5)

Captulo 13. Propriedades do N de Modelagem 221


Tabela 134. Propriedades de svmnode.
Propriedades de svmnode Valores Descrio da propriedade
all_probabilities sinalizador
stopping_criteria 1.0E-1 Determina quando parar o algoritmo
1.0E-2 de otimizao.
1.0E-3 (default)
1.0E-4
1.0E-5
1.0E-6
regularization number Tambm conhecido como o parmetro
C.
precision number Utilizado apenas se o nvel de
medio do campo de destino for
Continuos.
kernel RBF(padro) Tipo de funo de kernel usado para a
Polynomial transformao.
Sigmoid
Linear
rbf_gamma number Utilizado apenas se kernel for RBF.
gamma number Utilizado apenas se Kernel fora
Polynomial ou Sigmoide.
bias number
degree number Utilizado apenas se kernel for
Polynomial.
calculate_variable_importance sinalizador
calculate_raw_propensities sinalizador

calculate_adjusted_ sinalizador
propensities
adjusted_propensity_partition Teste
Validation

Propriedades de tcmnode
A modelagem causal temporal tenta descobrir relacionamentos causais chave nos dados de
sries temporais. Na modelagem causal temporal, voc especifica um conjunto de sries de
destino e um conjunto de entradas candidatas a esses destinos. Em seguida, o procedimento
constri um modelo de srie temporal autorregressivo para cada destino e inclui somente as
entradas que tiverem o relacionamento causal mais significativo com o destino.

Tabela 135. Propriedades de tcmnode


Propriedades de tcmnode Values Descrio da propriedade
custom_fields Boolean
dimensionlist [dimension1 ... dimensionN]
data_struct Multiple
Single
metric_fields campos
both_target_and_input [f1 ... fN]
targets [f1 ... fN]

222 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 135. Propriedades de tcmnode (continuao)
Propriedades de tcmnode Values Descrio da propriedade
candidate_inputs [f1 ... fN]
forced_inputs [f1 ... fN]
use_timestamp Timestamp
Perodo
input_interval None
Unknown
Ano
Trimestre
Ms
Semana
Day
Hora
Hour_nonperiod
Minuto
Minute_nonperiod
Segundo
Second_nonperiod
period_field string
period_start_value integer
num_days_per_week integer
start_day_of_week Sunday
Segunda-feira
Tera-feira
Quarta-feira
Quinta-feira
Sexta-feira
Sbado
num_hours_per_day integer
start_hour_of_day integer
timestamp_increments integer
cyclic_increments integer
cyclic_periods list
output_interval None
Ano
Trimestre
Ms
Semana
Day
Hora
Minuto
Segundo
is_same_interval Same
Notsame
cross_hour Boolean
aggregate_and_distribute list
aggregate_default Mdia
Sum
Modo
Min
Mx.

Captulo 13. Propriedades do N de Modelagem 223


Tabela 135. Propriedades de tcmnode (continuao)
Propriedades de tcmnode Values Descrio da propriedade
distribute_default Mdia
Sum
group_default Mdia
Sum
Modo
Min
Mx.
missing_imput Linear_interp
Series_mean
K_mean
K_meridian
Linear_trend
Nenhum
k_mean_param integer
k_median_param integer
missing_value_threshold integer
conf_level integer
max_num_predictor integer
max_lag integer
epsilon nmero
threshold integer
is_re_est Boolean
num_targets integer
percent_targets integer
fields_display list
series_display list
network_graph_for_target Boolean
sign_level_for_target nmero
fit_and_outlier_for_target Boolean
sum_and_para_for_target Boolean
impact_diag_for_target Boolean
impact_diag_type_for_target Effect
Cause
Ambos
impact_diag_level_for_target integer
series_plot_for_target Boolean
res_plot_for_target Boolean
top_input_for_target Boolean
forecast_table_for_target Boolean
same_as_for_target Boolean
network_graph_for_series Boolean
sign_level_for_series nmero
fit_and_outlier_for_series Boolean

224 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 135. Propriedades de tcmnode (continuao)
Propriedades de tcmnode Values Descrio da propriedade
sum_and_para_for_series Boolean
impact_diagram_for_series Boolean
impact_diagram_type_for_series Effect
Cause
Ambos
impact_diagram_level_for_series integer
series_plot_for_series Boolean
residual_plot_for_series Boolean
forecast_table_for_series Boolean
outlier_root_cause_analysis Boolean
causal_levels integer
outlier_table Interactive
Pivot
Ambos
rmsp_error Boolean
bic Boolean
r_square Boolean
outliers_over_time Boolean
series_transormation Boolean
use_estimation_period Boolean
estimation_period Times
Observation
observations list
observations_type Mais recente
Mais Antigo
observations_num integer
observations_exclude integer
extend_records_into_future Boolean
forecastperiods integer
max_num_distinct_values integer
display_targets FIXEDNUMBER
PERCENTAGE
goodness_fit_measure ROOTMEAN
BIC
RSQUARE
top_input_for_series Boolean
aic Boolean
rmse Boolean

Captulo 13. Propriedades do N de Modelagem 225


Propriedades de timeseriesnode
O n Sries Temporais estima modelos de suavizao exponencial, Mdia Mvel Integrada
AutoRegressiva (ARIMA) univariada e ARIMA multivariada (ou funo de transferncia) para
dados de sries temporais e produz previses do desempenho futuro. Um n Sries
Temporais deve ser sempre precedido por um n Intervalos de Tempo.

Exemplo
node = stream.create("timeseries", "My node")
node.setPropertyValue("method", "Exsmooth")
node.setPropertyValue("exsmooth_model_type", "HoltsLinearTrend")
node.setPropertyValue("exsmooth_transformation_type", "None")

Tabela 136. Propriedades de timeseriesnode


Propriedades de timeseriesnode Valores Descrio da propriedade
targets campo O n Sries Temporais prev
um ou mais destinos,
utilizando, opcionalmente,
um ou mais campos de
entrada como preditores. Os
campos de frequncia e de
ponderao no so
utilizados. Consulte o tpico
Propriedades Comuns do
N de Modelagem na
pgina 157 para obter mais
informaes.
continue sinalizador
method ExpertModeler
Exsmooth
Arima
Reuse
expert_modeler_method sinalizador
consider_seasonal sinalizador
detect_outliers sinalizador
expert_outlier_additive sinalizador
expert_outlier_level_shift sinalizador
expert_outlier_innovational sinalizador
expert_outlier_level_shift sinalizador
expert_outlier_transient sinalizador
expert_outlier_seasonal_additive sinalizador
expert_outlier_local_trend sinalizador
expert_outlier_additive_patch sinalizador
exsmooth_model_type Simples
HoltsLinearTrend
BrownsLinearTrend
DampedTrend
SimpleSeasonal
WintersAdditive
WintersMultiplicative

226 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 136. Propriedades de timeseriesnode (continuao)
Propriedades de timeseriesnode Valores Descrio da propriedade
exsmooth_transformation_type None
SquareRoot
NaturalLog
arima_p integer
arima_d integer
arima_q integer
arima_sp integer
arima_sd integer
arima_sq integer
arima_transformation_type None
SquareRoot
NaturalLog
arima_include_constant sinalizador
tf_arima_p. fieldname integer Para funes de
transferncia.
tf_arima_d. fieldname integer Para funes de
transferncia.
tf_arima_q. fieldname integer Para funes de
transferncia.
tf_arima_sp. fieldname integer Para funes de
transferncia.
tf_arima_sd. fieldname integer Para funes de
transferncia.
tf_arima_sq. fieldname integer Para funes de
transferncia.
tf_arima_delay. fieldname integer Para funes de
transferncia.
tf_arima_transformation_type. fieldname None Para funes de
SquareRoot transferncia.
NaturalLog
arima_detect_outlier_mode None
Automtico
arima_outlier_additive sinalizador
arima_outlier_level_shift sinalizador
arima_outlier_innovational sinalizador
arima_outlier_transient sinalizador
arima_outlier_seasonal_additive sinalizador
arima_outlier_local_trend sinalizador
arima_outlier_additive_patch sinalizador
conf_limit_pct real
max_lags integer
events campos

Captulo 13. Propriedades do N de Modelagem 227


Tabela 136. Propriedades de timeseriesnode (continuao)
Propriedades de timeseriesnode Valores Descrio da propriedade
scoring_model_only sinalizador Utilize para modelos com
nmeros muito grandes
(dezenas de milhares) de
sries temporais.

Propriedades de treeas
O n rvore-AS estar disponvel apenas se voc tiver uma conexo com o IBM SPSS
Analytic Server. Este n semelhante ao n CHAID existente, no entanto, o n rvore-AS
projetado para processar Big Data para criar uma rvore nica e exibe o modelo resultante no
visualizador de sada que foi includo no SPSS Modeler verso 17. O n gera uma rvore de
deciso usando estatsticas qui-quadrado (CHAID) para identificar divises ideais. Essa
utilizao do CHAID pode gerar rvores no binrias, o que significa que algumas divises
possuem mais de duas ramificaes. Os campos de destino e de entrada podem ser um
intervalo numrico (contnuo) ou categricos. Um CHAID exaustivo uma modificao de
CHAID que faz um trabalho mais profundo de examinar todas as divises possveis, porm
demora mais tempo para calcular.

Tabela 137. Propriedades de treeas


Propriedades de treeas Valores Descrio da propriedade
target campo No n rvore do AS, os modelos CHAID
requerem um nico destino e um ou mais
campos de entrada. Um campo de
frequncia tambm pode ser especificado.
Consulte o tpico Propriedades Comuns
do N de Modelagem na pgina 157 para
obter mais informaes.
method chaid
exhaustive_chaid
max_depth integer Profundidade mxima da rvore, de 0 a 20.
O valor padro 5.
num_bins integer Utilizado apenas se os dados forem
compostos de entradas contnuas.
Configure o nmero de categorias de
frequncia igual a ser utilizado para as
entradas; as opes so: 2, 4, 5, 10, 20, 25,
50, ou 100.
record_threshold integer O nmero de registros no qual o modelo
alternar do uso de valores-p para
tamanhos de Efeito ao construir a rvore. O
padro 1.000.000; aumente ou diminua
isso em incrementos de 10.000.
split_alpha number Nvel de significncia para diviso. O valor
deve estar entre 0,01 e 0,99.
merge_alpha number Nvel de significncia para mesclagem. O
valor deve estar entre 0,01 e 0,99.
bonferroni_adjustment sinalizao Ajusta valores de significncia usando o
mtodo de Bonferroni.

228 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 137. Propriedades de treeas (continuao)
Propriedades de treeas Valores Descrio da propriedade
effect_size_threshold_cont number Configure o limite de tamanho do Efeito ao
dividir os ns e mesclar as categorias
quando usar uma varivel resposta
contnua. O valor deve estar entre 0,01 e
0,99.
effect_size_threshold_cat number Configure o limite de tamanho do Efeito ao
dividir os ns e mesclar as categorias
quando usar uma varivel resposta
categrica. O valor deve estar entre 0,01 e
0,99.
split_merged_categories sinalizao Permite rediviso de categorias mescladas.
grouping_sig_level number Utilizado para determinar como os grupos
de ns so formados ou como ns
incomuns so identificados.
chi_square pearson Mtodo utilizado para calcular a estatstica
likelihood_ratio chi-quadrada: Razo de Verossimilhana ou
Pearson
minimum_record_use use_percentage
use_absolute
min_parent_records_pc number O valor padro 2, o mnimo 1 e o
mximo 100, em incrementos de 1. O
valor de ramificao pai deve ser superior
ramificao filha.
min_child_records_pc number O valor padro 1, o mnimo 1 e o
mximo 100, em incrementos de 1.
min_parent_records_abs number O valor padro 100. O mnimo 1 e o
mximo 100, em incrementos de 1. O
valor de ramificao pai deve ser superior
ramificao filha.
min_child_records_abs number O valor padro 50. O mnimo 1 e o
mximo 100, em incrementos de 1.
epsilon number Mudana mnima nas frequncias de clula
esperadas.
max_iterations number Iteraes mximas para convergncia.
use_costs sinalizao
costs estruturado Propriedade estruturada. O formato uma
lista de 3 valores: o valor real, o valor
previsto e o custo se esta predio estiver
errada. Por exemplo:
tree.setPropertyValue("costs", [["drugA",
"drugB", 3.0], ["drugX", "drugY", 4.0]])
default_cost_increase none Nota: Ativado somente para destinos
linear ordinais.
square
custom Configure os valores padro na matriz de
custos.
calculate_conf sinalizao
display_rule_id sinalizao Inclui um campo na sada de escoragem
que indica o ID do n terminal para o qual
cada registro designado.

Captulo 13. Propriedades do N de Modelagem 229


Propriedades de twostepnode
O n TwoStep usa um mtodo de clusterizao em dois passos. O primeiro passo faz uma
simples passagem pelos dados para compactar os dados de entrada brutos em um conjunto
gerencivel de subclusters. O segundo passo usa um mtodo de armazenamento em cluster
hierrquico para mesclar progressivamente os subclusters em clusters cada vez maiores.
TwoStep tem a vantagem de estimar automaticamente o nmero ideal de clusters para dados
de treinamento. Ele pode manipular tipos mistos de campos e conjuntos grandes de dados de
forma eficiente.

Exemplo
node = stream.create("twostep", "My node")
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Age", "K", "Na", "BP"])
node.setPropertyValue("partition", "Test")
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "TwoStep_Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("exclude_outliers", True)
node.setPropertyValue("cluster_label", "String")
node.setPropertyValue("label_prefix", "TwoStep_")
node.setPropertyValue("cluster_num_auto", False)
node.setPropertyValue("max_num_clusters", 9)
node.setPropertyValue("min_num_clusters", 3)
node.setPropertyValue("num_clusters", 7)

Tabela 138. Propriedades de twostepnode


Propriedades de twostepnode Valores Descrio da propriedade
inputs [field1 ... fieldN] Os modelos de TwoStep utilizam uma lista
de campos de entrada, mas no de destino.
Os campos de peso e de frequncia no so
reconhecidos. Consulte o tpico
Propriedades Comuns do N de
Modelagem na pgina 157 para obter mais
informaes.
standardize sinalizador
exclude_outliers sinalizador
percentage nmero
cluster_num_auto sinalizador
min_num_clusters nmero
max_num_clusters nmero
num_clusters nmero
cluster_label Sequncia de caracteres
Processo Processo
label_prefix string
distance_measure Euclidean
Loglikelihood
clustering_criterion AIC
BIC

230 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Propriedades de twostepAS
O Cluster TwoStep uma ferramenta exploratria projetada para revelar agrupamentos
naturais (ou clusters) dentro de um conjunto de dados que, de outra forma, no seriam
aparentes. O algoritmo que utilizado por este procedimento possui vrios recursos
desejveis que o diferenciam das tcnicas tradicionais de armazenamento em cluster, como
manipulao de variveis categricas e contnuas, seleo automtica do nmero de clusters e
escalabilidade.

Tabela 139. Propriedades de twostepAS


Propriedades de twostepAS Valores Descrio da propriedade
inputs [f1 ... fN] Os modelos de TwoStepAS
utilizam uma lista de campos
de entrada, mas no de
destino. Os campos de peso e
de frequncia no so
reconhecidos.
use_predefined_roles Booleano Default=True
use_custom_field_assignments Booleano Default=False
cluster_num_auto Booleano Default=True
min_num_clusters integer Default=2
max_num_clusters nmero inteiro Default=15
num_clusters nmero inteiro Default=5
clustering_criterion AIC
BIC
automatic_clustering_method use_clustering_criterion_setting

Distance_jump
Mnimo
Mximo
feature_importance_method use_clustering_criterion_setting

effect_size
use_random_seed Booleano
random_seed integer
distance_measure Euclidean
Loglikelihood
include_outlier_clusters Booleano Default=True
num_cases_in_feature_tree_leaf_is_less_than nmero inteiro Default=10
top_perc_outliers nmero inteiro Default=5
initial_dist_change_threshold nmero inteiro Default=0
leaf_node_maximum_branches nmero inteiro Default=8
non_leaf_node_maximum_branches nmero inteiro Default=8
max_tree_depth nmero inteiro Default=3
adjustment_weight_on_measurement_level nmero inteiro Default=6
memory_allocation_mb number Default=512
delayed_split Booleano Default=True
fields_to_standardize [f1 ... fN]

Captulo 13. Propriedades do N de Modelagem 231


Tabela 139. Propriedades de twostepAS (continuao)
Propriedades de twostepAS Valores Descrio da propriedade
adaptive_feature_selection Booleano Default=True
featureMisPercent nmero inteiro Default=70
coefRange number Default=0.05
percCasesSingleCategory nmero inteiro Default=95
numCases nmero inteiro Default=24
include_model_specifications Booleano Default=True
include_record_summary Booleano Default=True
include_field_transformations Booleano Default=True
excluded_inputs Booleano Default=True
evaluate_model_quality Booleano Default=True
show_feature_importance bar chart Booleano Default=True
show_feature_importance_ word_cloud Booleano Default=True
show_outlier_clusters Booleano Default=True
interactive_table_and_chart
show_outlier_clusters_pivot_table Booleano Default=True
across_cluster_feature_importance Booleano Default=True
across_cluster_profiles_pivot_table Booleano Default=True
withinprofiles Booleano Default=True
cluster_distances Booleano Default=True
cluster_label Sequncia de caracteres
Processo Processo
label_prefix String

232 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Captulo 14. Propriedades do N de Nugget do Modelo
Os ns de nugget do modelo compartilham as mesmas propriedades comuns que outros ns. Consulte o
tpico Propriedades Comuns do N na pgina 69 para obter mais informaes.

Propriedades de applyanomalydetectionnode
Os ns de modelagem de Deteco de Anomalias podem ser utilizados para gerar um nugget do modelo
de Deteco de Anomalias. O nome de script deste nugget do modelo applyanomalydetectionnode. Para
obter mais informaes sobre como criar script do prprio n de modelagem, consulte Propriedades de
anomalydetectionnode na pgina 157.
Tabela 140. Propriedades de applyanomalydetectionnode.
Propriedades de
applyanomalydetectionnode Valores Descrio da propriedade
anomaly_score_method FlagAndScore Determina quais sadas so criadas para
FlagOnly escoragem.
ScoreOnly
num_fields nmero inteiro Campos para relatrio.
discard_records sinalizador Indica se os registros so descartados a partir da
sada ou no.
discard_anomalous_records sinalizador Indicador que determina se registros anmalos
ou no anmalos devem ser descartados. O
padro off, o que significa que registros no
anmalos so descartados. Caso contrrio, se for
on, registros anmalos sero descartados. Esta
propriedade ser ativada somente se a
propriedade discard_records for ativada.

Propriedades de applyapriorinode
Os ns de modelagem a priori podem ser utilizados para gerar um nugget do modelo a priori. O nome
de script deste nugget do modelo applyapriorinode. Para obter mais informaes sobre como criar script
do prprio n de modelagem, consulte Propriedades de apriorinode na pgina 159.
Tabela 141. Propriedades de applyapriorinode.
Propriedades de applyapriorinode Valores Descrio da propriedade
max_predictions nmero (inteiro)
ignore_unmatached sinalizador
allow_repeats sinalizador
check_basket NoPredictions
Predictions
NoCheck
criterion Confidence
Suporte
RuleSupport
Lift
Deployability

233
Propriedades de applyassociationrulesnode
O n de modelagem Regras de Associao pode ser utilizado para gerar um nugget do modelo de regras
de associao. O nome de script deste nugget do modelo applyassociationrulesnode. Para obter mais
informaes sobre como criar script do prprio n de modelagem, consulte Propriedades de
associationrulesnode na pgina 160.
Tabela 142. Propriedades de applyassociationrulesnode
Propriedades de
applyassociationrulesnode Tipo de dados Descrio da propriedade
max_predictions integer O nmero mximo de regras que podem ser
aplicadas a cada entrada na escoragem.
criterion Confidence Seleciona a medida usada para determinar a
Rulesupport fora das regras.
Lift
Conditionsupport
Implementabilidade
allow_repeats Boolean Determina se regras com a mesma predio so
includas na escoragem.
check_input NoPredictions
Predictions
NoCheck

Propriedades de applyautoclassifiernode
Os ns de modelagem Classificador Automtico podem ser utilizados para gerar um nugget do modelo
de Classificador Automtico. O nome de script neste nugget do modelo applyautoclassifiernode. Para
obter mais informaes sobre como criar script do prprio n de modelagem, consulte Propriedades de
autoclassifiernode na pgina 162
Tabela 143. Propriedades de applyautoclassifiernode.
Propriedades de
applyautoclassifiernode Valores Descrio da propriedade
flag_ensemble_method Voting Especifica o mtodo utilizado para
ConfidenceWeightedVoting determinar o escore de combinao.
RawPropensityWeightedVoting Essa configurao se aplicar apenas
HighestConfidence se o destino selecionado for um
AverageRawPropensity campo de sinalizao.
flag_voting_tie_selection Random Se um mtodo de votao for
HighestConfidence selecionado, especifica como os
RawPropensity empates sero resolvidos. Essa
configurao se aplicar apenas se o
destino selecionado for um campo de
sinalizao.
set_ensemble_method Voting Especifica o mtodo utilizado para
ConfidenceWeightedVoting determinar o escore de combinao.
HighestConfidence Essa configurao se aplicar apenas
se o destino selecionado for um
campo de conjunto.

234 Guia de Script e Automao Python do IBM SPSS Modeler 17.1


Tabela 143. Propriedades de applyautoclassifiernode (continuao).
Propriedades de
applyautoclassifiernode Valores Descrio da propriedade
set_voting_tie_selection Random Se um mtodo de votao for
HighestConfidence selecionado, especifica como os
empates sero resolvidos. Essa
configurao se aplicar apenas se o
destino selecionado for um campo
nominal.

Propriedades de applyautoclusternode
Os ns de modelagem de Cluster Automtico podem ser utilizados para gerar um nugget do modelo de
Cluster Automtico. O nome de script deste nugget do modelo applyautoclusternode. Nenhuma outra
propriedade existe para este nugget do modelo. Para obter mais informaes sobre como criar script do
prprio n de modelagem, consulte Propriedades de autoclusternode na pgina 165.

Propriedades de applyautonumericnode
Os ns de modelagem Numerao Automtica podem ser utilizados para gerar um nugget do modelo de
Numerao Automtica. O nome de script deste nugget do modelo applyautonumericnode. Para obter
mais informaes sobre como criar script do prprio n de modelagem, consulte Propriedades de
autonumericnode na pgina 166
Tabela 144. Propriedades de applyautonumericnode.
Propriedades de
applyautonumericnode Valores Descrio da propriedade
calculate_standard_error sinalizador

Propriedades de applybayesnetnode
Os ns de modelagem Rede Bayesiana podem ser utilizados para gerar um nugget do modelo Rede
Bayesiana. O nome de script neste nugget do modelo applybayesnetnode. Para obter mais informaes
sobre como criar script do prprio n de modelagem, consulte Propriedades de bayesnetnode na
pgina 167.
Tabela 145. Propriedades de applybayesnetnode.
Propriedades de applybayesnetnode Valores Descrio da propriedade
all_probabilities sinalizador
raw_propensity sinalizador
adjusted_propensity sinalizador
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador

Captulo 14. Propriedades do N de Nugget do Modelo 235


Propriedades de applyc50node
Os ns de modelagem C5.0 podem ser utilizados para gerar um nugget do modelo C5.0. O nome de
script deste nugget do modelo applyc50node. Para obter mais informaes sobre como criar script do
prprio n de modelagem, consulte Propriedades de c50node na pgina 169.
Tabela 146. Propriedades de applyc50node.
Propriedades de applyc50node Valores Descrio da propriedade
sql_generate Never Usado para configurar as opes de
NoMissingValues gerao de SQL durante a execuo do
conjunto de regras.
calculate_conf sinalizador Disponvel quando a gerao de SQL est
ativada; essa propriedade inclui clculos de
confiana na rvore gerada.
calculate_raw_propensities sinalizador
calculate_adjusted_propensities sinalizador