Você está na página 1de 10

17-11-2005

SPSS Data Mining Tips


Um guio para ajud-lo a poupar tempo e dinheiro quando planeia e executa um projecto de data mining.

ndice
Introduo ................................................................ 2 Dicas gerais para data mining .................................. 3 Compreenso do problema ...................................... 4 Compreenso dos dados .. 5 Preparao dos dados .............................................. 5 Modelizao 6 Avaliao ................................................................. 7 Distribuio dos resultados . 7 Seleco de uma ferramenta de data mining ........... 7 Concluso ................................................................ 8 A SPSS Inc .............................................................. 9 Os produtos SPSS .................................................... 9

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

1
Ref SPClem05

17-11-2005

Introduo
Voc est envolvido num projecto de data mining ? Ou vai realizar o seu primeiro projecto ? Qualquer que seja o seu nvel de experincia, o SPSS Data Mining Tips ajud-lo- a planear e executar essa tarefa. Utilize as dicas adiante apresentadas para poupar recursos tempo e dinheiro e obter resultados mensurveis. No decorrer da leitura ver smbolos que ajud-loo a compreender melhor a informao deste guio. Este smbolo indica um exemplo ilustrativo de uma dica em particular. Em caso de dvidas sobre qualquer dos temas em discusso neste documento contacte localmente a PSE ou visite o site www.spss.com. Temos ao seu dispr diversos cursos de formao e programas de consultoria tcnica sobre a implementao de projectos de data mining.. O que o data mining ? Data mining resolve um paradoxo muito comum quantos mais dados (informao) temos, mais difcil e demorado a sua anlise. O que deveria ser uma mina permanece muitas vezes inexplorado devido falta de recursos sejam estes humanos, tempo ou conhecimento. O Data mining utiliza poderosas tcnicas analticas para rapidamente extrair valor de montanhas de dados. Que dados so utilizados no data mining ? Dependendo da sua ferramenta de data mining, o seu projecto pode incluir dados provenientes das fontes mais diversas. De facto, os projectos de data mining beneficiam da utilizao de diferentes tipos de dados, sempre que cada um deles adiciona informao preciosa ao objecto em anlise. Tudo o que se relacione com informaes sobre transaces guardadas em base de dados; com respostas contidas num inqurito; com registos dos acessos a pginas na internet; ou com informao textual, pode contribuir para aumentar a qualidade dos resultados finais. Recentes avanos na tecnologia analtica originaram dois novos tipos de mining text mining e web mining. Estas duas tecnologias abrem novas formas de abordagem da informao no estruturada sejam respostas de opinio a questes abertas em inquritos ou ficheiros de log nos servidores de stios na internet acrescentando informao valiosa sobre opinies e preferncias que do a conhecer o porqu de determinada aco ou comportamento.

Data mining e anlise predictiva O data mining descobre padres nos dados utilizando tcnicas predictivas. A anlise predictiva combina estas tcnicas analticas avanadas com a optimizao do processo de deciso ou seja, os resultados analticos so utilizados para determinar quais as aces que produziro maiores benefcios para a instituio. Estas recomendaes, bem como toda a informao que as suportam, so disponibilizadas s pessoas e sistemas que decidem. Em que que o data mining diferente de um sistema OLAP ou de reporting de informao ? As ferramentas OLAP (online analtical processing) e de reporting so importantes para compreender o que aconteceu no passado. Data mining o processo para conhecer o que acontecer no futuro. O data mining utiliza modelos predictivos, sejam estes estatsticos ou de auto aprendizagem (do tipo rede neuronal), para prever o que acontecer. Por exemplo, uma pesquisa de informao permite-nos obter resultados sobre o que vendemos no ms de Janeiro do ano de 2005; um quadro OLAP permitenos ir um pouco mais longe, saber tambm essa informao por famlia de produtos; um projecto data mining dir-nos- quem ter maior propenso para comprar cada um dos nossos produtos no prximo ms. E com base nesta informao poderemos construir uma campanha de marketing com ofertas personalizadas para cada um dos segmentos identificados. Em que que o data mining diferente da estatstica ? O data mining no substitui a estatstica. De facto, a estatstica um bom complemento dos projectos de data mining. As tcnicas estatsticas tradicionais, como a regresso, so utilizadas a par das tecnologias de data mining como o caso das redes neuronais. As estatsticas so muitas vezes utilizadas para validar os resultados de data mining. Porqu usar o data mining ? Quando dispe de instrumentos fiveis para projectar o futuro do seu negcio, Voc tem o poder de tomar hoje as decises correctas. O data mining ajuda-o a gerir e actuar sobre a evoluo do seu negcio, porque lhe permite compreender melhor as razes dos acontecimentos passados e presentes e projectar os cenrios futuros mais previsveis. Por exemplo, o data mining diz-lhe quais os prospects que tm mais probabilidade de se transformarem em seus clientes e quais aqueles que tm mais propenso a responder sua proposta de valor. Com esta viso do futuro, aumenta o retorno do seu investimento (ROI). As suas decises basearam-se numa viso de negcio e no num instinto ou num impulso.

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

2
Ref SPClem05

17-11-2005

Que problemas podero ser solucionados por um projecto de data mining ? O data mining pode ser-lhe extremamente til em qualquer actividade que envolva dados, por exemplo: Aumentar vendas a clientes Conhecer segmentos de clientes e as suas preferncias Identificar os clientes mais rentveis e criar estratgias para ret-los Adquirir novos clientes Aumentar a capacidade de cross-selling e de up-selling Aumentar o ROI de campanhas de marketing, atravs de melhor identificao dos alvos Detectar situaes de abuso, desperdcio e fraude Determinar riscos de crdito Aumentar a rentabilidade do seu stio na internet Monitorar a perfomance da sua actividade Como que se implementa um projecto de data mining ? Os produtos de data mining SPSS Clementine e os servios que lhe esto associados, asseguram-lhe resultados fiveis e mensurveis porque se baseiam numa metodologia de implementao conhecida por CRISP-DM (Cross-Industry Standard Process for Data Mining). Esta metodologia est estruturada em torno de tarefas e objectivos para cada uma das fases do projecto de data mining. uma metodologia no proprietria e adoptada por um consrcio internacional de empresas, em que se inclui a SPSS Inc. A metodologia CRISP-DM inclui 6 fases: Compreenso do problema obter uma viso clara das necessidades a satisfazer; Compreenso dos dados determinar quais os dados disponveis (e onde se encontram) para encontrar respostas; Preparao dos dados Adaptar e formatar os dados de forma apropriada s respostas a encontrar; Modelizao criar modelos explicativos das necessidades a satisfazer; Avaliao testar os resultados encontrados contra os objectivos do projecto; Distribuio dos resultados disponibilizar os resultados do projecto aos decisores.

Dicas gerais para data mining


Prepare-se para o sucesso Siga a metodologia CRISP-DM Utilizando o CRISP-DM como um guio de projecto, garante o seu sucesso. crtico desenvolver o projecto segundo uma metodologia testada as tecnologias complexas de data mining e os grandes volumes de dados disponveis podem sobrevalorizar-se num projecto em que as necessidades a prover no esto convictamente assimiladas pela equipa. Comece com a mente focada nos finalmente Para ser capaz de mostrar o retorno (ROI, ganho, ..) do projecto, deve saber antes de comear como sero avaliados os resultados (ou seja, que mtricas utilizar na sua medio ? Como calcul-las ? ). Por exemplo, o nosso objectivo reduzir a taxa de churning (perda de clientes) de 70 para 60%. Como que traduz esta informao em volume de receita recuperada (ou no perdida) ? Ou, quanto ganharia se em vez de atingir o objectivo de 60% atingisse 58% ? Coloque as expectativas no stio certo Tenha a certeza de que os responsveis da sua instituio sabem que o data mining no uma poo mgica que automaticamente resolve os problemas. O data mining um processo de negcio. E como tal tem que existir um problema resolvel e trabalho para encontrar uma soluo. Se planeia segmentar clientes para qualquer aco do seu departamento de marketing, faa com que estes saibam qual o tipo de informao que vo receber como resultado do projecto (por exemplo, estamos a utilizar informao sobre os produtos e as caractersticas demogrficas dos clientes, pelo que esperamos fornecer segmentos defenidos pela idade, pelo rendimento, etc... e indicaremos qual o mix de produtos preferidos para cada um destes segmentos de clientes). Limite a abrangncia do projecto inicial Comece com objectivos realsticos e prazos defenidos. medida que vai tendo sucesso, passe para projectos mais complexos. Crie um grupo de apoio ao projecto Um projecto de data mining um esforo de grupo. Requer-se que os utilizadores finais estejam presentes porque eles conhecem os dados e as informaes relevantes subjacentes ao problema. Mas tambm so necessrias pessoas que percebam o que a anlise de dados. E aqueles que permitem o acesso aos dados no podem faltar.

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

3
Ref SPClem05

17-11-2005

Evite o bloqueio do projecto pelos dados Sempre, mas sempre, determine o problema a solucionar; defina os objectivos a atingir e obtenha suporte. Se pura e simplesmente comear a analisar uma montanha de dados sem qualquer estrutura de projecto, o mais provvel que se perca nos dados e esteja a perder tempo. No deixe que o volume de dados dirija o seu projecto. O foco a soluo do problema. Pode no uitlizar todos os dados disponveis s alguns podero ser relevantes para o projecto. Pode at mesmo descobrir que os dados que possui no so suficientes para resolver o problema. Um grande volume de dados no garantia de que tem os dados correctos. Por exemplo, normalmente informao recente mais importante para caraterizar um cliente do que todo o histrico da sua relao com a sua empresa. Nas seces seguintes realamos o que achamos importante em cada uma das fases da metodologia CRISP-DM. Se quiser obter informao mais detalhada sobre esta metodologia visite o stio na internet www.crisp-dm.org.

Inventarie os recursos disponveis e necessrios ao projecto Liste adiantadamente todos os aspectos do projecto e assegure-se que tem tudo o que necessita para ter sucesso: Pessoal (sponsor do projecto, tcnicos conhecedores da actividade e da anlise de dados) Fontes de dados (em data-waherouses ou nas aplicaes operacionais, mas acessveis) Recursos computacionais (computadores e software especfico de anlise) Quais so os requisitos do projecto Liste todos os requisitos do projecto: Calendrio de execuo Segurana a implementar Restries legais no acesso aos dados Formas de distribuio e apresentao dos resultados. Que pressupostos poram estabelecidos no projecto Liste e clarifique todos os pressupostos assumidos sobre: Qualidade dos dados (disponibilidade e fiabilidade) Factores externos (envolvente econmica, concorrentes, avanos tecnolgicos) Factores internos (o problema) Modelos (restries, descries, apresentao) Sob que condicionalismos se far o projecto ? Verifique e crie solues para: Restries gerais (legais, oramentais, de recursos, de tempo) Direiros de acesso aos dados (restries, passwords necessrios) Acessibilidade tcnica aos dados (sistemas operativos, sistemas de gesto dos dados, formatos de ficheiros e de bases de dados, permisses de acesso) Acessibilidade a conhecimento relevante Elabore um plano de projecto Crie um plano que reale as tarefas a executar para atingir os objectivos do projecto de data mining e encontrar a soluo desejada para o problema.

Compreenso do problema
Saiba quem, o qu, quando, onde, porqu e como na perspectiva do problema Compreenda detalhadamente todos os parmetros do projecto o enquadramento actual do problema; o objectivo principal do projecto; os critrios que definem o sucesso e quem determinar se houve ou no sucesso no projecto. Defina a forma como os resultados sero entregues Pense na forma como quer utilizar os resultados do seu projecto: Sero usados por especialistas a quem podem ser fornecidos tal como obtidos ? Sero utilizados por diferentes tipos de utilizadores com necessidades diferentes de interpretao ? Sero distribudos por qualquer meio em particular (em papel, por ficheiros, electronicamente, ...) que requeira um formato especfico ? Defina a forma de manuteno do projecto Como far a gesto dos dados uma vez terminado o projecto ? Se o projecto parte de um processo de gesto contnuo, ser que: Os dados sero analisados periodicamente ? Novos dados sero analisados em tempo real ?

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

4
Ref SPClem05

17-11-2005

Compreenso dos dados


Assegure-se que os dados esto disponveis Disponha de todos os dados que necessitar para o seu projecto. Se tiverem origem em mais que uma fonte, assegure-se que a sua ferramenta de data mining tem capacidades para integr-los. Os dados com origem no seu stio internet podem ser valiosos para o seu projecto. Utilize uma ferramenta de web mining para integr-los no seu projecto de data mining. Os dados com origem em inquritos de opinio podem acrescentar informao importante sobre caractersticas e atitudes dos indivduos nos seus modelos. Mais de 80 por cento da informao relevante pode estar incluida em documentos texto no estruturados. Utilize uma ferramenta de text mining para integr-los no seu projecto de data mining. Descreva os dados Obtenha uma fotografia de todos os dados recolhendo a informao descritiva de formatos, de variveis (ou campos), de nmero de registos e de variveis e de toda as caractersticas julgadas relevantes. Assegure-se que os dados escolhidos so os que melhor representem o problema que pretende analisar. Experimente algumas tcnicas exploratrias de dados e avalie a sua qualidade Seja com ferramentas de data mining ou de anlise estatstica, o conhecimento exploratrio dos dados ajudar-lhe- a tomar decises sobre a qualidade dos dados. Para prevenir futuros problemas, elabore um plano de soluo de qualquer erro detectado nos dados: Ser que o nome das variveis esto conformes com os valores que contm? H valores em falta ? H valores duplicados? H disperso elevada nos valores de determinada varivel ? Qual a sua causa ? Existe correlao elevada entre variveis ? esperada e conhecida ? Reveja variveis que conjugadas contm informao errada e que o senso comum detecta de imediato (por exemplo, homens grvidos) Exclua qualquer dado no relevante (por exemplo, se estamos a analisar comportamentos de automobilistas, excluimos todos aqueles que no tm carta de conduo)

Preparao dos dados


Seleccione os dados a utilizar Decida sobre quais os dados a utilizar na anlise e liste as razes das suas decises. Podem ser: Nveis de significncia e testes de correlao que determinaram a incluso de variveis Condicionantes da seleco de subconjuntos de dados Tcnicas de amostragem utilizadas para ver a adequadabilidade dos dados Decida se certos atributos so mais importantes que outros e pondere-os de forma adequada. Para aumentar a fiabilidade dos modelos, veja os benefcios de incluir neles informao no estruturada e que pode no estar disponvel nas bases de dados da sua instituio. Por exemplo, ser que a informao que recolheu no inqurito de satisfao aos seus clientes importante para o seu projecto de reteno de clientes ? Melhore a qualidade dos dados Para obter resultados fiveis, perca agora tempo a corrigir os erros detectados nos dados aquando da avaliao da sua qualidade. Pode ter que realizar as seguintes actividades: Determinar como lidar com elementos anormais valores em falta; valores extremos; ou outras anomalias prprias dos dados Fixar regras de codificao de valores. Por exemplo, ser que o ano deve ser sempre referenciado com quatro dgitos (2005) ou s com dois (05) ? Algumas variveis podem ser irrelevantes para os nossos objectivos actuais e no necessitam de ser limpos. Registe estas aces executadas porque mais tarde pode ter que reaproveit-los no projecto. Disponha de uma ferramenta flexvel para estas operaes A sua ferramenta de data mining deve dispr de funcionalidades para preparao dos dados de acordo com os requisitos do projecto. Deve ter a possibilidade de adicionar ou criar novas variveis a partir das existentes nas fontes de dados. Relembre-se que o data mining um processo de descoberta impossvel saber priori para onde os dados nos levam. Determine se necessrio criar novas variveis Pode ser necessrio criar novas variveis a partir dos dados existentes pelas seguintes razes: Devido experincia anterior ou ao conhecimento da actividade, sabemos que um atributo (varivel) em particular importante na construo do modelo;

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

5
Ref SPClem05

17-11-2005

O algoritmo a utilizar s manipula certos tipos de variveis, pelo que pode ser necessrio recodificar dados caso essas variveis sejam importantes e os seus formatos no estejam de acordo com os pressupostos tcnicos; Os resultados obtidos demonstram que os modelos criados a partir dos dados originais no so analiticamente interessantes ou fiveis. Antes de criar novas variveis avalie se e como sero importantes para o processo de modelizao. Consolide a informao agregando dados. Ao juntar informao de diferentes fontes (ficheiros ou bases de dados) pode ter que criar novas variveis e/ou agregar valores com significado similar. Assegure-se que a sua ferramenta de data mining pode combinar diferentes tipos de dados provenientes de diferentes fontes e sem ter que criar rotinas informticas caras e demoradas. Ser que as tcnicas analticas requerem uma ordem especfica nos dados a tratar ? A sua ferramenta de data mining deve ter a possibilidade de ordenar os dados consoante os requisitos tcnicos do procedimento analtico. Devero os dados estar balanceados ? A tcnica analtica pode requerer parties de dados em grupos de igual dimenso. A sua ferramenta de data mining deve permiti-lo.

Teste antes de criar o modelo Antes de criar o modelo explicativo, teste a qualidade e validade das tcnicas que planeia utilizar. Crie um desenho de teste que inclua um conjunto de dados para treino; outro para testes e outro para validao dos resultados. A partir do conjunto de treino crie o seu modelo e certifique a sua qualidade com o conjunto de dados para teste. Construa o seu modelo Para criar o seu modelo, execute a sua ferramenta de modelizao no conjunto de dados que preparou. Descreva os resultados e confirme a sua fiabilidade e adequabilidade realidade. Elabore um memorando detalhado sobre o modelo, assinalando as regras produzidas, a definio de parmetros feita, o seu comportamento e a sua forma de interpretao. Utilize a induo para produzir uma regra Regras so no essencial parmetros a que os dados devem obedecer para serem considerados num modelo. Normalmente tm o formato condicional If ... Then. A induo permite-lhe escolher automaticamente quais as regras mais efectivas para obter um resultado especfico. Por exemplo, utilize a induo para criar um conjunto de regras para qualificar o risco de um emprstimo: Se empregado h mais de 2 anos, ento o risco baixo; Se maior que 30 anos, o risco baixo; Se alguma vez no passado entrou em incumprimento no pagamento das prestaes, o seu risco elevado. As tcnicas de clustering so boas para: Encontrar grupos naturais de observaes (individuos) que tm as mesmas caractersticas - por exemplo, detecte situaes de fraude com tcnicas de clustering porque encontrar grupos semelhantes de comportamento na utilizao do carto de crdito (e este foi o factor importante para a fraude). As regras de associao so boas para: Basket analysis descubra quais os produtos que tm maior probabilidade de serem comprados em conjunto. Utilize esta informao para melhorar a sua capacidade de cross-selling atravs de catlogo ou por tcnicas de merchandising na sua loja.

Modelizao
Seleccione as tcnicas analticas a utilizar Para analisar os seus dados com o procedimento adequado, verifique quais os pressupostos que cada tcnica impe sobre formato e qualidade dos dados. Nalguns casos, s um procedimento poder ser apropriado para abordar o problema. Tenha a certeza que considera: Quais os procedimentos so mais apropriados para o seu problema Se existem alguns requisitos prvios (expectativas da gesto, interpretao dos resultados) Se existem algumas restries (estranhas caractersticas dos dados, conhecimento tcnico dos analistas, tempo de execuo) De forma a que tenha a tcnica mais apropriada para cada modelo ou para cada problema, escolha uma ferramenta de data mining que lhe disponibilize um conjunto alargado de tcnicas analticas.

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

6
Ref SPClem05

17-11-2005

Avaliao
Avalie os resultados do projecto de data mining Determine se e como os resultados de cada modelo sero teis como soluo do problema. Existe alguma razo para que o modelo explicativo encontrado seja deficiente ? Se dispuser de tempo e recursos, tente test-los com aplicaes reais do dia a dia. Reveja todas as etapas do processo at agora Ao confirmar a qualidade dos seus resultados, reveja todo o trabalho feito no projecto para detectar se alguma fase foi esquecida ou se informao importante no foi considerada: Retrospectivamente, cada etapa feita foi necessria ? Cada uma delas foi executada tal como previsto ? Determine as prximas etapas Chegou o momento de determinar se o projecto tem o sucesso suficiente para passarmos apresentao dos resultados. Se no, faa trabalho adicional para encontrar resultados satisfatrios. Tenha sempre em mente: O potencial interesse de cada resultado Como pode melhorar o processo Se existem recursos para trabalho adicional

Produza um relatrio final Dependendo da forma como planeou distribuir os resultados, o relatrio pode ser ou um sumrio de todo o projecto ou uma apresentao final dos resultados obtidos. Ao faz-lo: Identifique os meios a utilizar Analise a aderncia dos resultados aos objectivos iniciais do projecto Identifique os receptores do relatrio Sublinhe a estrutura e contedo do relatrio Inclua todos os pontos importantes do projecto. Reveja todo o projecto Finalmente tem a oportunidade de identificar o que correu bem, o que correu mal e o que necessrio corrigir em futuros projectos. No se esquea de: Entrevistar todos os elementos da equipa de projecto e conhecer a sua opinio; Entrevistar os utilizadores finais envolvidos e saber como avaliam os resultados; Documentar e analisar todas as aces realizadas em cada fase do projecto. Fazer recomendaes para projectos futuros.

Seleco de uma ferramenta de data mining


As dicas apresentadas nesta seco so excertos do manual CRISP-DM, no captulo que se refere a Performing a data mining tool evaluation. Procure uma ferramenta utilizada em projectos idnticos ao seu Escolha uma ferramenta que saiba ser utilizada no seu sector de actividade ou que tenha um conjunto conhecido de referncias em projectos semelhantes ao seu. Seleccione uma ferramente que faa a ponte entre a metodologia e a capacidade tcnica do data mining Assegure-se que a estrutura da ferramenta vai de encontro s suas necessidades no s no que se refere qualidade e quantidade de procedimentos analticos que inclui, mas tambm quanto ao controlo metodolgico de todo o projecto: Os conceitos de data mining esto facilmente perceptveis na ferramenta ? Integra-se com software de gesto de projectos ou outras ferramentas que Voc utiliza ? Se no, como feita essa integrao ? A sua ferramenta deve utilizar transparentemente as suas fontes de dados e os seus formatos Poupar tempo e dinheiro, e maximizar as probabilidades de obter resultados fiveis, se a sua ferramenta de data mining for capaz de utilizar e importar dados provenientes de vrias fontes e em vrios formatos. Tal particularmente importante, se em fases posteriores do projecto pretendermos adicionar novos dados de uma nova fonte.

Distribuio dos resultados


Crie um plano de distribuio dos resultados Aceites os resultados do projecto, decida qual a melhor forma de aport-los soluo: Faa uma descrio sucinta dos modelos e resultados obtidos; Avalie as diferentes formas de apresentao disponveis; Confirme a sua viabilidade e identifique possveis problemas; Determine como monitorizar o uso dos resultados e medir os benefcios. Monitorize a aplicao dos resultados Assegure-se que os resultados produzidos so utilizados correctamente e esteja atento a factores como: O que que se poder alterar no futuro e que influencie directamente a qualidade dos resultados ? Como que se controlar a eficincia dos resultados ? Quando, se necessrio, se deve interrromper o uso dos resultados ?

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

7
Ref SPClem05

17-11-2005

Uma ferramenta de data mining que lhe permita combinar dados estruturados ou no (por exemplo, informao sobre atitudes e comportamentos provenientes de inquritos), aumentar a probabilidade de termos melhores resultados no projecto. Disponha de capacidades interactivas de explorao e de visualizao mais fcil explorar os dados se a ferramenta incluir tcnicas interactivas de visualizao. Estas tcnicas permitem-nos aumentar a capacidade de deciso e de informao porque podemos alterar de imediato os grficos e as dimenses de visualizao que nos so apresentadas. Disponha de funcionalidades de preparao e manipulao dos dados fceis de utilizar Se as tarefas de preparao dos dados forem fceis de executar, tcnicos com diferentes nveis de conhecimento podero participar nesta fase de extrema importncia para o projecto e, potencialmente, de trabalho intensivo. A sua ferramente deve importar e extrair dados automaticamente Evite programar queries, por vezes complexas e demoradas, escolhendo uma ferramenta que extrai automaticamente os dados nas diferentes actividades de preparao dos dados. Pode criar um modelo eficiente e rapidamente ? Procure uma ferramenta que permita aos analistas encontrar rapidamente os melhores modelos. A ferramenta deve incluir funcionalidades tcnicas para construo e teste de mltiplos modelos. Escolha uma ferramenta com um largo espectro de tcnicas Para obter os melhores resultados, assegure-se que a sua ferramenta dispe de mltiplas tcnicas e algoritmos para visaulizao, classificao, clustering, associao e regresso. A ferramenta tambm deve ser capaz de combinar diferentes tcnicas sempre com o objectivo de produzir os melhores resultados. A ferramenta escolhida utiliza os seus recursos informticos actuais Escolha uma ferramenta que utiliza os seus dados tal como eles existem na sua organizao, qualquer que seja o sistema de base de dados ou de ficheiros. Caso contrrio pode ser necessrio afectar novos recursos ao seu projecto de data mining. Escolha uma ferramenta que lhe garanta bons resultados Com o sucesso do seu projecto de data mining vai querer replicar a utilizao deste processo na

resoluo de outros problemas. A ferramenta a escolher deve adaptar-se a qualquer tipo de projecto de data mining em vez de ser desenhada para uma aplicao especfica. Quais as capacidades de apresentao e de distribuio dos resultados que a ferramenta dispe? crtico dispr de uma ferramenta que lhe permita integrar os resultados obtidos nos seus sistemas operacionais do dia a dia agora e no futuro. Saiba se essa integrao fcil ou se requer investimentos adicionais. Avalie os potenciais custos de propriedade associados ferramenta escolhida Para cada ferramenta em anlise, analise o seu retorno (ROI): Qual ser o seu custo adicional para alm da aquisio inclua aqui os servios de manuteno ou custos de renovao anual de licenas de software. Quando obter um ROI positivo ? Quando tempo demorar a implementar a sua ferramenta de data mining ? Est desenhada para especialistas ou pode ser utilizada por tcnicos com mltiplas formaes ? Quais os custos de formao envolvidos agora e no futuro ? A ferramenta customizvel para utilizadores ou aplicaes em particular ? Pode automatizar tarefas rotineiras ?

Concluso
Este documento tocou de forma muito sucinta num nmero de temas que deve ter em mente sempre que planeia e realiza um projecto de data mining. Outros tpicos relacionados com este tema esto para alm dos objectivos deste documento. Se quiser explorar ou estudar com mais detalhe algum dos tpicos agora abordados, recomendamos a consulta de livros especializados sobre data mining. Outro meio que est ao seu dispr frequentar uma aco de formao sobre a utilizao dos produtos SPSS para data mining. Consulte-nos e teremos todo o gosto em colaborar consigo. Muito obrigado pela sua ateno.

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

8
Ref SPClem05

17-11-2005

A SPSS Inc.
A SPSS Inc. uma empresa lider mundial no fornecimento de solues analticas predictivas. A sua tecnologia melhora o processo de tomada de deciso ao dar s organizaes um maior controlo sobre a qualidade das decises dirias. Uma organizao torna-se predictiva quando incorpora esta tecnologia analtica nas suas operaes dirias est apta a encontrar solues para os seus problemas de gesto e obter vantagens comparativas mensurveis. Muitas instituies, em Portugal e no Mundo, utilizam-na para aumentar o rendimento, diminuir os custos, melhorar processos e detectar e prevenir a fraude. A SPSS Inc. foi fundada em 1968 em Chicago (EUA) e representada em Portugal desde 1994 pela PSE Produtos e Servios de Estatstica, Lda. O que nos torna nicos H mais de 35 anos que a SPSS lida com tecnologia analtica. Os nossos clientes escolheram-nos por mltiplas razes: Uma viso integral, a 360 O software SPSS permite-lhe desenvolver uma cultura empresarial baseada no conhecimento, porque conjuga todo o tipo de informao dados estruturados e dados no estruturados para obter uma viso de 360; Integramo-nos facilmente com outros sistemas operacionais As tecnologias analticas SPSS esto desenhadas para serem autnomas na sua funo ou serem integradas com tecnologias de outros construtores; A arquitectura do software aberta e conforme os padres da indstria O software SPSS incorpora os padres da indstria como o caso do OLE DB para acesso a dados; XMLA para partilha de dados e formatos; PMML para partilha de modelos predictivos; SSL para gesto da segurana na Internet e LDAP/Active Directory Services para autenticao e autorizao, s para nomear alguns. O retorno mais rpido no seu investimento em software De acordo com um estudo recente da empresa Nucleus Research, 94 % dos clientes SPSS obtiveram um retorno positivo do seu investimento num perodo mdio de 10,7 meses. Um baixo custo total de propriedade A tecnologia SPSS est desenhada para trabalhar com a sua infraestrutura tecnolgica e mantemos os custos de propriedade baixos no curto e longo prazo porque temos opes de licenciamento muito flexveis.

Os produtos SPSS
Na SPSS dispomos de uma vasta gama de produtos que lhe permitem construir um sistema flexvel para anlise da sua informao. Data mining AnswerTree - Software para deteco de segmentos e projeco da sua resposta a impulsos, por utilizao de rvores de deciso. Clementine - Software para data mining que incorpora no seu processo todo o seu conhecimento do problema a analisar. A famlia de produtos Clementine inclui: Clementine Application Templates (CATs) que so streams pr-construidas para resoluo de problemas especficos. Podem ser aplicados directamente sobre os seus dados para obter resultados imediatos, ou utilizados como base de customizao do seu prprio problema. Text Mining for Clementine para extraco de conceitos e relaes em dados no estruturados e sua converso em formatos estruturados para incluso no Clementine. Web Mining for Clementine para fcil transformao dos logs web em eventos para anlise no Clementine SPSS Predictive Enterprise Services que centraliza e organiza os modelos e os processos que estiveram associados a cada um dos projectos. Cleo que disponibiliza via Web aplicaes que permitem aos gestores utilizar os modelos predictivos criados no Clementine. Anlise Predictiva Predictive Analytic Applications Aplicaes que entregam recomendaes em tempo real a sistemas e decisores pela combinao de avanadas tcnicas analticas e de optimizao de decises. A SPSS dispe das seguintes solues: PredictiveCallCenter transforma chamadas de clientes inbound em oportunidades de venda. PredictiveClaims aumenta a satisfao dos clientes e reduz a fraude nos pedidos de participao financeira dos seguros. PredictiveMarketing gera mais lucro nas campanhas de marketing outbound. PredictiveWebSite transforma as visitas ao seu stio na web em oportunidades de venda.

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

9
Ref SPClem05

17-11-2005

Anlise estatstica SPSS for Windows o software de anlise estatstica de dados com maior reconhecimento no mercado. A partir de um mdulo principal SPSS Base System pode criar a sua prpria soluo analtica adicionando-lhe tcnicas consoante a sua necessidade. DecisionTime software para criao de modelos previsionais de sries temporais e anlise de cenrios alternativos de previso. Amos software para modelizao de equaes estruturais que completa a oferta SPSS em mtodos de anlise multivariada. Permite a construo de modelos que reflectem realisticamente as relaes complexas entre variveis. Smartviewer Web Server software para disponibilizao de informao na Internet. Com ele possvel garantir o acesso imediato aos resultados obtidos com qualquer ferramenta analtica SPSS de um modo seguro e eficiente. Desenho e recolha de informao por inquritos Dimensions Realize inquritos em grande escala ou em projectos de menor dimenso, a SPSS disponibiliza uma plataforma integrada e customizvel para apoio em todo o processo de pesquisa por inqurito. Esta soluo inclui produtos para todas as etapas do processo de pesquisa por inqurito (Veja o documento SPSS Survey Tips) desde a criao do questionrio at captura dos dados, seja ela efectuada em papel, por telefone, pela internet ou por equipamento porttil (por exemplo, PDA). Consultoria e Formao A PSE, enquanto parceiro SPSS para Portugal, assegura aos seus clientes servios de formao, consultoria e apoio tcnico na utilizao dos produtos e solues SPSS de acordo com as normas internacionais da nossa representada.

PSE Produtos e Servios de Estatstica, Lda Rua Mouzinho da Silveira, n 27 3 C 1250-166 Lisboa Telefone 213170910 Tefefax 213170919 Mail Site spssinfo@pse.pt www.pse.pt

Este documento foi traduzido do original pela PSE, na sua qualidade de distribuidora SPSS para o mercado portugus.

10
Ref SPClem05

Você também pode gostar