Você está na página 1de 2

ou tentar resumir o que o código usado no VBA do colega @ppeterk faz:

 O Módulo1 pelo que me consta é uma adaptação de um antigo


código publicado a primeira vez em 2009 por um usuário no fórum
americano administrado pelo notável Excel MVP Bill Jelen ("Mr.
Excel"), situado no link PDF to Excel data copy:
o Inicialmente você precisa ter o Adobe Acrobat Reader 32
bits instalado em sua máquina para funcionar;
o Na rotina *Start o código começa deixando o usuário
escolher qual pdf será processado através da caixa de
diálogo GetSaveAsFilename. Se me permite a sugestão, aqui
o mais coerente seria talvez usar a
análoga Application.GetOpenFileName já que não é um
salvamento e sim abertura de arquivo (para isso é só
eliminar o parâmetro InitialFileName). O nome do pdf
escolhido é lançado numa variável;
o Na sequência o pdf é aberto no Acrobat Reader o qual é
iniciado via Shell passando como parâmetro na linha de
comando o nome do pdf que está na variável;
o Aguarda 4 segundos para executar a
rotina FirstStep (tempo pra carregar o Reader e o pdf);
o A rotina FirstStep manda então um pressionamento de
tecla CTRL + A na tela do Adobe (Selecionar Tudo)
via SendKeys e em seguida um CTRL + C (copiar p/ Área de
Transferência);
o Mais uma pausa de 4 seg para a SecondStep;
o A rotina SecondStep inicialmente deveria
fechar o Reader com pressionamento de ALT + F + X
entretanto, para o Reader em português, teria que
ser substituído por CTRL + Q (SendKeys ("^q"));
o Ainda na mesma procedure o arquivo Excel é ativado, a
planilha "PDF" é ativada, as células são previamente limpas
e o conteúdo da clipboard é colado na célula A1 pelo envio
do pressionamento CTRL + V;
o Finalmente ocorre o pressionamento da tecla NUMLOCK
seguido de ALT + S que honestamente não sei qual
finalidade.
 O Módulo2 não está sendo usado
 Resumindo, o código abre, seleciona, copia e cola o pdf da célula
A1 em diante da planilha "PDF".

Em 23/11/2020 às 15:14, ppeterk disse:


Se mantermos sempre o mesmo modelo de currículo, talvez funcione.

Esse é o problema central. Não há um padrão rigoroso no modelo. Pelo


menos não um que o @VargasExcel possa ele mesmo determinar.

Em 23/11/2020 às 15:14, ppeterk disse:


@Edson Luiz Branco, se for ajudar um pouco, veja essa macro que adaptei...
Em 23/11/2020 às 20:18, VargasExcel disse:
Espero que a planilha que o @ppeterk enviou possa te ajudar...

A vantagem do código que o @ppeterk disponibilizou é que todos os


candidatos aparecem no conteúdo de texto puro colado nas células o
que não está ocorrendo na conversão direta para o Word (apesar de o
texto estar lá pois pode ser pesquisado).

A desvantagem principal é que não é possível refluir o pdf conforme as


posições originais dos boxes como estão sendo layoutados no
original, sendo que partes de trechos que estão em blocos à direita
acabam por se misturar ao texto à esquerda o que eventualmente pode
tornar a extração não tão confiável.
Além disso, cabeçalhos e rodapés que no Word ficam corretamente
desmembrados do texto principal, também acabam por ficar diluídos no
meio do conteúdo dos dados dos candidatos.
Particularmente também não sou muito fã de trabalhar com programas
externos através de pressionamentos de tecla na tela (via SendKeys).

Mas fica sim como uma carta na manga. Se ficar inviável extrair como
imaginado devido à complexidade, temos essa alternativa pra trabalhar,
afinal não são muitos dados que você precisa extrair.

Vamos seguindo trocando ideias, colegas.

Você também pode gostar