Introdução
Este documento fornece orientações sobre o que você precisa e como fazer para
converter um arquivo Open XML do Microsoft Office Word no formato DAISY XML
e, em seguida, em DAISY DBT para ser tocado no programa MecDaisy.
a) Ter o ambiente Microsoft .NET Framework 3.5 Service Pack 1 instalado na sua
máquina (faça o download pelo Baixaki:
http://www.baixaki.com.br/download/microsoft-net-framework-3-5.htm - se o
endereço mudar, procure na busca do Baixaki). O Windows Vista já vem com
ele instalado, mas em geral é preciso instalá-lo para outros sistemas
operacionais.
d) Junto com o ambiente Microsoft Office 2003 ou 2007, deve-se ter o Microsoft
2007 Primary Interop Assemblies (PIA) instalado na máquina (faça o download
pelo site da Microsoft: http://www.microsoft.com/downloads/details.aspx?
FamilyID=59daebaa-bed4-4282-a28c-b864d8bfa513&displaylang=en – se o
endereço mudar, procure no Microsoft Download Center).
Full DAISY (de docx Único): Neste sub-menu irá aparecer um sub-menu "DAISY
Pipeline TTS Narrator", que irá traduzir de Word 2007 para "DAISY DTBook".
DAISY XML (a partir de múltiplos docx): Este sub-menu irá traduzir um grupo de
documentos em um único "DAISY XML".
Full DAISY (a partir de múltiplos docx): Este sub-menu irá fazer aparecer um sub-
menu "DAISY Pipeline TTS Narrator", que irá traduzir um grupo de documentos para
"DAISY DTBook".
A janela "Daisy tradutor – Validation error" fornece uma opção para abrir a
documentação sobre orientações de “Authoring” e também uma opção para salvar o
arquivo de log que contém a informação sobre os erros de validação que ocorreram
durante a tradução.
Após salvar o documento em DAISY DTBook, finalmente, abra o livro criado no leitor
MecDaisy. Acesse o índice e leia trechos dele.
Nota: Verifique no painel de controle na opção FALA se você está usando um
sintetizador de voz adequado, e em português.
Introdução:
Mostraremos a seguir orientações técnicas sobre como criar um documento no
Microsoft Word visando minimizar as perdas de fidelidade ao traduzir para DAISY
XML.
O mais importante é buscar refletir a estrutura do livro, em particular indicar onde estão
os capítulos, tópicos e subtópicos. A forma mais simples de indicar isso é usar os
seguintes estilos do Word na marcação dos textos.
Mesmo quando existirem estilos genéricos no Word, deve-se preferir usar os seguintes
os estilos direcionados à transcrição para o formato DAISY:
Sent (sentença)
Word (palavra destacada)
Poem (poema)
Poem – Heading (cabeçalho do poema)
Poem – Title (título do poema)
Poem – Author (autor do poema)
Poem – Byline (linhas do poema)
Nota:
Um valor gerado automaticamente será exibido em um texto "Document UID" na
interface do usuário.
Recursos:
Os seguintes recursos deverão ser usados seguindo a orientação dada neste documento
para que ocorra um mínimo de perda de fidelidade.
a) Tabelas
Em Open XML, tabelas complexas incluem tabelas com fusão de linhas e colunas,
tabelas embutidas dentro de outras, com cor de fundo e de bordas, com diferentes
tonalidades de cor, com encaixe na página, com textos coloridos e com imagens. O
mapeamento dessas tabelas complexas de Open XML para DAISY é desencorajado,
pois pode levar a perdas de fidelidade. A preferência é por tabelas simples com linhas e
colunas, que são implementadas com um mínimo de perda de fidelidade.
É altamente recomendável usar tabelas para dados tabulares e não para fins de layout. É
melhor usar estilos específicos para a formatação que pretende realizar. Por exemplo,
no processo de tradução, cabeçalhos e barras laterais de uma tabela serão convertidos
em pontos. Para mantê-los como cabeçalhos e laterais, deve-se movê-los para fora da
tabela e utilizar o estilo adequado (Table-Caption).
Imagens simples Jpeg, Bmp, e Gif serão convertidas sem qualquer perda de fidelidade.
No entanto, se recomenda fortemente o uso de texto alternativo para imagem ou grupo
de imagens. Se o usuário não colocar texto alternativo para imagens, a saída em xml irá
conter atributo de texto alternativo sem valor.
Os arquivos de imagem com extensões Jpeg, Jpe e Jpg serão todos convertidos para
arquivos com a extensão Jpg e copiados para a pasta de destino. Todas as outras
imagens serão convertidas para arquivos com a extensão Png e copiados para a pasta de
destino.
Se uma imagem for inserida no meio de um texto, será exibida antes do texto.
c) Legendas
Se as imagens forem envolvidas com texto utilizando opção diferente de "Alinhada com
o texto", as legendas não serão manipuladas.
d) Notas e referências
Notas de rodapé serão preenchidas no final da página. Se a nota não for preenchida no
final da página, ela será preenchida no final da próxima página senão ela será
preenchida no final do documento.
Estilos como Intense Emphasis e Subtle Emphasis não são tratados, uma vez que podem
levar à perda fidelidade. Por características como relevo e força, os estilos Emphasis e
Strong devem ser utilizados. No entanto, os usuários também podem usar negritos e
itálicos em conjunto com esses dois estilos.
f) Listas
Só estilos padrão de listas serão suportados. Estilos customizados não serão suportados.
g) Níveis e Cabeçalhos
h) Citações (Blockquotes)
Abreviaturas e siglas são tratadas com recurso “Favoritos” (Bookmark) do Word. Todas
as palavras marcadas como Abreviatura e Acrônimos são internamente marcadas como
“Favoritos” onde o nome do bookmark começa com "Abreviaturas" e "Sigla",
respectivamente. O usuário verá muitas fichas na caixa de diálogo Bookmark da
palavra, onde o nome do favorito começa com "Abreviaturas "e" Sigla", mas não deve
excluir esses marcadores. Se o usuário apagar o favorito, terá perdido as informações de
abreviaturas e siglas.
j) Números de páginas
Não se deve iniciar uma nova página com uma linha em branco nem com uma imagem.
Não deve expandir uma tabela por várias páginas, sem colocar textos na célula.
Uma tabela de conteúdo que abranja várias páginas será traduzida para uma única
página. Por exemplo, se a tabela de conteúdos abrangendo as páginas 3 e 4, isso será
tratado como se todo o conteúdo da tabela estivesse na página 3.
Não é suportado o número de página contendo o número do capítulo, de modo que não
se deve formatar o número de página com o número do capítulo.
A formatação dos números de página através de uma edição do campo não é suportada.
Para este fim, deve-se usar a opção de “formatar os números de página.”
Números de página são tratados da melhor maneira possível, mas ainda pode haver
algumas situações que não resultam em boa numeração de página. Por exemplo,
documentos com páginas vazias (com base no comportamento do usuário) não vão
produzir uma boa numeração de página. Se o documento não tiver a informação correta
sobre a quebra de página, ele também irá resultar em números de página impróprios.
k) Barras laterais
Imagens e tabelas com legenda dentro de uma barra lateral podem levar a algumas
informações perdidas. Portanto, é altamente recomendável usar um estilo personalizado
de imagens dentro de uma legenda para uma barra lateral.
O Word fornece três tipos de estilos built-in para o quadro de conteúdo. Usuário não
deve usar a opção. Usuário deve usar estilos automáticos da tabela de conteúdos.
A tabela de conteúdo não deve ser incorporada a outras funcionalidades do Word, como
os sidebars, célula de tabela etc. A tabela de conteúdo é algo que sempre se espera que
esteja na primeira página do documento do Word.
m) Controle de mudanças
n) Comentários
o) Estilos customizados
As legendas de imagem devem ser inseridas no topo ou base da imagem. Se forem
colocadas em ambos os lugares, a legenda resultante conterá ambas as legendas
concatenadas.
1. Notas do produtor para Imagens (Prodnote):
As notas do produtor (Producer Note) para imagens devem ser inseridas sempre abaixo
da imagem, sem espaços em branco. Se elas forem inseridas acima da imagem não
serão capturadas sob a tag <imggroup>.
Notas de produtor para imagens dentro de citação (“blockquote”) não serão traduzidas.
2. Números de linhas.
Números de linhas para parágrafos bidirecionalmente orientados (bdo) não são
traduzidos. Se o estilo customizado de número de linhas for aplicado à primeira linha
do parágrafo, irão ocorrer tags <p> no arquivo XML de saída.
3. Rodapé de tabela.
O estilo customizado Rodapé de Tabela (Table-Footer DAISY) deve ser aplicado
sempre à última linha da tabela.
Nota: Este estilo será automaticamente adicionado à barra de ferramentas de tabelas ao
se clicar o botão “Import Daisy Styles” na barra Accessibility como mostrado na figura
a seguir.
Para aplicar este estilo, o usuário deve selecionar a tabela e clicar no estilo DAISY “Table Footer” e
também clicar no check bos “Table Row” como mostra a figura acima.
TRANSCRIÇÃO DE ELEMENTOS QUE NÃO SÃO SUPORTADAS
c) Detecção de linguagem
A característica de linguagem funciona apenas ao nível de parágrafo. Se o usuário
seleciona parte de um parágrafo, a informação de linguagem não será traduzida
apropriadamente. Assim, a tradução só será efetiva se o usuário selecionar um ou mais
parágrafos inteiros.
d) Formas e objetos
Na forma de linha de comando, formas e objetos não são traduzidos.
Não serão criados Audio Books para um documento contendo objetos embutidos,
mesmo que seja um documento Word embutido num outro. Deve-se criar Áudio Books
separados para documentos embutidos.