Escolar Documentos
Profissional Documentos
Cultura Documentos
ELIZÂNEA C. L. CAMPELO
GLEICIANE JOSÉ DA SILVA
RECIFE – PE
2021
ELIZÂNEA C. L. CAMPELO
GLEICIANE JOSÉ DA SILVA
RECIFE – PE
2021
ELIZÂNEA C. L. CAMPELO
GLEICIANE JOSÉ DA SILVA
______________________________________
Prof. Dr. Fernando Ferreira Carvalho
Orientador
______________________________________
Avaliador(a)
________________________________________
Avaliador(a)
RECIFE – PE
2021
Dedicamos este trabalho a Deus e à minha
família, em especial a minha mãe, mulher
forte e guerreira que nos apoiou em todos
os momentos difíceis.
AGRADECIMENTOS
Taking into account the significant rate of blind people who suffer from the lack of
accessibility, the present work is a study about the assistive technology resources as
well as the importance and usefulness of an application for monetary recognition in the
lives of people with this disability. This research was composed of four parts. Firstly, a
feasibility study was carried out, in which it became evident the need for an application
for currency recognition, based on conversations and suggestions from the visually
impaired people interviewed. Secondly, bibliographic research was done to compose
the theoretical referential of this work. Thirdly, a prototype was developed, named APP
See, which uses computer vision and convolutional neural network to recognize
Brazilian coins. Finally, the demand validation of an APP focused on currency analysis
in terms of usability was performed using a questionnaire developed by the authors
based on the NBR ISO/IEC 9126-1. From the results, it can be concluded that assistive
technology resources are fundamental to help visually impaired people in their daily
activities. Furthermore, the prototype contributes to social inclusion, providing a better
quality of life and generating more autonomy and safety. It is also noticed the need for
future studies to improve the validation of usability and implementation of the APP
since the project was idealized, analyzed, and programmed only by the application
developers. Moreover, a version of the prototype for Android and IOS operational
systems will also be made available in future research, besides improving the See APP
to identify and calculate several currencies at the same time, as well as to make the
automatically recognition of currencies from other countries.
APP Aplicativo
CNN Convolutional Neural Network
CTA Centro Tecnológico de Acessibilidade
GUI Graphical User Interface
IBGE Instituto Brasileiro de Geografia e Estatística
IBM International Business Machines Corporation
IDE Integrated Development Environment
IEC International Electrotechnical Commission
ISO International Organization of Standardization
MEC Ministério da Educação e Cultura
NBR Norma Brasileira
OHA Open Handset Alliance
OMS Organização Mundial da Saúde
OpenCV Open Source Computer Vision
SDK Software Development Kit
SNPD Secretaria Nacional de Promoção dos Direitos da Pessoa com
Deficiência
SUS System Usability Scale
TCC Trabalho de Conclusão de Curso
WRD World Report on Disability
SO Sistema Operacional
SUMÁRIO
1 INTRODUÇÃO ........................................................................................ 16
1.1 CONTEXTUALIZAÇÃO DO PROBLEMA DA PESQUISA ....................... 18
1.2 OBJETIVOS ............................................................................................ 19
1.2.1 Objetivo Geral ........................................................................................ 19
1.2.2 Objetivos Específicos ........................................................................... 19
1.3 JUSTIFICATIVA ...................................................................................... 20
2 FUNDAMENTAÇÃO TEÓRICA .............................................................. 21
2.1 DEFICIÊNCIA VISUAL ............................................................................ 21
2.2 TECNOLOGIA ASSISTIVA...................................................................... 23
2.3 INTELIGÊNCIA ARTIFICIAL ................................................................... 25
2.3.1 Redes Neurais Convolucionais ............................................................ 26
2.3.1.1 Visão Computacional............................................................................... 27
2.3.1.1.1 Processamento digital de imagens .......................................................... 29
2.3.1.1.2 Biblioteca OpenCV (Open Source Computer Vision Library) ................... 31
2.3.1.2 Biblioteca TensorFlow ............................................................................. 32
2.4 ANDROID ................................................................................................ 33
2.4.1 Tecnologias de Voz ............................................................................... 34
2.4.1.1 Reconhecimento de Voz ......................................................................... 34
2.4.1.2 Sintetizador de Voz ................................................................................. 35
2.5 AVALIAÇÃO DE USABILIDADE .............................................................. 36
2.6 TRABALHOS RELACIONADOS ............................................................. 38
3 METODOLOGIA ..................................................................................... 40
3.1 CLASSIFICAÇÃO DA PESQUISA ........................................................... 40
3.2 UNIVERSO E AMOSTRA ........................................................................ 41
3.3 COLETA E ANÁLISE DOS DADOS ........................................................ 42
4 ANÁLISE E RESULTADOS DOS DADOS ............................................. 43
4.1 ESTUDO DE VIABILIDADE..................................................................... 43
4.1.1 Questionário .......................................................................................... 44
4.1.2 Entrevista e criação de personas ......................................................... 52
4.2 DESENVOLVIMENTO DO PROTÓTIPO................................................. 54
4.2.1 Processo de Prototipagem ................................................................... 54
4.2.2 Rede Neural ........................................................................................... 56
4.3 VALIDAÇÃO DO USUÁRIO .................................................................... 58
5 CONSIDERAÇÕES FINAIS .................................................................... 61
5.1 CONTRIBUIÇÕES .................................................................................. 62
5.2 LIÇÕES APRENDIDAS ........................................................................... 63
5.3 TRABALHOS FUTUROS ........................................................................ 64
REFERÊNCIAS ....................................................................................... 65
APÊNDICE A – PESQUISA SOBRE A ANÁLISE DE UM APLICATIVO
VOLTADO PARA DEFICIENTES VISUAIS ............................................ 74
APÊNDICE B – ENTREVISTA COM DEFICIENTE VISUAL ................... 79
APÊNDICE C – PERSONAS .................................................................. 82
APÊNDICE D – QUESTIONÁRIO DE USABILIDADE ............................ 83
1 INTRODUÇÃO
Gráfico 1 – Porcentagem da população por tipo, grau de dificuldade e deficiência, Brasil ‒ 2010
Silveira (2020) diz que o uso de tecnologias móveis (tais como os smartphones
e aplicativos mobile) possibilita que as pessoas tenham acesso a informações a
qualquer momento, em qualquer lugar e por qualquer pessoa, pois as tecnologias
móveis atualmente estão presentes até mesmo em áreas onde livros e computadores
são escassos.
Com o avanço dos recursos tecnológicos, a inclusão social tem permitido que
o indivíduo com deficiência visual possa estar cada vez mais integrado ao meio em
16
que ele está inserido. O surgimento da tecnologia assistiva tem como objetivo a
utilização de ferramentas que auxiliam pessoas com deficiência visual nas tarefas
comuns do dia a dia, como é o caso dos meios de acessibilidade TalkBack e o
VoiceOver, recursos padrões de leitores de tela disponibilizados nos sistemas Android
e IOS que auxiliam o deficiente visual na utilização do seu dispositivo móvel (CTA –
Centro Tecnológico de Acessibilidade/RS, 2021).
Dessa forma, o presente TCC pretende analisar a viabilidade do aplicativo Meu
Dinheiro mediante investigação da sua funcionalidade na identificação de cédulas,
bem como o feedback obtido através da saída sonora, constatando ou não se o
aplicativo conseguiu ser utilizado independentemente pelo usuário com deficiência
visual, sem o auxílio de terceiros. Além disso, propõe-se desenvolver um protótipo de
um APP chamado See que visa reconhecer o valor de uma moeda brasileira ao fazer
uma compra ou um pagamento, com o intuito de solucionar os reais problemas
enfrentados pelos deficientes nas realizações de tarefas simples do seu dia a dia,
contribuindo com maior independência e qualidade de vida de forma acessível. Por
fim, este TCC se propõe a implementar o protótipo do APP See baseado na demanda
evidenciada pela pesquisa de caso e na pesquisa de usabilidade realizada pelas
autoras cumprido os critérios do questionário de System Usability Scale (SUS) para
avaliar a usabilidade em termos de inteligibilidade, apreensibilidade, operacionalidade,
atratividade e conformidade relacionada à usabilidade.
Neste contexto, o presente Trabalho de Conclusão de Curso (TCC) encontra-
se estruturado nas etapas descritas pela Figura 1. No passo 1 (fundamentação
teórica) foram pesquisados os seguintes assuntos: deficiência visual, tecnologias
assistivas, inteligência artificial, redes neurais, visão computacional, processamento
digital de imagens, biblioteca openCV, biblioteca tensorflow, android, tecnologias de
voz, reconhecimento do comando de voz, sintetizador de voz, avaliação de
usabilidade e trabalhos relacionados. No passo 2 foi feito um estudo de caso do
aplicativo denominado Meu Dinheiro, disponível na Play Store, com o intuito de
verificar sua usabilidade e aceitabilidade dos usuários com relação à tecnologia
assistiva. No passo 3 foi feito o desenvolvimento do protótipo APP See, que se propõe
a identificar o valor das moedas para os deficientes visuais. Por fim, no passo 4 foi
realizada a validação da proposta para avaliar a usabilidade do APP See
17
Figura 1 – Passos metodológicos do presente TCC
1.2 OBJETIVOS
1.3 JUSTIFICATIVA
20
2 FUNDAMENTAÇÃO TEÓRICA
De acordo com dados da Fundação Dorina Nowil para cegos (2019) “Do total
da população brasileira, 23,9% (45,6 milhões de pessoas) declararam ter algum tipo
de deficiência. Entre as deficiências declaradas, a mais comum foi a visual, atingindo
3,5% da população”. Além disso, dados da Organização Mundial da Saúde apontam
as principais causas de cegueira no Brasil. São elas: catarata, glaucoma, retinopatia
diabética, cegueira infantil e degeneração macular (OMS, 2018).
Não apenas os dados expostos acima, a Fundação Dorina Nowil para cegos
(2019) também cita dados do IBGE de 2010:
A tecnologia pode ser utilizada por qualquer pessoa que apresenta alguma
deficiência ou não. Deve-se considerar que a tecnologia assistiva tem um papel
indispensável na vida das pessoas com deficiência, pois irá ajudá-las em diversas
atividades ou desempenho nas tarefas desejadas. Portanto, é extremamente oportuno
que dediquemos especial atenção ao entendimento das tecnologias de apoio do
Comitê de Ajudas Técnicas.
Segundo o Comitê de Ajudas Técnicas (2009):
23
Neste sentido, a tecnologia assistiva possui um grande valor para as pessoas
com deficiência. Muitas delas ainda não têm condições financeiras e recursos para
adquirir dispositivos móveis que possam auxiliá-los nas atividades diárias.
Neste sentido, a tecnologia assistiva é baseada em recursos e métodos que
auxiliam as pessoas com deficiência nas suas atividades, facilitando a sobrevivência
e proporcionando mais autonomia para essas pessoas.
Nicácio (2010, p. 15), coloca que:
[...] pessoas sem deficiência, sistemas da Web facilitam a vida, mas para
quem não pode ver ou ouvir ou andar, estes mesmos sistemas são mais do
que facilitadores. Para essas pessoas, ter acesso a esses sistemas, muitas
vezes significa tornar possível a realização de tarefas que, de outra forma,
exigiriam um esforço imenso ou até mesmo seriam impossíveis de serem
realizadas.
[...] as tecnologias estão presentes em cada uma das pegadas que o ser
humano deixou sobre a terra, ao longo de toda a sua história. Desde um
simples pedaço de pau que tenha servido de apoio, de bengala, para um
homem no tempo das cavernas, por exemplo, até as modernas próteses de
fibra de carbono que permitem, hoje, que um atleta com amputação de ambas
as pernas possa competir em uma Olimpíada, disputando corridas com outros
atletas sem nenhuma deficiência. [...]
25
Nesse contexto, a máquina imitaria a mente humana através do processo de
inferência, e é justamente por esse fator que se faz necessário o estudo da IA, para
compreender, não só o comportamento, bem como suas atividades mentais.
De acordo com IBM (2020), inteligência artificial (IA) é uma tecnologia que usa
um mecanismo de processamento que simula a inteligência humana e é programada
através de softwares com capacidades de desenvolver raciocínios e tomar decisões
por conta própria.
Diante das pesquisas realizadas e artigos estudados, a Inteligência Artificial
apresenta uma vasta biblioteca de códigos abertos que ajudam no processamento da
imagem, tanto na classificação quanto na avaliação. Por isso, através dela há
melhores resultados nos treinos e testes ao reconhecer uma moeda, visto que é
bastante abrangente e envolve uma imensidão de métodos e técnicas capazes de
desenvolver softwares cada vez mais inteligentes e autossuficientes aptos a imitar a
capacidade humana de tomar decisões e solucionar problemas através do
cruzamento de percepções, dados e ideias (CITTÀ TELECOM, 2020).
A partir de tais conceitos, é importante destacar também que a visão
computacional é de suma importância para o pré-processamento de uma imagem,
visto que nem sempre o dataset representa a realidade. Desta forma, o pré-
processamento pode ajudar as imagens de um dataset limitado a se assemelhar às
do mundo real. Dito de outra forma, a visão computacional é um ramo da inteligência
artificial.
Diante da ideia de planejamento e criação de um aplicativo voltado para
deficientes visuais que auxiliasse no reconhecimento de moedas, os meios utilizados
para obter um melhor resultado seria utilizar a inteligência artificial agregada à visão
computacional e redes neurais convolucionais.
Levin (2006) afirma que, visão computacional se refere a uma ampla classe de
algoritmos que permite aos computadores fazerem leituras e interpretações de
imagens digitais e de vídeo.
Visão computacional é um campo da ciência e da tecnologia que utiliza
computadores para enxergar e compreender o mundo visual, ou seja, tecnologias de
máquinas que processam imagens. Ela procura desenvolver teoria e prática para a
construção de sistemas artificiais que obtêm informação de imagens (AZEVEDO;
CONCI; VASCONCELOS, 2018).
27
Na visão de Graciano (2007), diversos problemas práticos envolvendo sistemas
de visão computacional, tais como vigilância automatizada, pesquisas de conteúdo
específico em bancos de dados multimídias ou edição de vídeo, requerem a
localização e o reconhecimento de objetos dentro de sequências de imagens ou
vídeos digitais.
Para Shapiro e Stockman (2000): “A meta da visão computacional é tomar
decisões sobre objetos físicos reais a partir de cenas baseadas em imagens
captadas”. Deste modo, compreende-se que a visão computacional busca reproduzir
por meios de técnicas computacionais as imagens, fazendo leituras de áudios e
vídeos, ou seja, é a ciência que vai estudar, estruturar e criar maneiras para que a
máquina através do algoritmo processe a imagem.
A visão computacional compreende os campos do processamento da imagem,
modelos de reconhecimento, análises da cena, interpretação da cena, processamento
óptico, processamento de vídeo e a compreensão da imagem (HAVENS, 1983;
COHEN, 1984; VÁMOS, 1986).
Para Conci, Azevedo e Leta (2008), a visão computacional é a área que trata
da extração de informações das imagens e da identificação e classificação de objetos
presentes nessas imagens. Estes sistemas têm sido usados em reconhecimento de
pessoas, de assinaturas, de impressões digitais, inspeção de peças em linhas de
montagem e até na orientação de movimentos de robôs na indústria automatizada.
Entre tantas definições, Budiharto e Group (2014) afirma que, visão
computacional é a emulação da visão humana no computador, ou seja, fazer com que
a partir de imagens captadas de uma câmera, o computador possa pensar e tomar
decisões sobre aquilo que está vendo. A quantidade de informações que podem ser
obtidas através de visão computacional, assim como na visão humana, é muito
grande, gerando muitas possibilidades, por essa razão é a tecnologia mais importante
no futuro em desenvolvimento de interatividade de robôs. Podendo ser utilizada para
identificação de objetos, reconhecimento facial, reconhecimento de movimentos
através de gestos, processamento e produção de vídeos e aprendizado de máquina.
A visão computacional ou de máquina, compreende técnicas e métodos para
manipulação de imagem. A imagem é capturada por uma câmera, características são
extraídas e decisões são tomadas através dessas informações (BECKER, 2013).
Backes e Junior (2016) dizem que:
28
A visão computacional é uma área de estudo que busca repassar para
máquinas a capacidade de visão, não só a habilidade de captar imagens, mas
de processá-las e melhorá-las a fim de obter diferentes informações sobre
uma imagem, como profundidade, cor, textura, forma, e relacioná-las com
imagens já vistas.
29
Desta maneira, processamento de imagens é um conjunto de métodos utilizado
para transformar a imagem de forma que a torne mais adequada à visão humana ou
à análise computacional.
Segundo Petrou e Petrou (2010), a área de processamento de imagem foi
desenvolvida em resposta a três grandes problemas: digitalização da imagem e
codificação para facilitar a impressão, transmissão e armazenamento de imagens e
necessidade de melhoramento da imagem para facilitar a interpretação de dados
gráficos por máquinas.
Por meio de extração de informação ou transformação da imagem através do
processamento, a imagem melhora seu aspecto e facilita sua análise. A área de
processamento de imagens consiste em desenvolver técnicas de compressão dos
mecanismos de visão natural e artificial e em fornecer ferramentas cujo desempenho
aproxima-se o mais possível das extraordinárias capacidades do sistema visual
humano (FACON, 1993).
As seguintes áreas estão relacionadas ao processamento digital de imagem:
computação gráfica, processamento de dados, visão computacional, inteligência
artificial, reconhecimento de padrões, animação e multimídia.
Uma das primeiras aplicações de técnicas de processamento de imagens
segundo Gonzales (2000) foi à melhoria da informação visual, onde o interpretador
era o homem.
Existem diversas formas de ser aplicada o processamento de imagens, são
elas: fotografia e impressão, imagens de satélite, medicina, detecção de face ou de
objeto e biometria.
As principais categorias de aplicações em processamento de imagens são a
melhoria da informação visual para a interpretação humana e a análise automática por
sistemas computacionais de uma imagem (FILHO; NETO, 1999). Através de conjunto
de operações matemáticas (algoritmos), o processamento é aplicado sobre uma
imagem e o resultado disso é uma outra imagem.
Segundo Gonzalez e Woods (2000), existem alguns passos que devem ser
seguidos para processar imagens, como: aquisição de Imagens, pré-processamento,
segmentação, representação e descrição e reconhecimento de interpretação.
30
1 – Aquisição de imagens: Início para o processamento de imagem. É nesta
etapa que serão adquiridas as imagens que vão formar o dataset que será
posteriormente processado.
2 – Pré-Processamento: Realiza a melhoria da imagem. Nesta fase é feito os
ajustes de contraste, redução de ruído, entre outras melhorias. Também podemos
piorar a qualidade do nosso dataset para imitar as condições do mundo real, como por
exemplo, celulares com câmeras de baixa qualidade, imagem tirada às pressas sem
boa resolução, etc.
3 – Segmentação: Divisão da imagem em unidades significativas, ou seja,
seleciona as partes que interessam na imagem;
4 – Representação e descrição: Transformação dos dados obtidos pela fase
de segmentação;
5 – Reconhecimento e interpretação: Análise da imagem.
Nos termos deste TCC utilizamos a biblioteca OpenCV para fazer o pré-
processamento do dataset. Esta biblioteca será explorada no capítulo seguinte.
32
É importante destacar que o TensorFlow possui uma interface de programação
simples em linguagem Python, que traz um desenvolvimento simplificado para o
programador final. Sua execução une a facilidade da linguagem Python com a
aplicação de alta performance escrita em C/C++. Sua arquitetura se divide em três
partes, sendo elas: pré-processamento dos dados, construção dos modelos e
treinamento do modelo criado (ARAÚJO et al., 2017).
2.4 ANDROID
33
em GNU/Linux, uma interface visual rica, GPS, diversas aplicações já instaladas e um
ambiente de desenvolvimento poderoso, inovador e flexível.
O desenvolvimento de aplicações Android é atrelado à linguagem de
programação Java. Não é requerido sistema operacional específico e a IDE indicada
pelo Google é o Android Studio, oficial para desenvolvimento de aplicativos Android
(ANDROID, 2016b).
Para Behlau (2004) apud Braz (2008), a voz é uma das ferramentas primárias
e mais imediatas que o ser humano dispõe para interação entre as pessoas e com a
sociedade. O reconhecimento de voz foi criado através de diversos estudos, como:
definições matemáticas, transformações de Fourier, estudos da definição da fala e as
regras das formações gramaticais.
Para que o processamento de reconhecimento de voz seja aplicado, o mesmo
está dividido em quatro categorias: comando por voz, fala natural, síntese de voz e
autenticação de voz. Sobre isso, Damasceno (2005) explica que, o software de
reconhecimento de voz compara o sinal processado com os padrões existentes,
agrupa os sinais reconhecidos dentro de uma determinada categoria e disponibiliza,
em uma saída, as palavras ou expressões reconhecidas.
34
Marin e Cunha (2006) definem que, o reconhecimento de voz é:
Para que a interface ofereça uma interação intuitiva, o projeto deve ter como
meta a usabilidade, característica que determina se o manuseio de um produto é fácil
e de simples aprendizagem satisfazendo seus usuários, bem como resolvendo as
tarefas para as quais ele foi projetado (FERREIRA; CHAUVEL; FERREIRA, 2007
apud NIELSEN, 2007).
Dessa forma, se a usabilidade orientar o desenvolvimento do sistema, seus
usuários se sentirão confortáveis e encorajados em usá-lo. Vale destacar que uma
aplicação orientada à usabilidade não necessariamente é orientada à acessibilidade,
e vice-versa. Ou seja, ela pode ser de fácil uso para usuários comuns, mas inacessível
para os deficientes visuais (HANSON, 2004 apud SHNEIDERMAN, 2004).
Cybis, Betil e Faust (2010, p. 16) definem usabilidade como sendo:
36
capacidade que um software deve possuir de aprendizado, operabilidade, proteção
contra erros dos usuários, estética da interface de usuário e acessibilidade"
(REZENDE, 2013 apud FERREIRA; DRUMOND, 2002).
Através da NBR ISO/IEC 9126-1 é possível realizar análises de características
do software para que se defina o modelo de qualidade a ser utilizado, sempre na busca
de identificar as necessidades do usuário e também avaliar as características de
qualidade do software finalizado.
Para validar se o protótipo desenvolvido tem boa usabilidade foi feito um estudo
de usabilidade, isto é, capacidade do produto de software de ser compreendido,
aprendido, operado e atraente ao usuário, quando usado sob condições
especificadas. Para isso foram estudadas todas as subcaracterísticas de usabilidade:
inteligibilidade, apreensibilidade, operacionalidade, atratividade e conformidade
relacionada à usabilidade.
• Inteligibilidade: capacidade do produto de software de possibilitar ao usuário
compreender se o software é apropriado e como ele pode ser usado para
tarefas e condições de uso específicas;
• Apreensibilidade: capacidade do produto de software de possibilitar ao
usuário aprender sua aplicação;
• Operacionalidade: capacidade do produto de software de possibilitar ao
usuário operá-lo e controlá-lo;
• Atratividade: capacidade do produto de software de ser atraente ao usuário;
• Conformidade: capacidade do produto de software de estar de acordo com
normas, convenções, guias de estilo ou regulamentações relacionadas à
usabilidade (NBR 9126-1, 2003).
O Quadro 1 sumariza como o produto de software apresenta cada
subcaracterística de usabilidade.
37
Quadro 1 – Subcaracterísticas de Usabilidade – NBR 9126-1
39
3 METODOLOGIA
41
3.3 COLETA E ANÁLISE DOS DADOS
42
4 ANÁLISE E RESULTADOS DOS DADOS
4.1.1 Questionário
44
Gráfico 2 – Nível de escolaridade
45
Gráfico 4 – Grau de perda visual
Como foco principal também desse estudo, após a análise das respostas do
formulário on-line no que concerne a utilização de recursos, ferramentas e serviços da
tecnologia assistiva, observa-se no Quadro 2 que há uma diversidade em sua
utilização.
Assim sendo, baseado nos dados obtidos no Gráfico 5, conclui-se que a maior
necessidade de uso é do leitor de tela para celular. Hipoteticamente o uso do celular
está no topo dos mais utilizados pelos deficientes visuais devido a sua maior facilidade
de manuseio e custo financeiro. Com isso, conclui-se que por ser a ferramenta mais
utilizada, ajuda os usuários na utilização de aplicativos, como por exemplo o de
reconhecimento de cédulas, auxiliando-os nas necessidades diárias de cada um.
46
Gráfico 5 – Ferramentas utilizadas em suas atividades do dia-a-dia
47
Gráfico 7 – Frequência do uso do celular
49
Do mesmo modo que a grande maioria dos colaboradores mencionaram que o
aplicativo Meu Dinheiro facilita no reconhecimento do dinheiro mostrado no Gráfico
12, 78,9% concordam totalmente que o feedback dado como resposta no
reconhecimento facilita o seu entendimento durante o manuseio do mesmo, pois após
o reconhecimento ser feito a efetivação do comando de voz é ativado. Em contraste
com esse percentual, 21,1% concordam parcialmente. Possivelmente os 21,1%
concordam parcialmente devido à dificuldade encontrada em alguns momentos do
aplicativo reconhecer a cédula aberta posicionada em uma superfície plana, e em
outros momentos só reconhecer quando a cédula está dobrada.
50
Gráfico 13 – Manuseio do APP Meu Dinheiro
Para que o aplicativo Meu Dinheiro possa ser utilizado é necessário que o
dispositivo móvel tenha o sistema operacional Android, uma câmera para o
reconhecimento do dinheiro e o comando de voz para a resposta desse
reconhecimento. Sabe-se que o crescente uso desses aparelhos tecnológicos por
pessoas com deficiência visual tem aumentado consideravelmente com o passar dos
anos, mesmo com as atuais dificuldades, uma delas o medo de utilizar essa tecnologia
como citado anteriormente. Como resposta referente a facilidade em utilizar o
aplicativo mostrado no Gráfico 14, 42,1% dos colaboradores classificaram como muito
bom, 47,4% como bom e 10,5% como normal. Mais uma vez realça que o aplicativo
necessita de melhorias para que o mesmo facilite o deficiente visual ao utilizá-lo em
seu dia a dia.
51
4.1.2 Entrevista e criação de personas
Figura 2 – Persona 1
52
Figura 3 – Persona 2
53
4.2 DESENVOLVIMENTO DO PROTÓTIPO
O protótipo do APP See foi criado da maneira descrita na Figura 4: tela inicial
onde estará o slogan do APP; a tela de notificação onde estará a parte de feedback
auditivo para interação com o usuário final; e a tela de câmera onde será feita a
captura da moeda e enviada para a rede neural onde será feito o processamento e a
identificação do valor da moeda.
55
4.2.2 Rede Neural
56
Por meio do modelo sequencial foi criada a estrutura da rede, onde foi
adicionada às camadas de rede neural convolucional. No primeiro momento foi gerada
uma camada de entrada e as camadas (Conv2D, Filtro (Kernel), ReLU e MaxPooling)
para extrair as características dos dados. Na sequência, todo este processo (Conv2D,
Filtro (Kernel), ReLU e MaxPooling) foi refeito para as camadas seguintes,
adicionando o BatchNormalization e o GlobalMaxPooling2D. Por fim, houve a
classificação dos dados através da camada totalmente conectada (Dense), em que a
função Softmax é utilizada para fazer a ativação da rede de classificação já que seu
resultado é interpretado como uma distribuição de probabilidade, jogando o resultado
para a camada de saída. A Figura 8 resume a quantidade de parâmetros utilizada em
cada camada descrita acima.
57
todo o conjunto de dados de treinamento pela rede neural) e a predição de uma
imagem.
58
Com base no questionário proposto por Lewis (2018) apud Revythi e Tselios
(2019) e na NBR ISO/IEC 9126-1 de 2003 foi realizado o Apêndice D - Questionário
de usabilidade com perguntas que abrangem todas as subcaracterísticas de
usabilidade: Inteligibilidade, apreensibilidade, operacionalidade, atratividade e
conformidade.
O questionário se inicia com uma das subcaracterísticas de usabilidade, a
inteligibilidade. Nessa questão, evidencia-se que o reconhecimento de moedas por
comando de voz no APP See desenvolvido é necessário e imprescindível para o
deficiente visual em meio às suas necessidades diárias. Logo, a concordância em sua
totalidade no que concerne a sua inteligibilidade é notável, pois sem a tecnologia do
comando de voz o deficiente não conseguiria realizar o que é proposto pelo APP.
Em um primeiro contato com o aplicativo, percebe-se que o mesmo não
apresenta dificuldades desde o seu acesso inicial até a realização do reconhecimento
de fato da moeda. Com isso, é importante mencionar que o APP See é de fácil
compreensão e suas etapas são descritas de forma clara. Porém, também é
necessário destacar que seus usuários poderão apresentar algumas dificuldades em
seu dispositivo móvel para localizá-lo, visto que mesmo utilizando o TalkBack, as
informações para encontrá-lo poderão ocorrer de forma lenta devido ao fato de entrar
em aplicativos diferentes ou até mesmo ter que tocar duas vezes na tela do seu
dispositivo para ter a resposta do que deseja.
Após a inserção efetiva no aplicativo, os comandos de voz são acionados e os
procedimentos para o reconhecimento da moeda são colados através de notificações
via comando de voz. O sintetizador de voz situa e ao mesmo tempo orienta o usuário,
seja ele deficiente visual ou não para os passos seguintes, como por exemplo, o tipo
de moeda e sua posição em frente a câmera do dispositivo. Em seguida, a câmera é
automaticamente acionada e um segundo áudio é ativado. Nele, a indicação de alerta
para que a moeda seja posicionada em frente a câmera é falada e nesse momento o
reconhecimento acontece. O feedback da imagem é proferido como resposta ao valor
da moeda e o reconhecedor de voz é acionado perguntando se o usuário deseja fazer
um novo reconhecimento ou não. Caso a escolha seja sim, todo o procedimento é
realizado novamente. Caso a resposta seja não, encerra-se o seu uso. Destaca-se
como ponto positivo o fato de poder ouvir os resultados através do comando de voz
das etapas que são realizadas ao longo da utilização do protótipo.
59
Portanto, conclui-se que as instruções de como utilizar o APP See são claras e
objetivas e a forma de interação por voz facilita a identificação de como usar o
protótipo, sendo entendido através do retorno do reconhecimento da moeda por meio
do feedback como resposta da classificação da mesma.
Ao término de todas as etapas das subcaracterísticas de usabilidade, conclui-
se que as ações propostas pelo APP See foram satisfatórias ao que se desejava e
esperava alcançar, pois é de fácil compreensão, suas etapas são descritas de forma
clara e sua função é de total importância para o deficiente visual frente a uma de suas
necessidades diárias. Constata-se que mediante as limitações do sistema operacional
Android pode ser desafiador para a pessoa portadora de deficiência visual encontrar
rapidamente o aplicativo desejado ao utilizar o próprio dispositivo móvel, um recurso
do próprio SO para minimizar essa limitação é a busca através da Inteligência Artificial
de Pesquisa do Google integrado em dispositivos smartphones modernos.
Sugere-se a aplicação do questionário de usabilidade desenvolvido pelas
autoras e presente no Apêndice D com uma amostra maior para uma validação do
APP See em pesquisas futuras.
60
5 CONSIDERAÇÕES FINAIS
61
Em trabalhos futuros o APP See será disponibilizado no Play Store para
download, e assim, poderá ser utilizado não somente pelo deficiente visual, mas como
por qualquer usuário final.
Uma das considerações proposta neste trabalho é da otimização do software
desenvolvido para cálculos de conjuntos de moedas identificadas, de modo que um
deficiente visual ou não, possa através de uma simples fotografia obter o resultado da
soma das moedas, funcionalidade que pode agregar nas operações financeiras
diárias de qualquer pessoa e transformar os meios de pagamentos atuais através de
modernização.
5.1 CONTRIBUIÇÕES
62
Receber o feedback dos testes realizados com aplicativo de terceiros e o
desenvolvimento do protótipo do APP See fez toda diferença para a reflexão, análise
e construções futuras do tema abordado
63
5.3 TRABALHOS FUTUROS
64
REFERÊNCIAS
ABADI, M.; AGARWAL, A.; BARHAM, P.; BREVDO, E.; CHEN, Z.; CITRO, C.;
CORRADO, G. S.; DAVIS, A.; DEAN, J.; DEVIN, M.; GHEMAWAT, S.;
GOODFELLOW, I.; HARP, A.; IRVING, G.; ISARD, M.; JIA, Y.; JOZEFOWICZ, R.;
KAISER, L.; KUDLUR, M.; LEVENBERG, J.; MANÉ, D.; MONGA, R.; MOORE, S.;
MURRAY, D.; OLAH, C.; SCHUSTER, M.; SHLENS, J.; STEINER, B.; SUTSKEVER,
I.; TALWAR, K.; TUCKER, P.; VANHOUCKE, V.; VASUDEVAN, V.; VIÉGAS, F.;
VINYALS, O.; WARDEN, P.; WATTENBERG, M.; WICKE, M.; YU, Y.; ZHENG, X.
TensorFlow: Large-Scale Machine Learning on Heterogeneous Systems. 2015
Software available from tensorflow.org. Disponível em: http://tensorflow.org/.
Acessado em: 11 de junho de 2021.
BAGGIO, D. L. OpenCV 3.0 Computer Vision with Java. [S.l.]: Packt Publishing Ltd,
2015. Acessado em: 03 de maio de 2021.
65
BEHLAU, M.; AZEVEDO, R.; PONTES, P. Conceito da voz normal e classificação das
disfonias. In: BEHLAU, Mara (Org.). Voz – O livro do especialista. v.1. Rio de
Janeiro: Revinter, 2004. p.53-84. Acessado em: 05 de julho de 2021.
BRADSKI, G.; KAEHLER, A. Learning OpenCV: Computer vision with the OpenCV
library. América. O’Reilly Media, Inc. 1ª ed. 2008. 580 p. ISBN: 978-0-596-51613-0.
Acessado em: 05 de maio de 2021.
COHEN, M. H.; GIANGOLA, J. P.; BALOGH, J. Voice User Interface Design, Addison
Wesley. ISBN: 0-321-18576-5. 368 pp., 2004. Acessado em: 09 de julho de 2021.
CONCI, A.; AZEVEDO, E.; LETA, F. R. Computação Gráfica – Teoria e Prática. Rio
de Janeiro: Campus/Elsevier. 2008. 2 ed. Vol. 2. 432 p. ISBN: 978-85-352-2329-3.
Acessado em: 14 de abril de 2021.
66
COSTA, C. I. da. As tecnologias têm um impacto? In: LÉVY, P. Cibercultura. São
Paulo: Ed. 34, 1999. p. 21-30. Acesso em: 10 de fevereiro de 2021.
DEBATIN, L.; FILHO, A.; NAU, J.; ZANCHETT, P.; CORREIA, W. Implementação de
API para Reconhecimento e Sintetização de Voz em um Aplicativo Móvel. In:
SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 13., 2017,
Lavras. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2017. p. 151-
157. DOI: https://doi.org/10.5753/sbsi.2017.6037. GONZALEZ; WOODS.
Processamento Digital de Imagens. 3ª ed. Ed. Pearson, 2009. Acessado em: 15 de
julho de 2021.
DEMARTINI, F. Brasil já tem mais de um smartphone ativo por habitante. [S. l.].
2018. Disponível em: <https://canaltech.com.br/produtos/brasil-ja-tem-mais-de-um-
smartphone-ativo-por-habitante-112294/>. Acessado em: 19 de julho de 2021.
DORINA, 2019. Estatísticas sobre pessoas cegas e com baixa visão. Sobre pessoas
cegas e com baixa visão no Brasil. Fundação Dorina Nowill para Cegos, 2019.
Disponível em: <http://fundacaodorina.org.br/a-fundacao/pessoas-cegas-e-com-
baixa-visao/estatisticas-da-deficiencia-visual/>. Acessado em: 15 de fevereiro de
2021.
67
FERREIRA, S.; CHAUVEL, M.; FERREIRA, S. E-acessibilidade: Tornando Visível
o Invisível. In: Morpheus – Revista Eletrônica em Ciência Humanas – Ano 06, número
10, 2007. Acessado em: 03 de agosto de 2021.
GIL, A. C. Métodos e técnicas de pesquisa social. 5.ed. São Paulo: Ed. Atlas S. A.,
1999, 208 p. ISBN: 978-85-224-2270-8. Acessado em: 04 de outubro de 2021.
GIL, A. C. Métodos e técnicas de pesquisa social. 6.ed. São Paulo: Ed. Atlas S. A.,
2008. 220 p. ISBN 978-85-224-5142-5. Acessado em: 07 de outubro de 2021.
68
HANSON, V. L. The User Experience: Designs and Adaptations. Proceedings of
International Cross-Disciplinary Workshop on Web, p. 13, 2004. Acessado em: 09 de
agosto de 2021.
HIGA, P. 95,5% dos smartphones vendidos no Brasil são Androids. [S. l.]. 2016
Disponível em: <https://tecnoblog.net/203749/Android-ios-market-share-brasil-3t-
2016/>. Acessado em: 23 de julho de 2021.
LECUN, Y.; BENGIO, Y.; HINTON, G. Deep learning. Nature, Springer Science and
Business Media LLC. Vol. 521. n. 7553. 2015. p. 436–444. Acessado em: 12 de março
de 2021.
LEVIN, G. Computer Vision for Artists and Designers: Pedagogic Tools and
Techniques for Novice Programmers. Journal of Artificial Intelligence and Society.
London. Vol. 20. Ed. 4. Springer Verlag. Sep 2006: 462-482. DOI:10.1007/s00146-
006-0049-2. Disponível em http://www.flong.com/texts/essays/essay_cvad/.
Acessado em: 15 de março de 2021.
LEWIS, J. R. The system usability scale: Past, present, and future. International
Journals of Human – Computer Interaction. Vol. 34, 7ª Ed., 2018. Acessado em: 15 de
outubro de 2021.
69
Dissertação (Bacharelado em Engenharia da Computação) – Pontifícia Universidade
Católica de Campinas. Campinas, 2019, 6 f. ISSN: 2447-8326. V.1. Acessado em: 21
de setembro de 2021.
MUNARI, B. Das Coisas Nascem Coisas. 2ª ed. São Paulo: Martins Fontes, 2008,
388p. Acessado em: 18 de outubro de 2021.
70
PAPAJORGJI, P. Automated Enterprise Systems for Maximizing Business
Performance. 1 edition. ed. Hershey, PA: IGI Global, 2015. ISBN 978-1-4666-8841-
4. Acessado em: 18 de agosto de 2021.
SHAPIRO, L.; STOCKMAN G. Computer Vision. 1ª ed. Ed. Prentice Hall, Inc. 2000.
617 p. Acessado em: 26 de abril de 2021.
SILVEIRA, C.; BERTOLINI, C.; PARREIRA, F. J.; SILVEIRA, S. R.; ULBRICHT, V. R.;
ALMEIDA, I. C. de; GELLER, M.; RIBEIRO, V. G. Money Identifier: aplicativo
identificador de cédulas para dispositivos móveis. Research, Society and
Development [S. l.], v. 9, n. 1, p. e07911393, 2020. DOI: 10.33448/rsd-v9i1.1393.
71
Disponível em: <https://rsdjournal.org/index.php/rsd/article/view/1393/1392>.
Acessado em: 20 de janeiro 2021.
VIANNA, M.; VIANNA, Y.; ADLER, I. K; LUCENA, B.; RUSSO, B. Design thinking:
inovação em negócios. 2ª ed. Rio de Janeiro: MJV Press, 2018. 162 p. ISBN 978-
85-65424-00-4. Acessado em: 26 de outubro de 2021.
72
YIN, R. K. Estudo de caso: planejamento e métodos. 4ª ed. Porto Alegre: Bookman,
2010. 248 p. ISBN: 978-85-778-0655-3. Acessado em: 27 de outubro de 2021.
73
APÊNDICE A – PESQUISA SOBRE A ANÁLISE DE UM APLICATIVO VOLTADO
PARA DEFICIENTES VISUAIS
74
75
76
77
78
APÊNDICE B – ENTREVISTA COM DEFICIENTE VISUAL
79
80
81
APÊNDICE C – PERSONAS
82
APÊNDICE D – QUESTIONÁRIO DE USABILIDADE
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
83
4. Você teve dificuldades ao utilizar o aplicativo.
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
84
8. Você pode ouvir os resultados de cada ação que realiza.
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
□ Discordo Totalmente
□ Discordo
□ Neutro
□ Concordo
□ Concordo Totalmente
85