Rotulação de símbolos matemáticos manuscritos via casamento de expressões [thesis]

Willian Yukio Honda
Primeiramente, gostaria de agradecer a Deus por todas as conquistas em minha vida. À minha querida família pelos valores, princípios, incentivo, apoio, força e encorajamento. Sem eles, não seria nada do que sou hoje. À Roberta Sayuri da Costa Iraha, por todo o carinho e mensagem positiva que resultaram em motivação. À Prof a . Dr a . Nina S. T. Hirata pelos ensinamentos, auxílio e paciência, elementos essenciais para meu aprendizado. Muito obrigado pela excelente orientação e condução em todo o
more » ... meu mestrado. Também aproveito para agradecer a todos os mestres que guiaram minha vida e me auxiliaram a construir a base do meu conhecimento. Ao Alexandre Noma, pela inspiração e importante contribuição para os alicerces deste trabalho. Sem eles, o mesmo não teria toda força para seu sucesso. Ao Frank Dennis Julca Aguilar pela excelente ferramenta visual do ExpressMatch e por toda a ajuda e contribuição no desenvolvimento do trabalho, essenciais para a realização dos experimentos, análise dos resultados e qualidade da apresentação. À todos os meus amigos que diretamente ou indiretamente me incentivaram a lutar por essa conquista. Muito obrigado. i Resumo O problema de reconhecimento de expressões matemáticas manuscritas envolve três subproblemas importantes: segmentação de símbolos, reconhecimento de símbolos e análise estrutural de expressões. Para avaliar métodos e técnicas de reconhecimento, eles precisam ser testados sobre conjuntos de amostras representativos do domínio de aplicação. Uma das preocupações que tem sido apontadas ultimamente é a quase inexistência de base de dados pública de expressões matemáticas, o que diculta o desenvolvimento e comparação de diferentes abordagens. Em geral, os resultados de reconhecimento apresentados na literatura restringem-se a conjuntos de dados pequenos, não disponíveis publicamente, e muitas vezes formado por dados que visam avaliar apenas alguns aspectos especícos do reconhecimento. No caso de expressões online, para treinar e testar reconhecedores de símbolos, as amostras são em geral obtidas solicitando-se que as pessoas escrevam uma série de símbolos individualmente e repetidas vezes. Tal tarefa é monótona e cansativa. Uma abordagem alternativa para obter amostras de símbolos seria solicitar aos usuários a transcrição de expressões modelo previamente denidas. Dessa forma, a escrita dos símbolos seria realizada de forma natural, menos monótona, e várias amostras de símbolos poderiam ser obtidas de uma única expressão. Para evitar o trabalho de anotar manualmente cada símbolo das expressões transcritas, este trabalho propõe um método para casamento de expressões matemáticas manuscritas, no qual símbolos de uma expressão transcrita por um usuário são associados aos correspondentes símbolos (previamente identicados) da expressão modelo. O método proposto é baseado em uma formulação que reduz o problema a um problema de associação simples, no qual os custos são denidos em termos de características dos símbolos e estrutura da expressão. Resultados experimentais utilizando o método proposto mostram taxas médias de associação correta superiores a 99%. Palavras-chave: casamento de expressões matemáticas, expressões matemáticas manuscritas, emparelhamento de grafos bipartidos, rotulação de símbolos matemáticos.
doi:10.11606/d.45.2013.tde-22022013-120830 fatcat:are766hcpfaxjprnru3bzmbcqi