Comparação de Serviços em Nuvem para Transcrição de Fala na Língua Portuguesa em áudios com Sotaques Regionais Brasileiros

Thalles Vargas Ribeiro Lopes, Jefferson Oliveira Andrade, Karin S. Komati
2021 Anais da IX Escola Regional de Informática de Goiás (ERI-GO 2021)   unpublished
Neste trabalho, foi realizada uma análise de dois serviços em nuvem, Google Cloud e Wit.ai, que realizam a transcrição de áudio em língua portuguesa, com o objetivo de determinar qual é a melhor ferramenta quando submetida aos diferentes sotaques brasileiros. Foi utilizada a base de dados Braccent, em um conjunto de 1.648 áudios, com sete sotaques: nortista, baiano, fluminense, mineiro, carioca, nordestino e sulista. A média da métrica de Levenshtein Normalizado para o Wit.ai é de 0,96, e para
more » ... Google Cloud é de 0,89, e em ambas as ferramentas os piores resultados foram para o sotaque carioca. Ao final, o Wit.ai apresentou resultados melhores em todos os cenários, além de transcrever os símbolos de pontuação.
doi:10.5753/erigo.2021.18436 fatcat:xmf4lczqurflvp47utcr6lopqu