Técnica de Segmentação Multidimensional de Fala

  • Raissa Bezerra Rocha
  • Wamberto José Lira de Queiroz
  • Marcelo Sampaio de Alencar

Resumo

A segmentação de fala é uma etapa importante em várias aplicações que envolve o processamento do sinal de voz, como reconhecimento, síntese e codificação de fala, bem como utilizada como ferramenta para tratamentos fonoaudiológicos. Este artigo descreve um novo método de segmentação baseado na observação da energia do sinal da voz. Trata-se de um algoritmo dinâmico, que divide a locução em multi regiões e detecta os limiares fonéticos pela comparação da energia a cada curto segmento da fala com a energia média de cada região. Para otimizar o desempenho do segmentador, um sistema de refinamento usando o tamanho máximo de cada fonema é proposto. O desempenho do segmentador é aferido por testes objetivos, que indicam que a técnica proposta fornece resultados competitivos com os encontrados na literatura, apresentando uma taxa de 84,86% de segmentação.

Publicado
2017-08-29
Como Citar
BEZERRA ROCHA, Raissa; JOSÉ LIRA DE QUEIROZ, Wamberto; SAMPAIO DE ALENCAR, Marcelo. Técnica de Segmentação Multidimensional de Fala. Revista de Tecnologia da Informação e Comunicação, [S.l.], v. 7, n. 2, p. 49-53, ago. 2017. ISSN 2237-5104. Disponível em: <http://rtic.com.br/index.php/rtic/article/view/90>. Acesso em: 19 nov. 2017.
Seção
Artigos