Seres humanos conseguem identificar facilmente trechos com voz cantada em um áudio com uma mistura de fontes sonoras. No entanto, tentar identificar tais trechos computacionalmente não é uma tarefa trivial. Neste seminário serão apresentados os fundamentos do problema de detecção de voz cantada em sinais de áudio polifônicos, uma breve descrição das técnicas utilizadas para resolvê-lo, e suas aplicações em outras tarefas de recuperação de informação musical (MIR). Por fim, serão destacados alguns desafios em relação à melhoria da performance na detecção automática de trechos com voz cantada.