(Abstract available in Portuguese only)
Músicos manipulam, conscientemente, diferentes parâmetros acústicos, com o objetivo de expressar suas ideias musicais para os ouvintes e para outros músicos. Eles performam, ainda, movimentos físicos que, embora sejam essenciais para a produção de som no instrumento musical, possuem estreita relação com as intenções artísticas dos performers.
O termo ancillary gesture (gestos auxiliar) caracteriza os movimentos que fazem parte da performance, mas que não necessariamente produzem o som. Gestos aparecem ao longo da performance e, consequentemente, assumem a intenção de comunicar.
Nesta comunicação, apontarei para a complexa inter-relação entre os gestos executados pelos músicos e a organização das frases musicais interpretadas por eles, definidas a partir de análises de parâmetros acústicos manipulados, além de relatos de expressão de suas intenções musicais. Este trabalho pretende mostrar também que os gestos auxiliares não são aleatórios, uma vez que os mesmos são recorrentes e estáveis, em todas as performances estudadas.
Despite the complexity of assigning genres to songs, automatic musical genre classification of large databases is of great importance for Music Information Retrieval tasks. Historically, several Machine Learning techniques were applied using audio features extracted from audio files, scores and even the lyrics of the songs.
In this talk we will present the results of experiments performed with the GTZAN dataset, using global audio features (extracted with the LibROSA library) and traditional classification algorithms (implemented by scikit-learn).
Source code: https://github.com/rppbodo/musical-genre-classification
(Abstract available in Portuguese only)
Neste seminário vamos abordar o projeto de efeitos de áudio baseados em decomposições que levam um sinal proveniente de um instrumento musical para a representação AM/FM. A decomposição AM/FM produz um par de sinais também no domínio do tempo, que representam o envelope (porção AM) e a frequência instantânea (porção FM) do sinal analisado. Estes dois sinais atuam em conjunto e podem recriar o sinal original caso utilizados para modular um oscilador senoidal em amplitude e em frequência. Por outro lado, a manipulação individual das porções AM e FM oferece novas possibilidades para processamento de sinais e implementação de efeitos musicais. Neste trabalho discutimos aspectos sobre diferentes técnicas para a decomposição, baseadas na Transformada de Hilbert em conjunto com o Sinal Analítico ou no Operador de Energia de Teager-Kaiser em conjunto com o Algoritmo de Separação de Energia. Apresentamos novos efeitos de áudio baseados em filtragem simples, mapeamento não-linear e manipulações das porções AM e FM inspiradas em efeitos clássicos, entre outros efeitos. Implementações para operação em tempo-real são apresentadas e discutidas. Também apresentaremos uma avaliação experimental da aplicação dos efeitos propostos, baseada na análise do comportamento de descritores de áudio relacionados com amplitude (variação dinâmica) e frequência (variação espectral) de sinais.
This seminar is a presentation of the award article as Best Student Paper of the ISMIR in 2009, called EASY AS CBA: A Probabilistic SIMPLE MODEL FOR TAGGING MUSIC Matthew D. Hoffman, David M. Blei, Perry R. Cook.
Many songs are not associated with well representative tags and this makes the songs recovery process from the tags not be efficient.
We present a probabilistic model that learns to perform automatic prediction that words applies to a song from the timbre features. This method is simple to implement, easy to test and returns results quickly.
This seminar is a presentation of the award article as Best Student Paper of the ISMIR in 2009, called EASY AS CBA: A Probabilistic SIMPLE MODEL FOR TAGGING MUSIC Matthew D. Hoffman, David M. Blei, Perry R. Cook.
Many songs are not associated with well representative tags and this makes the songs recovery process from the tags not be efficient.
We present a probabilistic model that learns to perform automatic prediction that words applies to a song from the timbre features. This method is simple to implement, easy to test and returns results quickly.