Marcos André Gonçalves


Associado  Professor 


Bolsa produtividade CNPq nível   1C


Doutor, Virginia Polytechnic Institute and State University, USA, 2004

  mgoncalv@dcc.ufmg.br   www
 ICEx/DCC, room 6313, +55 (31) 3409-7541
Research areas

Information extracted from Lattes platform


Last update: 2019/01/10

Degrees

Ph.D. Computer Science na Virginia Tech em 2004
M.Sc. Ciência da Computação na Universidade Estadual de Campinas em 1997
B.Sc. Bacharelado em Ciência da Computação na Universidade Federal do Ceará em 1995

Current projects

2018 a AtualProjeto Universal 2018 - Faixa C - Avanços em Recuperação de Informação Inteligente através de Engenharia de Atributos, Enriquecimento Semântico e Aprendizado Ativo
O tema de inteligência artificial (IA) e aprendizado de máquina tem atraído enorme interesse acadêmico e empresarial nos últimos anos. De acordo com o Artificial Intelligence Index , o número de artigos sobre IA aumentou mais de 9 vezes desde 1996. Uma das aplicações mais interessantes de técnicas de Aprendizado de máquina tem sido da área de gerenciamento e tratamento de grandes volumes de informação (aka, Big Data). De fato, a sobrecarga de informação, gerada principalmente pela utilização ?quase onipresente? de dispositivos eletrônicos (smartphones, tablets, etc) ligados `a Internet (aka, Internet das Coisas) é um dos principais desafios da Ciência da Computação na atualidade. Estes desafios advém não apenas da imensa quantidade de dados/informações disponíveis, que precisam ser tratados de forma eficaz e eficiente, nas mais diversas plataformas utilizadas pelos usuários, mas também da dificuldade inerente em identificar e tratar conteúdo de boa e principalmente de má qualidade (e.g., spam, vandalismo, fake news, informalidade e imprecisão na linguagem naturais da linguagem humana). Esses desafios têm motivado continuamente pesquisas para avançar o estado-da-arte em áreas como classificação automática, sistema de ranqueamento (ranking) e de recomendação. Por exemplo sistemas de classificação automática baseados em aprendizado supervisionado podem ser usados para aprender a: (i) separar notícias reais daquelas fake a partir de um conjunto de evidências previamente coletados (e.g., viralidade da mensagem; texto associado à mensagem); (ii) determinar a polaridade/sentimento (positivo, negativo ou neutro) de uma mensagem de texto curta em uma rede social ou aplicação de chat; (iii)a categorizar usuários como tendenciosos ou não a aceitar a oferta de determinados produtos e serviços, etc. Sistemas de busca ou de respostas de questões (aka, question answering), por sua vez, são utilizados para ordenar, literalmente dentre milhões de possibilidades, as respostas mais relevantes a uma consulta ou pergunta do usuário de tal forma que esse usuário possa rapidamente encontrar os ?melhores? documentos ou respostas. Nesse contexto, aprendizado de máquina tem sido utilizado para aprender funções de ordenação que maximizem a relevância através de uma combinação, geralmente não-linear, dos atributos (aka, features) disponíveis. Esses algoritmos de ranqueamento podem ser também utilizados em sistemas de recomendação que sugerem os melhores itens para um usuário em um determinado contexto, ou as palavras-chave mais adequadas para descrever um produto de forma a maximizar o lucro em um site de comercio eletrônico. Em suma, esse projeto, conectado a várias pesquisas desenvolvidas pelo proponente, tem por objetivo geral propor soluções inovadoras para vários problemas relacionados ao tratamento de grandes volumes de informação, em aplicações tais como recuperação de informação em máquinas de busca, classificação automática de texto e recomendação de conteúdo, por meio de avanços em algoritmos e técnicas de aprendizado de máquina, particularmente engenharia de atributos com exploração de semântica e aprendizado ativo. Nossas pesquisas nessas áreas têm obtidos resultados de grande impacto científico, exemplificados pelo volume e qualidade da produção cientifica do proponente (ver currículo Lattes) bem como pelos inúmeros prêmios recebidos ao longo dos últimos anos, tais como: orientador da melhor dissertação de mestrado do Brasil (2018) - Sociedade Brasileira de Computação (SBC); orientador da melhor tese de Doutorado do Brasil em Banco de Dados e recuperação de Informação (2017) ? Comissão Especial de Banco de Dados (CEBD-SBC); best paper award na ACM/IEEE Joint Conference on Digital Libraries (JCDL); vários Google Research Awards para a America Latina, dentre outros. Particularmente, nesse projeto propomos avanços em técnicas e algoritmos
Integrantes: Marcos André Gonçalves (coordenador), Thierson Couto, Leonardo Rocha, Jussara Marques Almeida, Wellington Santos Martins.
2018 a AtualProjeto 25945 MUNDIALE/EMBRAPII/ICEX/DCC/AM-TELE
Projeto Embrapii/DCC-UFMG.- O pojeto iIrá desenvolver tecnicas para produzir scores de propensao de adesao de usuarios a produtos. Para desenvolver os scores serão investigadas diferentes técnicas de aprendizado de máquina, especificamente algoritmos de regressão do estado-da-arte bem como de learning-to-rank para geração dos modelos que atribuam scores a cada cliente, tendo com entrada uma lista de atributos extraídos dos dados disponíveis.
Integrantes: Marcos André Gonçalves (coordenador).
2018 a AtualProjeto ELO7/EMBRAPII/ICEX/DCC/Recuperação de Informação Inteligente e Aprendizado de Máquina Aplicados a E-Commerce
Recomendação de tags para produtos e melhoria de qualidade de busca
Integrantes: Marcos André Gonçalves (coordenador), Jussara Marques Almeida, Fabiano Belem, Rodrigo Silva.
2018 a AtualProjeto ASTREIN/EMBRAPII/ICEX/DCC/Recuperação de Informação Padronizada de Materiais (RecInt-PaMat)
Saneamento de Catalogos de Produtos
Integrantes: Marcos André Gonçalves (coordenador), Leonardo Rocha, Washington Luiz, GOMES, CHRISTIAN.
2018 a AtualProjeto 26139 FAPEMIG/ICEX/DCC/RECINT
Esse projeto visa propor soluções inovadoras para vários problemas relacionados ao tratamento de informação na Web, principalmente associados a serviços e aplicações da Web 2.0 (e.g., redes sociais, blogs e micro-blogs)
Integrantes: Marcos André Gonçalves (coordenador).
2016 a AtualOptimizing Ensembles of Boosted Additive Bagged Trees for Learning-to-Rank.
In 2015, this research focused on solving the problem of the information retrieval known as ?Learning to Rank (L2R)?, the primary goal of which was to learn how to combine predictors to leverage the performance of ranking models, by combining in an effective manner two ensemble-based Machine Learning (ML) strategies: Boosting and Bagging. For this year's research, the focus will be on covering a lot of ground regarding ML approaches.
Integrantes: Marcos André Gonçalves (coordenador).
2015 a AtualBoosting Out­of­Bag Estimators for Learning to Rank
This project aims at solving the L2R (Learning To Rank) problem by developing an original and novel Random Forest­based algorithm which smoothly combines properties of the bagging with the boosting procedures.
Integrantes: Marcos André Gonçalves (coordenador), Clebson Sá.
2015 a AtualProjeto 21997 FAPEMIG/ICEX/DCC/INFORMACAO INTELIGENTE

Integrantes: Marcos André Gonçalves (coordenador).
2014 a AtualCNPq Universal Faixa C- RecInt - Recuperação de Informação Inteligente
O problema da sobrecarga de informação produzida pelo crescimento da Web e principalmente de serviços e aplicações da chamada Web 2.0, (e.g., redes sociais, blogs e microblogs, etc), bem como pelo uso cada vez maior de dispositivos eletrônicos no dia-a-dia (smartphones, tablets, etc) é um dos principais desafios da Ciência da Computação na atualidade. Estes desafios advém não apenas da imensa quantidade de dados/informações disponíveis, que precisam ser tratados de forma eficaz e eficiente nas mais diversas plataformas utilizadas pelos usuários, mas também da dificuldade inerente em identificar e tratar conteúdo de boa e principalmente de má qualidade (e.g., spam, vandalismo, informalidade e imprecisão na linguagem). Esse projeto de pesquisa busca propor soluções inovadoras para vários problemas relacionados ao tratamento de grandes volumes de informação, principalmente associados a serviços e aplicações da Web 2.0 (e.g., redes sociais, blogs e micro-blogs) tais como recuperação de informação em máquinas de busca, classificação automática de texto e recomendação de conteúdo. Em particular, propomos o uso de técnicas avançadas de aprendizado de máquina para a resolução de alguns desse problemas focando em seis linhas de pesquisa, a saber: (1) Exploração de Meta-Atributos para Classificação Automática de Documentos; (2)Classificação Automática de Documentos com Florestas Aleatórias Melhoradas (FAM); (3) Classificação Automática de Documentos Probabilística em Plataformas Massivamente Paralelas; (4) Aprendizado Multi-Visão para Estimativa de Qualidade de Conteúdo Criado Colaborativamente na Web 2.0. (5) Exploração de Diversidade e Novidade em Recomendação de Tags; (5) Aprendizado Ativo para Ordenação de Documentos em Máquinas de Busca
Integrantes: Marcos André Gonçalves (coordenador).
2013 a AtualA Multi-view Approach for Automatic Quality Assessment in Collaborative Web Documents
The Web 2.0 has brought deep changes to the Internet, as users are now able not only to consume, but also to produce content in a much faster and easier manner, in many cases in a collaborative way. This change gave rise to new ways for creating knowledge repositories to which anyone can freely contribute. Some examples of these repositories include blogs, forums, or collaborative digital libraries, whose collections are maintained by the own Web community. However, such freedom also carries an important question: given the rhetoric of democratic access to everything, by everyone, at any time, how can a user determine the quality of the information provided? Currently, content generated in a more traditional, centralized manner, published using physical media, such as books or journals, is still naturally seen as being of higher quality and more trustworthy [Dondio et al. 2006]. Nevertheless, the growth and level of dissemination of this collaboratively created content is such that mechanisms to assess the quality and trust of this type of material should be provided. For instance, collaborative e fforts such as Wikipedia and Wikia rely on human judgments of specialized editors for quality assessment. However, manual assessment not only does not scale to the current rate of growth of such collections, but is also subject to human bias, which can be in uenced by the varying background, expertise, and even a tendency for abuse. A possible solution to this problem would be to automatically estimate the quality of these collaborative content. Accordingly, this research proposal aims at developing automatic quality assessment methods of collaborative content such as collaborative encyclopedia and Q&A Forums. In particular, we intend to explore machine learning methods which exploit the idea of the combination of \multiple experts" for quality estimation. Our hypothesis is that quality is a multifaceted problem in which each facet corresponds to a quality aspect (e.g., readability, style, organizational structure, link/citation coverage, review history) which can be individually analyzed by an automated \expert" (learner) and the \opinions" of these experts can be combined for a nal decision about the overall quality of a particular item. Moreover, based on lessons learned in these other domains, for which some labels about the quality of certain items can be obtained (e.g., editors' analyses of Wikipedia articles, \best" answers for Q&A forums), we intend to study how to \transfer" the obtained knowledge for other domains for which such labeled data is not easily available such as the open Web. Particularly, the goal is to explore the quality of web pages aiming at improving ranking results.
Integrantes: Marcos André Gonçalves (coordenador).
2009 a AtualINCTWeb - Instituto Nacional de Ciencia e tecnologia para a Web
O objetivo do INCT para Web é desenvolver modelos, algoritmos e novas tecnologias que permitam aumentar a integração da Web com a sociedade. Além disso, pretende-se tornar mais efetiva e mais segura a distribuição de informação na Web, e mais eficazes e eficientes os seus serviços, de forma a proporcionar um vetor de mudanças sociais e econômicas no País. O programa do Instituto compreende atividades relacionadas à pesquisa, à formação de recursos humanos e à transferência de conhecimento para a sociedade e para o setor empresarial.
Integrantes: Virgilio Almeida (coordenador), Marcos André Gonçalves, Alberto H F Laender, Altigran Soares da Silva, Edleno Silva de Moura, Nivio Ziviani, Carlos Alberto Heuser, Jussara Marques Almeida.
2008 a AtualInfoWeb- Métodos e Ferramentas para Tratamento de Informação Disponível na Web
A Web é hoje o maior repositório de informação digital produzida pelo ser humano, estando distribuído por milhões servidores conectados ao redor do mundo via Internet. O domínio de tecnologias capazes de tirar proveito desse repositório representa um diferencial de competitividade dentro da sociedade moderna, gerando oportunidades de desenvolvimento econômico e social. Este projeto visa desenvolver novos métodos e ferramentas para tratamento de informação existente em grandes repositórios de dados e coleções de documentos disponíveis na Web. O projeto pretende gerar soluções para diversos problemas relacionados ao tratamento de informação, tais como classificação de texto, mineração de dados a partir de fontes não estruturadas, integração de dados de fontes heterogêneas, enriquecimento semântico de dados, indexação e busca, dentre outros.
Integrantes: Nivio Ziviani (coordenador), Marcos André Gonçalves, Alberto H F Laender, Berthier Ribeiro Neto, Wagner Meira Jr, José Carlos Maldonado.
2007 a AtualGP Ranking ? Descoberta de funcoes de ranking para colecoes de documentos usando Programacao Genetica
Neste projeto focamos na aplicação de uma técnica de aprendizado de máquina, Programação Genética (PG), na resolução do problema de recuperação de informação efetiva em coleções de documentos textuais. PG ser´a utilizada como um arcabouço para permitir a combinação flexível das diversas evidências disponíveis para a geração de funções de ranking que permitam recuperar, dado uma consulta, os documentos mais relevantes àquela consulta, ordenados por relevância. A idéia é descobrir a partir de um processo de aprendizado funções de similaridade que maximizem a relevância ou a qualidade das respostas obtidas. Essas funções normalmente recaem no uso de conjuntos de evidências positivas e negativas extraídos dos próprios documentos, e.g., frequência de termos nos documentos e nas consultas; frequência de termos como um todo na coleção, tamanho do documento, etc.
Integrantes: Marcos André Gonçalves (coordenador), Humberto Mossri.

Current applied research projects

See all projects in Lattes

Recent publications

Articles in journals

A Thorough Evaluation of Distance-Based Meta-Features for Automated Text Classification
2018. IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING.
BLOSS: Effective Meta-Blocking with Almost no Effort
2018. INFORMATION SYSTEMS.
Exploiting Efficient and Effective Lazy Semi-Bayesian Strategies for Text Classification
2018. NEUROCOMPUTING.
A Genetic Programming Approach for Feature Selection in Highly Dimensional Skewed Data Neurocomputing
2018. NEUROCOMPUTING.
Improving random forests by neighborhood projection for effective text classification
2018. INFORMATION SYSTEMS.
NetClass: A Network-Based Relational Model for Document Classification
2018. INFORMATION SCIENCES.
A General Multi-View Framework for Assessing the Quality of Collaborativelly Created Content on the Web 2.0
2017. Journal of the American Society for Information Science and Technology (Print).
A survey on tag recommendation methods
2017. Journal of the Association for Information Science and Technology.
Diversity-based Interactive Learning meets Multimodality
2017. NEUROCOMPUTING.
Ranked Batch-Mode Active Learning
2017. Information Sciences.
Incremental author name disambiguation by exploiting domain-specific heuristics
2017. Journal of the Association for Information Science and Technology.
A Two-Stage Machine Learning Approach for Temporally-Robust Text Classification
2017. INFORMATION SYSTEMS.
On cold start for associative tag recommendation
2016. Journal of the Association for Information Science and Technology.
A Multimodal query expansion based on genetic programming for visually-oriented e-commerce applications
2016. Information Processing & Management.
On Interactive Learning-to-Rank for IR: Overview, Recent Advances, Challenges, and Directions
2016. Neurocomputing (Amsterdam).
SentiBench - A Benchmark Comparison of State-of-the-Practice Sentiment Analysis Methods
2016. EPJ Data Science.
Beyond Relevance
2016. ACM Transactions on Intelligent Systems and Technology.
A quantitative analysis of the temporal effects on automatic text classification
2016. Journal of the Association for Information Science and Technology.
TrendLearner: Early Prediction of Popularity Trends of User Generated Content
2016. Information Sciences.
A Practical and Effective Sampling Selection Strategy for Large Scale Deduplication
2015. IEEE Transactions on Knowledge and Data Engineering (Print).
On the combination of domain-specific heuristics for author name disambiguation: the nearest cluster method
2015. International Journal on Digital Libraries (Print).
Predicting the popularity of micro-reviews: A Foursquare case study
2015. Information Sciences.
A Spatiotemporal Analysis of Brazilian Science from the Perspective of Researchers? Career Trajectories
2015. Plos One.
Self-training author name disambiguation for information scarce scenarios
2014. Journal of the Association for Information Science and Technology.
A Two-stage active learning method for learning to rank
2014. Journal of the Association for Information Science and Technology.
Multimodal retrieval with relevance feedback based on genetic programming
2014. Multimedia Tools and Applications (Dordrecht. Online).
He Votes or She Votes? Female and Male Discursive Strategies in Twitter Political Hashtags
2014. Plos One.
Reducing Fragmentation in Incremental Digital Name Disambiguation
2014. Journal of Information and Data Management - JIDM.
Personalized and object-centered tag recommendation methods for Web 2.0 applications
2014. Information Processing & Management.
Disambiguating Author Names using Minimum Bibliographic Information
2014. World Digital Libraries.
On the Dynamics of Social Media Popularity
2014. ACM Transactions on Internet Technology.
A Genetic Programming Approach to Record Deduplication
2012. IEEE Transactions on Knowledge and Data Engineering (Print).
A genetic programming framework for content-based image retrieval
2009. Pattern Recognition.
``What is a Good Digital Library?'' -- A Quality Model for Digital Libraries
2007. Information Processing & Management.
Link-based similarity measures for the classification of Web documents
2006. Journal of the American Society for Information Science and Technology.
Streams, structures, spaces, scenarios, societies (5s)
2004. ACM Transactions on Information Systems.

Papers in conferences

CluWords: Exploiting Semantic Word Clusters Representation for Enhanced Topic Modeling
2019. WSDM 2019: The 12th ACM International Conference on Web Search and Data Mining (WSDM 2019).
User-Oriented Objective Prioritization for Meta-Featured Multi-Objective Recommender Systems
2018. Adjunct Publication of the 26th Conference.
A Feature-Oriented Sentiment Rating for Mobile App Reviews}
2018. International World Wide Web Conferences (WWW'18).
Improving Tourism Prediction Models Using Climate and Social Media Data: A Fine-Grained Approach
2018. International AAAI Conference on Web and Social Media (ICWS2018).
Semantically-Enhanced Topic Modeling
2018. the 27th ACM International Conference.
CluWords: Exploiting Semantic Word Clusters for Enhanced Topic Modeling.
2018. WSDM 2019: The 12th ACM International Conference on Web Search and Data Mining.
A multicriteria Evaluation of Hybrid Recommender Systems
2017. 19th International Conference on Enterprise Information Systems.
A Framework for Unexpectedness Evaluation in Recommendation
2017. The 32nd ACM SIGAPP Symposium On Applied Computing (SAC 2017).
Stacking Bagged and Boosted Forests for Effective Automated Classification
2017. 40th International ACM SIGIR Conference on Research and Development in Information Retrieval.
Automatic Hierarchical Categorization of Research Expertise Uisng Minimum Information
2017. International Conference on Theory and Practice of Digital Libraries (TPDL).
Generalized BROOF-L2R: A General Framework for Learning to Rank Based on Boosting and Random Forests
2016. The 39th Annual ACM SIGIR Conference.
Dissecting a Scholar Popularity Ranking into Different Knowledge Areas
2016. International Conference on Theory and Practice of Digital Libraries (TPDL).
On the combination of "off-the-shelf" sentiment analysis methods
2016. the 31st Annual ACM Symposium.
Incorporating Risk-Sensitiveness into Feature Selection for Learning to Rank
2016. he 25th ACM International Conference on Information and Knowledge Management (CIKM 2016).
Exploiting New Sentiment-Based Meta-level Features for Effective Sentiment Analysis
2016. the Ninth ACM International Conference.
Early Prediction of Scholar Popularity
2016. the 16th ACM/IEEECS.
Quando a Amazônia Encontra a Mata Atlântica: Empilhamento de Florestas para Classificação Efetiva de Texto
2016. IV KDMile - Symposium on Knowledge Discovery, Mining and Learning.
A Fast and Scalable Manycore Implementation for an On-Demand Learning to Rank Method
2016. WSCAD - Simpósio em Sistemas Computacionais de Alto Desempenho.
Compression-Based Selective Sampling for Learning to Rank
2016. The 25th ACM International Conference on Information and Knowledge Management (CIKM 2016).
A Multi-View Approach for Assessing the Quality of Collaboratively Created Content on the Web 2.0
2016. X Concurso de Teses e Dissertações em Inteligência Artificial e Computacional (CTDIAC).
BERT: Melhorando Classicação de Texto com Arvores Extremamente Aleatorias, Bagging e Boosting
2016. 31st of the Brazilian Symposium on Databases.
G-KNN: An Efficient Document Classification Algorithm for Sparse Datasets on GPUs using KNN
2015. ACM SAC 2015.
BROOF: Exploiting Out-of-Bag Errors, Boosting and Random Forests for Effective Automated Classification
2015. The 38th Annual ACM SIGIR Conference.
On Tag Recommendation for Expertise Profiling
2015. the Eighth ACM International Conference.
Parallel Lazy Semi-Naive Bayes Strategies for Effective and Efficient Document Classification
2015. The 24th ACM International Conference on Information and Knowledge Management (CIKM'15).
An Efficient and Scalable MetaFeature-based Document Classification Approach based on Massively Parallel Computing
2015. the 38th International ACM SIGIR Conference.
A Soft Computing Approach for Learning to Aggregate Rankings
2015. the 24th ACM International.
Bazinga! Caracterizando e Detectando Sarcasmo e Ironia no Twitter
2015. IV Brazilian Workshop on Social Network Analysis and Mining (BraSNAM 2015).
Aprendendo a Ranquear com Boosting e Florestas Aleatórias: Um Modelo Híbrido
2015. 3rd Symposium on Knowledge Discovery, Mining and Learning (KDMiLe).
A Genealogy of the work of Collector: the document and its image
2015. Digital Heritage (2015).
On the Impact of Academic Factors on Scholar Popularity: A Cross-Area Study
2015. 19th International Conference on Theory and Practice of Digital Libraries.
How you post is who you are: characterizing Google+ status updates across social groups
2014. ACM Hypertext conference.
Combining Domain-Specific Heuristics for Author Name Disambiguation
2014. International Conference on Digital Libraries 2014 (conjoined conference for both the ACM/IEEE Joint Conference on Digital Libraries and the Theory and Practice of Digital Libraries Conference)..
Noticing the Other Gender on Google+
2014. ACM Web Science 2014 Conference.
Characterizing Scholar Popularity: A Case Study in the Computer Science Research Community
2014. International Conference Digital Libraries 2014 (conjoined conference for both the ACM/IEEE Joint Conference on Digital Libraries and the Theory and Practice of Digital Libraries Conference)..
What makes your Opinion Popular? Predicting the Popularity of Micro-Reviews in Foursquare
2014. ACM Symposium On Applied Computing.
Diversity-driven Learning for Multimodal Image Retrieval with Relevance Feedback
2014. IEEE International Conference on Image Processing (ICIP).
Quality Assessment of Collaborative Content With Minimal Information
2014. International Conference Digital Libraries 2014 (conjoined conference for both the ACM/IEEE Joint Conference on Digital Libraries and the Theory and Practice of Digital Libraries Conference)..
Popularity Dynamics of Foursquare Micro-Reviews
2014. ACM Conference on Social Networgs (COSN 2014).
On Efficient Meta-Level Features for Effective Text Classification
2014. CIKM 2014 : Conference on Information and Knowledge Management..
Improving the Effectveness of Content Popularity Prediction Methods using Time Series Trends
2014. Workshop on Predictive Web Analytics - ECML/PKDD 2014.
Recomendação Associativa de Tags na Ausência de Informação Prévia
2014. Concurso de Teses e Dissertações da SBC.

Extended abstracts in conferences

Rank Fusion and Multimodal Per-topic Adaptiveness for Diverse Image Retrieval
2017. MediaEval 2017 Workshop and Conference and Labs of the Evaluation Forum (CLEF 2017).
The LExR Collection for Expertise Retrieval in Academia
2016. the 39th International ACM SIGIR conference.
Automatic Methods for Disambiguating Author Names in Bibliographic Data Repositories
2015. the 15th ACM/IEEECE.
Combining Classifiers and User Feedback for Disambiguating Author Names
2015. the 15th ACM/IEEECE.
RECOD @ Placing Task of MediaEval 2015
2015. MediaEval 2015 Multimedia Benchmark Workshop.
Recod @ MediaEval 2015: Diverse Social Images Retrieval
2015. MediaEval 2015 Multimedia Benchmark Workshop.

Abstracts in conferences

A practical and effective sampling selection strategy for large scale deduplication
2016. 2016 IEEE 32nd International Conference on Data Engineering (ICDE).
Métodos Automáticos para Desambiguação de Nomes de Autores em Repositórios de Dados Bibliográficos
2014. Simpósio Brasileiro de Bancos de Dados.
From Concepts to Implementation and Visualization: Tools from a Team-Based Approach to IR
2008. 31st Annual International ACM SIGIR Conference.
PIM through a 5S Perspective
2007. ACM IEEE Joint Conference on Digital Libraries.
5SQual - A Quality Assessment Tool for Digital Libraries
2007. ACM/IEEE Joint Conference on Digital Libraries.

See all publications in Lattes

Current students

MS

Elaine Resende. Deep Learning for Text Classification. Início: 2018. Universidade Federal de Minas Gerais (Orientador principal)

PhD

Amir Khatib. Sem Titulo. Início: 2016. Universidade Federal de Minas Gerais (Orientador principal)
Felipe Augusto Resende Viegas. Exploiting Efficient and Effective and Bayesian Strategies for Text Classification. Início: 2015. Universidade Federal de Minas Gerais (Orientador principal)
Sergio Daniel. Meta-Atributos para Classificacao. Início: 2014. Universidade Federal de Minas Gerais (Orientador principal)
Rodrigo Silva. Active Learning for Learning to Rank. Início: 2013. Universidade Federal de Minas Gerais (Orientador principal)
Reinaldo Fortes. Combinação de Recomendadores. Início: 2013. Universidade Federal de Minas Gerais (Orientador principal)

See all students in Lattes