Mineração de Dados

Segundo semestre de 2013

Local: a definir - ICEx

Horário: 3a/5a - 11:10 às 12:50

Objetivo

Esta disciplina tem por objetivo apresentar várias das técnicas de mineração de dados, discutir detalhes da sua utilização e analisar campos de aplicações onde essas técnicas são utilizadas.

Esta disciplina é ofertada no contexto do grupo de pesquisa em Técnicas de Inteligência de Descoberta do Conhecimento. Esta página contem informações sobre as várias disciplinas.

Descrição

Com base no aumento sem precedentes da taxa de geração de dados nos vários campos do conhecimento humano, há uma crescente necessidade, tanto do ponto de vista científico quanto do ponto de vista prático, de extrair informações úteis a partir destes dados. Mineração de dados é o processo de descoberta automática de padrões, mudanças, associações, sequências e anomalias em grandes massas de dados. Esta disciplina vai focar os aspectos principais de mineração de dados e descoberta do conhecimento.

Ementa

  1. Conceitos básicos, engenharia e análise de dados
  2. Mineração de padrões frequentes
  3. Agrupamentos
  4. Classificação

Programa

  1. Dados
  2. Atributos numéricos
  3. Atributos categóricos
  4. Atributos gráficos
  5. Método Kernel
  6. Alta dimensionalidade em dados
  7. Redução de dimensionalidade
  8. Mineração de conjuntos frequentes
  9. Mineração de sequências frequentes
  10. Mineração de grafos frequentes
  11. Avaliação de padrões frequentes
  12. Agrupamentos baseados em representantes
  13. Agrupamentos hierárquicos
  14. Agrupamentos baseados em densidade
  15. Agrupamentos espectrais
  16. Validação de agrupamentos
  17. Classificação baseado em árvores de decisão
  18. Classificação baseado em regras
  19. Classificação probabilística
  20. Análise de discriminantes lineares
  21. Máquinas de vetor suporte
  22. Avaliação de classificadores

Avaliação

Os alunos serão avaliados segundo as atividades abaixo descritas. Pede-se atenção quanto às datas previstas para entrega dos artefatos previstos pois atrasos poderão ser penalizados.

Projeto de aplicação

O projeto de aplicação tem por objetivo prover uma experiência prática de aplicação de técnicas de mineração de dados. A partir de uma base de dados real e um conjunto de hipóteses inerente ao domínio de aplicação, o projeto é desenvolvido com o objetivo de validar ou não essas hipóteses.

Projeto de pesquisa

O projeto de pesquisa deve ser desenvolvido por alunos de pós-graduação. Neste caso, os alunos devem produzir um “artigo” que investigue sobre algum tema de pesquisa de mineração de dados, tanto no sentido de uma aplicação inovadora de técnicas de mineração de dados quanto de novas técnicas de mineração.

Discussões artigos/vídeos

Semanalmente serão indicados artigos e/ou vídeos para serem lidos e discutidos no portal da disciplina.

Listas de exercícios

Listas de exercícios pertinentes a cada tópico ministrado a serem desenvolvidas individualmente.

Testes

Testes presenciais em sala de aula versando sobre os tópicos ministrados.

Bibliografia

O curso será baseado no livro:

As bibliografias complementares são:

  1. P. Tan, M. Steinbach, and V. Kumar Introduction to Data Mining Addison Wesley, 2006.
  2. J. Han and M. Kamber Data Mining: Concepts and Techniques, Morgan Kaufmann, 2nd Edition, 2007.
  3. I. Witten and E. Frank Data Mining, Morgan Kauffmann, 2nd edition, 2007.
  4. D. Ballard, Introduction to Natural Computation, MIT Press, March, 1997.

O curso também será baseado em artigos das principais conferências da área de mineração de dados:

ensino_md.txt · Última modificação: 2013/06/06 08:23 por meira
Alterações recentes · Mostrar código fonte · Autenticar