Objetivo
Capacitar os alunos a projetar e avaliar um processo de descoberta de conhecimento completo utilizando bases de dados reais.
Mineração de
Dados AplicadaAlgoritmos de mineração de dados são soluções gerais para problemas específicos. Para ser útil, eles têm que ser configurados e incluídos num processo de descoberta de conhecimento que é especificamente criado para a aplicação considerada. Esse processo, intrinsecamente iterativo e interativo, vai dos dados brutos até o conhecimento. O foco desse curso será no estudo dos vários estágios do processo, nas técnicas para implementá-los e nas ferramentas e plataformas existentes para tal. Diversas plataformas tentam ajudar esse processo e KNIME será usada como exemplo. A partir de dados reais, o aluno vai, nessa plataforma, criar um processo de descoberta de conhecimento que responde a um problema específico. Os alunos trabalharão em grupo e escolherão tanto o problema quanto os dados.
Capacitar os alunos a projetar e avaliar um processo de descoberta de conhecimento completo utilizando bases de dados reais.
Oferta como turmas nas disciplinas de Tópicos em Ciência da Computação e Tópicos em Sistemas de Informação, com carga horária de 60 horas.
Primeiro semestre de 2025 - Segundas e quartas-feiras - 14h55 às 16h35 - Sala 2012 do ICEx.
Muitas das aulas serão compostas de uma parte teórica e de uma parte prática. A parte teórica não detalhará os fundamentos teóricos dos algoritmos (os quais são cobertos em maior detalhe pelo curso "Mineração de dados"). O enfoque deste curso é somente apresentar uma grande variedade de técnicas, as vantagens/desvantagens delas e enfatizar aspectos como a escolha de seus parâmetros.
Avaliação do curso será através do projeto e os respectivos relatórios e apresentações associados a cada fase. O processo de descoberta de conhecimento terá que incluir ao menos um estágio não trivial (por exemplo um pré ou pós-processamento que não se pode efetuar facilmente com KNIME).
Além dessa avaliação por grupo, um exame prático avaliará a capacidade de cada aluno de processar arquivos de texto com comandos POSIX e perguntas individuais serão feitas sobre o projeto e sobre o conteúdo da disciplina. Este arquivo, atualizado ao longo do semestre, contém as perguntas teóricas que serão feitas e o script que será usado para escolhê-las de forma aleatória.
sed's
substitution (fonte
Beamer)awk
(fonte Beamer)