UFMG - Departamento de Ciência da Computação - DCC
 
Modelos Gráficos Probabilísticos



Bebel's graphical model of saturday's activities

AS AULAS TERÃO INÍCIO NO DIA 14/08/2018.

VEJA OS PRÉ-REQUISITOS ESSENCIAIS NO FINAL DESTA PÁGINA.

Professor: Renato Assunção
Dias e Hor
ários: Tercas e Quintas, 09:25 - 11:05
Local: ICEx, sala ???

Material de ofertas anteriors da disciplina - vou editar aos poucos esta página para refletir as aulas de 2019

Modelos Gráficos Probabilísticos (ou Probabilistic Graphical Models, PGM, em inglês) é uma sub-área de pesquisa dentro de Aprendizagem de Máquina (Machine Learning). O objetivo dos Modelos Gráficos Probabilísticos é criar uma estrutura matemática unindo grafos e probabilidade que sirva  para modelar situações complexas que envolvam aleatoriedade ou incerteza. Os nós do grafo representam variáveis aleatórias e as arestas entre os nós formam uma representação da estrutura de dependência condicional entre as variáveis.

Os dois principais tipos de modelos g
ráficos probabilísticos são as redes bayesianas (grafos direcionados) e os campos aleatórios de Markov (grafos não-direcionados). Embora modelos probabilísticos fossem comuns no passado, eles eram sempre limitados a situações simples que permitiam um tratamento matemático analítico. Recentemente foram desenvolvidos algoritmos eficientes que permitiram a utilização de modelos probabilísticos para tomada de decisões em situações complexas, envolvendo centenas ou milhares de variáveis ou condicionantes. As aplicações de PGM incluem o processamento de imagens e sinais, visão computacional, robótica, sistemas expecialistas, redes sociais, redes regulatórias de proteínas, recuperação de informação, entre outras. 

PGM tem se tornado um tema comum 
nos principais programas de pós-graduação em computação mundo afora, seja como uma parte substancial dentro de um curso mais geral de aprendizagem de máquina, seja como uma disciplina inteiramente devotada ao assunto. Exemplos de cursos que vamos procurar emular são os seguintes:

AVALIAÇÃO:



LIVROS-TEXTO e BIBLIOGRAFIA:

A primeira parte da disciplina vai varrer de forma simples, sem muita teoria e de forma muito prática, as redes bayesianas. Para isto vamos usar  o livro Bayesian Networks: With Examples in R de Scutari e Denis, publicado em 2014 pela Chapman and Hall.

Este livro é totalmente baseado em R.

A segunda parte da disciplina vai cobrir aspectos mais avançados. Para isto vou usar material de dois livros descritos abaixo.
Capa do livro de Scutari e Denis
Machine Learning, a Probabilistic Perspective, de Kevin Murphy.

Esta disciplina vai assumir que você já conhece o material contido nos capítulos 2, 4, 6, 7, e 8. Isto foi coberto na disciplina de probabilidade e estatística lecionada no primeiro semestre. Veja a lista de pré-requisitos abaixo.

O material a ser coberto na disciplina PGM (Probabilistic Graphical Models) é  aquele contido nos capítulos 3, 5, e parte dos seguintes: 9, 10, 11, 12, 13,17 19, 23, 26  
Livro de Murphy
Outro livro que acabei de receber e ainda não tive oportunidade de decidir sobre sua qualidade é Machine Learning: a Bayesian and Optimization Perspective, de Sergios Theodoridis. Este autor tem um livro clássico e excelente em Processamento de Sinais e Imagens e seu livro parece ser muito bom a primeira vista.

A organização dos assuntos é a ideal, do meu ponto de vista, muito didática.

Não adoto este livro ainda pois não tive chance de estudá-lo adequadamente.    

Os assuntos a serem cobertos na disciplina estão nos capítulos 12, 13, 14, 15, 16, 17, 19
Vou assumir que você já conhece o material contido nos capítulos 2, 3, 4, 6, 71. e 7.2.  

Theodoridis
Outros livros úteis que cobrem o material da disciplina. Os dois últimos estão disponíveis gratuitamente como pdf na página dos autores.

Koller BookBishop BookBarber BookMackey Book



PRÉ-REQUISITO ESSENCIAL:

Conhecimento de probabilidade b
ásico (em QUALQUER LIVRO de probabilidade): variáveis aleatórias, distribuição conjunta, distribuição condicional e distribuição marginal, regra de Bayes, distribuição normal multivariada, distribuição multinomial, esperança, variância e matriz de covariância-correlação. Modelos de regressão linear .

Este é o material coberto na disciplina Fundamentos Estatísticos de Ciência dos Dados. Você não precisa ter cursado esta disciplina mas deve ter conhecimento desses assuntos. Veja o nível de conhecimento requerido na página da disciplina.

Programação: o curso será baseado na linguagem R. O aluno deve ter familiaridade com esta linguagem ao nível do que foi exigido nas listas de exercícios  da disciplina Fundamentos Estatísticos de Ciência dos Dados.


DCC - UFMG: Departamento de Ciência da Computação, Universidade Federal de Minas Gerais