Capa Barry James

PÓS-GRADUAÇÃO  EM  CIÊNCIA  DA  COMPUTAÇÃO - DCC, UFMG

Fundamentos Estatísticos para Ciência dos Dados B

FECD B

Informações Gerais 



Objetivo da disciplina

Aprofundar o aprendizado de ciência dos dados do ponto de vista teórico.

Tópicos cobertos

FECD B
  1. Regressão linear como projeção ortogonal e visão estocástica
  2. Modelos com dados não-normais: logística e Poisson
  3. Modelos com dados dependentes: espaciais e temporais.
  4. Principios de inferência estatística: vício, variância, consistência, eficiência.
  5. Métodos de estimação: distância mínima, mínimos quadrados, mínimo qui-quadrado,  máxima verossimilhança.
  6. Métrica para medir distância entre distribuições de probabilidade: entropia, Kullback-Leibler e Kolmogorov
  7. Exemplos com máxima verossimilhanca. 
  8. Propriedades de otimalidade do estimador de máxima verossimilhança.
  9. Algoritmo EM.
  10. Intervalos de Confiança
  11. Testes de Hipótese e p-valores.
  12. Famílias exponenciais de distribuições e GLM
  13. Modelos de fatores latentes: filtragem colaborativa.
  14. Modelos de mistura: análise de clusters com modelos probabilísticos
  15. Seleção de modelos de novo.
A disciplina pré-requisito é FECD A.


Material de aula: slides, exercícios, etc

Clique aqui

Avaliação da Aprendizagem

3 provas (20, 20, 20): 60
Listas de exercícios semanais: 40

Importante:




Material de apoio


Capa FECD Fundamentos Estatísticos de Ciência dos Dados
Renato Assunção (DCC-UFMG) 

Livro em andamento.
Ele será  atualizado várias vezes ao longo do semestre.
Shalizi - Trotsky Advanced Data Analysis from an Elementary Point of View

Cosma Shalizi do Departamento de Estatística da Carnegie Mellon University


FREE pdf - no link acima
Murphy Machine Learning: A Probabilistic Perspective (2nd edition, 2 volumes)

Keith Murphy (Google)
MIT Press, 2012, ISBN 978-0262018029
Murphy Foundations of Machine Learning, second edition
Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar 





Última modificação em 04/03/2020.