Atividade

95297 - Introdução à Ciência de Dados,

Período da turma: 04/03/2020 a 10/06/2020

Selecione um horário para exibir no calendário:
 
 
Descrição: 1 - Ementa:

Noções de cálculo (derivada, mínimo de funções) GA (bases e hiperplanos), estatística (probabilidade, mle, teorema de bayes) e programação python. modelos fittar modelo, overfit, bias. feature space e target. model tunning ? tipos de problemas: regressao, classificaçao
feature engineering. Sintaxe python, especificidades do python, introduçao ao numpy, principais conceitos do numpy, operaçoes vetorizadas. Abrir csv, drop, loc iloc, describe, nulos, inconsistências, histograma, boxplot, barplot, scatterplot. Metodos de árvore, interface sklearn (train_test_split, aplicando arvores e knn, comparação), overfitting e underfitting. Encoding, Train test, KFold, Métricas, Normalizacao, GridSearch. Regressão linear, loss functions, gradient descent. Relembrar e passar melhor gradient descent e loss function, , sigmoid, regressão logistica. Groupby, Merge. Regularização, clustering, interpretabilidade.

2 - Referências Bibliográficas

- Wes McKinny, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd edition O'Reilly Media, 2017
- Mark Lutz, Learning Python, 5th Edition, O'Reilly Media, 2013
- Eric Matthew, Python Crash Course: a hands-on, project-based introduction to programming, no starch press, 2013
- Katti Faceli, Inteligência Artificial. Uma Abordagem de Aprendizado de Máquina, LTC 2012
- Al Sweigart, Automate the Boring Stuff with Python: Practical Programming for Total Beginners, Starch Press 2015

Carga Horária:

28 horas
Tipo: Obrigatória
Vagas oferecidas: 100
 
Ministrantes: Bruno Gomes Coelho
David Cairuz da Silva
Gustavo Sutter Pessurno de Carvalho
João Guilherme Madeira Araújo
João Pedro Rodrigues Mattos
Luísa Souza Moura
Tobias Mesquita Silva da Veiga


 
 voltar

Créditos
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP