95297 - Introdução à Ciência de Dados, |
Período da turma: | 04/03/2020 a 10/06/2020
|
||||
|
|||||
Descrição: | 1 - Ementa:
Noções de cálculo (derivada, mínimo de funções) GA (bases e hiperplanos), estatística (probabilidade, mle, teorema de bayes) e programação python. modelos fittar modelo, overfit, bias. feature space e target. model tunning ? tipos de problemas: regressao, classificaçao feature engineering. Sintaxe python, especificidades do python, introduçao ao numpy, principais conceitos do numpy, operaçoes vetorizadas. Abrir csv, drop, loc iloc, describe, nulos, inconsistências, histograma, boxplot, barplot, scatterplot. Metodos de árvore, interface sklearn (train_test_split, aplicando arvores e knn, comparação), overfitting e underfitting. Encoding, Train test, KFold, Métricas, Normalizacao, GridSearch. Regressão linear, loss functions, gradient descent. Relembrar e passar melhor gradient descent e loss function, , sigmoid, regressão logistica. Groupby, Merge. Regularização, clustering, interpretabilidade. 2 - Referências Bibliográficas - Wes McKinny, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd edition O'Reilly Media, 2017 - Mark Lutz, Learning Python, 5th Edition, O'Reilly Media, 2013 - Eric Matthew, Python Crash Course: a hands-on, project-based introduction to programming, no starch press, 2013 - Katti Faceli, Inteligência Artificial. Uma Abordagem de Aprendizado de Máquina, LTC 2012 - Al Sweigart, Automate the Boring Stuff with Python: Practical Programming for Total Beginners, Starch Press 2015 |
||||
Carga Horária: |
28 horas |
||||
Tipo: | Obrigatória | ||||
Vagas oferecidas: | 100 | ||||
Ministrantes: |
Bruno Gomes Coelho David Cairuz da Silva Gustavo Sutter Pessurno de Carvalho João Guilherme Madeira Araújo João Pedro Rodrigues Mattos Luísa Souza Moura Tobias Mesquita Silva da Veiga |
voltar |
Créditos © 1999 - 2024 - Superintendência de Tecnologia da Informação/USP |