Disciplina dos Cursos de Ciências da Computação e afins da UNINOVE.
- Python e Programação Orientada à Objetos
 - Álgebra Linear com 
NumPy - Análise de Dados com 
pandas - Visualização de Dados com 
pandas,matplotlibeseaborn - Machine Learning com 
Scikit-Learn - Redes Neurais com 
TensorFlow,KerasePyTorch 
- 
Prof. Dr. Edson Melo de Souza - Currículo Lattes - ORCID
 
Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.
Para configurar um ambiente local:
- Clone o repositório do GitHub: 
git clone https://github.com/storopoli/ciencia-de-dados.git - Acesse o diretório: 
cd ciencia-de-dados - Instale as bibliotecas necessárias: 
pip install -r .binder/requirements.txtouconda env create -f .binder/environment.yml 
- Notebooks: Jupyter Notebooks das aulas
 
- Aula Especial - Curso Rápido de Python para Programadores 
 - Aula 0 - Jupyter Notebook 
 - Aula 1 - Operadores aritméticos, relacionais e lógicos 
 - Aula 2 - Desvio Condicional (
IF) - Aula 3 - Estruturas de Repetição (
FOReWHILE) - Aula 4 - Estruturas de Dados (
listedict) - Aula 5 - Funções 
 - Aula 5a - Classes e métodos 
 - Aula 6 - 
NumPye Algebra Linear - Aula 7 - 
pandas - Aula 8 - 
pandasestatística - Aula 9 - Gráficos com 
matplotlibepandas - Aula 10 - Machine Learning com 
Scikit-Learn - Aula 11 - Regressão Linear com 
Scikit-Learn - Aula 12 - Regressão Logística com 
Scikit-Learn - Aula 13 - Support Vector Machines com 
Scikit-Learn - Aula 14 - Árvores de Decisão com 
Scikit-Learn - Aula 15 - Florestas Aleatórias com 
Scikit-Learn - Aula 16 - Análise de Componentes Principais (PCA) com 
Scikit-Learn - Aula 17 - Análise de Agrupamentos (Clusterização) com 
Scikit-Learn - Aula 18a - Redes Neurais com 
TensorFloweKeras - Aula 18b - Redes Neurais com 
PyTorch - Aula 19 - Redes Neurais Convolucionais com 
PyTorch 
Algumas cheat sheets selecionadas para os temas e ferramentas da disciplina:
- Pandas: 
pandas.pydata.org - Matplotlib: 
matplotlib/cheatsheets - Scikit-Learn: choosing the right estimator
 - PyTorch: 
pytorch.org - Git: português ou inglês
 - Machine Learning: diversas linguas em 
afshinea/stanford-cs-229-machine-learninge tambémremicnrd/ml_cheatsheet - Markdown: sintaxe geral e sintaxe GitHub
 - RegEx: 
regex101.com - GitHub: atalhos do teclado em português e inglês
 
A avaliação pode ser realizada por meio de trabalho final no qual cada grupo de alunos (3 a 6 integrantes) devem entregar um notebook contendo os seguintes tarefas:
- Leitura de dados com 
pandas - Manipulação e limpeza de dados com 
pandas - Descritivo e exploração de dados com 
pandas(groupbys) - Figuras que mostrem insights sobre os dados com 
pandasematplotlib - Quebrar os dados em conjunto de treino e conjunto de teste
 - Treinar um estimador do 
scikit-learnde aprendizagem supervisionada (regressor ou classificador) no conjunto de treino - Verificar o desempenho do estimador do 
scikit-learnno conjunto de teste 
A entrega pode ser via e-mail, mas é extremamente incentivado para que os alunos criem um repositório no GitHub aberto com um README.md bem escrito que explica o projeto. Isto pode já ser um incentivo para os alunos criarem os seus portfolio de projetos de ciências de dados no GitHub, algo que impulsionaria bastante a carreira deles.
A correção dos trabalhos deverá levar em conta o tamanho dos grupos. Grupos pequenos têm maior tolerância de erros e inconsistências do que grupos com um maior número de integrantes.
Para citar o conteúdo use:
Storopoli & Souza (2020). Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch. Disponível em https://github.com/storopoli/ciencia-de-dados
Ou em formato BibTeX para LaTeX:
@misc{storopolisouza2020cienciadedados,
  author = {Storopoli, Jose and Souza, Edson Melo de},
  title = {Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch},
  url = {https://github.com/storopoli/ciencia-de-dado},
  year = {2020}
}Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).

