domingo, 24 de junho de 2018

Bibliotecas para Ciência de Dados


 O Cientista de Dados Igor Bobriakov publicou um excelente post no site Data Science Central (ponto de encontro de Cientistas de Dados em todo mundo) sobre as principais bibliotecas Python para Data Science. O post original está em inglês, mas trazemos aqui para você a versão em português. Confira as Top 20 Bibliotecas Python Para Data Science.

A Linguagem Python continua a assumir posições de liderança na solução de tarefas e desafios em Data Science. A seleção das bibliotecas está separada por categorias e a maioria delas já são estudadas no curso gratuito Python Fundamentos Para Análise de Dados.

Bibliotecas Principais e Estatísticas

1. NumPy
2. SciPy
3. Pandas


Visualização

6. Seaborn
8. Bokeh 
9. Pydot


Machine Learning


11. XGBoost LightGBM / CatBoost 
7. Plotly
12. Eli5

Deep Learning

13. TensorFlow 
14. PyTorch
15. Keras


Distributed Deep Learning



Processamento de Linguagem Natural


17. NLTK 
18. SpaCy
19. Gensim

Data Scraping


20. Scrapy 



Ao lado do nome da biblioteca você encontra o total de commits no Github e o total de colaboradores.
Python

http://datascienceacademy.com.br/blog/top-20-bibliotecas-python-para-data-science/

Referencia: MEDIUM
Traduzido do original em inglês: https://www.datasciencecentral.com/profiles/blogs/top-20-python-libraries-for-data-science-in-2018

Sem comentários:

Enviar um comentário