International Seminar on Statistics with R

Minicurso Presencial-Bruno e Leo

Integrando R e Python: Usando os pacotes Reticulate e Feather.

O minicurso irá abordar a integração entre R e Python em um fluxo de análise comum no dia a dia do cientista de dados, utilizando os pacotes reticulate e feather para realizar essa interoperabilidade entre as linguagens. O fluxo de análise utilizará do reticulate a possibilidade de importar módulos e scripts Python numa sessão do R, de modo a prosseguir a análise na linguagem. Além disso será apresentado o pacote feather, que proporciona rapidez de leitura e gravação de objetos e é codificado independente da linguagem. Ao expor esses pacotes será possível utilizar as duas linguagens em prol de uma boa análise de dados, nos beneficiando dos pontos fortes do R e do Python. Vamos elaborar um processo estruturado para data cleaning, data processing e data visualization, utilizando como base um conjunto de dados anonimizado de e-commerce brasileiro, disponibilizado pelo olist que pode ser encontrado no kaggle.

Público-alvo/ target audience

Iniciantes

Instrutores:  Bruno Lucian Gonçalves da Costa/Globo e Leonardo Filgueira/IBOPE-DTM

Bruno Lucian

Graduado em Estatística pela UFF e Mestre em Matemática Aplicada pela FGV. Atualmente é Cientista de dados líder na Rede Globo trabalhando com modelos de series temporais, classificação e clusterização de usuários, com passagens pelo IBOPE DTM onde também atuou como líder dos cientistas de dados liderando a área responsável pelos sistemas de recomendação. Gerador de conteúdo para o dadosaleatorios.com.br por mais de 4 anos. Possui interesse em modelagem preditiva, sistemas de recomendação, machine learning, aplicações web e visualização de dados.

Leonardo Filgueira

Graduado em estatística em 2018 pela Universidade Federal Fluminense, onde foi monitor de estatística básica em 2015 e 2018. Participa do projeto de extensão “Estatística é com R!” desde seu início em 2015 e produz conteúdos para o blog Dados Aleatórios. Foi estagiário do IBOPE DTM por mais de 1 ano, trabalhando atualmente na mesma empresa como Data Scientist.

 

Instruções aos participantes

É necessário a instalação do git, anaconda/python e R/Rstudio. Além dos pacote do R tidyverse, reticulate e feather, no python feather, pandas e scikit-learn
 

  Formulário de Inscrição

Copyright 2019 - STI - Todos os direitos reservados

Translate »