Escolha uma Página

Todas as palestras serão seguidas por uma seção de perguntas ao vivo, por favor mantenha-se no link.

The live questions section will follow recorded presentations so, please still online to follow the chat.

Horário PalestranteTítulo IdiomaResumo/Preview
9:45Luciane Alcoforado
Ariel Levy
Orlando Longo
Abertura V SERPortuguês / InglêsWelcome to V SER
10:00
Fernando A. BarbalhoMeu SICONFI: transparência pública, shiny, SQL, máquina de estado, dataviz e machine learning tudo ao mesmo tempo agoraPortuguês
Há cada vez mais interesse em se consumir dados de finanças públicas dos entes federativos brasileiros. As opções disponíveis para esse consumo trazem vários constrangimentos para quem não tem conhecimento aprofundado da Lei de Responsabilidade Fiscal e da arquitetura do Sistema que centraliza essas informações na Secretaria do Tesouro Nacional. A aplicação Meu SICONFI foi desenvolvida para tornar mais fácil esse consumo a partir de um diálogo entre aplicação e usuário. Esse produto foi desenvolvioa usando Shiny e flexdashboard com recursos de máquina de estado, consumo de dados usando SQL, visualização de dados em gráficos e mapas e clusterização. A palestra mostra rapidamente como é o uso da aplicação e em seguida navega pelos principais códigos.
Fernando Barbalho - Preview
10:30Larissa de Carvalho AlvesInferência variacional bayesiana como alternativa ao MCMCPortuguês
A inferência variacional (ou Bayes variacional - VB) é um método de machine learning que aproxima densidades de probabilidade por meio de otimização usando a divergência de Kullback-Leibler. Sabe-se que a inferência Bayesiana tem como principal meta obter a distribuição a posteriori que na maioria dos problemas é desconhecida. Portanto, o VB pode ser utilizado como um método alternativo ao tradicional MCMC para obter uma aproximação para a densidade a posteriori. Nesta palestra apresentarei resultados simulados para modelos de regressão linear e seleção de variáveis, comparando o MCMC e o VB. Serão indicados os principais pacotes já desenvolvidos no software R que lança mão do VB para fazer inferência. Além disso, proponho uma aplicação aos dados de Covid-19 com o objetivo de capturar a tendência do número de casos do Brasil por meio do ajuste de um modelo de regressão spline utilizando o VB.
11:00Bruno Thiago Tomio
Collect and use open access World Bank data to know your country
Inglês
Package {WDI} enables exploring 40 different datasets hosted by the World Bank. The database World Development Indicators (‘WDI’) contains 1,600 time series indicators for 217 economies and more than 40 country groups. For many series, data goes back more than 50 years. The package is very useful to explore the development of the countries. We will download and plot data together during this session.
11;30Alessia PaccagniniVector Autoregressive Models in R.
InglêsThe lecture replicates the example in Kilian and Lutkepohl (2017), Structural Vector Autoregressive Analysis, Cambridge University Press, Chapter 9 (page 239-240). The exercise focuses on the identification of an oil price shock and its impact on inflation and real GDP. The oil price shock is identified by using a recursive scheme (that is through Cholesky decomposition of the VAR's reduced form residuals covariance matrix). The proposed R codes allow to compute impulse response functions (IRFs), Forecast Error Variance Decomposition (FEVD) and Historical Decomposition (HD).
Alessia Paccagnini - Preview
14:20Manuel Febrero BandeBuilding a ShinyApp for CoVid-19 from the very beginingEspanholIn this presentation the needed steps for publishing a Shiny Apps for COVID19 prediction are shown. Since the very first statistical idea that involves Functional Data Analysis techniques extending the classical epidemiological models based on differential equations up to practical details for deploying the Shiny Server and its cost.
15:00Eduardo Soares Jangutta/Morgany Leite dos Santos Bibliometria com R: Aplicação e uso do pacote Bibliometrix na função BiblioshinyPortuguêsParte 1 com Morgany Leite: Contextualização de proposta de pesquisa bibliométrica sobre feminismo e gestão em duas bases internacionais: SCOPUS e Web of Science. Tutorial de como buscar e baixas as buscas. Parte 2 com Eduardo Jangutta: Como reunir as buscas realizadas e analisá-las em uma única base de dados sem duplicados no formato csv ajuda do RStudio e sua interface gráfica biblioshiny.
Morgany Leite e Eduardo Soares Jangutta - Preview
15:30Gilberto Rodrigues LiskaDistribuição Generalizada de Pareto aplicada à análise de eventos extremos de chuva em Uruguaiana-RS.PortuguêsO monitoramento das chuvas permite compreender o ciclo hidrológico que não só influencia a dinâmica ecológica e ambiental, mas também afeta as atividades econômicas e sociais. Esses setores são muito afetados quando as chuvas ocorrem em valores superiores à média, chamados de eventos extremos; além disso, as metodologias estatísticas baseadas na ocorrência média desses eventos são inadequadas para analisar esses eventos extremos. A Teoria dos Valores Extremos fornece modelos teóricos adequados para este tipo de evento; portanto, a Distribuição Generalizada de Pareto (Doravante GPD) é usada para analisar os eventos extremos que excedem um determinado limite. O presente trabalho aplicou o GPD e sua versão aninhada, a Distribuição Exponencial, em dados pluviométricos mensais da cidade de Uruguaiana, no estado do Rio Grande do Sul, Brasil. Para apoiar os resultados, utilizamos alguns critérios de qualidade de ajuste e propomos um
procedimento de simulação de Monte Carlo para detectar a verdadeira distribuição de probabilidade em cada mês analisado. Os resultados mostram que o GPD e a Distribuição Exponencial se ajustam aos dados em todos os meses. Por meio do estudo de simulação, percebemos que o GPD é mais adequado nos meses de setembro e novembro. No entanto, em janeiro, março, abril e agosto, a distribuição exponencial é mais apropriada e, nos outros meses, podemos usar qualquer uma delas.
Todos os materiais (apresentação, script em R, arquivo de dados) estarão disponíveis na pasta virtual V_SER_Gilberto.
Link da pasta virtual: https://1drv.ms/u/s!AvxsaQZPoPWd4TquBa0e7zxRvNvv?e=Z9Qm38
Gilberto Liska - Preview
16:00Orlando Fonseca GuilarteManipulação de grafos no R.PortuguêsA manipulação de grafos no R e o uso de banco de dados orientado a grafos são temáticas que ultimamente vêm merecendo grande destaque, em particular na área de Ciência de Dados. Nesta palestra serão tratados os pacotes igraph, threejs, networkD3 e visNetwork (análise de grafos e visualização) e o pacote neo4r (driver do banco de dados Neo4j).
Orlando Fonseca Guilarte - Preview
16:30Matheus Valentim de BarrosComo usar a plataforma Base dos Dados com RPortuguêsA palestra apresenta a utilização "pura" da biblioteca da Base dos Dados para R, apresentando a sua estrutura e suas principais funções e apresenta ainda como combinar o nosso pacote com outros pacotes e funcionalidades do R.Matheus Valentim de Barros - Preview
20:00Paulo Henrique Sales GuimaraesBest R Libraries for Machine LearningPortuguêsThis lecture talks about the main packages used in supervised machine learning.
20:20Fernando CorrêaDeploy de modelos de Machine Learning em RPortuguêsAnalisar dados e construir modelos preditivos ou de decisão são as principais atividades de Cientistas de Dados, mas o processo de entrega desses modelos vem logo depois na ordem de prioridades. Nesta apresentação vamos te mostrar como usar um dos mais flexíveis frameworks de modelagem para disponibilizar modelos de Machine Learning em APIs REST, abarcando desde o pré-processamento dos dados até a devolução do resultado dos modelos de previsão em formato JSON. A solução utilizará docker containers para garantir a robustez e reprodutibilidade do resultados, além os pacotes tidymodels e plumber da linguagem R.
HorárioPalestranteTítuloIdiomaResumo/ Preview
10:00Bruna WundervaldFeature Selection via Gain Penalization in Random ForestsPortuguês"Random forests are a very popular tree-ensemble based machine learning algorithm, which are known to not do feature selection very well. They commonly  use all or most of the features that are fed to them, and struggle a lot to detect highly correlated features. In this talk, I will give an overview about a new gain penalization feature selection method for random forests, focusing on its application to high-dimensional (large p) datasets.  The new method locally-globally applied, allowing for full flexibility in the choice of feature-specific penalization weights, while also applying a global penalization to all the features.  The implementation is provided through the popular random forests R package ranger, and its demonstration is given in the talk.

We develop a new approach for feature selection via gain penalization in tree-based models. First, we show that previous methods do not perform sufficient regularization and often exhibit sub-optimal out-of-sample performance, especially when correlated features are present. Instead, we develop a new gain penalization idea that exhibits a general local-global regularization for tree-based models. The new method allows for full flexibility in the choice of feature-specific importance weights, while also applying a global penalization. We validate our method on both simulated and real data, exploring how the hyperparameters interact and we provide the implementation as an extension of the popular R package ranger."
10:30Emmanuelle Rodrigues NunesGenetic Algorithms in RPortuguês"Genetic Algorithms are performed using evolutionary algorithms. These algorithms are used for optimisation problems and are loosely based on population genetics and selection mechanics.
Optimisation techniques are used to find the values of a set of parameters that maximise or minimise some objective function of interest. Such methods have become of great importance in statistics for estimation, model fitting, etc.
The potential solutions are in a population and are encoded as ‘genes’. We can produce new solutions by ‘mutating’ members of the current population and ‘crossing over’ two solutions to form a new solution. The better solutions are selected to breed and mutate, and the worse ones are discarded. As this is a probabilistic method, the solutions they explore are not determined only by the properties of the problem of interest. Genetic algorithms are used in artificial intelligence as an alternative to more traditional methods when we face, for example, problems that act on discrete spaces, where gradient-based methods cannot be used.
This talk aims to introduce the concept of Genetic Algorithm and demonstrate how to apply this technique in R the libraries GA."
Emmanuelle Rodrigues Nunes - Preview
11:00Fernando RibeiroLeague of Legends - Como ser um bom jogador?PortuguêsAplicação de recursos do R em variáveis do jogo mais jogado do mundo.
Fernando Ribeiro - preview
11:30Dean AttaliTaking your shiny apps to the next level: Tips for building grat user-facing toolsInglêsI build Shiny apps and R packages. A lot of them. Whenever you build a tool for others to use, you of course focus on making it work. But there are many other considerations to take into account if you want your software to survive and get popular. In this talk, I share some lessons learned from developing CRANalerts.com about how to build great user-facing tools.
14:30Vanessa Manhães e Alexandre Sousa da SilvaO R na Educação BásicaPortuguêsNessa palestra, os professores Vanessa e Alexandre fazem uma reflexão sobre a importância do estudo de Estatística para o engajamento cívico e apresentam sites e projetos que utilizam o R como ferramenta facilitadora do ensino da mesma, aplicada à realidades da Educação Básica.
15:00Luis TorgoEnsembles for Time Series ForecastingPortuguêsNesta palestra descrevemos e ilustramos duas abordagens de previsão de séries temporais, usando ensembles. Ambas as abordagens são baseadas na ideia de gerar diversidade entre os models usando propriedades dinâmicas das séries temporais. Resultados experimentais demonstram a eficácia das abordagens, em particular o método ADE disponível na package tsensembler do R.
15:30Leonardo FilgueiraQualithron: a qualidade faz a diferençaPortuguêsNesta palestra irei compartilhar um pouco do meu dia a dia como Cientista de Dados na DTM. Dentro do time de Data Science sou responsável pela automatização de processos, criação de pacotes e, mais recentemente, pelo desenvolvimento de um produto. Dentre todos os códigos em que trabalhei, pretendo contar um pouco mais sobre um pacote de qualificação de dados feito em R e Python (qualithron) que é usado em diversos clientes e foi desenvolvido por mim, com o apoio da equipe de Data Science e que obteve um resultado surpreendentemente positivo logo que teve sua primeira versão. Contarei como a ideia surgiu, como o desenvolvimento foi acontecendo, qual foi a reação da empresa com os primeiros resultados. Também mostrarei alguns resultados da aplicação desse pacote e por último, mas não menos importante, vou apresentar os pacotes que são utilizados. Leonarodo Filgueira - preview
16:00Beatriz MilzColeta de dados automatizada e integração contínua utilizando GitHub Actions: Exemplos com o Pacote MananciaisPortuguêsO GitHub Actions (GHA) (https://docs.github.com/pt/actions) permite automatizar fluxos de trabalho de desenvolvimento de pacotes em R. Nessa palestra, será mostrado alguns exemplos de uso de GitHub Actions no pacote Mananciais, que disponibiliza dados sobre o volume operacional em reservatórios utilizados para abastecimento público na Região Metropolitana de São Paulo. Os exemplos que utilizam GHA são: atualização da base de dados, checagem do pacote, execução de testes e avaliação da cobertura de testes. O pacote foi desenvolvido por Beatriz Milz, e pode ser acessado em: https://beatrizmilz.github.io/mananciais/index.html . Este pacote foi pensado para atender demandas de pessoas pesquisadoras que não somente utilizam R, disponibilizando também a base de dados atualizada diariamente em csv e em xlsx.
16:30Julio TrecentiGitHub ActionsPortuguêsVou falar um pouco sobre GitHub Actions (GHA). Trata-se de uma ferramenta do Github que permite fazer integração contínua de códigos desenvolvidos em quaisquer linguagens de programação, incluindo o R. É possível utilizar o GHA para diversas atividades, como testar um pacote em várias distribuições atualizar dados periodicamente e até mesmo automatizar relatórios com envio de e-mails, tudo em R. Como a Beatriz Milz já vai fazer uma introdução bem completa, vamos aproveitar para fazer um exemplo em live coding!
Julio Trecenti - Preview
20:00Eric Batista FerreiraExpDes e ExpDes.pt: pacotes R para análise de experimentosPortuguêsA pesquisa científica está constantemente utilizando-se de experimentos para provar suas hipóteses. Os pacotes Experimental Designs (ExpDes), e sua versão em Português, ExpDes.pt são bibliotecas de funções do software R que propiciam análise de experimentos balanceados segundo modelos de efeitos fixos. Eles permitem fazer a análise de variância, checando a normalidade e homogeneidade de variâncias dos resíduos, comparações múltiplas de tratamentos qualitativos e ajuste de modelos de regressão para fatores quantitativos. Além desse pacotes, em 2019 a família ExpDes aumento com a chegada de uma interface gráfica que facilita o processo de ensino-aprendizagem: o GExpDes. Com esses três pacotes, ganham o estudante, o professor e o analista de dados.

Eric Batista Ferreira - Preview
20:20Daniel FalbelImplementation of torchPortuguêsFalamos sobre o como o torch é implementado e suas motivações e em seguida apresentamos o pacote luz que faz com que seja muito fácil ajustar modelos e fazer previsões usando o torch.