International Seminar on Statistics with R

Minicurso Presencial – Julio

Resolvendo Captchas

CAPTCHAs são desafios criados com soluções fáceis de obter por humanos, mas difíceis de obter por robôs. Nesse minicurso, apresentaremos o decryptr, um pacote em R que utiliza modelos estatísticos para resolver CAPTCHAs de imagens que contêm textos. Essa solução vem sendo utilizada por diversos desenvolvedores para colocar os modelos em produção, auxiliando em sistemas de raspagem de dados. Para compreender o decryptr, mostraremos o que são e como funcionam as redes neurais profundas, começando pela regressão logística e chegando nas redes neurais convolucionais. Também faremos uma introdução ao pacote Keras, uma biblioteca que funciona tanto em R quanto Python. Depois, apresentaremos como o decryptr foi desenvolvido, como pode ser utilizado e como pode ser expandido para resolver novos CAPTCHAs. Também mostraremos detalhes do desenvolvimento do decryptr como serviço, através de uma API para resolver CAPTCHAs via requisições web.

Público-alvo/ target audience

Estatísticos e cientistas da computação. Na parte teórica, tods devem saber pelo menos regressão logística. Na parte computacional, o público-alvo são estudantes intermediários com noções de tidyverse. Obrigatório conhecer o pipe (%>%)

Instrutor: Julio Trecenti/IME-USP / Curso-R

Julio é o faxineiro de dados. Doutorando em Estatística pelo IME-USP. Secretário-geral da Associação Brasileira de Jurimetria (ABJ). Presidente do CONRE-3a Região. Sócio da Terranova Consultoria. Trabalha com web scraping, arrumação de dados, construção de modelos preditivos, APIs, pacotes em R e dashboards em Shiny. Coordenador e ministrante de diversos cursos sobre R, ciência de dados e jurimetria.

Instruções aos participantes

Vamos abrir uma máquina na nuvem. Nem todos os modelos rodam em menos de 3 horas, então vamos rodar só uma parte dos códigos.
 

  Formulário de Inscrição

Copyright 2019 - STI - Todos os direitos reservados

Translate »