Octávio Santana

PhD in Physics | Data Scientist at GAVB - Grupo Boticário | Computer Vision

Sobre mim

Bacharel em Física pela Universidade Federal de Sergipe (2012), mestre (2015) e doutor (2019) em Física pela Universidade Estadual de Campinas. Atualmente sou Cientista de Dados na GAVB e no Grupo Boticário, no qual atuo em projetos de Visão Computacional, NLP e Áudio Data no time de Deep Learning. Devido a minha formação, tenho capacidade de analisar, descrever e explicar resultados, formular perguntas e encaminhar soluções das mesmas, podendo atuar em diversas áreas distintas. Desde a minha iniciação científica, que utilizo programação para solucionar problemas relacionados ao meu tema de pesquisa. Tenho experiência com linguagem de programação Python, para construção de gráficos (bibliotecas matplotlib e seaborn), manipulação de dados (biblioteca pandas), manipulação de vetores, matrizes e cálculo numérico (bibliotecas numpy e scipy), raspagem de dados na internet (bibliotecas request, beatifulsoup, selenium e request-html), aprendizagem de máquina (biblioteca scikit-learn), visão computacional (opencv, Yolo) e aprendizagem profunda (keras, tensorflow).

Experiência

GAVB

Atuo como Cientista de Dados em projetos de inteligência artificial e machine learning. Principalmente em projetos de Visão Computacional, NLP e Audio Data no time de Deep Learning.

Universidade Federal de Sergipe

Curriculo Lattes

Professor substituto no departamento de matemática.

Exemplaria Solutions

Programa AIM Factory

Participação de projetos de inteligência artificial e machine learning.

Formação Acadêmica

Universidade Estadual de Campinas

Fev 2015 - Mar 2019

Doutorado em Física

Título: Devios de feixes ópticos: o efeito Goos-Hänchen

Universidade Estadual de Campinas

Fev 2013 - Fev 2015

Mestrado em Física

Título: Medidas fracas do deslocamento Goos-Hänchen próximo do ângulo crítico para reflexão interna total

Universidade Federal de Sergipe

Fev 2009 - Dez 2012

Bacharelado em Física

Título: Lasers Semicondutores Caóticos

Formação Complementar

Deep Learning com Python de A a Z - O curso completo

Visualizar certificado

Introduction to Python for Data Science Course

Visualizar certificado

HackerRank: Python Intermediate

Visualizar Certificado

PYTHON PROGRAMMING: BEGINNER

Visualizar Certificado

Python Fundamentos para Análise de Dados

Visualizar Certificado

Machine Learning: Introdução a Classificação

Visualizar Certificado

Machine Learning: Aprendizado Supervisionado

Visualizar Certificado

Machine Learning II: Avançando com tipos diferentes de classificação

Visualizar Certificado

Machine Learning: Introdução as Sistemas de Recomendações

Visualizar Certificado

Introdução ao SAS

Visualizar Certificado

Projetos

Segmentação de áudio

Neste repositório desenvolvemos um modelo no qual identifica os trechos do áudio em que o estudante ou o professor está falando.

O dataset utilizado para treinamento e validação está disponível no kaggle .

Ver Projeto

Artigo no medium sobre o projeto. Click aqui!

Case IBAMA

O objetivo deste case é encontrar qual transportadora realizou o transporte de madeira com maior custo-benefício e construir um modelo preditivo que prevê o preço do transporte em dezembro de 2007 por transportadora utilizando as variáveis do problema.

O dataset utilizado corresponde apenas aqueles com origem no estado do Acre e no ano de 2007. O dataset pode ser baixado no link .

Ver Projeto

Web of Science

Faz a raspagem e analises de algumas informações referente ao tema de busca do site web of science. Atualmente este projeto está dividido em três etapas.

  • Obter os links de todos os artigos referente ao tema de busca
  • Percorrer por todos os links e raspar algumas informações em cada link
  • Fazer uma analise com os dados e obter algumas informações.

Ver Projeto

Artigo no linkedin sobre o projeto. Click aqui!

Club da Aposta

Notebook com as analises que fiz para o Processo Seletivo Cientista de Dados Júnior do Clube da Aposta no qual participei.

No README do projeto contém feedback da equipe club da aposta.

Ver Projeto

Link com o vídeo explicando o notebook. Click aqui!

Google Scholar API

API que retorna informações referente ao tema de busca no site google scholar em formato json. As informações obtidas são:

Título Autores; Nome da revista; Ano da publicação;
Número de citações; Link do abstract; Link dos artigos citados; Link dos artigos relacionados

Ver Projeto

Analise de indicadores do turismo

Neste projeto minha colaboração foi na simulação de monte carlo de overbooking de companhia aérea e em alguns ajustes no modelo de forma geral.

Ver Projeto

Best Rout

Projeto pessoal que estou desenvolvendo que refere-se a obter a melhor rota, podendo ser aplicado em empresas de transporte de mercadorias, empresas de turismo, ou até mesmo a pessoas que não conheçam em detalhes uma certa cidade e que queira visitar alguns pontos turísticos (restaurantes, bares, etc) com o menor percurso.

Ver Projeto

Artigo no linkedin sobre o projeto. Click aqui!

Similaridade entre Comentários

Aqui apresento como construir um algoritmo que analisa o quanto semelhante são dois comentários, apenas para fins de estudo. Está não é uma solução completa, mas te dar uma ideia geral de como pode ser feito esse tipo de comparação apenas usando o conhecimento de álgebra linear. Em seguida utilizarei a biblioteca sklearn como uma alternativa ao código.

Ver Projeto

Artigo no medium sobre o projeto. Click aqui!

Criptografia Caótica

Dada uma condição inicial (chave inicial), podemos criptografar uma mensagem de texto misturando com a dinâmica caótica descrita pela equação de Lorentz, de modo que para descriptografar a mensgaem é necessário termos a mesma chave inicial.

Ver Projeto

Artigo no linkedin sobre o projeto. Click aqui!

Deploy de uma simples página web no Heroku

Neste simples projeto, o back end vai resolver numerica a equação de Lorentz, sendo que o usuário irá inserir os valores dos parâmetros e as condições inicias, e então é retornado um gráfico com a evolução temporal das equações de Lorentz.

Ver Projeto

Página em funcionamento. Click aqui!

Motor de Passo

Programa que controla um motor de passo, usando a biblioteca RPi.GPIO do raspberry pi 3 e a biblioteca PyQt4 para contruir a interface gráfica. O link no youtube mostra o programa em funcionamento.

Ver Projeto

Kaggle

Alguns programas que utilizei nos desafios do kaggle. No momento apenas contém as competições Titanic e Toxic Comment Classification Challenge (desatualizado).

Ver Projeto

Neste link você pode visualisar meu perfil no site do kaggle.

Competências

Entrar em Contato