Gostaria de compartilhar com vocês o meu projeto py-classifica-legal
. O intuito do programa é auxiliar em uma melhor governança de dados públicos, por meio de sugestõe de classificações de normas infraconstitucionais a partir de suas respectivas ementas. Como sabemos que aqui é uma comunidade mão na massa, eu gostaria de compartilhar com vocês toda a minha jornada de desenvolvimento. Incorporamos o espírito unicórnio
e construímos o produto de ponta a ponta e documentamos tudo em nosso blog em uma série de posts.
-
Na primeira etapa fizemos a coleta da base a ser usada no projeto
-
No próximo post definimos o escopo do projeto, bem como realizamos um recorte na base.
-
O terceiro post é uma das etapas cruciais de todo projeto, a construção adequada dos datasets de treino, validação e teste.
-
Na próxima fase relatamos tudo que deu ERRADO no nosso treinamento de machine learning.
-
Nesse, ressurgirmos das cinzas, e treinamos um classificador a partir de um language model.
-
O próximo passo ficou a cargo do deploy da solução, utilizamos desde fastapi, docker e tudo o mais para levar a POC para produção.
-
Por fim, nesse post apresentamos como construímos o frontend da aplicação usando o streamlit. Ufa! É isso aí! Ao longo dessa série pudemos ver como se deu a construção de um projeto de data science ponta a ponta! Espero que vocês gostem de conhecer essa jornada, tanto quanto eu gostei de caminhá-la. Grande Abraços!