Base de Acórdãos TCU

O dataset está publicado no kaggle :

Além disso, caso tenham interesse no código de coleta dos dados o repositório é o:

4 Curtidas

Excelente, @NetoFerraz! :tada: Parabéns pelo trabalho e obrigado por compartilhar. :partying_face:

Pensei que você já tivesse compartilhado aqui antes mas não encontrei a postagem anterior.

Será interessante compartilhar também os trabalhos que o pessoal fizer, especialmente no curso, em cima desse dataset. Por exemplo, a limpeza do campo “assunto”, que é um campo livre no sistema, e que tem muitas variações de se escrever a mesma coisa.

Encontrei duas experiências de classificadores de assunto:

3 Curtidas

Eu não havia publicado por aqui devido ao downtime do servidor. A @Debora disponibilizou o notebook criado pelo Ami Aran no kaggle.

Pelo trabalho do Ami Aran ficou claro que é necessário um pré-processamento de alguns campos para melhorar a eficácia nas tarefas de classificação.

3 Curtidas