Coleta
Baixe PDFs de diários oficiais e registre a origem, data e fonte do arquivo.
O DadosJus organiza dados públicos de processos, pessoas, empresas e publicações oficiais em uma experiência moderna, simples e objetiva.
Esta primeira versão já nasce com estrutura para importar diários oficiais, extrair textos de PDFs e transformar publicações em registros pesquisáveis.
Baixe PDFs de diários oficiais e registre a origem, data e fonte do arquivo.
Converta o conteúdo dos PDFs em texto e identifique processos, nomes e empresas.
Use índices no MySQL para pesquisar por número do processo, nome ou documento.