Python para conversão de documento


A IBM lançou uma biblioteca Python gratuita que converte QUALQUER documento em dados: o Docling é uma biblioteca Python que simplifica o processamento de documentos, analisando diversos formatos — incluindo compreensão avançada de PDF — e fornecendo integrações perfeitas com o ecossistema de IA gen. 

Para cada formato de documento, o conversor sabe qual backend específico do formato empregar para analisá-lo e qual pipeline usar para orquestrar a execução, juntamente com quaisquer opções relevantes. 

O Docling inclui: – Backends de PDF para análise; Modelo de análise de layout; Formatador de tabela baseado em visão; OCR para texto 

Últimas Notícias

O Brasil abandona novas usinas a carvão mineral, mesmo com o governo prorrogando contratos de usinas termelétricas existentes até 2040

Um novo relatório do Global Energy Monitor constata que o Brasil eliminou efetivamente as propostas de novas usinas a carvão mineral, ao mesmo tempo...

Novo relatório alerta para acúmulo recorde de calor no planeta e níveis elevados de aquecimento futuro

O planeta continua acumulando calor em ritmo crescente, um sinal de que níveis elevados de aquecimento global já estão contratados para as próximas décadas,...

Conselhão faz balanço, traz mapa do Caminho e pode se tornar permanente

Durante a reunião do Conselho de Desenvolvimento Econômico Social Sustentável, o Conselhão, o ministro do Desenvolvimento, Indústria, Comércio e Serviços (MDIC), Márcio Elias Rosa,...