Entiende el contexto, no solo las líneas
Identifica número de factura, proveedor, cliente, fechas relevantes, bases imponibles, tipos de IVA y totales aunque cambie el diseño del documento.
ExtractIA lee tus facturas, identifica proveedor, cliente, importes e impuestos y devuelve un JSON estable en segundos. Sin plantillas, sin reglas frágiles, listo para integrarse en tus flujos.
{
"document_type": "factura",
"core": {
"invoice_number": "2020A00171254",
"issue_date": "2020-05-18",
"supplier": {
"name": "MERKASOL ENERGIAS RENOVABLES",
"tax_id": "ESB91508879"
},
"customer": {
"name": "AUSSA",
"tax_id": "A41946211"
},
"amounts_core": {
"tax_base": 2392.00,
"tax_amount": 502.32,
"total_amount": 2894.32,
"tax_rate": 21,
"currency": "EUR"
}
},
"confidence": 0.98
}
No es un OCR genérico. ExtractIA está diseñado para entender facturas de proveedores reales, con formatos cambiantes, textos desordenados y PDFs escaneados.
Identifica número de factura, proveedor, cliente, fechas relevantes, bases imponibles, tipos de IVA y totales aunque cambie el diseño del documento.
Siempre devolvemos la misma estructura JSON para facturas:
un bloque core con los campos imprescindibles y un bloque
enriched con detalles adicionales.
El núcleo está preparado para añadir nuevos tipos documentales (contratos, convenios, informes…) sin romper la integración actual.
Puede funcionar como servicio centralizado multi-cliente o desplegarse en tu propia infraestructura como microservicio interno.
Desde una simple subida manual hasta la integración completa con tu ERP, RPA o sistema documental.
Facturas escaneadas, descargadas del portal del proveedor o generadas por tu propio sistema. ExtractIA trabaja con el PDF tal cual lo recibes.
Analizamos el contenido, detectamos la estructura y generamos un JSON limpio con los campos que realmente importan para tu contabilidad o ERP.
El JSON se consume desde tus procesos: registro contable, validación, workflow de aprobación o simple archivo documental con metadatos.
Llamadas HTTP simples, formatos claros y un contrato de salida estable. Ideal para microservicios, integraciones internas o SaaS multi-tenant.
POST https://www.extractia.es/api/extract-metadata
Content-Type: multipart/form-data
file: factura.pdf
{
"success": true,
"metadata": {
"document_type": "factura",
"core": {
"invoice_number": "2020A00171254",
"issue_date": "2020-05-18",
"supplier": {
"name": "MERKASOL ENERGIAS RENOVABLES",
"tax_id": "ESB91508879"
},
"customer": {
"name": "AUSSA",
"tax_id": "A41946211"
},
"amounts_core": {
"tax_base": 2392.00,
"tax_amount": 502.32,
"total_amount": 2894.32,
"tax_rate": 21,
"currency": "EUR"
}
},
"confidence": 0.98
}
}
import FormData from "form-data";
import fs from "fs";
import axios from "axios";
const form = new FormData();
form.append("file", fs.createReadStream("factura.pdf"));
const res = await axios.post(
"https://www.extractia.es/api/extract-metadata",
form,
{ headers: form.getHeaders() }
);
console.log(res.data.metadata.core.invoice_number);
Hoy el foco está en facturas. La arquitectura ya está preparada para añadir nuevos tipos documentales manteniendo la misma API.
La lógica es simple: costes técnicos bajos, márgenes razonables y precios que permitan usar ExtractIA como pieza clave sin miedo a la factura.
Bajo demanda
Ideal para pruebas, proyectos piloto y carga baja.
A medida
Para empresas que quieren integrar ExtractIA en serio en su operativa.
Infraestructura propia
Cuando el dato no puede salir de tu entorno.
Algunas de las dudas habituales al plantear un motor de extracción de facturas basado en IA.
El foco de ExtractIA está en los datos, no en el archivo. El procesamiento se realiza en memoria y el objetivo es generar un JSON estable con los metadatos realmente útiles para tus sistemas.
Sí. Aunque el primer foco son las facturas, la arquitectura permite añadir extractores específicos para otros tipos de documentos (contratos, convenios, informes…) sin romper lo ya existente.
El motor devuelve siempre un campo de confidence que permite
saber con qué grado de seguridad se han identificado los datos clave.
La idea es que puedas automatizar la mayoría de casos y revisar solo los dudosos.
Sí. ExtractIA se puede usar como motor interno o como base de un SaaS comercializado, con autenticación por API key, límites por cliente, métricas de uso y modelos de facturación por volumen.