Motor de extracción para facturas reales

De factura PDF
a JSON limpio listo para tu ERP

ExtractIA lee tus facturas, identifica proveedor, cliente, importes e impuestos y devuelve un JSON estable en segundos. Sin plantillas, sin reglas frágiles, listo para integrarse en tus flujos.

Tiempo medio ≈ 5 s / factura
Coste técnico < 0,03 € / doc
Estabilidad JSON consistente
Extracción de metadatos
Factura · IA
PDF MERKASOL_FACTURA_7182.pdf
Nº factura: 2020A00171254
Total: 2.894,32 €
Proveedor: MERKASOL ENERGÍAS RENOVABLES
Respuesta JSON 200 · OK
{
  "document_type": "factura",
  "core": {
    "invoice_number": "2020A00171254",
    "issue_date": "2020-05-18",
    "supplier": {
      "name": "MERKASOL ENERGIAS RENOVABLES",
      "tax_id": "ESB91508879"
    },
    "customer": {
      "name": "AUSSA",
      "tax_id": "A41946211"
    },
    "amounts_core": {
      "tax_base": 2392.00,
      "tax_amount": 502.32,
      "total_amount": 2894.32,
      "tax_rate": 21,
      "currency": "EUR"
    }
  },
  "confidence": 0.98
}
                    
Pensado para
ERP & contabilidad Gestorías y despachos RPA y automatización Sistemas documentales

Un motor de extracción especializado en facturas reales

No es un OCR genérico. ExtractIA está diseñado para entender facturas de proveedores reales, con formatos cambiantes, textos desordenados y PDFs escaneados.

Entiende el contexto, no solo las líneas

Identifica número de factura, proveedor, cliente, fechas relevantes, bases imponibles, tipos de IVA y totales aunque cambie el diseño del documento.

Salida estable y predecible

Siempre devolvemos la misma estructura JSON para facturas: un bloque core con los campos imprescindibles y un bloque enriched con detalles adicionales.

Arquitectura lista para crecer

El núcleo está preparado para añadir nuevos tipos documentales (contratos, convenios, informes…) sin romper la integración actual.

Diseñado para SaaS y on-prem

Puede funcionar como servicio centralizado multi-cliente o desplegarse en tu propia infraestructura como microservicio interno.

Cómo encaja ExtractIA en tus procesos

Desde una simple subida manual hasta la integración completa con tu ERP, RPA o sistema documental.

01

Subes la factura o llamas a la API

Facturas escaneadas, descargadas del portal del proveedor o generadas por tu propio sistema. ExtractIA trabaja con el PDF tal cual lo recibes.

02

La IA extrae los campos clave

Analizamos el contenido, detectamos la estructura y generamos un JSON limpio con los campos que realmente importan para tu contabilidad o ERP.

03

Integras o automatizas el registro

El JSON se consume desde tus procesos: registro contable, validación, workflow de aprobación o simple archivo documental con metadatos.

Modos de uso
  • Demo web Prueba el motor con tus propias facturas, sin instalar nada.
  • API HTTP Integra la extracción directamente desde tu ERP, RPA o servicio backend.
  • Cliente por lotes Pendiente de desarrollo: envío masivo de facturas y recepción de JSON para archivado y clasificación.
Abrir demo de extracción de facturas Abrir demo de certificados energéticos (CEE)

Una API pensada para integrarse de verdad

Llamadas HTTP simples, formatos claros y un contrato de salida estable. Ideal para microservicios, integraciones internas o SaaS multi-tenant.

Ejemplo de petición

POST https://www.extractia.es/api/extract-metadata
Content-Type: multipart/form-data

file: factura.pdf
            

Respuesta simplificada

{
  "success": true,
  "metadata": {
    "document_type": "factura",
    "core": {
      "invoice_number": "2020A00171254",
      "issue_date": "2020-05-18",
      "supplier": {
        "name": "MERKASOL ENERGIAS RENOVABLES",
        "tax_id": "ESB91508879"
      },
      "customer": {
        "name": "AUSSA",
        "tax_id": "A41946211"
      },
      "amounts_core": {
        "tax_base": 2392.00,
        "tax_amount": 502.32,
        "total_amount": 2894.32,
        "tax_rate": 21,
        "currency": "EUR"
      }
    },
    "confidence": 0.98
  }
}
            

Integración en Node.js

import FormData from "form-data";
import fs from "fs";
import axios from "axios";

const form = new FormData();
form.append("file", fs.createReadStream("factura.pdf"));

const res = await axios.post(
  "https://www.extractia.es/api/extract-metadata",
  form,
  { headers: form.getHeaders() }
);

console.log(res.data.metadata.core.invoice_number);
            

Hoy el foco está en facturas. La arquitectura ya está preparada para añadir nuevos tipos documentales manteniendo la misma API.

Modelo de precios pensado para escalar

La lógica es simple: costes técnicos bajos, márgenes razonables y precios que permitan usar ExtractIA como pieza clave sin miedo a la factura.

Exploración

Bajo demanda

Ideal para pruebas, proyectos piloto y carga baja.

  • Pago por uso
  • Acceso a la demo y a la API
  • Sin compromiso de permanencia

Producción

A medida

Para empresas que quieren integrar ExtractIA en serio en su operativa.

  • Volúmenes medios y altos
  • Condiciones adaptadas a tu caso
  • Soporte en integración y puesta en marcha

On-prem / dedicado

Infraestructura propia

Cuando el dato no puede salir de tu entorno.

  • Instancia aislada del motor
  • Integración con tu stack y autenticación
  • Control total de los flujos de información

Preguntas frecuentes

Algunas de las dudas habituales al plantear un motor de extracción de facturas basado en IA.

El foco de ExtractIA está en los datos, no en el archivo. El procesamiento se realiza en memoria y el objetivo es generar un JSON estable con los metadatos realmente útiles para tus sistemas.

Sí. Aunque el primer foco son las facturas, la arquitectura permite añadir extractores específicos para otros tipos de documentos (contratos, convenios, informes…) sin romper lo ya existente.

El motor devuelve siempre un campo de confidence que permite saber con qué grado de seguridad se han identificado los datos clave. La idea es que puedas automatizar la mayoría de casos y revisar solo los dudosos.

Sí. ExtractIA se puede usar como motor interno o como base de un SaaS comercializado, con autenticación por API key, límites por cliente, métricas de uso y modelos de facturación por volumen.