Volver a Proyectos Sistemas de Dominio

Clasificador de Industria

Clasificación industrial con evaluación de riesgo. Conectividad con registros oficiales y screening de medios adversos.

El Problema

Clasificar una empresa en el código de industria correcto lleva entre 10 y 30 minutos de investigación manual por entidad — buscando en registros gubernamentales, cruzando presencia web e interpretando actividades empresariales ambiguas. A escala, esto se convierte en un cuello de botella para el onboarding de merchants y los flujos de compliance KYB. Distintas jurisdicciones usan distintos sistemas de clasificación (ANZSIC, SIC, NACE), y cada cliente puede aplicar su propia política de riesgo con categorías prohibidas y umbrales diferentes.

La Solución

Un servicio de clasificación potenciado por IA que combina tres fuentes de inteligencia: registros gubernamentales oficiales (ABR, NZBN, AUSTRAC), búsqueda web en tiempo real para investigar la actividad empresarial, y razonamiento LLM para la asignación de códigos. Los datos de entrada se enriquecen primero desde los registros, luego la IA analiza la presencia web para determinar las actividades del negocio y mapearlas a códigos de industria — validados contra la jerarquía taxonómica oficial. Un motor de riesgo de 4 niveles evalúa el resultado: screening de listas negras, mapeo código-riesgo, escaneo de keywords con desambiguación LLM, y razonamiento LLM completo para casos ambiguos. Tanto el sistema de clasificación como la política de riesgo son configurables por cliente.

Arquitectura

%%{init: {'theme': 'dark', 'themeVariables': { 'fontFamily': 'Inter', 'secondaryColor': '#1e293b', 'primaryColor': '#3b82f6', 'primaryBorderColor': '#60a5fa' }}}%% graph TB subgraph Input ["Entrada"] A["Datos de Empresa<br/>(name, identifiers, country)"] B["Configuración<br/>(Risk Policy + Classification System)"] end subgraph Enrichment ["Enriquecimiento"] A --> C1["Registro ABR (AU)"] A --> C2["Registro NZBN (NZ)"] A --> C3["Registro AUSTRAC"] A --> C4["Búsqueda Web"] end subgraph Classification ["Clasificación"] C1 & C2 & C3 & C4 --> D1["Detección de Trust / Entidad"] B --> D2 D1 --> D2["Clasificación LLM"] D2 --> D3["Validación de Códigos"] end subgraph Risk ["Evaluación de Riesgo"] D3 --> E1["Screening de Listas Negras"] E1 --> E2["Mapeo Código-Riesgo"] E2 --> E3["Escaneo Keywords + Desambiguación LLM"] E3 --> E4["Razonamiento LLM de Riesgo"] end subgraph Output ["Salida"] E4 --> F["Resultado<br/>+ Risk Level + Confidence"] end classDef default fill:#0f172a,stroke:#334155,color:#fff,stroke-width:1px; classDef agent fill:#0f172a,stroke:#3b82f6,color:#fff; classDef process fill:#0f172a,stroke:#334155,color:#fff; classDef config fill:#1e1b4b,stroke:#818cf8,color:#fff,stroke-width:2px; class D2,E3,E4 agent; class C1,C2,C3,C4,D1,D3,E1,E2 process; class B config;
Agente IA
Paso del Proceso

Tags

PythonWeb SearchData EnrichmentRisk AssessmentMulti-Registry

Resultados

  • Precisión de clasificación superior al 90% con validación cruzada de registros oficiales
  • Tiempo de procesamiento inferior a 1 minuto por entidad (vs. 10–30 minutos manual)
  • Políticas de riesgo y sistemas de clasificación configurables por cliente
  • Motor de riesgo de 4 niveles con códigos hard-floor que no pueden ser sobreescritos
  • Desplegado en producción para clientes enterprise de servicios financieros