Cómo funciona

El motor de matching toma cada SKU de tu catálogo y, contra cada fuente, busca el candidato más probable de ser el mismo producto. Esta página explica el pipeline desde adentro: qué señales considera, cómo las pondera y cómo decide.

El pipeline

Cada match pasa por cuatro etapas:

Input. Tu SKU (con todos sus atributos) + lista de candidatos del competidor en la misma categoría aproximada.
Signals. Para cada candidato, el motor calcula coincidencia en las cinco señales (EAN, modelo, marca, name+atributos, categoría).
Score. Combinación ponderada de las señales arroja un valor entre 0% y 100%.
Verdict. El score cae en una de tres bandas — HIGH, MEDIA, BAJA — y eso determina qué hace Prize con el match (entrar al motor, esperar revisión humana, descartar).

Las señales y sus pesos

Cinco señales con pesos relativos. Recap expandido respecto a Atributos:

| Señal | Peso | Qué busca | |-------|------|-----------| | EAN | ★★★★★ | Coincidencia exacta del EAN-13. Si el competidor expone EAN limpio, es la señal más confiable. Casi siempre HIGH cuando coincide. | | Modelo del fabricante | ★★★★ | Match exacto del modelo + marca igual. Tolera variaciones menores de formato (espacios, guiones). Detecta sufijos regionales (PSA, AR) como variante. | | Marca | ★★★ | Filtro hard. Productos de marcas distintas nunca se matchean (un Samsung no matchea con un LG aunque el resto coincida). | | Name + atributos custom | ★★ | Fallback. Cuando no hay EAN ni modelo claro, name + JSON attributes (pulgadas, capacidad, etc.) arman el match. | | Categoría | ★ | Filtro suave. Un match cross-categoría es raro pero posible. Útil cuando el competidor categoriza distinto que vos. |

Cómo se computa el score

El score combina las señales en tres tramos:

Si EAN coincide y la categoría no es absurdamente diferente → score arranca arriba de 85% (HIGH casi seguro).
Si EAN no coincide pero modelo + marca sí → score se calcula como promedio ponderado de las señales restantes (name + atributos + categoría). Resultado típico: 70–90% según divergencia de atributos.
Si modelo o marca difieren → score arranca abajo. Sin coincidencia de marca, score < 40%.

No usamos fórmula matemática expuesta — el cálculo se calibra con feedback de matches confirmados/rechazados por humanos. Lo que importa: EAN cuando coincide manda, modelo + marca arman el grueso, atributos custom resuelven los empates.

Per-source matching

Un SKU tuyo se matchea contra cada fuente independientemente. Tu Smart TV Samsung 55" genera tres matches separados — uno contra Frávega, uno contra Musimundo, uno contra Garbarino — y cada uno tiene su propio score y banda.

Implicancias:

Un SKU puede ser HIGH en Frávega y MEDIA en Garbarino al mismo tiempo. No hay un "score promedio" — cada fuente lleva el suyo.
Si confirmás manualmente el match en Frávega, eso no afecta el match contra Musimundo (son evaluaciones independientes).
Cuando una fuente entra en Down, los matches contra esa fuente quedan en pausa pero el resto sigue activo.

Re-matching

Prize re-evalúa cada match en cada ciclo. Si nada cambió en los inputs (tu SKU + el candidato del competidor), el score se mantiene. Si cambió algo, el score se recalcula y puede cambiar de banda.

Casos típicos de cambio:

Atributo del SKU cambió (renombraste, corregiste EAN, agregaste atributos JSON) → re-evaluación inmediata.
Atributo del candidato cambió (el competidor actualizó descripción, modelo o packaging) → re-evaluación.
Candidato dejó de existir en la fuente → match queda como huérfano hasta el próximo ciclo, donde Prize busca reemplazo.
Sin cambios visibles → score igual al ciclo anterior. La auditoría registra "re-validado" sin cambio.

Próximos pasos

Score de confianza — las tres bandas en detalle.
Hints contextuales — las pistas que Prize muestra a humanos.
Resolver matches — la cola operacional.