Saltar al contenido principal

Sugerencias

El widget consume dos endpoints distintos para sugerencias, con propósitos diferentes. Es importante no confundirlos.

EndpointLatenciaOrigenPropósito
GET /api/widget/suggestions< 50 ms (p95)índice precomputadoautocomplete tradicional: queries previas, categorías, marcas, productos más buscados
GET /api/widget/suggest200-600 msLLMcompletion conversacional / ghost text inline

/api/widget/suggestions (instant)

GET/api/widget/suggestions
curl "https://api.neuroon.ai/api/widget/suggestions?q=zap&limit=8" \
-H "X-Widget-Token: $WIDGET_TOKEN"

Controlador en WidgetSearchController.java.

Devuelve un array de Suggestion (

GET/api/widget/suggest
curl "https://api.neuroon.ai/api/widget/suggest?q=zapatos%20mujer%20talla" \
-H "X-Widget-Token: $WIDGET_TOKEN"

Controlador en WidgetSearchController.java.

Devuelve una sola completion que el widget muestra como ghost text dentro del input (estilo IDE): el usuario pulsa Tab para aceptar.

Cuándo usar cada uno

  • Auto-completar mientras se escribe/suggestions. Económico, p95 < 50 ms, sin coste de LLM.
  • Sugerir el siguiente token de la query/suggest. Más caro pero contextual.

El widget combina ambos: dropdown del bloque inferior viene de /suggestions; el ghost text inline viene de /suggest.

Configuración

  • features.suggestions: false deshabilita ambos completers y elimina el dropdown.
  • No se puede deshabilitar sólo uno actualmente; si necesitas ese control fino, abre un issue en soporte.

Rate limits

EndpointLímite por minuto
GET /api/widget/suggestions300
GET /api/widget/suggest100

Próximas lecturas