Saltar al contenido principal

Conceptos fundamentales

Antes de entrar en la plataforma, conviene entender los conceptos fundamentales que impulsan Hanc.AI. Esta sección explica desde los principios básicos de la IA hasta la terminología específica de la plataforma.


¿Qué es la Inteligencia Artificial (IA)?

La Inteligencia Artificial es software que puede realizar tareas que normalmente requieren inteligencia humana. A diferencia del software tradicional, que sigue reglas exactas, la IA puede:

  • Entender el lenguaje natural: comprende el habla y el texto humano
  • Aprender patrones: mejora a partir de datos y ejemplos
  • Tomar decisiones: elige las respuestas adecuadas según el contexto
  • Generar contenido: crea texto, voz u otros resultados similares a los humanos

IA en términos sencillos

Piensa en la IA como un sistema muy sofisticado de reconocimiento de patrones:

Software tradicional:
SI el cliente dice "hola" ENTONCES responder "Hola, ¿en qué puedo ayudar?"
SI el cliente dice "hi" ENTONCES responder "Hola, ¿en qué puedo ayudar?"
SI el cliente dice "buenas" ENTONCES responder "Hola, ¿en qué puedo ayudar?"
... (hace falta una regla por cada entrada posible)

Software con IA:
ENTIENDE que "hola", "hi", "buenas", "buenos días", "qué tal"
significan un saludo → responde de forma adecuada según el contexto
Diferencia clave

La IA no necesita reglas explícitas para cada situación: entiende la intención y el contexto, produciendo respuestas naturales incluso ante entradas que nunca había visto.


¿Qué es un agente de voz?

Un agente de voz (también llamado asistente de voz o voicebot) es un programa basado en IA que se comunica con personas mediante conversación hablada.

Cómo funcionan los agentes de voz

Paso a paso:

  1. El cliente habla: "¿A qué hora cerráis los sábados?"
  2. La IA entiende: convierte la voz en significado y busca en la base de conocimiento
  3. Base de conocimiento: contiene tu horario: "Sábado: 10:00-18:00"
  4. La IA genera la respuesta: "Los sábados abrimos de 10:00 a 18:00"
  5. El cliente escucha: respuesta de voz natural

Agente de voz vs. chatbot

FunciónAgente de vozChatbot
ComunicaciónVoz habladaTexto escrito
CanalLlamadas, widgets de vozChat web, apps de mensajería
InteracciónConversación en tiempo realPuede ser asíncrona
ComplejidadMayor (procesado de voz)Menor
Casos de usoSoporte telefónico, citasSoporte web, FAQ

Hanc.AI se especializa en agentes de voz: IA que gestiona conversaciones telefónicas reales.


Modelos de lenguaje grandes (LLM)

El "cerebro" de un agente de voz es un modelo de lenguaje grande (LLM). Es la tecnología IA que:

  • Entiende lo que dice el cliente
  • Formula respuestas adecuadas
  • Mantiene el contexto de la conversación
  • Sigue tus instrucciones (el "prompt")

Los LLM en Hanc.AI

Hanc.AI usa modelos de lenguaje avanzados para las conversaciones de voz. La plataforma selecciona automáticamente el modelo; tú te centras en configurar el comportamiento mediante el prompt y la base de conocimiento.

Cómo "piensan" los LLM

Los LLM no "piensan" realmente: predicen las palabras más probables a partir de:

  1. Datos de entrenamiento: miles de millones de ejemplos de texto de internet
  2. Tu prompt: las instrucciones que das sobre cómo comportarse
  3. Base de conocimiento: la información concreta de tu negocio
  4. Historial de conversación: lo dicho antes en la llamada

Base de conocimiento (RAG)

Una base de conocimiento es una colección de documentos con información sobre tu negocio. La IA la usa para responder con precisión a las preguntas de los clientes.

¿Qué es RAG?

RAG significa Retrieval-Augmented Generation (generación aumentada por recuperación):

  • Retrieval: localiza información relevante en tus documentos
  • Augmented: añade esa información al contexto de la IA
  • Generation: crea una respuesta usando esa información

Por qué importa el RAG

Sin RAG, la IA solo conoce información general de su entrenamiento. No conoce:

  • Tus servicios y precios concretos
  • Tu horario
  • Tus políticas
  • Tus miembros de equipo
  • Cualquier cosa propia de tu negocio
Con RAG
Cliente: "¿Cuánto cuesta un corte de pelo?"
IA: [Busca en la KB] "Un corte para hombre cuesta 25 EUR y para mujer 35 EUR."
Sin RAG
Cliente: "¿Cuánto cuesta un corte de pelo?"
IA: "No tengo información sobre vuestros precios concretos. En general, los cortes van de 15 EUR a 50 EUR..."

Contenido de la base de conocimiento

Tu base de conocimiento debería incluir:

CategoríaEjemplos
Servicios/productosDescripciones, precios, duración
Información del negocioHorarios, ubicación, contacto
PolíticasCancelaciones, devoluciones, reservas
FAQPreguntas frecuentes
EquipoMiembros del equipo, especializaciones
PromocionesOfertas actuales, descuentos

El prompt

Un prompt es un conjunto de instrucciones que dice a la IA cómo comportarse. Es como dar a un empleado su descripción de puesto y sus pautas.

Componentes del prompt

Buenas prácticas del prompt

No
Ser específico y claroUsar instrucciones vagas
Definir límitesDejar el comportamiento sin definir
Incluir ejemplosAsumir que la IA entiende el contexto
Definir reglas de escaladoQue la IA lo gestione todo
Especificar idioma y tonoOlvidar el estilo de comunicación

Tecnología de voz

Hanc.AI gestiona automáticamente todo el pipeline de procesamiento de voz:

  • Entendimiento del habla: la plataforma convierte las palabras habladas en significado en tiempo real
  • Respuestas de voz naturales: las respuestas de la IA se entregan como habla natural
Selección de la voz

Adapta la voz a tu marca. Los servicios profesionales se benefician de voces calmadas y maduras. Las marcas para jóvenes funcionan con voces enérgicas. La sanidad necesita tonos cálidos y tranquilizadores. Hay múltiples opciones de voz por género, edad y estilo.


Comunicación en tiempo real (WebRTC)

WebRTC (Web Real-Time Communication) es la tecnología que permite:

  • Llamadas de voz desde el navegador
  • Streaming de audio con baja latencia
  • Sin necesidad de plugins

Hanc.AI utiliza LiveKit (una plataforma WebRTC) para:

  • El widget de voz en tu sitio web
  • Llamadas de prueba en el dashboard
  • Procesamiento de audio en tiempo real

Términos clave de la plataforma

TérminoDefinición
AgenteAsistente de voz IA configurado
Golden TemplateRol de agente prediseñado con prompt, estructura de KB y flujo (24 disponibles)
Deploy AgentCreación con un clic de un agente desde una plantilla con valores por defecto
Guided SetupAsistente paso a paso para rellenar variables de plantilla antes de crear
Setup WizardHerramienta posterior a la creación (icono de varita) para completar la configuración por secciones
Reset to TemplateRestaura el contenido original tras ediciones manuales y reactiva el Setup Wizard
Espacio de trabajoContenedor de agentes que pertenece a una organización
Herramienta (Tool)Capacidad usada durante la llamada (desvío, Google Calendar, API RAG)
AcciónTarea posterior a la llamada (correo, SMS, WhatsApp, API)
Variable de extracciónDatos que la IA obtiene de las conversaciones (nombre, correo, etc.)
First MessageSaludo que dice el agente al contestar
EscaladoTransferir una llamada a un operador humano
Role BadgeEtiqueta naranja o gris en las tarjetas de agente que muestra el rol de la plantilla

Próximos pasos

Ahora que comprendes los conceptos clave:


Resumen

ConceptoIdea clave
IASoftware que entiende y genera respuestas similares a las humanas
Agente de vozIA que se comunica mediante conversación hablada
LLMEl "cerebro" que procesa el lenguaje y genera respuestas
Base de conocimientoTu información de negocio que la IA usa para responder
RAGTecnología que recupera información relevante de tus documentos
PromptInstrucciones que definen el comportamiento del agente
Tecnología de vozLa plataforma gestiona la comprensión del habla y respuestas naturales

Entender estos conceptos te ayudará a configurar agentes de voz más eficaces y a resolver problemas cuando aparezcan.