Bienvenido al glosario de inteligencia artificial más completo en español, con más de 263 términos explicados de forma clara y práctica. Desde los fundamentos del machine learning hasta los últimos avances en IA generativa, LLMs y agentes autónomos: aquí encontrarás la definición de cada concepto que necesitas conocer.
En LaudeMMedia llevamos más de dos décadas aplicando tecnología de vanguardia al marketing digital, la administración de sistemas y el DevOps. La inteligencia artificial es hoy una pieza central de nuestro trabajo: desde la optimización SEO potenciada por IA hasta la gestión de infraestructura de servidores para cargas de ML. Este glosario refleja ese conocimiento aplicado.
Última actualización: marzo 2026.
#
3D Gaussian Splatting
Técnica de renderizado neuronal que representa escenas 3D mediante millones de primitivas gaussianas. Permite generar vistas fotorrealistas en tiempo real a partir de un conjunto de imágenes, y se está integrando con modelos de IA generativa para crear mundos virtuales.
A
A/B Testing de Modelos
Metodología para comparar dos versiones de un modelo de IA en producción, dirigiendo tráfico a cada una y midiendo métricas de rendimiento. Es esencial en MLOps para validar mejoras antes de un despliegue completo.
Accuracy
Métrica de evaluación que mide el porcentaje de predicciones correctas sobre el total. Es útil cuando las clases están balanceadas, pero puede ser engañosa en datasets desbalanceados donde conviene complementarla con precision, recall y F1.
Activation Function
Función matemática aplicada a la salida de cada neurona para introducir no linealidad en la red. Sin funciones de activación (como ReLU, sigmoid o tanh), una red neuronal profunda se comportaría como un simple modelo lineal.
Agentic AI
Paradigma donde los sistemas de IA operan como agentes autónomos capaces de descomponer tareas complejas, usar herramientas, mantener memoria y colaborar con otros agentes. Es la evolución natural de los LLMs hacia sistemas que no solo responden, sino que actúan. En LaudeMMedia ofrecemos servicios de agentes IA autónomos para PYMEs.
AGI (Inteligencia General Artificial)
Concepto teórico de una IA capaz de realizar cualquier tarea intelectual que pueda hacer un humano, con capacidad de razonamiento general, aprendizaje autónomo y transferencia entre dominios. A día de hoy no se ha alcanzado y sigue siendo objeto de debate entre investigadores.
AI Agent
Sistema de IA que actúa de forma autónoma para alcanzar un objetivo, tomando decisiones, planificando pasos intermedios y ejecutando acciones (como llamar a APIs o navegar la web). Los agentes de IA representan una evolución frente a los chatbots simples de pregunta-respuesta. En LaudeMMedia ofrecemos servicios de agentes de IA para empresas.
AI Alignment
Disciplina que investiga cómo garantizar que los sistemas de IA actúen de acuerdo con las intenciones y valores humanos. Es uno de los grandes desafíos de la seguridad en IA, especialmente a medida que los modelos se vuelven más capaces.
AI Assistant
Aplicación o servicio basado en IA diseñado para ayudar a usuarios en tareas concretas como escribir, programar, buscar información o gestionar agendas. Ejemplos populares incluyen ChatGPT, Claude y Google Gemini.
AI Coding
Uso de modelos de IA para asistir en la programación: autocompletar código, generar funciones, detectar bugs o refactorizar. Herramientas como GitHub Copilot, Cursor y Claude Code están transformando el flujo de trabajo de los desarrolladores.
AI Content Detection
Tecnología que intenta identificar si un texto, imagen o vídeo ha sido generado por inteligencia artificial. Se usa en educación, periodismo y SEO, aunque su fiabilidad es limitada y genera controversia sobre falsos positivos.
AI Governance
Marco organizativo de políticas, procesos y controles que regulan el uso responsable de la inteligencia artificial dentro de una empresa. Incluye gestión de riesgos, auditoría de modelos, cumplimiento normativo (EU AI Act, NIST) y supervisión ética. En 2026, es prioridad máxima en las agendas corporativas de cualquier organización que utilice IA.
AI Safety
Campo de investigación dedicado a prevenir daños causados por sistemas de IA, tanto a corto plazo (sesgos, desinformación) como a largo plazo (riesgos existenciales de una IA superinteligente). Incluye AI Alignment, robustez y control.
AI Scientist
Concepto de un sistema de IA capaz de realizar investigación científica autónoma: formular hipótesis, diseñar experimentos, analizar resultados y publicar hallazgos. Trabajos recientes de Sakana AI han demostrado prototipos funcionales que automatizan partes del proceso de investigación.
AI SEO
Aplicación de inteligencia artificial a la optimización para motores de búsqueda. Incluye generación de contenido optimizado, análisis de intención de búsqueda, clustering de palabras clave y predicción de rankings. En LaudeMMedia aplicamos IA a nuestros servicios de SEO para obtener mejores resultados.
AI Slop
Contenido digital de baja calidad producido masivamente mediante inteligencia artificial, sin supervisión ni edición humana significativa. El término se popularizó en 2025-2026 para describir textos, imágenes y vídeos generados por IA que inundan internet y degradan la calidad general del contenido online.
AI-powered Search
Motores de búsqueda que usan modelos de IA generativa para sintetizar respuestas directas en lugar de solo listar enlaces. Ejemplos incluyen Google AI Overviews, Perplexity y Bing Copilot. Esto está cambiando el SEO y dando lugar al GEO.
Algoritmo
Conjunto ordenado de instrucciones o reglas que sigue un sistema para resolver un problema o realizar una tarea. En IA, los algoritmos de aprendizaje (como gradient descent o backpropagation) son los que permiten a los modelos aprender de los datos.
AMD ROCm
Ver ROCm (AMD). Plataforma de computación abierta de AMD para ejecutar cargas de deep learning en sus GPUs como alternativa al ecosistema CUDA de Nvidia.
Análisis de Sentimiento
Técnica de NLP que identifica la polaridad emocional de un texto (positivo, negativo o neutro). Se utiliza ampliamente en monitorización de redes sociales, reseñas de productos y atención al cliente.
API de IA
Interfaz de programación que permite integrar capacidades de inteligencia artificial en aplicaciones propias. Proveedores como OpenAI, Anthropic y Google ofrecen APIs para acceder a sus modelos de lenguaje, visión y audio sin necesidad de infraestructura propia.
Aprendizaje No Supervisado
Tipo de machine learning donde el modelo aprende patrones en los datos sin etiquetas predefinidas. Técnicas como clustering (K-means) y reducción de dimensionalidad (PCA) permiten descubrir estructuras ocultas en los datos.
Aprendizaje por Refuerzo
Paradigma de ML donde un agente aprende mediante prueba y error, recibiendo recompensas o penalizaciones según sus acciones en un entorno. Es la base del entrenamiento de modelos como AlphaGo y se usa en RLHF para alinear LLMs.
Aprendizaje Supervisado
Tipo de machine learning donde el modelo se entrena con datos etiquetados (pares entrada-salida conocidos). Es el enfoque más común e incluye tareas de clasificación y regresión. Ejemplos: detectar spam, predecir precios, clasificar imágenes.
ASI (Superinteligencia Artificial)
Concepto hipotético de una IA que supera ampliamente la inteligencia humana en todos los dominios cognitivos. Mientras que la AGI igualaría al humano, la ASI lo superaría. Es objeto de estudio en AI Safety.
Attention Mechanism
Mecanismo que permite a una red neuronal enfocarse en las partes más relevantes de la entrada al generar cada parte de la salida. Es el componente fundamental de la arquitectura Transformer y la base de todos los LLMs modernos.
AUC (Area Under the Curve)
Métrica que mide el área bajo la curva ROC y cuantifica la capacidad de un clasificador para distinguir entre clases. Un AUC de 1.0 indica un clasificador perfecto, mientras que 0.5 equivale a una predicción aleatoria.
Automatización Inteligente
Combinación de IA, machine learning y automatización robótica de procesos (RPA) para automatizar tareas empresariales complejas que requieren cierto grado de juicio. Va más allá de la automatización basada en reglas simples. En LaudeMMedia ofrecemos servicios de automatización con IA.
Autonomous Agent
Agente de IA capaz de operar de forma independiente durante periodos prolongados, tomando decisiones sin intervención humana constante. Puede planificar, ejecutar acciones, evaluar resultados y corregir su rumbo de forma autónoma.
AWS SageMaker
Plataforma de ML gestionada de Amazon Web Services que cubre todo el ciclo de vida del ML: etiquetado de datos, entrenamiento, ajuste, despliegue y monitorización de modelos. Incluye instancias con GPU y acceso a modelos fundacionales a través de Amazon Bedrock.
Azure ML
Plataforma de machine learning de Microsoft Azure para crear, entrenar y desplegar modelos de IA a escala empresarial. Incluye AutoML, pipelines de ML, MLOps y acceso a modelos de OpenAI a través del servicio Azure OpenAI.
Amazon Nova
Familia de modelos fundacionales de Amazon (AWS Bedrock). Incluye Nova Pro (multimodal), Nova Lite (300K contexto, imagen/vídeo), Nova Micro (texto, baja latencia), Nova Canvas (imágenes) y Nova Reel (vídeo). Compiten con OpenAI y Anthropic dentro del ecosistema AWS.
B
Backpropagation
Algoritmo fundamental para entrenar redes neuronales. Calcula el gradiente de la función de pérdida respecto a cada peso de la red, propagando el error desde la capa de salida hacia atrás. Junto con gradient descent, permite ajustar los pesos para minimizar el error.
Batch Normalization
Técnica que normaliza las activaciones de cada capa durante el entrenamiento, estabilizando y acelerando el proceso. Reduce la sensibilidad a la inicialización de pesos y permite usar learning rates más altos.
Batch Size
Número de ejemplos de entrenamiento procesados antes de actualizar los pesos del modelo. Un batch size mayor proporciona gradientes más estables pero requiere más memoria; uno menor introduce más ruido pero puede ayudar a escapar de mínimos locales.
Benchmark
Conjunto estandarizado de pruebas para evaluar y comparar el rendimiento de modelos de IA. Benchmarks como MMLU, HumanEval o MATH permiten medir capacidades específicas de los LLMs de forma reproducible.
BERT
Modelo de lenguaje bidireccional desarrollado por Google en 2018 que revolucionó el NLP. A diferencia de modelos anteriores, BERT lee el texto en ambas direcciones simultáneamente, lo que le permite captar mejor el contexto. Es la base de muchos sistemas de búsqueda y clasificación de texto.
Bias (Sesgo)
En ML, tiene dos significados: (1) el parámetro de sesgo en una neurona que ajusta la salida, y (2) el sesgo estadístico o social presente en los datos de entrenamiento que puede llevar a predicciones injustas o discriminatorias. El segundo es un problema clave en ética de IA.
Bark
Modelo de generación de voz open source de Suno. Genera habla realista, música, efectos de sonido y expresiones como risas a partir de texto. Soporta múltiples idiomas y clonación de voz con pocos segundos de audio. Alternativa gratuita a ElevenLabs.
C
Cadena de Pensamiento (Chain of Thought)
Técnica de prompt engineering que instruye al modelo a razonar paso a paso antes de dar una respuesta final. Mejora significativamente el rendimiento en tareas de matemáticas, lógica y razonamiento complejo. Es la base del razonamiento avanzado en modelos como Claude y o1.
Chatbot
Programa de software que simula una conversación con usuarios humanos mediante texto o voz. Los chatbots modernos basados en LLMs son mucho más capaces que los chatbots basados en reglas tradicionales.
Chatbot Empresarial
Chatbot diseñado específicamente para entornos corporativos: atención al cliente, soporte interno, ventas o RRHH. Suelen integrarse con CRMs, bases de conocimiento y sistemas internos mediante RAG para ofrecer respuestas precisas y contextualizadas. En LaudeMMedia ofrecemos servicios de chatbots de WhatsApp con IA para empresas.
Clasificación de Texto
Tarea de NLP que asigna automáticamente una o varias categorías a un texto. Aplicaciones incluyen detección de spam, clasificación de tickets de soporte, análisis de sentimiento y moderación de contenido.
Claude
Familia de modelos de IA desarrollada por Anthropic, conocida por su enfoque en seguridad y honestidad mediante Constitutional AI. Claude destaca en razonamiento, seguimiento de instrucciones y generación de código. Disponible vía API y como asistente.
Cloud AI
Servicios de inteligencia artificial ofrecidos por proveedores cloud como AWS SageMaker, Google Vertex AI y Azure ML. Permiten entrenar, desplegar y gestionar modelos sin invertir en hardware propio. En LaudeMMedia gestionamos infraestructura cloud para proyectos de IA.
ComfyUI
Interfaz gráfica basada en nodos para ejecutar pipelines de generación de imágenes con Stable Diffusion y otros modelos. Permite crear flujos de trabajo complejos de forma visual, combinando modelos, LoRAs, ControlNet y postprocesado.
Computer Vision
Subcampo de la IA que permite a las máquinas interpretar y procesar información visual (imágenes y vídeos). Incluye tareas como detección de objetos, reconocimiento facial, segmentación y clasificación de imágenes.
Confusion Matrix
Tabla que muestra las predicciones correctas e incorrectas de un modelo de clasificación, desglosadas por clase. Permite calcular métricas como precision, recall y F1-score, y visualizar qué clases confunde el modelo.
Constitutional AI
Enfoque de alineación de IA desarrollado por Anthropic donde el modelo se entrena siguiendo un conjunto de principios éticos (una «constitución»). El modelo aprende a autoevaluarse y corregirse, reduciendo la necesidad de retroalimentación humana directa.
Context Window
Número máximo de tokens que un LLM puede procesar en una sola interacción (entrada + salida). Los modelos modernos han escalado desde 4K tokens (GPT-3.5) hasta 200K+ (Claude) y 1M+ tokens, permitiendo procesar documentos extensos completos.
ControlNet
Arquitectura que añade control condicional a modelos de difusión como Stable Diffusion. Permite guiar la generación de imágenes mediante mapas de bordes, poses, profundidad u otras condiciones, manteniendo la composición deseada.
Copilot
Término popularizado por Microsoft/GitHub para designar asistentes de IA integrados en herramientas de trabajo. GitHub Copilot asiste en programación, Microsoft 365 Copilot en productividad. El concepto implica una IA que acompaña al usuario como un copiloto, no lo reemplaza.
Copyright IA
Debate legal en torno a la propiedad intelectual de contenidos generados por IA y al uso de obras protegidas en el entrenamiento de modelos. La regulación varía por país y está en plena evolución, con litigios activos en EE.UU. y la UE.
CUDA
Plataforma de computación paralela desarrollada por Nvidia que permite usar GPUs para cálculos de propósito general. Es el estándar de facto para entrenar e inferir modelos de deep learning, y la mayoría de frameworks de IA (PyTorch, TensorFlow) dependen de CUDA.
Claude Code
Herramienta de desarrollo de Anthropic que integra el modelo Claude directamente en la terminal y en IDEs como VS Code y JetBrains. Permite escribir, refactorizar, depurar y documentar código mediante lenguaje natural, con acceso completo al sistema de archivos y herramientas del proyecto. A diferencia de los asistentes de chat genéricos, Claude Code opera como un agente autónomo capaz de ejecutar comandos, editar múltiples archivos y resolver tareas complejas de ingeniería de software de forma iterativa.
Chatwoot
Plataforma de atención al cliente open source que unifica conversaciones de WhatsApp, email, web chat, Telegram, Instagram y Facebook Messenger en un solo panel. Permite integrar chatbots de IA, asignar agentes y automatizar flujos. Se despliega self-hosted para control total de datos. Muy utilizado con n8n para respuestas automáticas con LLMs.
Codestral
Modelo de IA especializado en código de Mistral AI. Optimizado para generación, completado y refactorización en múltiples lenguajes. Alternativa open source a GitHub Copilot para integrarse en IDEs.
Command R+
Modelo de Cohere con 104B parámetros, especializado en RAG y uso de herramientas. Optimizado para buscar en bases de conocimiento y generar respuestas fundamentadas con fuentes. Disponible con pesos abiertos para investigación.
Coqui TTS / XTTS
Framework de síntesis de voz open source. XTTS v2 soporta 17 idiomas, clona voces con 6 segundos de audio y genera habla natural con control de emociones. Tras el cierre de Coqui como empresa, el proyecto continúa mantenido por la comunidad.
D
DALL-E
Modelo de generación de imágenes a partir de texto desarrollado por OpenAI. DALL-E 3 destaca por su capacidad de seguir instrucciones detalladas y generar texto legible dentro de las imágenes. Compite con Midjourney y Stable Diffusion.
Data Pipeline
Conjunto de procesos automatizados que mueven, transforman y preparan datos desde sus fuentes hasta los sistemas de ML. Un pipeline robusto es crítico para la calidad del modelo, ya que los datos deficientes producen modelos deficientes.
Data Poisoning
Tipo de ataque donde actores maliciosos contaminan intencionalmente los datos de entrenamiento de un modelo de IA, insertando información falsa o sesgada para alterar su comportamiento. En 2026, se considera una de las ciberamenazas más críticas para empresas que entrenan o ajustan modelos propios.
Dataset
Conjunto de datos utilizado para entrenar, validar o evaluar un modelo de IA. La calidad, tamaño y representatividad del dataset determinan en gran medida las capacidades y limitaciones del modelo resultante.
Datos Sintéticos
Datos generados artificialmente que imitan las propiedades estadísticas de datos reales. Se usan para aumentar datasets escasos, proteger la privacidad, reducir sesgos o crear escenarios de entrenamiento difíciles de obtener en el mundo real.
Decoder
Componente de una arquitectura neural que genera la secuencia de salida a partir de una representación interna. En los Transformers, los modelos GPT y Llama son «decoder-only», mientras que modelos como T5 usan encoder-decoder completo.
Deep Learning
Subcampo del machine learning basado en redes neuronales con múltiples capas (profundas). Permite aprender representaciones jerárquicas de los datos y es responsable de los avances más importantes en IA de la última década: reconocimiento de voz, visión por computador y modelos de lenguaje.
Deepfake
Contenido audiovisual manipulado o generado por IA que suplanta la apariencia o voz de una persona real. Los deepfakes plantean graves riesgos de desinformación, fraude y daño a la reputación, y su detección es un campo activo de investigación.
Desinformación
Información falsa o engañosa difundida de forma deliberada mediante herramientas de IA generativa. Los LLMs y los generadores de imágenes/vídeo pueden facilitar la creación de contenido falso a gran escala, lo que ha impulsado el desarrollo de tecnologías de detección y watermarking.
Detección de Objetos
Tarea de computer vision que identifica y localiza objetos dentro de una imagen, dibujando un recuadro delimitador (bounding box) alrededor de cada uno. Modelos como YOLO permiten detección en tiempo real para aplicaciones como conducción autónoma y vigilancia.
Diffusion Model
Familia de modelos generativos que aprenden a crear datos (típicamente imágenes) invirtiendo un proceso gradual de añadir ruido. Stable Diffusion, DALL-E 3 y FLUX son ejemplos. Han desplazado a los GANs como estándar en generación de imágenes.
Distillation (Destilación)
Técnica para transferir el conocimiento de un modelo grande (teacher) a uno más pequeño (student). El modelo pequeño aprende a imitar las salidas del grande, logrando rendimiento comparable con muchos menos parámetros y recursos. Clave para desplegar IA en dispositivos con recursos limitados.
Docker para ML
Uso de contenedores Docker para empaquetar modelos de ML junto con sus dependencias, garantizando reproducibilidad y portabilidad. Facilita el despliegue en cualquier entorno, desde desarrollo local hasta producción en la nube. En LaudeMMedia usamos Docker extensivamente para infraestructura de IA.
DPO (Direct Preference Optimization)
Método alternativo a RLHF para alinear LLMs con preferencias humanas. Elimina la necesidad de entrenar un modelo de recompensa separado, optimizando directamente la política del modelo a partir de pares de respuestas preferidas/rechazadas. Es más simple y estable que RLHF.
Dropout
Técnica de regularización que desactiva aleatoriamente un porcentaje de neuronas durante el entrenamiento. Previene el overfitting al forzar a la red a no depender excesivamente de ninguna neurona individual, actuando como un ensemble implícito.
DeepSeek
Startup china que desarrolla LLMs open source de vanguardia. DeepSeek-V3 (685B params, MoE) iguala a GPT-4 con costes menores. DeepSeek-R1 es su modelo de razonamiento frontier. DeepSeek Coder soporta 52 lenguajes de programación. Todos disponibles en Ollama.
E
Edge AI
Ejecución de modelos de IA directamente en dispositivos locales (smartphones, cámaras, sensores IoT) en lugar de en la nube. Reduce la latencia, mejora la privacidad y permite funcionar sin conexión. Requiere modelos optimizados mediante cuantización y pruning.
Embedding
Representación numérica densa de datos (palabras, frases, imágenes) en un espacio vectorial de dimensión reducida. Los embeddings capturan relaciones semánticas: palabras con significados similares tienen vectores cercanos. Son fundamentales para búsqueda semántica, RAG y sistemas de recomendación.
Embeddings Semánticos
Tipo específico de embeddings optimizados para capturar el significado semántico de textos completos, no solo palabras individuales. Modelos como Sentence-BERT generan vectores donde la cercanía refleja similitud de significado, permitiendo búsqueda semántica y clustering temático.
Encoder
Componente de una arquitectura neural que procesa la entrada y genera una representación interna comprimida. En los Transformers, modelos como BERT son «encoder-only» y se usan para tareas de comprensión (clasificación, NER, embeddings).
Entrenamiento
Proceso de ajustar los parámetros de un modelo de IA a partir de datos. Durante el entrenamiento, el modelo ve ejemplos repetidamente, calcula su error mediante una función de pérdida y actualiza sus pesos mediante backpropagation para mejorar sus predicciones.
Epoch
Una pasada completa por todo el dataset de entrenamiento. Los modelos suelen entrenarse durante múltiples epochs. Demasiadas epochs pueden causar overfitting; muy pocas pueden resultar en un modelo infraentrenado.
ETL para ML
Proceso de Extract, Transform, Load adaptado para flujos de machine learning. Incluye la extracción de datos de múltiples fuentes, su transformación (limpieza, normalización, feature engineering) y carga en los sistemas de entrenamiento o feature stores.
EU AI Act
Regulación de la Unión Europea sobre inteligencia artificial, la primera legislación integral sobre IA a nivel mundial. Clasifica los sistemas de IA por niveles de riesgo (inaceptable, alto, limitado, mínimo) y establece requisitos de transparencia, seguridad y gobernanza.
Explicabilidad (XAI)
Capacidad de un sistema de IA para que sus decisiones sean comprensibles por humanos. Es especialmente importante en aplicaciones de alto riesgo como salud, finanzas y justicia. Técnicas como SHAP, LIME y attention maps ayudan a interpretar las predicciones de modelos complejos.
ElevenLabs
Plataforma líder de IA de voz con síntesis ultrarrealista, clonación de voz, doblaje automático y agentes conversacionales en más de 30 idiomas. Ofrece API para integración y es compatible con n8n y Vapi para flujos de voz automatizados. Utilizada en audiolibros, videojuegos y atención al cliente.
F
F1-Score
Media armónica de precision y recall que proporciona una única métrica equilibrada. Es especialmente útil cuando las clases están desbalanceadas y se necesita un compromiso entre ambas métricas. Varía entre 0 (peor) y 1 (perfecto).
Face Detection
Tecnología de computer vision que identifica y localiza rostros humanos en imágenes o vídeos. Es el primer paso para aplicaciones como reconocimiento facial, análisis de expresiones y verificación de identidad. Modelos modernos funcionan en tiempo real incluso en dispositivos móviles.
Fairness (Equidad)
Principio ético que busca garantizar que los sistemas de IA no discriminen a personas o grupos por características protegidas como raza, género o edad. Incluye métricas cuantificables y técnicas de mitigación aplicadas durante el entrenamiento y la evaluación de modelos.
Feature Engineering
Proceso de crear, seleccionar y transformar variables de entrada (features) para mejorar el rendimiento de un modelo de ML. Aunque el deep learning automatiza parte de este proceso, sigue siendo crucial en ML tradicional y puede marcar la diferencia entre un modelo mediocre y uno excelente.
Feature Store
Repositorio centralizado para almacenar, gestionar y servir features de ML de forma consistente entre entrenamiento y producción. Evita la duplicación de esfuerzos, garantiza la coherencia de datos y acelera el desarrollo de modelos en equipos de ML.
Federated Learning (Aprendizaje Federado)
Técnica que permite entrenar modelos de ML de forma distribuida sin centralizar los datos. Cada dispositivo o nodo entrena localmente y solo comparte las actualizaciones del modelo, preservando la privacidad. Google lo usa en Gboard para mejorar predicciones de teclado sin enviar datos personales.
Feed-Forward Network
Red neuronal donde la información fluye solo en una dirección: de la entrada a la salida, sin ciclos. En los Transformers, cada bloque incluye una red feed-forward de dos capas con activación no lineal que procesa cada posición de forma independiente.
Few-shot Learning
Capacidad de un modelo para realizar una tarea nueva a partir de muy pocos ejemplos (típicamente 2-10). En LLMs, se logra incluyendo ejemplos en el prompt. Contrasta con el entrenamiento tradicional que requiere miles o millones de ejemplos.
Fine-tuning
Proceso de adaptar un modelo pre-entrenado a una tarea o dominio específico mediante entrenamiento adicional con datos especializados. Es mucho más eficiente que entrenar desde cero y permite personalizar modelos grandes para necesidades concretas con relativamente pocos datos.
FLUX
Familia de modelos de generación de imágenes de código abierto desarrollada por Black Forest Labs (fundadores de Stable Diffusion). FLUX.1 destaca por su calidad fotorrealista y capacidad de generar texto legible en imágenes, compitiendo con los mejores modelos propietarios.
Foundation Model
Modelo de gran escala entrenado con cantidades masivas de datos que puede adaptarse a múltiples tareas posteriores. GPT-4, Claude y Llama son foundation models de lenguaje; Stable Diffusion lo es de imágenes. Son la base sobre la que se construyen aplicaciones específicas.
Function Calling
Capacidad de un LLM para generar llamadas estructuradas a funciones o APIs externas como parte de su respuesta. Permite a los modelos interactuar con el mundo real: consultar bases de datos, ejecutar código, buscar en internet o controlar sistemas.
Falcon
LLMs open source del Technology Innovation Institute (Abu Dabi). Tamaños de 7B, 40B y 180B parámetros. Entrenado con RefinedWeb (5B tokens). Licencia Apache 2.0 para uso comercial.
Fish Speech
Modelo de síntesis de voz open source con clonación en tiempo real, latencia menor a 150ms, soporte multilingüe y captura de emociones. Popular para despliegue en servidores propios.
G
GAN (Generative Adversarial Network)
Arquitectura de IA generativa donde dos redes neuronales compiten: un generador que crea datos sintéticos y un discriminador que intenta distinguirlos de los datos reales. Fueron revolucionarios para generar imágenes, aunque los modelos de difusión los han superado en calidad.
Gemini
Familia de modelos multimodales de Google DeepMind capaces de procesar y generar texto, imágenes, audio, vídeo y código. Gemini Ultra compite con los modelos más avanzados de OpenAI y Anthropic en benchmarks de razonamiento y conocimiento.
GEO (Generative Engine Optimization)
Nueva disciplina de optimización enfocada en posicionar contenido en motores de búsqueda generativos (como Google AI Overviews, Perplexity o ChatGPT Search). A diferencia del SEO tradicional, el GEO se centra en que la IA cite y referencie tu contenido en sus respuestas. En LaudeMMedia integramos GEO en nuestras estrategias SEO.
GitHub Copilot
Asistente de programación con IA desarrollado por GitHub y OpenAI, integrado en editores de código como VS Code. Sugiere código en tiempo real, genera funciones completas y explica código existente. Es uno de los productos de AI Coding más adoptados.
Google Vertex AI
Plataforma de ML gestionada de Google Cloud que ofrece herramientas para entrenar, ajustar y desplegar modelos de IA, incluyendo los modelos Gemini. Incluye AutoML, pipelines de ML y herramientas de MLOps.
GPT
Familia de modelos de lenguaje de OpenAI basada en la arquitectura Transformer (decoder-only). GPT-4o y sus variantes son modelos multimodales que procesan texto, imágenes y audio. La serie GPT ha sido catalizadora de la revolución de la IA generativa desde el lanzamiento de ChatGPT en noviembre de 2022.
GPU (Unidad de Procesamiento Gráfico)
Procesador originalmente diseñado para gráficos que se ha convertido en el hardware fundamental para entrenar y ejecutar modelos de IA. Su arquitectura masivamente paralela es ideal para las operaciones matriciales del deep learning. Nvidia domina este mercado con sus GPUs datacenter como H100 y B200.
Gradient Descent
Algoritmo de optimización que ajusta los parámetros de un modelo iterativamente en la dirección que reduce la función de pérdida. Es el motor del entrenamiento de redes neuronales, con variantes como SGD, Adam y AdaGrad que mejoran la velocidad y estabilidad de convergencia.
Grounding
Técnica para conectar las respuestas de un LLM con información verificable y actualizada, reduciendo alucinaciones. Se implementa mediante RAG, búsqueda web en tiempo real o acceso a bases de datos factuales.
GRU (Gated Recurrent Unit)
Variante simplificada de LSTM que usa menos parámetros al combinar las puertas de olvido y entrada en una sola puerta de actualización. Ofrece rendimiento comparable a LSTM con menor coste computacional, aunque ambas han sido superadas por los Transformers.
Guardrails
Mecanismos de seguridad implementados en sistemas de IA para prevenir respuestas dañinas, inexactas o inapropiadas. Incluyen filtros de contenido, detección de prompts adversariales, limitación de temas y verificación factual. Son esenciales para el despliegue responsable de IA.
Gemini Pro
Versión avanzada del modelo Gemini de Google DeepMind, diseñada para tareas complejas de razonamiento, generación de código, análisis de datos y procesamiento multimodal (texto, imágenes, audio, vídeo). Disponible a través de Google AI Studio y Vertex AI. Compite directamente con GPT-4o de OpenAI y Claude de Anthropic en el segmento de modelos frontier.
GLM
Familia de LLMs de Zhipu AI (spin-off Universidad Tsinghua, China). GLM-5 tiene 745B parámetros (44B activos), 200K tokens de contexto. Compite con modelos frontier occidentales en razonamiento y código.
Grok
LLMs de xAI (Elon Musk). Grok 3 fue entrenado con 10x más cómputo que Grok 2, igualando a GPT-4o en matemáticas y razonamiento. Acceso a datos de X (Twitter) en tiempo real. Disponible para suscriptores de X Premium.
Groq
Empresa de hardware con chips LPU (Language Processing Unit) diseñados para inferencia de LLMs a 1.500 tokens/segundo. API compatible con OpenAI para ejecutar Llama, Mixtral, DeepSeek y Gemma a velocidades extremas y bajo coste.
H
Hallucination (Alucinación)
Fenómeno donde un modelo de IA genera información que suena plausible pero es factualmente incorrecta o inventada. Es uno de los principales desafíos de los LLMs actuales. Se mitiga con grounding, RAG y técnicas de verificación.
Hiperparámetros
Configuraciones que se definen antes del entrenamiento y controlan el proceso de aprendizaje (learning rate, batch size, número de capas, etc.). A diferencia de los parámetros del modelo que se aprenden, los hiperparámetros se seleccionan mediante búsqueda y experimentación.
I
IA Generativa
Subcampo de la IA que crea contenido nuevo: texto, imágenes, audio, vídeo y código. Impulsada por modelos como LLMs, modelos de difusión y GANs. Está transformando industrias enteras, desde el marketing digital hasta el desarrollo de software.
Image Classification
Tarea de computer vision que asigna una etiqueta o categoría a una imagen completa. Es una de las tareas fundamentales de IA visual, con aplicaciones desde diagnóstico médico hasta control de calidad industrial. Las CNNs y los Vision Transformers son los modelos más utilizados.
Img2Img
Técnica de generación de imágenes que toma una imagen existente como base y la transforma según un prompt textual. Permite modificar estilo, añadir elementos o hacer variaciones manteniendo la composición general. Es una función core de Stable Diffusion.
In-context Learning
Capacidad de los LLMs de aprender nuevas tareas únicamente a partir del contexto proporcionado en el prompt, sin modificar sus pesos. Es un fenómeno emergente de los modelos grandes y la base del few-shot learning y la cadena de pensamiento.
Inference Optimization
Conjunto de técnicas para acelerar y abaratar la ejecución de modelos de IA en producción, incluyendo cuantización, pruning, speculative decoding y batching eficiente. En 2026, la inferencia ha superado al entrenamiento como la carga de trabajo principal de IA, convirtiendo su optimización en prioridad empresarial.
Inferencia
Proceso de usar un modelo de IA ya entrenado para hacer predicciones o generar contenido con nuevos datos de entrada. A diferencia del entrenamiento, la inferencia no modifica los pesos del modelo y suele requerir menos recursos computacionales.
Inpainting
Técnica de edición de imágenes con IA que permite rellenar o reemplazar una zona seleccionada de una imagen de forma coherente con el contexto circundante. Se usa para eliminar objetos, reparar defectos o modificar partes específicas de una imagen generada.
Instruction Tuning
Proceso de fine-tuning de un LLM con datasets de instrucciones y respuestas, para que el modelo aprenda a seguir indicaciones de forma precisa. Es lo que convierte un modelo base (que solo predice texto) en un asistente útil que responde preguntas y ejecuta tareas.
Inteligencia Artificial
Disciplina de la informática que desarrolla sistemas capaces de realizar tareas que normalmente requieren inteligencia humana: aprender, razonar, percibir, crear y tomar decisiones. Abarca desde sistemas especializados (IA estrecha) hasta el concepto teórico de IA general.
K
Kubernetes para ML
Uso de Kubernetes para orquestar cargas de trabajo de machine learning: entrenamiento distribuido, inferencia escalable y gestión de recursos GPU. Herramientas como Kubeflow y MLflow se integran con K8s para crear plataformas de MLOps completas. En LaudeMMedia administramos clusters Kubernetes para cargas de IA.
Kimi (Moonshot AI)
LLM de la startup china Moonshot AI. Kimi K2.5 tiene 1.04B parámetros (32B activos), 262K tokens de contexto. 4º modelo más capaz a nivel global, 1º en finanzas corporativas. Disponible con pesos abiertos y en Ollama.
L
Large Language Model (LLM)
Modelo de IA entrenado con cantidades masivas de texto capaz de comprender y generar lenguaje natural con fluidez. Los LLMs modernos como GPT, Claude, Gemini y Llama son capaces de razonar, programar, traducir y crear contenido con calidad cercana a la humana.
Large Reasoning Model (LRM)
Modelo de IA diseñado para razonar paso a paso a través de problemas complejos, en lugar de simplemente predecir la siguiente palabra. Ejemplos incluyen la serie o1/o3 de OpenAI y DeepSeek-R1. Representan una evolución de los LLM hacia sistemas con pensamiento estructurado y verificable.
Learning Rate
Hiperparámetro que controla cuánto se ajustan los pesos del modelo en cada paso de entrenamiento. Un learning rate demasiado alto puede hacer que el modelo no converja; uno demasiado bajo hace el entrenamiento extremadamente lento. Encontrar el valor óptimo es clave.
Llama
Familia de LLMs de código abierto desarrollada por Meta. Llama 3 ofrece rendimiento competitivo con modelos propietarios en muchos benchmarks y puede ejecutarse localmente. Su licencia abierta ha catalizado la innovación en la comunidad de IA open source.
Llama 4
Familia de modelos de lenguaje open-weight de Meta lanzada en 2025-2026. Llama 4 Scout destaca con una ventana de contexto de 10 millones de tokens, la mayor entre modelos de código abierto. Alternativa real para despliegues empresariales con requisitos de privacidad sin depender de APIs externas.
LocalAI
Framework de código abierto que permite ejecutar modelos de IA localmente como alternativa a las APIs cloud. Compatible con la API de OpenAI, facilita la transición de servicios cloud a infraestructura propia sin cambiar el código de las aplicaciones.
LoRA (Low-Rank Adaptation)
Técnica eficiente de fine-tuning que añade pequeños adaptadores entrenables a un modelo pre-entrenado congelado, reduciendo drásticamente los requisitos de memoria y cómputo. Muy popular en la comunidad de generación de imágenes para crear estilos y personajes personalizados.
Loss Function
Función matemática que cuantifica la diferencia entre las predicciones del modelo y los valores reales. Guía el proceso de entrenamiento: el objetivo es minimizarla. Funciones comunes incluyen cross-entropy para clasificación y MSE para regresión.
Low-code AI
Plataformas que permiten crear soluciones de IA con mínima programación mediante interfaces visuales de drag-and-drop. Democratizan el acceso a la IA para profesionales sin formación técnica profunda en ML, aunque con menor flexibilidad que el desarrollo custom.
LSTM (Long Short-Term Memory)
Tipo de red neuronal recurrente diseñada para capturar dependencias a largo plazo en secuencias, resolviendo el problema del gradiente que se desvanece. Fue dominante en NLP y series temporales antes de los Transformers, y aún se usa en algunas aplicaciones específicas.
M
Machine Learning
Subcampo de la IA donde los sistemas aprenden patrones a partir de datos sin ser programados explícitamente. Incluye aprendizaje supervisado, no supervisado y por refuerzo. Es la tecnología base que impulsa la mayoría de aplicaciones prácticas de IA actuales.
MCP (Model Context Protocol)
Protocolo abierto que estandariza cómo los modelos de IA se conectan con fuentes de datos y herramientas externas. Desarrollado por Anthropic, MCP permite a los LLMs acceder a bases de datos, APIs y sistemas locales de forma segura y estandarizada, eliminando integraciones ad-hoc.
Midjourney
Servicio de generación de imágenes por IA conocido por su estilo artístico y calidad estética sobresaliente. Opera principalmente a través de Discord y ofrece uno de los modelos más populares para arte digital, ilustración y diseño conceptual.
Mistral
Empresa francesa de IA que desarrolla LLMs de código abierto altamente eficientes. Sus modelos (Mistral 7B, Mixtral) ofrecen rendimiento excepcional para su tamaño y han demostrado que modelos más pequeños pero bien entrenados pueden competir con modelos mucho más grandes.
MLOps
Conjunto de prácticas que combina ML, DevOps e ingeniería de datos para desplegar y mantener modelos de IA en producción de forma fiable. Incluye versionado de modelos, monitorización, reentrenamiento automático y A/B testing. Es análogo al DevOps pero para machine learning.
MMLU (Massive Multitask Language Understanding)
Benchmark ampliamente usado para evaluar LLMs que cubre 57 materias académicas: STEM, humanidades, ciencias sociales y más. La puntuación MMLU se ha convertido en un estándar de referencia para comparar el conocimiento general y razonamiento de los modelos.
Model Collapse
Fenómeno donde un modelo de IA entrenado con datos generados por otros modelos de IA degrada progresivamente su calidad y diversidad de respuestas, perdiendo la capacidad de representar distribuciones del mundo real. Es un riesgo creciente en 2026 a medida que el contenido sintético domina internet.
Model Distillation
Técnica de compresión donde un modelo grande (teacher) transfiere su conocimiento a uno más pequeño (student), logrando aproximadamente el 97% del rendimiento con un 40% menos de tamaño. Es clave para desplegar IA en dispositivos edge y reducir costes de inferencia.
Model Registry
Sistema centralizado para almacenar, versionar y gestionar modelos de ML a lo largo de su ciclo de vida. Herramientas como MLflow Model Registry permiten rastrear versiones, metadatos, métricas y el estado de despliegue de cada modelo.
Model Serving
Infraestructura y procesos para servir predicciones de modelos de ML en producción. Incluye optimizar la latencia, gestionar la concurrencia, balancear carga y escalar según la demanda. Herramientas como vLLM, TensorRT y Triton son populares para servir LLMs.
Modelo
En IA, un modelo es un programa matemático entrenado con datos que puede hacer predicciones o generar contenido. Incluye su arquitectura (estructura de la red), sus parámetros (pesos aprendidos) y la configuración de hiperparámetros. Ejemplos: GPT-4 es un modelo, ResNet es otro.
Multi-Agent System (MAS)
Arquitectura donde múltiples agentes de IA colaboran simultáneamente para completar tareas complejas, dividiendo el trabajo y coordinándose. Modelos como Kimi K2.5 pueden dirigir hasta 100 sub-agentes. Tendencia clave en la IA empresarial agéntica de 2026.
Multi-Head Attention
Variante del mecanismo de atención que ejecuta múltiples operaciones de atención en paralelo, cada una con diferentes proyecciones de los datos. Permite al modelo captar diferentes tipos de relaciones simultáneamente. Es un componente core de los Transformers.
Multimodal AI
Sistemas de IA capaces de procesar y generar múltiples tipos de datos: texto, imágenes, audio y vídeo. Modelos como GPT-4o, Gemini y Claude son multimodales, pudiendo analizar imágenes, transcribir audio y generar contenido en distintos formatos.
Make.com
Plataforma de automatización visual (antes Integromat) que permite conectar aplicaciones y servicios mediante flujos de trabajo sin necesidad de programar. Ofrece un editor visual basado en nodos, mayor granularidad en las transformaciones de datos y precios más competitivos que Zapier. Permite integraciones con cientos de servicios incluyendo Google, Slack, CRMs, bases de datos y APIs personalizadas. Muy utilizada en marketing digital para automatizar procesos repetitivos. En LaudeMMedia somos agencia especializada en n8n, alternativa superior a Make.
Manus.ai
Agente IA autónomo de propósito general (adquirido por Meta, dic. 2025). Ejecuta acciones autónomamente: navega internet, analiza archivos, escribe/ejecuta código, despliega aplicaciones. Sistema multi-agente con panel de transparencia que muestra su trabajo en tiempo real.
MiniMax
Empresa china de IA con modelos agénticos avanzados. M2.7 alcanza 56.22% en SWE-Pro (ingeniería de software), igualando a GPT-5.3 Codex. Capaz de automatizar 30-50% de la investigación de aprendizaje por refuerzo sin intervención humana.
N
Named Entity Recognition (NER)
Tarea de NLP que identifica y clasifica entidades nombradas en texto: personas, organizaciones, lugares, fechas, importes, etc. Es fundamental para la extracción de información, y se usa en motores de búsqueda, procesamiento de documentos legales y análisis de noticias.
Neuromorphic Computing
Paradigma de computación que imita la estructura y funcionamiento del cerebro humano, usando chips con neuronas y sinapsis artificiales. Promete mayor eficiencia energética que la computación tradicional para tareas de IA, aunque aún está en fase de investigación.
NIST AI Risk Management Framework
Marco de gestión de riesgos de IA del Instituto Nacional de Estándares y Tecnología de EE.UU. Proporciona un vocabulario común y metodología para identificar, evaluar y mitigar riesgos de IA. Referencia estándar junto con el EU AI Act para gobernanza de IA en 2026.
No-code AI
Plataformas que permiten crear aplicaciones de IA sin escribir código, mediante interfaces completamente visuales. Herramientas como Obviously AI, Teachable Machine o n8n AI nodes permiten a no programadores construir modelos y automatizaciones con IA.
Nvidia
Empresa líder en hardware para IA que diseña las GPUs y la plataforma CUDA que dominan el entrenamiento e inferencia de modelos de deep learning. Sus GPUs datacenter (H100, B200, GB200) son el estándar de la industria, y su software ecosistema (CUDA, TensorRT, NeMo) es fundamental para la IA moderna.
Nemotron
LLMs de NVIDIA. Nemotron-3 Super (120B params, 12B activos) usa arquitectura híbrida Mamba-Transformer MoE para tareas agénticas. Principal modelo open source estadounidense. Disponible via NVIDIA NIM y Together AI.
O
OCR (Reconocimiento Óptico de Caracteres)
Tecnología que convierte imágenes de texto (escaneados, fotos de documentos) en texto editable y procesable. Los sistemas modernos de OCR basados en deep learning pueden manejar escritura manual, múltiples idiomas y formatos complejos con alta precisión.
Ollama
Herramienta de código abierto que simplifica la ejecución local de LLMs en ordenadores personales. Permite descargar y ejecutar modelos como Llama, Mistral y Phi con un solo comando, haciendo la IA local accesible para desarrolladores y usuarios.
On-premise AI
Despliegue de modelos de IA en infraestructura propia (servidores locales) en lugar de servicios cloud. Ofrece mayor control sobre datos y latencia, pero requiere inversión en hardware y mantenimiento. En LaudeMMedia ofrecemos servidores administrados para cargas de IA on-premise.
ONNX (Open Neural Network Exchange)
Formato abierto para representar modelos de ML que permite interoperabilidad entre frameworks (PyTorch, TensorFlow, etc.). Un modelo exportado a ONNX puede ejecutarse en cualquier runtime compatible, facilitando el despliegue multiplataforma.
Overfitting
Problema donde un modelo aprende demasiado bien los datos de entrenamiento (incluyendo ruido y particularidades) y pierde capacidad de generalizar a datos nuevos. Se combate con técnicas como regularización, dropout, data augmentation y early stopping.
OWASP Top 10 for LLM Applications
Lista de las 10 vulnerabilidades de seguridad más críticas en aplicaciones basadas en modelos de lenguaje, publicada por OWASP. Incluye prompt injection, data poisoning, insecure output handling y excessive agency. Referencia estándar de seguridad para despliegues LLM en 2026.
OpenELM
Modelos pequeños open source de Apple (270M a 3B params) para ejecución on-device. Licencia MIT. Superan a OLMo en 2.36% con la mitad de tokens de entrenamiento.
Orca
LLMs de Microsoft que aprenden de trazas de razonamiento de GPT-4. Orca 2 (13B params) alcanza rendimiento de modelos 5-10x más grandes mediante datos de entrenamiento centrados en razonamiento paso a paso.
P
Perceptrón
La unidad más básica de una red neuronal: un modelo lineal que toma varias entradas ponderadas, las suma y aplica una función de activación. Inventado en 1958, el perceptrón es el bloque fundamental sobre el que se construyen las redes neuronales modernas.
Persistent Agent
Agente de IA siempre activo diseñado para gestionar flujos de trabajo prolongados durante horas o días, manteniendo contexto y estado entre sesiones. A diferencia de los chatbots, puede trabajar autónomamente en tareas complejas como desarrollo de software o automatización de procesos empresariales.
Personalización
Uso de IA para adaptar contenido, productos o experiencias a las preferencias individuales de cada usuario. Desde las recomendaciones de Netflix hasta el feed de Instagram, la personalización basada en IA es ubicua en productos digitales modernos.
Physical AI
Rama de la inteligencia artificial que lleva los modelos de IA al mundo físico: robots, drones y dispositivos capaces de percibir, moverse e interactuar con su entorno. En 2026, robots como Atlas de Boston Dynamics integran modelos Gemini Robotics de Google DeepMind.
Pose Estimation
Técnica de computer vision que detecta y localiza las articulaciones del cuerpo humano en imágenes o vídeos. Se usa en análisis deportivo, realidad aumentada, animación y control gestual. Modelos como OpenPose y MediaPipe Pose operan en tiempo real.
Positional Encoding
Mecanismo que añade información sobre la posición de cada token en una secuencia a los Transformers. Es necesario porque, a diferencia de las RNNs, los Transformers procesan todos los tokens en paralelo y no tienen noción inherente de orden secuencial.
Pre-training
Fase inicial de entrenamiento de un foundation model con grandes cantidades de datos no etiquetados. El modelo aprende representaciones generales del lenguaje (o imágenes) que luego se refinan mediante fine-tuning para tareas específicas. Es la parte más costosa del entrenamiento.
Precision
Métrica que mide la proporción de predicciones positivas que son realmente correctas (verdaderos positivos / total de predicciones positivas). Es crítica cuando el coste de un falso positivo es alto, como en diagnóstico médico o filtrado de spam.
Predictive Analytics
Uso de técnicas de machine learning y estadística para predecir resultados futuros basándose en datos históricos. Aplicaciones empresariales incluyen predicción de ventas, churn de clientes, mantenimiento preventivo y detección de fraude.
Privacidad Diferencial
Técnica matemática que garantiza que el resultado de un análisis de datos no revele información sobre ningún individuo específico del dataset. Añade ruido calibrado a los datos o resultados, proporcionando garantías formales de privacidad. Apple y Google la usan en sus productos.
Procesamiento de Lenguaje Natural (NLP/PLN)
Subcampo de la IA dedicado a la interacción entre ordenadores y lenguaje humano. Abarca comprensión de texto, generación, traducción, análisis de sentimiento, resumen y más. Los LLMs actuales representan su avance más significativo.
Prompt
Texto o instrucción que se proporciona a un modelo de IA para obtener una respuesta o resultado. La calidad y estructura del prompt influye enormemente en la calidad de la salida. Es la interfaz principal de interacción con los LLMs modernos.
Prompt Engineering
Disciplina que estudia cómo diseñar prompts óptimos para obtener los mejores resultados de modelos de IA. Incluye técnicas como few-shot, chain of thought, role-playing y prompts estructurados. Es una habilidad cada vez más demandada en el mercado laboral.
Prompt Injection
Ataque de seguridad donde un actor malicioso introduce instrucciones ocultas en documentos, emails o páginas web para manipular un modelo de IA, haciéndolo ignorar sus instrucciones originales o filtrar datos sensibles. Es la amenaza número uno según OWASP Top 10 para aplicaciones LLM.
Pruning (Poda)
Técnica de optimización que elimina conexiones o neuronas redundantes de una red neuronal, reduciendo su tamaño y mejorando la velocidad de inferencia con mínima pérdida de rendimiento. Junto con cuantización y destilación, es clave para desplegar IA en dispositivos con recursos limitados.
Phi-4
LLMs pequeños de Microsoft (14B params). Excepcional en razonamiento matemático y código. Phi-4-multimodal soporta texto, imagen y audio en 20+ idiomas. Licencia MIT. Ideal para edge y servidores con recursos limitados.
PlayHT
Plataforma de síntesis de voz IA con voces ultrarrealistas en 140+ idiomas. PlayHT 2.0 genera habla con emociones y entonación contextual. API de streaming en tiempo real, clonación de voz y marketplace de voces.
Q
Quantization (Cuantización)
Técnica que reduce la precisión numérica de los pesos del modelo (por ejemplo, de 32 bits a 4 bits), disminuyendo dramáticamente el tamaño y los requisitos de VRAM. Permite ejecutar modelos grandes en hardware consumer. Formatos como GGUF y GPTQ son estándares populares.
Quantum Machine Learning
Campo emergente que explora el uso de computación cuántica para acelerar algoritmos de ML. Promete ventajas en optimización, muestreo y algebra lineal, aunque la tecnología cuántica actual aún no es lo suficientemente madura para superar a los ordenadores clásicos en aplicaciones prácticas de IA.
Question Answering
Tarea de NLP donde el modelo proporciona respuestas a preguntas basándose en un texto de referencia o su conocimiento interno. Los sistemas modernos de QA combinan RAG con LLMs para ofrecer respuestas precisas y fundamentadas.
Qwen
LLMs open source de Alibaba Cloud. Qwen 3.5 (397B params) es multimodal nativo. Con 100.000+ modelos derivados y 300M descargas, Qwen ha superado a Llama como ecosistema open source más grande. Tamaños de 0.8B a 397B. Incluye Qwen Coder para programación.
R
RAG (Retrieval-Augmented Generation)
Técnica que combina la búsqueda de información relevante en una base de datos con la generación de respuestas por un LLM. Primero se recuperan documentos relevantes, luego el modelo los usa como contexto para generar una respuesta fundamentada. Reduce alucinaciones y mantiene la información actualizada.
Reasoning Model
Modelo de IA diseñado o entrenado específicamente para tareas de razonamiento complejo: matemáticas, lógica, planificación y resolución de problemas. Modelos como o1, o3 y Claude usan «pensamiento» interno extendido para resolver tareas paso a paso antes de dar una respuesta.
Recall
Métrica que mide la proporción de casos positivos reales que el modelo identifica correctamente (verdaderos positivos / total de positivos reales). Es crítica cuando el coste de un falso negativo es alto, como en detección de enfermedades o fraude.
Recommendation System
Sistema que predice las preferencias del usuario y sugiere contenido, productos o servicios relevantes. Amazon, Spotify, YouTube y Netflix usan sistemas de recomendación basados en ML que combinan filtrado colaborativo, content-based filtering y deep learning.
Reconocimiento de Imágenes
Capacidad de un sistema de IA para identificar objetos, personas, escenas, texto u otras características en imágenes. Abarca múltiples subtareas como clasificación, detección y segmentación.
Red Neuronal Convolucional (CNN)
Arquitectura de red neuronal especializada en procesar datos con estructura de cuadrícula, como imágenes. Las capas convolucionales aplican filtros que detectan características como bordes, texturas y formas. Son la base de la mayoría de sistemas de computer vision, aunque los Vision Transformers les están ganando terreno.
Red Neuronal Recurrente (RNN)
Arquitectura de red neuronal diseñada para procesar secuencias de datos manteniendo un estado interno (memoria). Fue fundamental para NLP y series temporales, pero ha sido superada por los Transformers en la mayoría de tareas debido a sus limitaciones con dependencias a largo plazo.
Red Teaming
Práctica de seguridad donde equipos especializados intentan provocar fallos, sesgos o comportamientos dañinos en sistemas de IA mediante ataques adversariales. Es esencial para evaluar la robustez de los modelos antes de su despliegue público.
Redes Neuronales
Modelos computacionales inspirados en la estructura del cerebro humano, compuestos por capas de nodos interconectados (neuronas artificiales). Son la base del deep learning y responsables de los avances más significativos en IA moderna.
Regulación IA
Marco legal y normativo que gobierna el desarrollo y uso de sistemas de inteligencia artificial. La EU AI Act es la regulación más completa hasta la fecha. Otros países como EE.UU., China y Reino Unido están desarrollando sus propios marcos regulatorios.
Regularización
Conjunto de técnicas para prevenir el overfitting penalizando la complejidad del modelo. Incluye L1 (Lasso), L2 (Ridge), dropout y early stopping. La regularización fuerza al modelo a aprender patrones generales en lugar de memorizar los datos de entrenamiento.
ReLU (Rectified Linear Unit)
Función de activación que devuelve el valor de entrada si es positivo, o cero si es negativo. Su simplicidad computacional y capacidad para evitar el problema del gradiente que se desvanece la convirtieron en la función de activación más popular en deep learning.
Resumen Automático
Tarea de NLP que genera un resumen conciso de un texto más largo, preservando la información más importante. Puede ser extractivo (seleccionar frases clave) o abstractivo (generar texto nuevo). Los LLMs modernos sobresalen en resumen abstractivo.
RLHF (Reinforcement Learning from Human Feedback)
Técnica de entrenamiento que usa retroalimentación humana para alinear modelos de IA con las preferencias de los usuarios. Los humanos evalúan pares de respuestas, y un modelo de recompensa entrena al LLM para producir respuestas preferidas. Es clave en ChatGPT, Claude y otros asistentes.
RLVR (Reinforcement Learning with Verifiable Rewards)
Metodología de entrenamiento donde el modelo aprende mediante recompensas basadas en verificación automatizada de corrección, en lugar de feedback humano subjetivo (RLHF). Es más escalable y objetivo. DeepSeek-R1 y los modelos o-series de OpenAI utilizan principios RLVR.
ROC Curve
Gráfica que muestra el rendimiento de un clasificador binario a diferentes umbrales de decisión, trazando la tasa de verdaderos positivos frente a la de falsos positivos. Permite evaluar el equilibrio entre sensibilidad y especificidad, y su AUC resume el rendimiento global.
ROCm (AMD)
Plataforma de computación abierta de AMD, alternativa a CUDA de Nvidia. Permite usar GPUs AMD (como las Instinct MI300X) para entrenar e inferir modelos de IA. Aunque el ecosistema es menos maduro, está ganando adopción gracias a la competitividad de precio de AMD.
RPA (Robotic Process Automation)
Tecnología que usa bots de software para automatizar tareas repetitivas basadas en reglas: introducir datos, copiar información entre sistemas, procesar formularios. Combinada con IA (automatización inteligente), puede manejar tareas que requieren cierta comprensión contextual. En LaudeMMedia ofrecemos servicios de automatización empresarial con IA.
Resemble AI
Plataforma de síntesis y clonación de voz IA con latencia ultra baja en tiempo real. Destaca por seguridad: detección de deepfakes de audio, marcas de agua inaudibles y autenticación de voz.
S
Safety (Seguridad IA)
Disciplina enfocada en garantizar que los sistemas de IA operen de forma segura, predecible y alineada con las intenciones humanas. Incluye alignment, red teaming, guardrails y robustez ante ataques adversariales.
Segmentación
Tarea de computer vision que clasifica cada píxel de una imagen en una categoría, produciendo una máscara detallada. A diferencia de la detección de objetos que usa bounding boxes, la segmentación delimita la forma exacta de cada objeto. SAM (Segment Anything Model) de Meta es referente.
Self-Attention
Mecanismo donde cada elemento de una secuencia calcula su relación de relevancia con todos los demás elementos de la misma secuencia. Es el componente central de los Transformers y permite captar dependencias a cualquier distancia en el texto.
Semantic Search
Búsqueda basada en el significado de la consulta, no solo en coincidencia de palabras clave. Utiliza embeddings semánticos y bases de datos vectoriales para encontrar documentos relevantes incluso cuando usan terminología diferente.
Serverless AI
Modelo de despliegue donde la infraestructura para ejecutar modelos de IA se gestiona automáticamente, escalando según demanda y cobrando solo por uso. Servicios como AWS Lambda con SageMaker, Google Cloud Functions y Replicate eliminan la gestión de servidores.
Sesgo Algorítmico
Prejuicio sistemático en las decisiones de un sistema de IA, generalmente heredado de los datos de entrenamiento o del diseño del algoritmo. Puede resultar en discriminación por género, raza, edad u otros factores. Su detección y mitigación es un área clave de la equidad en IA.
Shadow AI
Uso no autorizado de herramientas de IA por empleados dentro de una organización, sin supervisión del departamento de TI. En 2026, es el punto de entrada más común para fugas de datos corporativos, impulsando la necesidad de políticas de gobernanza y consultoría de IA.
Sigmoid
Función de activación que comprime cualquier valor real al rango (0, 1), con forma de S. Es útil para clasificación binaria (predecir probabilidades) pero sufre del problema del gradiente que se desvanece en redes profundas, donde ReLU es preferida.
Small Language Model (SLM)
Modelos de lenguaje compactos (1 a 7 mil millones de parámetros) optimizados para dispositivos locales o edge con costes hasta un 75% menores que los LLM grandes. Ejemplos: Phi-4 de Microsoft y Gemma de Google. Ideales para empresas con requisitos de privacidad y latencia baja.
Softmax
Función que convierte un vector de valores reales en una distribución de probabilidades (todos los valores entre 0 y 1, sumando 1). Se usa típicamente en la capa de salida de clasificadores multiclase y en los mecanismos de atención de los Transformers.
Speculative Decoding
Técnica de optimización de inferencia donde un modelo pequeño genera tokens candidatos que son verificados en paralelo por el modelo grande, acelerando la generación de texto sin sacrificar calidad. Optimización estándar en despliegues de producción en 2026.
Speech-to-Text
Tecnología que convierte audio hablado en texto escrito. Modelos como Whisper de OpenAI ofrecen transcripción multilingüe de alta calidad. Es fundamental para asistentes de voz, subtitulado automático y documentación de reuniones.
Stable Diffusion
Modelo de generación de imágenes de código abierto basado en difusión latente. Su naturaleza abierta ha creado un ecosistema masivo de extensiones, LoRAs, ControlNet y herramientas como ComfyUI. Es referente en IA generativa de imágenes.
Superintelligence
Ver ASI (Superinteligencia Artificial). Concepto de una IA que supera la inteligencia humana en todos los aspectos cognitivos.
Swarm Intelligence
Enfoque donde múltiples agentes de IA simples colaboran de forma descentralizada para resolver problemas complejos, inspirado en el comportamiento colectivo de insectos sociales. Se investiga su aplicación en coordinación de drones, optimización logística y sistemas multiagente.
Synthetic Data
Datos generados artificialmente por modelos de IA que replican las propiedades estadísticas de datos reales, utilizados para entrenar otros modelos cuando los datos originales son escasos, privados o sesgados. Fundamentales en 2026 para entrenar SLMs eficientes como Phi-4.
Sonar (Perplexity)
Modelos de Perplexity optimizados para búsqueda. Sonar Deep Research sintetiza cientos de fuentes. Sonar Reasoning Pro aplica cadenas de pensamiento. Disponibles via API para búsqueda inteligente en aplicaciones.
StarCoder
Modelo de código open source de BigCode (Hugging Face + ServiceNow). StarCoder2 en 3B, 7B y 15B params, 600+ lenguajes de programación. Licencia permisiva para uso comercial. Disponible en Ollama.
StableLM
LLMs open source de Stability AI. StableLM 2 (1.6B params) entrenado con 2B tokens. Ligero y ejecutable en hardware de consumo. Licencia permisiva para uso comercial.
T
Temperature
Parámetro que controla la aleatoriedad en la generación de texto de un LLM. Una temperatura baja (0.0-0.3) produce respuestas más deterministas y conservadoras; una alta (0.7-1.0) genera texto más creativo y diverso. Se ajusta según el caso de uso.
TensorRT
Biblioteca de Nvidia para optimizar la inferencia de modelos de deep learning en GPUs. Aplica optimizaciones como fusión de capas, cuantización y selección de kernels óptimos para maximizar el rendimiento en producción.
Text Generation
Tarea de NLP donde un modelo produce texto nuevo a partir de un prompt o contexto. Es la capacidad fundamental de los LLMs y la base de chatbots, asistentes de escritura, generación de código y muchas otras aplicaciones.
Text-to-Speech (TTS)
Tecnología que convierte texto escrito en audio hablado con voz natural. Los modelos modernos de TTS basados en IA producen voces casi indistinguibles de voces humanas, con control de tono, velocidad y emoción.
Token
Unidad básica de procesamiento de texto en los LLMs. Un token puede ser una palabra completa, parte de una palabra o un carácter. El proceso de dividir texto en tokens se llama tokenización. Los modelos tienen límites de tokens en su ventana de contexto.
Tokenización
Proceso de dividir texto en tokens (unidades mínimas) para que un modelo de IA pueda procesarlo. Algoritmos como BPE (Byte Pair Encoding) y SentencePiece equilibran vocabulario y eficiencia. Una buena tokenización es crucial para el rendimiento del modelo en diferentes idiomas.
Tool Use
Capacidad de un LLM para utilizar herramientas externas (calculadoras, buscadores, APIs, intérpretes de código) como parte de su proceso de razonamiento. Permite superar las limitaciones inherentes del modelo, como cálculos precisos o acceso a información actualizada.
Top-k
Estrategia de muestreo que limita la selección del siguiente token a los k tokens más probables. Un valor bajo (como k=10) genera texto más predecible; un valor alto aumenta la diversidad. Suele combinarse con Top-p.
Top-p (Nucleus Sampling)
Estrategia de muestreo que selecciona tokens de un subconjunto dinámico cuya probabilidad acumulada alcanza el valor p. A diferencia de Top-k que fija el número de candidatos, Top-p adapta el conjunto según la distribución de probabilidades.
TPU (Tensor Processing Unit)
Chip de procesamiento diseñado por Google específicamente para cargas de trabajo de ML. Optimizado para operaciones matriciales y operaciones con tensores, es usado internamente por Google para entrenar modelos como Gemini.
Traducción Automática
Uso de IA para traducir texto o habla entre idiomas de forma automática. Los sistemas modernos basados en Transformers (como Google Translate, DeepL) han alcanzado niveles de calidad notables, aunque siguen teniendo limitaciones en contexto cultural y lenguaje especializado.
Train/Test Split
Práctica fundamental de ML que consiste en dividir el dataset en un conjunto de entrenamiento (para aprender) y uno de test (para evaluar). Típicamente se usa una proporción 80/20 o 70/30. Evita evaluar el modelo con datos que ya ha visto, previniendo sobreestimar su rendimiento.
Transfer Learning
Técnica donde un modelo entrenado en una tarea se reutiliza como punto de partida para otra tarea relacionada. Los conocimientos aprendidos en el pre-training (reconocimiento de patrones visuales, comprensión del lenguaje) se transfieren, reduciendo drásticamente los datos y tiempo necesarios para la nueva tarea.
Transformer
Arquitectura de red neuronal presentada en 2017 («Attention is All You Need») que revolucionó la IA. Basada en self-attention, procesa secuencias en paralelo y captura dependencias a cualquier distancia. Es la base de todos los LLMs modernos (GPT, Claude, Gemini, Llama) y ha transformado también la visión por computador.
Transparencia
Principio ético que exige que los sistemas de IA y sus decisiones sean comprensibles y auditables. Incluye documentar los datos de entrenamiento, las limitaciones del modelo, sus posibles sesgos y proporcionar explicaciones sobre sus decisiones cuando afectan a personas.
Together AI
Plataforma de infraestructura IA con API para 200+ modelos open source: Llama, DeepSeek, Qwen, Nemotron, GLM-5. Ofrece fine-tuning, inferencia serverless y clústeres GPU. Alternativa flexible a APIs propietarias.
Tortoise TTS
Sistema de síntesis de voz open source que genera habla de muy alta calidad. Clona voces con pocos minutos de audio. Uno de los primeros TTS open source en igualar calidad comercial.
U
Underfitting
Problema donde un modelo es demasiado simple para capturar los patrones de los datos, resultando en mal rendimiento tanto en entrenamiento como en test. Se soluciona aumentando la complejidad del modelo, añadiendo features, entrenando más tiempo o reduciendo la regularización.
Upscaling
Técnica de IA que aumenta la resolución de una imagen manteniendo o mejorando la calidad visual. Modelos como ESRGAN y Real-ESRGAN pueden escalar imágenes 4x o más, añadiendo detalles de forma inteligente. Es muy usado en fotografía, videojuegos y restauración de imágenes antiguas.
V
VAE (Variational Autoencoder)
Modelo generativo que aprende a comprimir datos a un espacio latente y reconstruirlos. A diferencia de los autoencoders simples, el espacio latente de un VAE es continuo y estructurado, permitiendo generar nuevos datos mediante muestreo. Los modelos de difusión como Stable Diffusion usan un VAE internamente.
Validación Cruzada
Técnica de evaluación que divide el dataset en K particiones (folds) y entrena/evalúa el modelo K veces, usando cada partición como test una vez. Proporciona una estimación más robusta del rendimiento que un simple train/test split, especialmente con datasets pequeños.
Varianza
En ML, la varianza mide cuánto cambian las predicciones del modelo cuando se entrena con diferentes subconjuntos de datos. Un modelo con alta varianza (complejo) tiende al overfitting. El equilibrio entre bias y varianza es un concepto fundamental en ML.
Vector Database
Base de datos especializada en almacenar y buscar eficientemente vectores de alta dimensión (embeddings). Es la infraestructura clave para RAG, búsqueda semántica y sistemas de recomendación. Ejemplos: Pinecone, Weaviate, Qdrant, ChromaDB.
Vibe Coding
Método de desarrollo de software acuñado por Andrej Karpathy en 2025, donde el programador genera código exclusivamente mediante prompts a modelos de IA, guiando el resultado de forma iterativa. Se ha convertido en uno de los términos más populares de 2025-2026 en desarrollo asistido por IA.
Vibe-Tuning
Evolución del vibe coding aplicada al fine-tuning de modelos. Permite ajustar un Small Language Model usando lenguaje natural, automatizando la generación de datos sintéticos y la configuración de entrenamiento. Reduce el proceso de fine-tuning de semanas a horas.
vLLM
Motor de inferencia de código abierto optimizado para servir LLMs con alto rendimiento. Implementa PagedAttention para gestionar eficientemente la memoria de la GPU, logrando un throughput significativamente superior a implementaciones naïve. Es referente en model serving de LLMs.
VRAM
Memoria de la GPU dedicada a almacenar datos durante el procesamiento. Es el recurso más limitante para ejecutar modelos de IA: un LLM de 70B parámetros en FP16 requiere ~140 GB de VRAM. La cuantización reduce dramáticamente estos requisitos.
Vapi
Plataforma para crear agentes de voz IA que mantienen conversaciones telefónicas en tiempo real. Integra cualquier LLM (GPT-4, Claude, open source) con motores de voz (ElevenLabs, PlayHT, Deepgram). Crea asistentes que contestan llamadas, agendan citas y cualifican leads. API y SDK para integración.
W
Watermarking IA
Técnica que inserta marcas imperceptibles en contenido generado por IA (texto o imágenes) para identificar su origen. Permite rastrear el modelo que generó el contenido y ayuda a combatir la desinformación. Google y OpenAI han implementado sistemas de watermarking.
Word2Vec
Modelo pionero de embeddings de palabras desarrollado por Google en 2013 que representó un avance fundamental en NLP. Demostró que las relaciones semánticas se pueden capturar como operaciones vectoriales (ej: rey – hombre + mujer = reina). Fue superado por modelos contextuales como BERT.
World Model
Modelo de IA que construye una representación interna del mundo para predecir cómo evolucionará ante diferentes acciones. Es un enfoque clave para la IA que necesita planificar a largo plazo, como vehículos autónomos, robótica y videojuegos. Sora de OpenAI se considera un world model de vídeo.
Workflow (Flujo de Trabajo)
Secuencia automatizada de pasos o acciones que se ejecutan en orden para completar un proceso. En el contexto de la IA, un workflow conecta múltiples herramientas, APIs o modelos para realizar tareas complejas sin intervención manual. Plataformas como n8n, Zapier y Make.com permiten diseñar workflows visualmente. En IA agéntica, los workflows definen cómo un agente descompone y ejecuta subtareas para alcanzar un objetivo. En LaudeMMedia somos automatización de workflows con n8n.
X
XAI (Explainable AI)
Ver Explicabilidad (XAI). Campo de investigación dedicado a hacer comprensibles las decisiones de los modelos de IA, especialmente los más complejos como redes neuronales profundas.
Y
YOLO (You Only Look Once)
Familia de modelos de detección de objetos en tiempo real que procesan la imagen completa en una sola pasada («you only look once»). YOLOv8 y versiones posteriores ofrecen detección rápida y precisa, usadas en vigilancia, conducción autónoma, robótica y análisis de vídeo.
Z
Zero-shot Learning
Capacidad de un modelo para realizar tareas para las que no fue explícitamente entrenado, basándose únicamente en la descripción de la tarea. Los LLMs modernos demuestran notable capacidad zero-shot, pudiendo clasificar, traducir o resumir textos con solo una instrucción en lenguaje natural.
Zephyr
LLM open source basado en Mistral 7B, optimizado con RLHF por Hugging Face. Supera a modelos mayores en seguimiento de instrucciones. Popular en Ollama como modelo ligero para despliegue local.
La inteligencia artificial aplicada a tu negocio
En LaudeMMedia no solo hablamos de inteligencia artificial: la aplicamos cada día para impulsar los resultados de nuestros clientes. Si quieres llevar tu proyecto al siguiente nivel con IA, estos son nuestros servicios relacionados:
- SEO potenciado con IA — Estrategias de posicionamiento que integran herramientas de IA y GEO para maximizar tu visibilidad orgánica.
- Glosario de Marketing Digital — Complementa tu conocimiento de IA con los términos esenciales del marketing digital.
- Servidores VPS administrados — Infraestructura optimizada para ejecutar modelos de IA, con GPUs dedicadas y soporte experto.
- Administración de sistemas 24×7 — Gestión profesional de servidores para cargas de machine learning e inferencia en producción.
- Diseño web WordPress — Webs profesionales con integraciones de IA: chatbots, personalización y búsqueda semántica.
- Glosario DevOps y SysAdmin — La infraestructura detrás de la IA: Docker, Kubernetes, MLOps y más.
- Migración VMware a Proxmox — Virtualización de servidores para consolidar cargas de IA con GPU passthrough.
¿Echas en falta algún término? Este glosario se actualiza periódicamente. Contacta con nosotros y te lo añadimos.
Preguntas frecuentes
¿Qué es un LLM (Large Language Model)?
Un modelo de lenguaje de gran tamaño entrenado con enormes volúmenes de texto, capaz de comprender y generar lenguaje natural. Es la base de herramientas como ChatGPT, Claude o Gemini.
¿Qué es un agente de IA?
Un sistema de IA que actúa de forma autónoma para alcanzar un objetivo: toma decisiones, planifica pasos intermedios y ejecuta acciones, como llamar a APIs o usar herramientas externas.
¿Qué diferencia hay entre IA generativa e IA tradicional?
La IA tradicional clasifica o predice a partir de datos existentes; la generativa crea contenido nuevo (texto, imágenes, audio, código) a partir de lo aprendido durante el entrenamiento.
¿Qué es la AGI?
La inteligencia general artificial: un concepto teórico de IA capaz de realizar cualquier tarea intelectual humana con razonamiento general y aprendizaje autónomo. Todavía no existe.
¿Cuántos términos incluye este glosario de IA?
Más de 263 términos de inteligencia artificial explicados en español de forma clara y práctica, desde los fundamentos del machine learning hasta agentes autónomos y LLMs.
