Question 1

¿Cómo funciona ChatGPT o Claude por dentro?

Accepted Answer

Los modelos de lenguaje como ChatGPT o Claude son redes neuronales basadas en la arquitectura Transformer, entrenadas con enormes volúmenes de texto. El proceso tiene tres fases: primero el texto se divide en tokens (fragmentos de palabras), luego cada token se convierte en un vector numérico (embedding) que codifica su significado, y finalmente el mecanismo de atención calcula qué partes del contexto son relevantes para predecir la siguiente palabra.

Question 2

¿Qué son los tokens en inteligencia artificial?

Accepted Answer

Un token es la unidad mínima de texto que procesa un modelo de lenguaje. Puede ser una palabra completa, parte de una palabra o un signo de puntuación. Por ejemplo, "electromagnetismo" se divide en varios tokens, mientras que "la" es un token único. GPT-4 maneja un contexto de hasta 128.000 tokens y modelos como Gemini 1.5 llegan al millón. El coste de uso de los LLMs se mide habitualmente en precio por cada 1.000 tokens.

Question 3

¿Qué son los embeddings y para qué sirven?

Accepted Answer

Los embeddings son representaciones numéricas (vectores de cientos o miles de dimensiones) que capturan el significado semántico de palabras o frases. Palabras con significados parecidos quedan cerca en ese espacio vectorial: "rey" y "reina" están próximas, igual que "París" y "capital". Permiten que el modelo entienda relaciones de sinonimia, analogías y contexto sin necesidad de reglas explícitas.

Question 4

¿Qué es la temperatura en un LLM y cómo afecta las respuestas?

Accepted Answer

La temperatura es un parámetro que controla la aleatoriedad al seleccionar la siguiente palabra. Con temperatura 0 el modelo siempre elige el token más probable, dando respuestas deterministas y precisas, ideales para tareas técnicas. Con temperatura alta (0,8–1,2) el modelo explora opciones menos probables, generando texto más creativo pero menos predecible. La mayoría de interfaces de usuario utilizan valores alrededor de 0,7 como equilibrio.

Question 5

¿Qué diferencia hay entre un LLM y una IA tradicional de reglas?

Accepted Answer

Los sistemas de IA tradicionales siguen reglas explícitas escritas por humanos (si X entonces Y), lo que los hace predecibles pero rígidos. Los LLMs aprenden patrones estadísticos de millones de textos sin que nadie les programe reglas de gramática o conocimiento del mundo. Esto les permite generalizar a situaciones nunca vistas, pero también cometer errores imprevisibles ("alucinaciones") cuando el patrón estadístico no coincide con la realidad.

Tarea	temperature	top-p	freq_pen	pres_pen	Por qué
Código / SQL	0.1	0.9	0	0	Máxima precisión, sin creatividad
Preguntas factuales	0.0	—	0	0	Totalmente determinista
Emails profesionales	0.5	0.9	0.1	0	Coherente y sin repeticiones
Redacción creativa	0.9	0.95	0.3	0.1	Variedad sin caos
Brainstorming / ideas	1.2	0.95	0.5	0.3	Máxima diversidad temática
Chatbot conversacional	0.7	0.9	0.1	0.1	Natural y variado

Tarea	temperature	top-p	freq_pen	pres_pen	Por qué
Código / SQL	0.1	0.9	0	0	Máxima precisión, sin creatividad
Preguntas factuales	0.0	—	0	0	Totalmente determinista
Emails profesionales	0.5	0.9	0.1	0	Coherente y sin repeticiones
Redacción creativa	0.9	0.95	0.3	0.1	Variedad sin caos
Brainstorming / ideas	1.2	0.95	0.5	0.3	Máxima diversidad temática
Chatbot conversacional	0.7	0.9	0.1	0.1	Natural y variado

Cómo Funcionan los LLMs

Tokenización — Cómo el modelo "lee" el texto

Embeddings — El espacio semántico

Mecanismo de atención — Transformers

Temperatura — Creatividad vs. Coherencia

Parámetros avanzados — top-p, frequency y presence penalty

Configuraciones recomendadas por caso de uso