Cargando aplicación...
Preparando tu experiencia meskeIA
Encuentra las diferencias entre dos textos (estilo Diff)
La información proporcionada tiene carácter orientativo. Los resultados pueden variar según tu situación particular.
meskeIA no se responsabiliza de decisiones basadas en el uso de esta herramienta.
Tu texto nunca sale de tu navegador
Comparación instantánea mientras escribes
Porcentaje de similitud y conteo de cambios
Cómo funcionan las herramientas de diff, similitud textual y detección de cambios
| Tipo | Algoritmo base | Qué detecta | Caso de uso | Limitación |
|---|---|---|---|---|
| Diff de líneas | LCS (Longest Common Subsequence) | Líneas añadidas, eliminadas o modificadas | Control de versiones (Git), revisión de contratos | No detecta reordenaciones de párrafos |
| Diff de palabras | Variante LCS sobre tokens | Palabras concretas cambiadas en cada línea | Revisión editorial, cambios sutiles en texto | Sensible a puntuación y espaciado |
| Similitud de cadenas | Distancia de Levenshtein / Jaro-Winkler | Porcentaje de similitud entre textos cortos | Deduplicación, corrección ortográfica, fuzzy search | Costoso computacionalmente en textos largos |
| Huella digital (hash) | Simhash / MinHash | Textos casi idénticos en colecciones masivas | Detección de plagio a escala web | No indica qué parte es igual, solo si son similares |
| Similitud semántica | Embeddings (word2vec, BERT) | Textos con mismo significado pero palabras distintas | Detección de paráfrasis, IA, análisis de contenido | Requiere modelos de lenguaje, no funciona offline |
Abogados y notarios comparan versiones de contratos para identificar exactamente qué cláusulas cambiaron entre borradores. Un cambio aparentemente menor ("podrá" vs "deberá") puede tener consecuencias legales enormes. El diff de palabras permite ver esos cambios con precisión quirúrgica sin leer dos veces el documento completo.
Editores, correctores y docentes usan comparadores para revisar las correcciones aplicadas entre versiones de un trabajo. En el contexto universitario, también ayuda a detectar si un alumno realmente reescribió una sección o simplemente sustituyó sinónimos. Los trabajos de fin de grado sometidos a dos rondas de revisión se comparan sistemáticamente.
Git usa el algoritmo Myers diff (variante de LCS) para mostrar los cambios entre commits. El comando "git diff" es la herramienta de comparación más usada del mundo. Las herramientas de code review (GitHub PR, GitLab MR) presentan estos diffs con coloreado para facilitar la revisión. Entender cómo funciona el diff ayuda a hacer commits más limpios y descriptivos.
Los fact-checkers comparan comunicados oficiales, discursos o páginas web entre versiones para detectar ediciones retroactivas sin aviso. Comparar la caché de Google con la versión actual de una página puede revelar cambios encubiertos en datos, estadísticas o declaraciones. Es una herramienta fundamental del periodismo de datos.
LCS (Longest Common Subsequence) encuentra la secuencia más larga de elementos comunes entre dos textos, en el mismo orden relativo pero no necesariamente consecutivos. Para comparar "ABCDE" y "ACFDE", el LCS es "ACDE" (longitud 4). Lo que no está en el LCS son las diferencias: "B" fue eliminada, "F" fue añadida. El algoritmo de Myers (1986), usado por Git, es una optimización de LCS que minimiza el número de cambios (ediciones) necesarios para transformar un texto en otro, produciendo diffs más limpios y legibles.
El porcentaje de similitud mide cuánto de los dos textos es compartido. La fórmula más común es: similitud = (2 × caracteres comunes) / (total caracteres texto A + total caracteres texto B). Un 100% significa textos idénticos; 0% significa ningún carácter en común. En la práctica, un 85-90% puede significar que se cambiaron solo unas pocas palabras. El porcentaje varía según el algoritmo: similitud de caracteres, de palabras o de n-gramas da valores distintos para el mismo par de textos.
Esta herramienta detecta similitud textual directa (texto copiado o ligeramente modificado), no plagio semántico (paráfrasis, traducción, resumen). Para detección de plagio académico real, las plataformas profesionales como Turnitin, PlagScan o iThenticate comparan contra bases de datos de millones de documentos académicos y la web completa. Esta herramienta es útil para comparar dos textos concretos que tienes en mano: comprobar si una versión revisada realmente cambió, o si dos documentos propios tienen solapamiento excesivo.
El algoritmo Myers minimiza el número de líneas cambiadas, pero no siempre elige el diff más "legible" para humanos. Por eso existen variantes como "git diff --patience" (que prioriza líneas únicas como anclas) o "git diff --histogram" (más preciso para código). Además, los cambios de indentación, espaciado o finales de línea (CRLF vs LF) pueden hacer que una línea aparezca como completamente eliminada y recreada aunque solo cambió un espacio invisible. Por eso se usan flags como --ignore-whitespace o --ignore-all-space en Git.
Google y los sistemas anti-plagio a gran escala usan técnicas como Simhash (Google, 2007): convierte un documento en una huella digital de 64 bits que preserva la similitud. Dos documentos con Simhash a distancia Hamming de 3 o menos (difieren en 3 bits de 64) son casi idénticos. MinHash hace lo mismo con conjuntos de n-gramas. Estas técnicas permiten comparar millones de documentos en segundos con muy poca memoria, algo imposible con LCS directo.
La distancia de Levenshtein (Vladimir Levenshtein, 1965) mide el mínimo de operaciones elementales (inserción, eliminación, sustitución de un carácter) para transformar una cadena en otra. "gato" → "pato": distancia 1 (sustituir g→p). Se usa en: correctores ortográficos (¿quisiste decir "algoritmo" en lugar de "algorritmo"?), búsqueda aproximada (fuzzy search), reconocimiento de voz (comparar lo dicho con lo esperado), bioinformática (alinear secuencias de ADN). La variante Jaro-Winkler da más peso a los caracteres iniciales, ideal para nombres propios.
Para texto y documentos: Beyond Compare y WinMerge (escritorio, gratuito) para archivos. Kaleidoscope (macOS). Diffchecker y Text Compare (web). Para código: VS Code diff (integrado), Meld (Linux). Para documentos Word: la función "Comparar documentos" de Microsoft Word traza cambios con precisión de párrafo. Para PDFs: Adobe Acrobat Pro y Draftable. Para páginas web: Versionista y ChangeTower monitorizan cambios en URLs automáticamente.
Los espacios en blanco son el mayor causante de confusión en las comparaciones. Un texto copiado desde PDF suele introducir saltos de línea adicionales, espacios dobles o guiones de división silábica que hacen que textos visualmente idénticos aparezcan muy distintos en el diff. Antes de comparar: normaliza los espacios (elimina dobles espacios), unifica los finales de línea (CRLF → LF en Windows) y elimina líneas vacías extras. Esta herramienta compara el texto tal como lo introduces, por lo que una pequeña limpieza previa mejora mucho la calidad del resultado.
Elimina encabezados de página, números de página, cabeceras automáticas y saltos de línea artificiales (los que introduce un PDF al exportar). Dos textos visualmente iguales pueden mostrar cientos de diferencias falsas por espaciado invisible.
Si los textos son largos, divide la comparación por secciones. Compara párrafo a párrafo para aislar exactamente qué sección cambió. Un diff de un documento de 50 páginas completo puede ser difícil de interpretar; el de un párrafo de 5 líneas es inmediato.
Rojo / tachado: texto que estaba en el original y fue eliminado. Verde / subrayado: texto nuevo añadido. Amarillo / resaltado: texto modificado (combinación de eliminación + adición). Sin color: texto idéntico en ambas versiones.
Un 95%+ indica cambios menores (correcciones puntuales). Un 70-90% indica revisión significativa de párrafos. Un 50-70% indica reescritura parcial. Menos del 50% puede indicar que los textos son fundamentalmente distintos o que uno está reorganizado respecto al otro.
En textos legales, los cambios más importantes suelen ser los más pequeños: una negación, un verbo modal ("podrá" vs "deberá"), una fecha, una cifra o una excepción entre paréntesis. El diff de palabras es más útil que el de líneas para este caso.
Si la comparación tiene valor probatorio (litigio, auditoría interna, control de versiones de documentos normativos), haz una captura de pantalla fechada o exporta el resultado. El comparador web no guarda historial; cada sesión es temporal y local.
Al copiar desde Word o PDF, el formato puede introducir caracteres invisibles. Pega primero en un editor de texto plano (Bloc de notas, Notepad++) y luego copia desde ahí para evitar sorpresas en el diff.
El comparador distingue "1.234,56" de "1234.56" como completamente distintos. Normaliza el formato de números antes de comparar documentos de distintas fuentes o idiomas (español vs inglés).
La comparación distingue mayúsculas de minúsculas y letras con tilde de las que no la tienen. "Esta" y "está" son distintas. Si esto genera ruido, normaliza el texto a minúsculas antes de comparar (útil para análisis de contenido, no para análisis legal).
La complejidad del algoritmo LCS es O(n×m), donde n y m son las longitudes de los textos. Para documentos de miles de líneas, los comparadores web pueden volverse lentos. Divide en bloques de 1.000-2.000 palabras para mantener la fluidez.
Esta herramienta procesa todo localmente en tu navegador: ningún texto se envía a ningún servidor. Puedes comparar documentos confidenciales con total seguridad. Esto también significa que funciona sin conexión a internet una vez cargada la página.
El diff A→B y el diff B→A no son simétricos en la presentación: cambiar qué texto es "original" y cuál es "revisado" cambia qué aparece como añadido y qué como eliminado. Si los colores te confunden, prueba a intercambiar los textos.