PD: Corregidos.
Alemán | Inglés | Español | |
Título | Die verwandlung | The metamorphosis | La metamorfosis |
Caracteres en total | 98540 | 96832 | 91975 |
Caracteres (sin repeticiones) | 44 | 39 | 52 |
Palabras en total | 19156 | 22041 | 19750 |
Palabras (sin repeticiones) | 3750 | 2978 | 3397 |
Promedio de letras por palabra | 5.1441 | 4.3933 | 4.657 |
Aun así, son el mismo texto, ¿verdad?
Veamos las palabras que más se repiten en los textos. Como es de esperar, las más populares son palabras muy cortas.
Alemán | Inglés | Español | |||||||
Palabra | # | Palabra | # | Palabra | # | ||||
die | – | el | 626 | the | – | el | 1371 | la | 969 |
und | – | y | 623 | and | – | y | 647 | de | 883 |
er | – | él | 448 | to | – | para | 647 | que | 650 |
der | – | el | 425 | his | – | su | 526 | y | 608 |
zu | – | para | 348 | he | – | él | 513 | el | 491 |
sich | – | es | 311 | in | – | en | 454 | en | 474 |
sie | – | ellos | 304 | of | – | de | 435 | a | 462 |
nicht | – | no | 260 | a | – | un | 396 | se | 439 |
in | – | en | 248 | was | – | era | 371 | con | 296 |
den | – | el | 245 | had | – | tuvo | 327 | no | 281 |
war | – | era | 235 | gregor | – | gregor | 265 | su | 257 |
gregor | – | gregor | 218 | that | – | eso | 250 | gregorio | 250 |
das | – | eso | 197 | with | – | con | 218 | por | 223 |
es | – | ello | 196 | it | – | ello | 214 | un | 188 |
mit | – | con | 194 | not | – | no | 201 | había | 172 |
A continuación uno de los análisis que más quería ver yo desde el comienzo: el de aparición porcentual de caracteres. Las proporciones son las siguientes:
Inglés
Español
Es bastante aproximado, teniendo en cuenta que La metamorfosis es un texto ‘corto’ si se lo compara con una novela, por ejemplo.
Tengo también una lista de las palabras más largas de cada texto, pero no fui capaz de ponerla aquí. En la posdata pongo más información al respecto. Claramente las cifras pueden variar dependiendo de la traducción que se utilice.
Termino con seis frases y una pequeña conclusión; luego de un análisis por el estilo, estadísico, en donde se catalogan y organizan las letras y las palabras de cada texto, es posible darse cuenta de las grandes diferencias y también de las semejanzas entre un texto y él mismo traducido a otro idioma. A mí, por lo menos, esto me recuerda la diferencia que existe entre los lenguajes, que (creo yo) además de ser una barrera entre los pueblos, son tan particulares y complejos que es imposible realizar una conversión perfecta entre ellos.
Pero eso es sólo lo que yo creo. Las seis frases son la primera y la última línea de los tres textos. Y dicen:
Alemán: Als Gregor Samsa eines Morgens aus unruhigen Träumen erwachte, fand er sich in seinem Bett zu einem ungeheueren Ungeziefer verwandelt. […] Und es war ihnen wie eine Bestätigung ihrer neuen Träume und guten Absichten, als am Ziele ihrer Fahrt die Tochter als erste sich erhob und ihren jungen Körper dehnte.
Inglés: One morning, as Gregor Samsa was waking up from anxious dreams, he discovered that in his bed he had been changed into a monstrous verminous bug. […] And it was something of a confirmation of their new dreams and good intentions when at the end of their journey their daughter stood up first and stretched her young body.
Español: Cuando Gregorio Samsa se despertó una mañana después de un sueño intranquilo, se encontró sobre su cama convertido en un monstruoso insecto. […] Tornándose cada vez más silenciosos y entendiéndose casi inconscientemente con las miradas, pensaban que ya llegaba el momento de buscarle un buen marido, y para ellos fue como una confirmación de sus nuevos sueños y buenas intenciones cuando, al final de su viaje, fue la hija quien se levantó primero y estiró su cuerpo joven.
Mentí cuando dije que yo hice el análisis; lo hizo un programa de computador, que pude escribir porque un amigo (se llama Francisco y lo agradezco mucho) dio un pequeño curso sobre el lenguaje de programación llamado Python. Si a usted le interesa la programación y en general los sitemas, le puedo decir que es un lenguaje muy versátil y que grandes compañías e instituciones lo están utilizando para varias tareas.
No es más por ahora.
PD: Tanto el programa como yo estamos dispuestos a hacer más análisis, así que si quieren pueden enviarme un correo y un texto y yo lo analizo o les mando el programa o las tablas y todo lo que no pude poner aquí.
Me llevó cierto tiempo hacerlo; espero que les haya gustado. Nos hablamos.
[…] PD6 Por si se perdieron las entradas anteriores. Y también, La metamorfosis, de Kafka, cumple 100 años; analizamos el relato hace un tiempo, aquí. […]
Califica:
Mis disculpas. Sí estaban mal los promedios. El número total de caracteres estaba mal calculado. Los nuevos datos son:
Promedio alemán
5.1441 letras por palabra
Promedio inglés
4.3933 etras por palabra
Promedio español
4.657 letras por palabra. Eso quiere decir que el orden se mantiene: el más ‘largo’ es el alemán, y el más ‘corto’ es el inglés.
Los otros datos están bien, sólo tuve que corregir unas líneas de la primera tabla.
Este número de caracteres incluye puntos, comas y espacios, pero comprobé que la diferencia entre calcular el promedio con este dato o con el número de letras ‘puras’ no es muy grande si el texto es grande.
Gracias por insistir y hacerme caer en cuenta del error.
Califica:
Ni contando como palabras los signos de puntuación, los espacios en blanco y el paso a renglón nuevo
darían esas cifras. En el primer renglón de los dos comentarios anteriores (de dancastell89 y de marodriguezto) las cifras son asombrosamente similares: 42 «palabras» y 87 letras, y 43 palabras y 87 letras, respectivamente. Eso daría 2.07 y 2.02 letras por palabra, o 2.02 y 1.98 si contamos como palabra también el paso al segundo renglón. Comparado esto con el dato dado en el artículo, hay un desfase de más del 50% en español. Sin embargo, más allá de esta circunstancia, ¿no sería más lógico contar los signos de puntuación, los espacios en blanco y el paso a renglón nuevo como letras en lugar de palabras?
Califica:
Esta explicación es coherente para el dato del español, pero no así para el del inglés y el del alemán que no tienen ninguna palabra de una sola letra (ni siquiera nuestros conectores «y», «o», «a» que se convierten en «and», «or», «to» en inglés y «und», «oder», «nach» en alemán). Yo creo que el problema radica en que el programa cuenta como palabras los espacios y signos de puntuación. Habría que revisar esto.
Califica:
Petúfar,
yo también pensé que era un error y lo estuve revisando, pero está bien. La explicación, creo yo, tiene que ver con el hecho de que las palabras más utilizadas, tanto en el inglés como en el español (y al parecer también en el alemán) son muy cortas. Así, una lista total de palabras organizada por longitud contiene muchas palabras relativamente cortas y un número reducido de palabras largas. El promedio tiende, por lo tanto, a favorecer a las palabras más cortas, que son muy, muy abundantes (‘a’, ‘y’, ‘la’, ‘de’, por ejemplo, cuentan como palabras, y se repiten mucho). Aun así, es notorio que los promedios organizan (cualitativamente) bien a los lenguajes según la longitud promedio de sus palabras.
Claramente este promedio es cierto matemáticamente, pero no debería ser representativo en textos muy cortos, como las conversaciones diarias, por ejemplo.
Gracias por su comentario.
Califica:
juansintinta,
vaya uno a saber. Lo que sí es cierto es que los alemanes utilizan palabras larguísimas (si se comparan con el español, por ejemplo). Mire nada más algunas de las palabras más largas que, según el análisis, aparecen en el texto en alemán,
3747. entschuldigungsbriefe
3748. familienschmuckstücke
3749. vermögensverhältnisse
3750. wahrscheinlicherweise (21 letras)
mientras que las más largas en el español son
3394. inconscientemente
3395. charlottenstrasse
3396. significativamente
3397. despreocupadamente (18 letras).
Gracias por su comentario.
Califica:
SEBASTIAN,
¿cuál es su blog? Interesante su idea de unirnos, pero ¿como sería? De pronto lo que ud. dice también es de interés de Petúfar.
Gracias por su comentario.
Califica:
Interesante análisis, pero hay un error matemático. No es posible que el número de letras por palabra sea tan bajo. ¿En inglés no llega ni a uno el número de las letras por palabra?
Califica:
Es más preciso en alemán y en español le inventaron todo un rollo con eso de entenderse con las miradas y buscarle marido, que no está en el original. En inglés se pierde la esencia para darle paso a la brevedad. Mejor leerlo en silencio en alemán, leerlo en voz alta en español y resumirlo en inglés!
Califica:
Buen análisis. A La metamorfosis sobre todo se le puede sacar y astillar cualquier tema. Por cierto, deberíamos unirnos los blogs literarios de El Tiempo…
Califica:
Los mismo se puede apreciar revisando los folletos que acompañan los discos de música «culta», que usualmente -en los buenos sellos discográficos- son extensos: el mismo texto es mucho más largo en alemán que en inglés, en francés, en italiano o en español.
Usualmente dicen lo mismo: notas sobre el compositor y sobre los intérpretes. Nuestro amigos alemanes usan más papel para expresar lo mismo; los angloparlantes son los más breves.
¿Sucederá lo mismo con las ideas? ¿Serán más extensas, densas o «sesudas» las de los alemanes? recordemos que buena parte del pensamiento filosófico viene de Alemania. Con lo cual las de los angloparlantes…
Califica:
Hola. No entiendo el alemán, pero si he notado algo en otros idiomas (en general, no para este libro). Los textos en Inglés son mucho más cortos que en Español, y a su vez estos dos mucho más cortos que sus equivalentes en francés. El francés es un tanto «rimbombante» y redundante para expresarse uno leendo artículos periodisticos se da cuenta que utilizan mucha metáforas y pefrifrasis para expresas algo.
Califica: