https://frosthead.com

Un escritor utilizó estadísticas para revelar los secretos de lo que hace una gran escritura

En la mayoría de los cursos de literatura de nivel universitario, se encuentran estudiantes diseccionando pequeñas porciones de clásicos literarios: los soliloquios de Shakespeare, la corriente de conciencia de Joyce y las frases en staccato de Hemingway. Sin duda, hay mucho que se puede aprender sobre un escritor, su oficio y el significado de una historia mediante este tipo de lectura cercana.

Pero Ben Blatt hace un fuerte argumento para otro enfoque. Al centrarse en ciertas oraciones y párrafos, postula en su nuevo libro, La palabra favorita de Nabokov es Mauve, los lectores están descuidando todas las otras palabras, que, en una novela de longitud promedio, suman decenas de miles de puntos de datos.

El periodista y estadístico creó una base de datos del texto a partir de una serie de clásicos del siglo XX y los más vendidos para responder cuantitativamente a una serie de preguntas de interés. Su análisis reveló algunos patrones extravagantes que de otro modo podrían pasar desapercibidos:

Por los números, las mejores oraciones iniciales para las novelas tienden a ser cortas. El autor prolífico James Patterson promedia 160 clichés por cada 100.000 palabras (eso es 115 más que la venerada Jane Austen), y Vladimir Nabokov usó la palabra malva 44 veces más a menudo que el escritor promedio en los últimos dos siglos.

Smithsonian.com habló con Blatt sobre su método, algunos de sus hallazgos clave y por qué los grandes datos son importantes para el estudio de la literatura.

Has adoptado un enfoque estadístico para estudiar todo, desde Where's Waldo hasta Seinfeld, restaurantes de comida rápida y canciones pop. ¿Puedes explicar tu método y por qué haces lo que haces?

Soy periodista de datos y miro cosas de la cultura pop y el arte. Realmente me gusta mirar cosas cuantitativas e imparciales que tienen mucha información que la gente no ha visto. Si quisieras aprender cómo es una persona típica de los Estados Unidos, sería útil, pero no solo hablarías con una persona, lo sabrías todo sobre ellos y luego asumirías que todo sobre las personas en los Estados Unidos es el mismo. Creo que una cosa con la escritura que se pierde es que puedes enfocarte en una oración de un autor, especialmente en las clases de escritura creativa, o en un pasaje, y pierdes el panorama general para ver estos patrones y tendencias generales que los escritores están usando una y otra vez, cientos y quizás miles de veces en sus propios escritos.

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

La palabra favorita de Nabokov es malva: lo que revelan los números sobre los clásicos, los más vendidos y nuestra propia escritura

Comprar

Entonces, ¿qué te hizo recurrir a la literatura?

Mi formación es matemática e informática, pero siempre me ha encantado leer y escribir. A medida que escribía más y más, me interesé mucho en cómo diferentes escritores y personas dan consejos de escritura. Mucho de eso tenía sentido pero parecía no estar respaldado por información, y mucho de eso estaba en conflicto entre sí. Simplemente pensé que tenía que haber una forma de tomar estos temas por escrito de los que la gente ya estaba al tanto y hablar y probarlos en grandes autores y autores populares para ver si este consejo es real o si es un consejo prescriptivo que no Realmente significa algo en los libros reales y en las páginas reales.

¿Cuál fue la primera pregunta que quería hacer acerca de los clásicos literarios y los más vendidos?

El primer capítulo del libro es sobre el consejo de si debes usar o no adverbios. Este es también el primer capítulo que escribí cronológicamente. Es sobre todo el consejo de Stephen King de no usar adverbios en su libro On Writing, que para muchos escritores es el libro sobre escritura. Pero muchos otros escritores —Toni Morrison, Chuck Palahniuk— y cualquier clase de escritura creativa aconseja no usar un adverbio –ly porque es una palabra innecesaria y una señal de que no estás siendo conciso. En lugar de decir: "Corrió rápidamente", puede decir: "Corrió".

Entonces quería saber, ¿es esto realmente cierto? Si este es un buen consejo, es de esperar que los grandes autores realmente lo usen menos. Es de esperar que los escritores aficionados lo utilicen más que los autores publicados. Realmente quería saber, estilísticamente, primero si Stephen King siguió su propio consejo, y luego si se aplica a todos los otros grandes y venerados autores.

Entonces, ¿qué encontraste?

De hecho, existe una tendencia de que autores como Hemingway, Morrison y Steinbeck, sus mejores libros, los que se sostienen y tienen más atención ahora, son los libros con la menor cantidad de adverbios. Además, si compara la escritura de ficción aficionada y la escritura en línea que no ha sido editada con los más vendidos y ganadores del Premio Pulitzer de los últimos tiempos, existe una discrepancia, donde los autores publicados usan adverbios menos comunes. No soy tan unilateral que creo que puedes sacar los adverbios de un buen libro y se convierte en un gran libro. Obviamente no es así como funciona. Pero hay algo en el hecho de que los escritores que escriben de manera muy directa producen libros que, en general, viven más tiempo.

p13 - Adverbios.JPG

¿Cómo hiciste para crear una base de datos de obras literarias?

Para muchas de las preguntas, estaba usando los mismos 50 autores que había elegido de forma algo arbitraria. Esencialmente se basó en autores que estaban en la parte superior de la lista de los más vendidos, autores que estaban en la cima de los mejores autores de todos los tiempos y autores que representaban una variedad de géneros y tiempos y lectores diferentes. De esa manera, a lo largo del libro, puede comparar estos autores y conocerlos.

Para mí era muy importante que si dijera algo como "Toni Morrison usa esta palabra a este ritmo", estaba hablando de cada novela que haya escrito y no solo de las tres que ya tengo. En mi libro, hay de 50 a 100 autores a los que se hace referencia en todas partes. Encontré sus bibliografías y luego encontré todas sus novelas que habían escrito hasta ese momento como su registro completo. De alguna manera, es un poco como mantener estadísticas deportivas, donde cada libro es como una temporada y luego todas estas temporadas o libros se unen como una carrera. Puedes ver cómo los autores cambian con el tiempo y cómo hacen las cosas en general. Una vez que tenga todos los libros en el archivo, responder estas preguntas que de alguna manera son muy desalentadoras es muy sencillo.

¿Y cómo procesaste todo ese texto?

Hay un lenguaje de programación llamado Python, y dentro de eso, hay un conjunto de herramientas llamadas Natural Language Toolkit, a menudo abreviado NLTK. Las herramientas involucradas están disponibles gratuitamente para cualquiera. Puede descargar el paquete en línea y usarlo en Python u otros idiomas. No puede obtener muchas de las preguntas escritas en particular, pero puede decir, ¿cuántas veces aparece esta palabra en el texto? Puede revisar e identificar dónde terminan las oraciones y dónde comienzan las oraciones, y partes del discurso: adjetivo vs. adverbio vs. verbo. Entonces, una vez que tenga esas herramientas, puede obtener los datos.

¿Qué estadísticas compiló manualmente? ¿Qué fue lo más tedioso?

Hay una sección donde miro las oraciones iniciales. Elmore Leonard, quien era un novelista muy exitoso, había dicho: "Nunca abras un libro con clima". Este es también un consejo que se encuentra en muchas guías de escritura. Así que revisé cientos de autores para ver con qué frecuencia abren su libro sobre el clima. Por ejemplo, Danielle Steel, creo que el 45 por ciento de sus primeras oraciones en los libros son sobre el clima. Muchas veces es solo "Fue un día magnífico" o "Fue brillante y soleado afuera", cosas así. Para eso, no había forma de hacerlo automáticamente sin tener algún error, por lo que simplemente revisaba todos los archivos del libro y marcaba si había clima involucrado. Se puede decir que fue tedioso, porque se recopilaron muchos datos, pero fue divertido leer y leer cientos de oraciones iniciales a la vez. Hay otros patrones que emergen claramente de los autores con el tiempo.

p207 --- Weather.jpg

Como dices, tedioso para algunos, divertido para otros. Algunos podrían pensar que este enfoque analítico es aburrido, pero usted argumenta que puede ser "divertido" y "a menudo francamente divertido". ¿Cuál fue su hallazgo más divertido?

El título del libro, La palabra favorita de Nabokov es malva, trata sobre cómo, según los números, la palabra que usa con mayor frecuencia en comparación con el inglés es malva. Eso termina teniendo mucho sentido si nos fijamos en sus antecedentes, porque tenía sinestesia. Hablaba, en su autobiografía, sobre cómo cuando escuchaba diferentes letras y sonidos, su cerebro automáticamente evocaba colores.

Repetí ese experimento con otros 100 autores para ver cuál es su palabra favorita. Como resultado, obtienes tres palabras que son representativas de su escritura por las palabras que más usan. Civilidad, fantasía e imprudencia. Esa es Jane Austen. Creo que si vieras esas palabras, Jane Austen podría ser una de tus primeras conjeturas. Y luego tienes un autor como John Updike, que es un poco más valiente y real y de una época diferente. Sus palabras favoritas son bordeadas, pinchadas y folladas. Creo que ver la personalidad a través de estas simples preguntas matemáticas es muy interesante. Si tiene un autor favorito, revisarlo revela algo sobre su personalidad que quizás no haya notado antes.

Ray Bradbury había escrito que su palabra favorita era canela. Por los números, él usa mucho eso. Su explicación de por qué le gustaba la canela fue que le recordaba a la despensa de su abuela. Así que busqué y encontré otras palabras de especias y olores que podrían asociarse con la despensa de una abuela, y Ray Bradbury usa la mayoría de esas palabras a un ritmo muy alto. En cierto sentido, puedes obtener esta extraña mirada freudiana sobre algo sobre la infancia de los autores. Si Ray Bradbury no hubiera dicho eso, tal vez aún podrías resolverlo.

Comparaste a escritores estadounidenses y británicos, confirmando un estereotipo de que los estadounidenses son ruidosos. ¿Puedes explicar esto?

Este se basó originalmente en un estudio realizado por un estudiante graduado en Stanford. Había identificado palabras que se usan para describir el diálogo en los libros, y las describió como ruidosas, neutrales o calladas. "Susurrado" y "murmurado" estaría en silencio. Neutral sería "él dijo" o "ella dijo", y en voz alta sería "exclamó" o "gritó". Revisé los 50 autores que vi, así como grandes muestras de fan fiction, y encontré, no por un margen loco pero un margen significativo, que los estadounidenses tienen una proporción más alta de las palabras fuertes a las palabras tranquilas. Hay algunas explicaciones. Podría ser que así es como los estadounidenses hablan durante toda su vida, así es como los escritores los describen hablando con frecuencia. También podrías verlo como escritores estadounidenses que tienen preferencia por historias más basadas en acción, suspenso y de mayor tempo en comparación con las más sutiles. Los estadounidenses son de hecho más ruidosos por los números.

Blatt_author photo_Credit Sierra Katow.JPG Ben Blatt, autor de La palabra favorita de Nabokov es malva (Sierra Katow)

¿Por qué crees que aplicar las matemáticas a la escritura es una buena forma de estudiar literatura?

Definitivamente no estoy abogando por que esta sea la primera forma de estudiar literatura si estás tratando de mejorar tu escritura. Pero incluso una novela de longitud moderada tiene probablemente 50, 000 palabras, y eso es 50, 000 puntos de datos. Simplemente no podrá absorber todo de una vez, y habrá algunas preguntas que simplemente no podrá responder leyendo por su cuenta. Es bueno ver la imagen más grande. Si te sientas y estudias un párrafo, estás en tu clase de escritura creativa hablando con tu profesor, si hay una forma establecida de ver eso, solo lo verás en todo. Pero con los datos, eso te libera, y puedes responder algunas preguntas sin estos prejuicios y realmente obtener información nueva.

Mencionas que seguiste pensando en "El gran gramatizador" de Roald Dahl.

Hay una gran historia de Roald Dahl donde esencialmente un ingeniero diseña una forma de escribir una historia. En este escenario del fin del mundo, alguien puede darle una trama a la máquina y escupirá una novela final. La insinuación es que están produciendo novelas que son tan formulales y básicas. El protagonista de esa historia elige no unirse a la operación de la máquina y lucha contra ella creando su propia escritura y arte.

Definitivamente creo que este libro, si te gusta escribir, responderá muchas preguntas por ti y definitivamente cambiará tu forma de pensar sobre algunas cosas, pero en última instancia, en realidad no hay sustituto para las ideas que hacen pensar a las personas y las escenas que hacen que las personas temeroso o conéctate con los personajes. Este libro analiza el arte de escribir y no necesariamente cómo crear una historia memorable. Este libro no está tratando de diseñar una novela perfecta, y no creo que estemos tan cerca de eso como algunas personas pueden temer.

Un escritor utilizó estadísticas para revelar los secretos de lo que hace una gran escritura