https://frosthead.com

The Million Word March

Solía ​​ser que la fuente experta de lo que era o no una palabra era ese elemento básico del día escolar: el diccionario. American Heritage, Webster's Third, Oxford English: había algunos jugadores de confianza en el juego.

Pero, ¿qué pasa si esos jugadores están perdiendo su ventaja?

Toma la palabra "vacaciones". Staycation, que significa pasar unas vacaciones en casa, apareció recientemente en el New York Times, USA Today y MSNBC . Pero no es probable que aparezca pronto en un diccionario. Lo mismo ocurre con la "bracketología" (la ciencia de las apuestas de la NCAA March Madness) en Facebook y Wikipedia .

"Tratamos de cubrir las palabras más destacadas", dice Joe Pickett, editor ejecutivo del American Heritage Dictionary. "¿Qué necesita saber el laico educado?"

Las personas que hacen diccionarios se conocen como lexicógrafos ("autores o editores de un diccionario". Gracias, Merriam-Webster). Y tienen un método probado para elegir qué palabras nuevas certificar y cuáles lanzar antes de la próxima edición o actualización del sitio web de un diccionario.

Los grupos de editores en un diccionario miran áreas temáticas específicas, registrando los aciertos que recibe una nueva palabra. Un "éxito" es una mención en un libro, periódico o sitio web. Luego ponen los resultados en una base de datos y comparan los nuevos términos con las palabras que ya tienen. Entonces, aunque Facebook, al ser una marca, no califica, cada palabra en las obras de Shakespeare sí lo hace, incluyendo cap-a-pie ("de pies a cabeza") y fardel ("carga"). Siendo el abuelo de la lingüística creativa, Shakespeare inventó más de 1.700 palabras. Todos ellos aparecen en un diccionario íntegro.

Los diccionarios rechazan las palabras por ser demasiado técnicos (incluso el fanático de "Anatomía de Grey" más duro nunca necesitará saber qué es un mammosomatotroph) o por ser demasiado joven (vacaciones).

No cuentan los nombres de marca (Coca-Cola, Facebook, Wikipedia) o la mayoría de las palabras y frases extranjeras.

"No estamos tratando de ser Wikipedia", dijo Pickett.

Entonces quien es? ¿Quién realiza un seguimiento, cuenta y clasifica las palabras que los angloparlantes usan a diario?

Austin, Texas, ha estado rastreando palabras durante los últimos cinco años. Utilizando sus propios equipos de expertos y su propio algoritmo, dicen que el inglés agrega una nueva palabra cada 98 minutos. Esto significa que hay más de 900, 000 palabras en inglés en el mundo, y la millonésima aparecerá en abril de 2009.

Por el contrario, la mayoría de los diccionarios estándar tienen alrededor de 200, 000 palabras, los diccionarios íntegros alrededor de 600, 000.

Pero el Monitor está tan seguro de sus números que ha comenzado una Marcha de millones de palabras, una cuenta regresiva para la millonésima palabra.

"Volvimos al inglés medio y vimos que la definición de una palabra era 'un pensamiento hablado'", dijo Paul JJ Payack, presidente y analista jefe de palabras en el Monitor, "lo que significa que si digo una palabra, y usted comprende yo, es una palabra real ".

Payack cuenta las vacaciones, Facebook y Wikipedia como palabras. Pero también sigue algunas de las viejas reglas. Por ejemplo, las palabras que son sustantivo y verbo, como "agua", se cuentan solo una vez. No cuenta todos los nombres que hay para los productos químicos, porque hay cientos de miles.

Una vez que el Monitor identifica una palabra, la rastrea con el tiempo, observando para ver dónde aparece la palabra. Sobre la base de esa medición, deciden si la palabra tiene "impulso", básicamente, si se está volviendo más popular o si es una maravilla de un solo golpe del mundo lingüístico.

A primera vista, esto se parece mucho al sistema de un diccionario.

"Es lo mismo que el [método] anterior, solo reconoce la nueva realidad", dijo Payack. El método del Monitor le da mucho más peso a las citas en línea.

Pero, ¿es real la "nueva realidad" de Payack? Afirma que el rápido flujo de información y el advenimiento del inglés global han cambiado la forma en que las personas usan las palabras. Y que la brecha entre las palabras que usa la gente y las palabras que aparecen en los diccionarios podría estar en aumento.

"Resulta que una vez que algo ingresa a Internet, es como una cámara de eco", dijo Payack. Desde que apareció el primer navegador web en 1991, Internet ha agregado muchas palabras al idioma inglés (punto-com, blog) y las ha agregado rápidamente. La Web también ha llevado las palabras existentes a nuevos oídos.

"A mediados de los 90, obtener un par de miles de visitas al navegador por una palabra nos hizo inclinarnos a ingresar; ahora el umbral ha cambiado", dijo Pickett. "Puedes encontrar tanta evidencia de palabras y expresiones oscuras".

Pero los diccionarios están acostumbrados a ponerse al día. Después de todo, es difícil definir una palabra antes de que se acuñe.

Payack dice que Internet no es el desafío más apremiante para la metodología tradicional de conteo de palabras. Eso, en su opinión, es "inglés global".

El inglés tiene casi 400 millones de hablantes nativos, lo que lo ubica en el segundo lugar del mundo, pero tiene 1.3 mil millones de hablantes en general, lo que lo convierte en el idioma más comprendido del mundo, explica Payack. Es hablado por más de 300 millones de personas en la India como segunda lengua, y al menos por esa cantidad de segundos hablantes en China.

"Cualquiera que hable inglés en este momento siente que lo posee", dice Payack. Por ejemplo, mire el adjetivo "quiebre". Después de que el director Ang Lee llamara a su película sobre dos vaqueros que se enamoran "Brokeback Mountain", la palabra "quiebra" se introdujo en la lengua vernácula inglesa como sinónimo de "gay". Aunque el "retroceso" puede haber pasado sus días de gloria en Estados Unidos, la palabra, con este nuevo significado, sigue siendo popular en China, dijo Payack. Aparece en blogs y sitios web, lo que significa que tiene impulso, lo que significa que es una palabra.

"Hoy en día tenemos mucho más tráfico de personas en todas las direcciones del mundo", dijo Salikoko Mufwene, profesora de lingüística en la Universidad de Chicago, que estudió el desarrollo de los dialectos regionales. Si las palabras inspiradas en chino se convertirán o no en parte del inglés americano, por ejemplo, "depende de qué tan regularmente los estadounidenses interactúen con los asiáticos en inglés", dijo.

Y si lo hicieran, ¿los estadounidenses se volverían, en promedio, más detallados? Los estadounidenses promedio usan alrededor de 7, 500 palabras por día y conocen alrededor de 20, 000 en total. Incluso Shakespeare solo sabía unos 60, 000.

Por lo tanto, el número de palabras en el idioma inglés siempre será mucho, mucho más de lo que cualquier persona sabe o usa.

Tanto Mufwene como Pickett de American Heritage dijeron que el inglés bien podría tener ya un millón de palabras. Contar palabras, después de todo, es una ciencia imprecisa.

Tampoco es la ciencia del diccionario. El trabajo de los diccionarios siempre ha sido, dijo Mufwene, "reflejar cómo hablan las personas, no enseñarles cómo hablar". Si la reflexión del diccionario se vuelve más estrecha, aún puede ser valiosa.

"Se necesita que la gente edite el diccionario y se responsabilice de él, para que sea confiable", dijo Pickett. "Y no creo que eso vaya a cambiar".

The Million Word March