Tesoro.pr, un diccionario de diccionarios
—Chica, qué linda te quedó la pollina.
—Y a mí me encantan tus pantallas.
—¡Gracias! ¿Quieres un cantito de china?
—¡Sí! Y ¿dónde boto la cáscara?
—Ahí hay un zafacón. Pero avanza, que es tarde.
—Nena, no me ajores...
El que haya entendido este intercambio o es boricua o conoce muy bien el español de Puerto Rico. Los que no, no se preocupen, porque ahora cuentan con Tesoro.pr, una herramienta en línea que les dará el significado de estas palabras puertorriqueñas.
Según Tesoro.pr, en esa isla caribeña:
pollina = flequillo
pantalla = arete
china = naranja dulce
canto = pedazo
botar = tirar, echar
zafacón = bote de basura
avanzar = darse prisa
ajorar = apresurar
Tesoro.pr, cuyo nombre completo es Tesoro lexicográfico del español de Puerto Rico en línea, es un diccionario de diccionarios, de base electrónica, en continuo crecimiento. Actualmente contiene más de 27,000 palabras y frases puertorriqueñas, provenientes de 65 fuentes (diccionarios, vocabularios, glosarios, tesis, etc.) escritas de 1788 a 2010.
Tesoro.pr es un proyecto de la Academia Puertorriqueña de la Lengua Española, dirigido por la Dra. Maia Sherwood Droz. Su intención es ser la obra de referencia más completa y actualizada sobre palabras y frases puertorriqueñas —y su historia—, así como una herramienta de investigación.
La base de Tesoro.pr es el Tesoro lexicográfico del español de Puerto Rico, de María Vaquero y Amparo Morales (San Juan: Plaza Mayor, 2005), que compiló en un solo tomo 60 fuentes diferentes sobre léxico puertorriqueño. A ese contenido inicial, Tesoro.pr continúa agregando fuentes, tanto del presente como del pasado.
En su momento, el Tesoro lexicográfico del español de Puerto Rico fue el tercero de su tipo publicado en el español y el primero en Hispanoamérica, tras el Tesoro lexicográfico del español de Canarias (1992) y el Tesoro léxico de las hablas andaluzas (2000). Tesoro.pr constituye también una publicación innovadora, al ser el primer tesoro lexicográfico en Hispanoamérica en soporte electrónico.
¿Qué es un tesoro lexicográfico?
Un tesoro lexicográfico, o un diccionario de diccionarios, es una colección organizada de diccionarios de una lengua o un dialecto. A diferencia de un diccionario regular, que tiene un solo autor (individual o institucional), un tesoro presenta las definiciones provistas por las diferentes fuentes incluidas, típicamente en orden cronológico. Así, Tesoro.pr nos informa de que canto, con el sentido de ‘pedazo’, fue registrado por cinco fuentes, de 1937 a 2010:
canto. 1. vulg. Pedazo de cualquier cosa. “Un canto de pan.”
Fuente: Malaret, 1937
2. (popular) Pedazo de algo, trozo.
Fuente: Del Rosario, 1965
3. Pedazo de cualquier cosa.
Fuente: Maura, 1984
4. a. En Puerto Rico, palabra para denotar la idea de ‘pedazo desprendible o separable de cualquier cosa, dura o blanda’.
b. La literatura costumbrista moderna registra su uso entre campesinos aplicado a sitios: “No quié uhté dehpegarse de ehte canto” (‘parte de un área geográfica’). “Tú teníah un canto e tierra” (‘porción de terreno’). Marqués.
Fuente: Álvarez Nazario, 1990
5. a. Pedazo, porción de algo.
b. Sitio, pedazo de tierra.
Fuente: Diccionario de Americanismos, 2010
Los tesoros lexicográficos son valiosos por varias razones: ofrecen pistas sobre cuándo aparece por primera vez una palabra o un sentido en una lengua o dialecto; permiten acercarnos al sentido de una palabra en un momento dado (ajorar no significó lo mismo en 1937 que en 2010, lo cual es relevante al estudiar textos de los 1930) y hacen visibles los cambios de sentidos de las palabras en el tiempo.
Por supuesto, los tesoros hacen todo esto a través del filtro de los diccionarios (y, por lo tanto, de sus autores). En eso se diferencian de los diccionarios históricos, que buscan trazar la historia de las palabras en los textos de cada época.
Objetivos de Tesoro.pr
El objetivo principal de Tesoro.pr es poner a disposición del público amplio —a través del Internet— el caudal léxico puertorriqueño recogido por diccionarios y otras fuentes a lo largo del tiempo.
En ese público destacan los maestros y estudiantes, que a menudo no encuentran sus palabras cotidianas en los diccionarios del español. También figuran los investigadores y estudiosos de textos puertorriqueños, que necesitan interpretar una palabra en su contexto temporal.
Además, están los puertorriqueños en general, ahora divididos en dos grandes grupos: los de la isla y los de la diáspora (el mayor de los dos). De hecho, los datos analísticos de Google indican que, en el último año, 28% de las visitas a Tesoro.pr se hacen desde la isla mientras que 42% salen de ciudades estadounidenses como Miami, Orlando y Nueva York, con grandes poblaciones puertorriqueños. Los otros visitantes están radicados en España, México, Colombia, Chile y otros países latinoamericanos.
El segundo gran objetivo de Tesoro.pr es usar la plataforma electrónica para posibilitar el máximo aprovechamiento de los datos lexicográficos. La plataforma electrónica no solo salva la limitación del espacio impreso, sino que permite explorar de maneras dinámicas y noveles las relaciones que existen entre palabras, significados y otros datos.
Búsquedas simples y búsquedas avanzadas
Como todo diccionario electrónico, Tesoro.pr tiene búsquedas simples por palabra o frase. El que quiera saber qué es la mancha de plátano para los puertorriqueños, solo tiene que teclear la frase y descubrirlo.
Otras búsquedas simples se realizan presionando las palabras sugeridas en las secciones “Palabra del día” o “Palabras más buscadas”, que al momento en que escribo incluyen sleepover (quedarse a dormir los jóvenes en casa de un amigo), pichipén (madera de calidad inferior) y Borinquen (nombre taíno de Puerto Rico).
Las búsquedas avanzadas constituyen, sin embargo, la ventaja más significativa de estructurar la información en una base de datos. Estas búsquedas permiten acceder al contenido desde la perspectiva de otros campos lexicográficos, en el caso de Tesoro.pr: categoría gramatical, origen de la palabra, campo temático, fuente y año. Los criterios de búsqueda pueden ir solos o combinados. Así, una búsqueda avanzada de ‘verbos transitivos’ considerados ‘anglicismos’ da 213 resultados, entre los que están:
baquear = respaldar (de to back up)
clipear = grapar (de to clip)
estartear = prender el auto, a veces con dificultad (de to start)
La búsqueda avanzada también puede orientarse desde las fuentes incluidas. Por ejemplo, nos permite saber que el texto del fray Iñigo Abbad y Lasierra (Historia geográfica, civil y natural de la isla de San Juan Bautista de Puerto Rico, 1788) incluye 102 palabras, de las cuales 46 son indigenismos.
Otra novedad de Tesoro.pr es el etiquetado por campo temático. Las más de 52,000 definiciones se etiquetaron con un inventario de 42 marcas temáticas que describen ámbitos de vida, del tipo: Alcohol, Agricultura, Cuerpo humano, Sexualidad, Tecnología, Vivienda, etc. Estas etiquetas buscan agrupar las palabras en campos semánticos y, por lo tanto, facilitar búsquedas onomasiológicas, es decir, que parten de un concepto para llegar a las palabras que hablan de ese concepto.
Por ejemplo, una búsqueda de los ‘adjetivos’ con etiqueta de ‘Estado anímico o afectivo’ —que incluye lo relativo a los estados de ánimo, procesos psicológicos e intelectuales, actitudes y voluntades— da 508 resultados. Algunos ejemplos son:
ababachado = avergonzado
caripelado = descarado
culeco = muy contento o alegre
Por otro lado, las definiciones de Tesoro.pr constituyen un corpus: podemos buscar palabras presentes en ellas, lo cual abre las puertas al análisis del diccionario como género textual y discursivo. Se puede hacer una búsqueda, por ejemplo, de la palabra mujer en las definiciones. El resultado será una lista de palabras acuñadas en el español de Puerto Rico —según fueron registradas por las fuentes— para decir algo de la mujer, lo que podría constituir la base de un estudio sobre ideología de género.
Finalmente, la función de búsqueda ortográfica “inversa” permite buscar palabras por su terminación. Esta búsqueda puede servir para hacer rimas (en ese comeivete se come de cachete), pero también para la investigación morfológica, por ejemplo, de diminutivos lexicalizados:
ahorita = en un rato, o hace un rato
bacalaíto = fritura de harina y bacalao
barrito = grano causado por el acné
Próximas etapas
El trabajo de adición de fuentes de Tesoro.pr es continuo. La fuente más reciente es de 2010, por lo que hay que añadir materiales de la última década. Paralelamente, hay que integrar fuentes de tiempos pasados, para empezar a dar mejor cuenta del español de Puerto Rico previo al siglo 20.
Por otro lado, la tercera etapa de Tesoro.pr se visualiza como un tesoro vivo del español de Puerto Rico. Dado el dinamismo de la creación lingüística, el hecho de que la plataforma electrónica nos permita actualizar contenidos casi “a tiempo real”, y la colaboración que facilitan las redes sociales, Tesoro.pr aspira a convertirse en un repositorio continuamente actualizado sobre el léxico usado por los puertorriqueños, debidamente descrito, que se nutra del trabajo de lingüistas y la colaboración del público en general. (No quedará fuera, pues, ninguna novedad reguetonera).
Finalmente, mantenemos la visión de un Tesoro internacional: una plataforma donde puedan coincidir los tesoros lexicográficos de múltiples naciones hispanohablantes, que nos permita completar los paisajes lingüísticos más allá de nuestras fronteras.
El proyecto Tesoro.pr se ha realizado gracias al apoyo de la National Endowment for the Humanities, la Fundación Puertorriqueña de las Humanidades, la Universidad Ana G. Méndez y Ediciones SM.
El proyecto Tesoro.pr también refleja el compromiso de todos los miembros de su equipo de trabajo —lingüistas, programadores y diseñadores—, que aportan al proyecto no solo su conocimiento y trabajo disciplinado, sino también su creatividad, talento y entusiasmo.
(Publicado en Archiletras. Revista de Lengua y Letras, abril/junio 2020, Núm. 7)