Jorge Lázaro. Lingüista.

I hold a PhD in Linguistic Communication from Universitat Pompeu Fabra (2015) and serve as Editor-in-Chief of Debate Terminológico and executive committee member of RITerm. I recently led the AI department at Customs City Global Services, Canada (2023-2025), and have authored over 40 publications focusing on terminology, computational linguistics, and Spanish lexicon studies.

Jorge Lázaro Hernández

Designed with WordPress

Últimas publicaciones

Latest publications

Engrirse con el lenguaje. Andanzas y avatares de un pionero de la lingüística del noroeste: José Everardo Mendoza

2025 Ed. Universidad Autónoma de Sinaloa


En la presente obra, el lector encontrará un homenaje a la memoria de José Everardo Mendoza Guerrero, pionero en la dignificación del español de Sinaloa como variante dialectal legítima. El volumen se divide en dos apartados: el primero, «Engrirse con el lenguaje», incluye textos relacionados directamente con el trabajo de Mendoza, desde análisis de su perspectiva social y lexicológica del habla de Sinaloa hasta el contraste con el noroeste mexicano; el segundo, «Entre los guégueres de la lengua», aborda las líneas de investigación que alimentó a lo largo de su vida, incluyendo cuestiones sociolingüísticas y corpus lingüísticos. Se trata de una obra colectiva que reúne a amigos, alumnos e investigadores que colaboraron con este académico que durante treinta años consolidó el interés por el español del noroeste mexicano, dejando un legado imperecedero de datos y exposiciones para su conocimiento.

Information Retrieval Techniques for Question Answering based on Pre-Trained Language Models

2024. En Research in Computing Science 152(12).


This paper presents a comparative study between two prominent pre-trained language models, RoBERTa and GPT-3, focused on their performance in Question Answering (QA). Broker exams serve as a rigorous evaluation guide, with which we examine the effectiveness of these models in understanding complex questions based on newly presented information in the form of the 19 Code of Federal Regulations of the United States (19 CFR). Our findings reveal insights into the strengths and limitations of each model, shedding light on their suitability for specific QA applications in the finance and legal domain. RoBERTa offers a fast implementation of a QA model yet it struggles processing complex questions, whereas GPT-3 is able to answer efficiently a wide range of reason based questions.

Jorge Adrián Lázaro Hernández
Jorge Lázaro Hernández

Los corpus como fuente de datos lexicográficos

2024. En The Routledge Handbook of Spanish Lexicography

«En el presente apartado el lector encontrará cómo es que estos materiales debidamente recopilados y explotados dan pie a las diferentes categorías de datos que conforman un diccionario: la manera en que se extraen los lemarios, las diferentes técnicas de obtención de definiciones, la utilidad en la confección de diccionarios bilingües y multilingües, el desarrollo de técnicas para obtener ejemplos y diferentes trabajos orientados a procesar, también, datos metalexicográficos que los nuevos diccionarios exigen para adaptarse a la realidad digital que ahora nos rodea y en la que vivimos día con día.»

Forma y función del ejemplo en terminología

2022. Ed. Universidad Autónoma de Baja California

«Me alegra que este trabajo, que ya ha sido distribuido en varios artículos de revista, vea hoy la luz en su totalidad. Si se lee con atención se encuentran muchas pistas de investigación que pueden suponer caminos nuevos para la terminología teórica y también aplicada a la producción de nuevos tipos de diccionario.»
M. Teresa Cabré

Jorge Adrián Lázaro Hernández
Jorge Lazaro Hernandez

Obtención del léxico para un diccionario incluyente en el área de sexualidad

2021. En Entrepalavras. Año 11 Vol. 11 N. especial

Este artículo presenta la reconfiguración del Corpus de las Sexualidades en México y la metodología para la obtención del léxico que conformará el lemario del diccionario, ya que anteriormente sólo se contaba con textos especializados y semiespecializados. Después del procesamiento computacional de léxico, se discuten las ventajas y las aportaciones de incluir un mayor número de registros lingüísticos en trabajos de corte social y terminológico como este, lo que da pie a un diccionario incluyente.

La metaforización en el aprendizaje de lenguas. El papel de la cultura en la competencia metafórica

2021. En Revista Lengua y Cultura. Vol. 3 Núm. 5

Esta investigación con enfoque cualitativo y con alcance descriptivo muestra resultados que sustentan la hipótesis de que existen elementos socioculturales en la L1 que generan, o inhiben, la interferencia lingüística, y se evidencian en el desarrollo de la competencia metafórica en L2.

jorge adrian lazaro hernandez
Jorge Adrian Lazaro Hernandez

Mecanismos para la representación del ambiente del narco sinaloense en cinco novelas. Estudio estilístico-léxico

2021. En Humanidades digitales 4: Corpus y literatura en México. Ester Bautista; Ignacio Rodríguez (eds.). Ed. Bonilla-Artiga Eds.

En el presente trabajo se busca analizar la manera en la que se utiliza el dialecto sinaloense en tres obras destacadas acerca del narcotráfico ubicadas en el estado de Sinaloa: La reina del sur (2002), de Arturo Pérez-Reverte, El amante de Janis Joplin (2001), de Élmer Mendoza, y El Sinaloa (2012), de Guillermo Rubio. Para contrastar con el lenguaje de la novela negra y el léxico asociado a este tipo de relatos hemos incluido La vida misma, de Paco Ignacio Taibo (1987). El Cartel (2015) de Don Winslow, nos ha servido para ver el ámbito de la literatura impregnada de elementos léxicos propios del narcolenguaje, pero en otra lengua de producción.

Costa Rica Central Valley Gastronomic Lexicon Structuring From An Ontological Arrangement

2020. En Fórum Linguístico. v. 17 n. 3 (2020): A Terminologia, A Lexicografia e suas Interfaces

This study intends to play with the «disagreement» between speakers and specialists to show that a reorganization of the terms of an area is possible. For this, a corpus of 596 recipes and 4652 ingredients for ontological representation was compiled. Each ontological class was defined by means of its functionality in the recipes. The ontological architecture is formalized through the postulates of Basic Formal Ontology (SMITH, 2014) and is schematized by means of Protege. In addition, the terminological theories of Cabre (1999), Fedor de Diego (1995) and Roche (2007, 2009) are used.

Jorge Lázaro
Jorge Adrián Lázaro Hernández

Estudios sobre léxico del español de México basados en corpus

2020. Ed. Fontamara

En la presente obra, el lector encontrará una variedad de textos que versan sobre la manera de hablar en México a partir de diferentes tópicos tan disímiles como los salones de baile, los panes, los regionalismos, el derecho penal, el narcotráfico y hasta los albures. Todos estos estudios tienen la característica de haberse basado en corpus lingüísticos; colecciones de datos fidedignos obtenidos desde documentos oficiales hasta entrevistas a pie. Se trata de una obra multidisciplinaria que reúne a los estudiosos del español de México desde una perspectiva contemporánea, y que tiene como fin la divulgación, por medio de un lenguaje accesible a todo público, pero no por ello sin rigor académico.