Otros corpus – Sociolingüística Andaluza

Corpus oral del español de los migrantes residentes en la ciudad de Sevilla

El corpus incluye 48 entrevistas realizadas a hablantes peruanos, colombianos, nicaragüenses y ecuatorianos, esto es, 12 entrevistas por cada nacionalidad. La selección de los informantes se ha llevado a cabo siguiendo el muestreo no probabilístico accidental y la técnica bola de nieve. Las muestras recopiladas son representativas de todos los sociolectos y sexos. Permitirá obtener resultados sobre las características lingüísticas del español hablado por los migrantes, sobre su acomodación e integración sociolingüística, a la vez que posibilitará la realización de estudios contrastivos, por una parte, con el español de hablantes vernáculos.

HumCor. Corpus Oral Multimodal de Humor en Español

Se trata de un corpus en línea diseñado específicamente para el estudio del humor en español, que contiene textos humorísticos como chistes, monólogos, sketches y ventrílocuos, en dos modalidades principales (visual y auditiva), provenientes de programas de televisión y radio y diferentes soportes como discos de vinilo, de pizarra y cintas de casetes. Este corpus incluye materiales de todas las décadas desde 1900 y abarca un periodo de más de 120 años (1900-actualidad). Además, ofrece una representación amplia y diversa de las variedades del español, tanto de España como de diferentes regiones de Hispanoamérica.

HumText. Corpus de humor escrito

HumText es un corpus en línea diseñado específicamente para el estudio del humor escrito en publicaciones impresas, como periódicos, folletos, revistas, almanaques, libros, fascículos o fanzines. Constituye una base de datos de textos humorísticos —chistes, anécdotas, epigramas, esquelas, obituarios, epitafios, relatos, artículos, crónicas o noticias— provenientes también de diferentes formatos, como viñetas, tiras cómicas, entre otros. El corpus abarca un extenso período histórico, con materiales que datan desde 1495 hasta la actualidad, esto es, más de 500 años de producción humorística escrita. Los textos han sido recopilados a partir de archivos históricos disponible en repositorios y hemerotecas públicas, colecciones personales y plataformas digitales.

HumNet. Corpus de humor digital en español

HumNet es una base de datos creada para estudiar el humor digital en español y comprender cómo nos reímos en internet. Este recurso permite analizar cómo evoluciona el lenguaje, cómo se crean comunidades en torno a la diversión compartida y cómo el humor refleja tendencias sociales, patrones comunicativos y cambios culturales. HumNet reúne diferentes tipos de contenidos humorísticos —memes, desmotivaciones, chistes y posts humorísticos— en distintos formatos, como imágenes, GIFs, vídeos o textos, procedentes de redes sociales y plataformas de vídeos como X (Twitter), Instagram, Facebook, Reddit, Tumblr, Bluesky o YouTube. El corpus abarca un periodo de más de 25 años e incluye materiales sobre el humor digital de España e Hispanoamérica, desde el año 2000 hasta la actualidad.