Enlaces

Transcripción

Bienvenidos y bienvenidas a una nueva entrega de Palabras binarias: Informática para lingüistas. Recordad que aquí podéis estar informados sobre cuestiones relacionadas con la lingüística de corpus, la lingüística computacional, la inteligencia artificial y la informática en general. En nuestro último vídeo hablamos con Victoria Vázquez sobre el corpus ESLORA, el corpus para el estudio del español oral. Lo que vamos a hacer en este vídeo es una demostración del sistema de búsquedas de ese corpus para ver las búsquedas más típicas que se pueden hacer en un corpus de ese tipo. Vamos a verlo.

Bien, vamos entonces a jugar un poco con la aplicación de búsquedas del corpus ESLORA, haciendo algunas consultas que pueden ser interesantes. La aplicación está en la dirección eslora.usc.es, ¿vale? https o http. Y para ir a la zona de búsquedas, tenéis que pinchar aquí en búsquedas. Veis aquí el formulario de búsquedas. En este formulario podéis ver 5 zonas. La zona de búsqueda, la zona de resultado, la zona de sensibilidad, la de filtros y finalmente aquí la de palabras ortográficas que a veces cambia cuando hacemos búsquedas de elementos gramaticales. Lo comentaremos en un momentito.

Veis que en búsqueda tenemos el subcorpus en el que podemos buscar, el de conversaciones o el de entrevistas o cualquiera. Nosotros esto no lo vamos a tocar. En los ejemplos que vamos a hacer no vamos a elegir un subcorpus. El tipo de búsqueda que queremos hacer, si son palabras ortográficas o elementos gramaticales.

Os recuerdo que tenemos un vídeo en palabrasbinarias.com, el número 5, donde explicamos la diferencia entre palabras ortográficas y elementos gramaticales en el contexto de este tipo de sistemas de búsqueda. Luego haré un pequeño ejemplito para que lo entendáis. A grandes rasgos la palabra "dárselo", por ejemplo, es una palabra ortográfica, pero en realidad son tres elementos elementos gramaticales. Es el verbo "dar", el pronombre "se" y el pronombre "lo". Esto es un resumen rápido. Si queréis más detalles sobre esto, ya os digo, el vídeo número 5, donde hablamos de palabras ortográficas y elementos gramaticales, lo explicamos con un poco más de detalle.

Podemos hacer búsquedas por palabras ortográficas o elementos gramaticales y luego en los dos primeros sistemas de búsqueda puedes buscar secuencias de palabras ortográficas o elementos gramaticales que están uno a continuación del otro. Los elementos gramaticales o las palabras ortográficas, pero si queremos que pueda haber distancia entre ellas, pues están los otros elementos. Palabras ortográficas próximas y elementos gramaticales próximos. Creo que tengo un ejemplito pequeño preparado con una de estas dos.

Tipo de resultado, pues frecuencia simple, que es el número de veces que aparece en nuestra búsqueda, la frecuencia completa. Lo vamos a ver, vamos a verlo en los ejemplos. La frecuencia completa que desglosa estas coincidencias en cada uno de los metadatos que considera la aplicación. Lo vamos a ver también. Las concordancias, que es la búsqueda, la coincidencia en el contexto. La palabra... keyword in context es concordancias del inglés, la palabra clave que coincide en su contexto. Los inventarios, que lo vamos a ver mejor en un ejemplo que podemos hacer y las intervenciones, que este este punto no lo vamos a tratar aquí, lo vamos a tratar en una sesión posterior con María Sampedro, que es la ideóloga de esta funcionalidad y lo vamos a hablar con ella.

Veremos sobre todo los cuatro primeros tipos de resultado. Aquí hay criterios de ordenación, el tamaño de páginas de resultados y luego los filtros de alto nivel que llamamos, que son los valores de los metadatos que considera el corpus. Tenemos el rango de edad, si queremos filtrar más para una edad concreta podemos especificarlo ahí, el papel que desempeña en la entrevista, el nivel de estudios, universitarios, medios y primarios, el género de la persona, hombre o mujer y también se puede llegar a filtrar por hablantes, hablantes concretos que están codificados y también hay una parte de que se puede limitar las búsquedas a ciertos fragmentos que están marcados con algún tipo de información oral y esta parte también la vamos a ver con María.

Vamos entonces a empezar con la palabra "rollo" que comentaba Victoria en la entrevista que hemos hecho con ella y, simplemente, una búsqueda simple de palabra ortográfica. Aunque el resultado por defecto que hay es concordancias, y tiene su sentido que eso sea así, lo comentaremos después, vamos a ir viendo primero el resultado de frecuencia simple, sin más. Veis que aparecen 181 resultados de 754.689. 181 es el número de veces que aparece la palabra rollo en todo el corpus y 754.689 es el número de palabras del corpus. Fijaos que luego aquí aparece lo que se llama la frecuencia relativa, que quiere decir que el corpus tiene 754.000 palabras buscables, pero si tuviera un millón de palabras, lo que dice aquí 240 por millón es, si el corpus tuviera un millón de palabras aparecería 240 veces. Entonces esta es la frecuencia relativa. ¿Qué es este 754.000? Si, por ejemplo, yo le digo aquí que me devuelva solo los casos del rango de edad 19-34, veis que cambia el número de coincidencias, ahora hay menos, hay 116, pero que también cambia el referente 287.000. ¿Por qué? ¿Qué es este 287.000? Es el número de palabras que hay en ESLORA asociados a hablantes con un rango de edad entre 19 y 34 años. Veis que también la frecuencia relativa cambia. Si queréis saber más sobre frecuencia absoluta y frecuencia relativa recordad que tenemos en palabrasbinarias.com, en la sección de talleres hay un taller que se llama taller de conceptos estadísticos aplicados a la lingüística de corpus. Es un taller introductorio de dos horas cuarenta minutos aproximadamente, no es muy extenso, donde, entre otras cosas, explicamos bien esto de la frecuencia absoluta, frecuencia relativa y alguna otra cosa más que os comentaré dentro de un momentito.

Bien, vamos a dejarlo como estaba, vamos a poner aquí "cualquiera". Ahora nos vamos a la frecuencia completa. La frecuencia completa es igual que la frecuencia simple, pero los datos aparecen desglosados por cada uno de los metadatos que hay asociados a los hablantes del corpus ESLORA. Por ejemplo, aquí vemos que hay, bueno, en realidad en ESLORA no hay textos, casi no hay texto de hablantes de menores de 19 años, de acuerdo, es alguna audiencia fortuita que ha aparecido en alguna conversación o en alguna entrevista, pero en realidad los rangos de años que se suelen manejar en ESLORA son estos tres, 19-34, 35-54 y mayores de 54.

Bien, pues vemos los valores desglosados, vemos que hay 116, los que salían antes cuando poníamos el filtro, 116 casos entre 19 y 34 años, 29 casos entre 35 y 54 y 36 en mayores de 54. Aunque es útil ver el número de casos, podemos luego ver los ejemplos o lo que sea, más interesante si cabe que la frecuencia absoluta es la frecuencia relativa, podemos ver aquí que entre 19-34 años hay 404 casos por millón, en 35-54 hay 126 por millón y en mayores de 54 hay 152 por millón. Veis que creo que es a lo que se refería Victoria en la entrevista, veis que en la zona de 19-34 hay muchos más casos, hay una ocurrencia de la palabra "rollo" en muchos más casos entre la gente joven más que en la gente no tan joven. Podemos ver aquí en entrevistador/informante, veis que una proporción mucho más alta la hay más entre los informantes que en los entrevistadores, quizás los entrevistadores están un poco con la alerta y son más cuidadosos con el vocabulario que están utilizando, no lo sé, estudios universitarios medios y primarios, fijaos que aquí hay una frecuencia más alta en las personas con estudios universitarios y entre conversaciones y entrevistas, fijaos igual en la línea de lo que estaba diciendo antes, se usa mucho más la palabra "rollo" en conversaciones que en entrevistas. Veis que aunque la frecuencia absoluta es menor aquí en conversaciones, hay 49 casos y en entrevistas hay 132, en cambio la frecuencia relativa es mucho mayor en conversaciones porque el subcorpus de conversaciones es mucho más pequeño. Al ser también bastante pequeño hay que tener un poco de cuidado al manejar estas cifras.

Se pueden ver ahí tendencias del uso de la palabra "rollo", bien por estudios, bien por edad, bien por el tipo de conversación o entrevista que se está teniendo. Aquí al ver la frecuencia normalizada podemos llegar a ver que es más frecuente en este corpus, es más frecuente una opción que otra, pero para llegar a la conclusión de que un fenómeno es más frecuente en un cierto tipo de población que en otro, aparte de que habría que comparar también con otros corpus para tener información diversificada, también sería necesario aplicar algún criterio o algún método de significancia estadística, como puede ser el ji-cuadrado que es de los más sencillos que se pueden calcular, que también explicamos un poco cómo usar el ji-cuadrado en estos contextos en ese taller de conceptos estadísticos aplicados a la lingüística de corpus, por si queréis cursarlo. Es un taller pequeñito introductorio, pero que tiene cositas interesantes que os pueden ayudar a concluir mejor o a interpretar mejor los resultados que vemos ahí, porque puede ser que una frecuencia relativa sea más grande que otra, pero que luego veamos que estadísticamente eso no... podría haber sido fruto de la casualidad. Es un poco lo que hace el ji-cuadrado, determinar si los datos que vemos ahí son productos de la casualidad o si realmente hay una diferencia en ellos. Cuando vemos un valor tan grande de diferencia, como puede ser aquí 404 por millón o incluso aquí que es el doble, es muy probable que el cálculo del ji-cuadrado nos refrende que hay alguna diferencia, que efectivamente. la palabra "rollo" se utiliza más en conversaciones espontáneas que en entrevistas, y que probablemente la gente joven emplee más esas palabras que la gente no tan joven. Es también lo que nos dice la lógica.

Aparte de esto, podemos ir ahora, y siempre es recomendable cuando estamos haciendo una búsqueda de este tipo, ir a las concordancias. No vaya a ser que el sistema esté haciendo algo raro o que las búsquedas estén obteniendo valores que no son los que... En este caso es una búsqueda muy sencillita que es la palabra "rollo". Pero cuando hay una búsqueda un poco más compleja, a lo mejor no estamos buscando lo que queremos. ¿Cómo sabemos si estamos buscando lo que queremos? Si en las concordancias obtenemos fenómenos de los que estamos buscando. Podéis ver ahí los casos de "rollo": "era un rollo", "buen rollo", "no sé era rollo", "y yo ya rollo". Lo tenéis ahí. Vamos a ir a ver el ejemplo número 15. Veis que aquí hay un triangulito. Podemos escuchar al hablante decir la palabra "rollo". Vamos a ponerla para escuchar ¿Qué es lo que dicen? "pero mientras tengo pocas clases podías venir, ¿no? en plan buen rollo". ¿Veis? Aquí se puede escuchar y si pincháis en el numerito también podéis ver más contexto de la conversación. Veis un poco las intervenciones anteriores y posteriores. Podéis ver aquí y podéis ir dándole al play a las anteriores y posteriores, e incluso podéis expandir más el contexto. Bien, esto sobre la palabra "rollo".

Vamos a volver. Bueno, vamos a limpiar directamente el formulario. Lo que os decía antes de palabras ortográficas y elementos gramaticales, como normalmente las búsquedas más útiles son sobre elementos gramaticales, tengo aquí un ejemplo un poco chorras, pero para que veáis, cuando vais a buscar elementos gramaticales, hay que saber qué es lo que hay debajo. Por ejemplo, tenemos la palabra "decírselo". Tenemos ahí, buscamos "decírselo" y vemos que hay ocho casos de "decírselo". Ahora vamos a hacer una búsqueda de elementos gramaticales y voy a buscar "decírselo". Le damos a buscar y no sale nada. ¿Por qué no sale nada? Lo explicamos antes. Lo que en las palabras ortográficas es una palabra, es "decírselo", en elementos gramaticales son tres elementos gramaticales, "decir", "se" y "lo". Entonces lo que habría que buscar es "decir" seguido de, al darle al más, cuando estamos en elementos gramaticales, aquí al darle al más, es seguido de. "Decir", "se" y "lo". Aquí están los ejemplos de antes, ¿de acuerdo? Lo que en palabras ortográficas es una palabra ortográfica son tres elementos gramaticales. Si vamos a buscar la palabra ortográfica y esa palabra ortográfica tiene varios elementos gramaticales, no va a aparecer. Tendríamos que buscar los elementos gramaticales individualmente, ¿vale?

Entonces vamos a hacer un ejemplo de búsqueda de elementos gramaticales y vamos a empezar por uno muy típico del español de Galicia, que es el empleo de la estructura ir + infinitivo. Por influencia del gallego, pues hay, cuando hablamos español, muchos gallegos, no es raro que digamos voy comer un bocadillo, en vez de voy a comer un bocadillo, por ir ver una pelicula haría lo que fuera, en vez de por ir a ver una película, o íbamos comer allí todas las tardes, íbamos a comer allí todas las tardes. Como la estructura sintáctica de ese tipo en gallego no lleva el "a", pues cuando hablamos castellano, muchas veces se nos, bueno, lo pronunciamos así, utilizamos esa estructura. Vale, vamos a ver si hay casos entonces en ESLORA. Vamos a hacer una búsqueda por elementos gramaticales y queremos buscar "ir" + infinitivo. ¿Qué pasa? Que son, como visteis en los ejemplos, puede ser cualquier forma del verbo "ir", no es el "ir" en infinitivo. "Voy comer", "iba ir", lo que fuera. Vale, entonces lo que vamos a hacer es buscar el lema "ir", para que nos busque todas las variantes del verbo "ir". "Ir" seguido de infinitivo. Infinitivo es la etiqueta, la etiqueta morfosintáctica, le vamos a decir aquí, verbo y modo infinitivo. Ahí está. Vale, fijaos que cuando yo pongo aquí la etiqueta, al pinchar aquí en el interrogante, veis el código de la etiqueta que realmente se está usando en la aplicación. Esto no lo vamos a usar ahora, pero lo vamos a usar después en otro ejemplo. VNP sería la etiqueta que está poniendo ahí. O sea que si yo escribo aquí VNP sería lo mismo que haber hecho que esto que acabamos de hacer con el menú más amigable.

Bueno, le damos a buscar, nos está yendo a concordancias. "Que fuéramos jugar al fútbol", "que fueron acompañar al hermano", "no fuese pasar". A ver, vamos a buscar alguno así más... "Ibas a salir el sábado", en vez de "ibas a salir el sábado", "iban hacer", etcétera. Veis que hay un montón de casos. Ojo, hay también cosas que no son las que estamos buscando. Como puede ser este "ir, ir, ella sola". Esto es que ha habido una repetición. Está el verbo "ir" y el verbo "ir", pero es una repetición de la persona. Aquí hay "ir, ir", "ir, ir". Pero veis que la mayoría sí encajan. "Ir jugar", "sí podía ir jugar al fútbol", "ir lavar al río"... Veis que hay bastantes casos. Hay 112 casos de la estructura "ir" más infinitivo.

Podemos ir aquí a la frecuencia completa. Nos salen aquí los casos. Podemos intentar ver si hay algún patrón por aquí. Fijaos, 195, 137 y 112 por millón. No veo aquí grandes diferencias como se veía en el caso anterior. Aquí, bueno, sí, entrevistador, informante, audiencia, pues sí que lo usa más la audiencia. Pero bueno, hay que tener cuidado con esto porque es un resultado. Recordad que audiencia es personas, que aparecen a veces en una entrevista de manera espontánea, que no son el objeto de la entrevista. Entonces, tened cuidado con esto porque sólo es un ejemplo el que sale aquí. Hay 110 en informante y uno aquí. Sí, nos da una frecuencia por millón muy elevada, pero sabemos que es testimonial lo que pasa ahí. No podemos fiarnos de este valor. 189 frente a 126, 132, 161, 178 y aquí 259 por 132. Aquí igual habría algo que investigar. Si también en un entorno de conversación espontánea esas fórmulas se utilizan más que cuando hay una entrevista, que a lo mejor controlamos un poco más el tipo de expresión que decimos, etcétera, sería algo a investigar.

Bien, y tenemos la concordancia, que es donde estábamos antes. También, bueno, si no me creéis de que decimos esto, podéis darle al play. Vamos a darle aquí al caso número 21. "Sí, sí, cada fin de mes hacemos cuentas. Y, nada, voy comer a casa, prefiero ir comer a casa. Tengo la posibilidad de comer aquí en el colegio, pero prefiero ir a... prefiero ir a casa, aunque no tenga mucho tiempo, porque a las cuatro tengo que estar aquí". Veis que lo dice varias veces: "voy comer a casa", "prefiero ir comer a casa". Veis que aparecen, ¿no?, no me lo estoy inventando, ni el sistema se lo está inventando.

Bien, entonces, ahora vamos a ver la parte de inventarios. Esta misma búsqueda, en las concordancias las vemos todas, pero ¿cómo podemos hacer para saber, por ejemplo, si es más habitual con un tipo de verbo? ¿Depende del verbo que hay después del "ir"?. O sea, ¿se utiliza solo con algunos verbos después del "ir" o se utiliza con cualquier verbo después de "ir"? ¿Qué verbos aparecen más frecuentes en esta estructura de "ir" + infinitivo? Pues eso lo podemos hacer con los inventarios. Si repetimos la búsqueda en inventarios, fijaos, nos salen aquí. "Voy ir", "ir ver", "ir ir", "voy pasar", "voy poner", "iba trabajar". Veis que "voy ir" aparece cinco veces. ¿Qué pasa aquí? Que está cogiendo. Fijaos que aquí, cuando vas a inventarios, aparece un nuevo campo que es agrupar, que es cómo queremos que se agrupen los casos. Aquí se están agrupando por elemento gramatical, pero fijaos que "voy ir", "ir ir" o, a ver, esperad que busco aquí uno, "ir comer", por ejemplo, "ir comer" y hay otro aquí abajo que es "iba comer". Veis, "ir comer" e "iba comer".

Como estamos agrupando por la forma concreta del elemento gramatical, pues los está desglosando, pero sería muy interesante poder tener el resultado agrupado por el lema, de tal manera que "voy comer" y "ir comer" se agruparan dentro de ir a comer, que estuvieran sumadas todas ahí. ¿Cómo podemos hacer eso? Pues aquí en la agrupación, en lugar de elemento gramatical, vamos a agrupar por lema y al agrupar por lema, fijaos, en "ir comer" ya están sumadas las de un lado con las del otro. Entonces tenemos "ir ir", acordaos que aquí hay algunas que son erróneas. Está "voy ir", "ir ir" y "va ir". Fijaos que al darle allí, lo voy a hacer otra vez, aquí si le doy ahora a los lemas, al pinchar aquí, me dice qué elementos gramaticales hay incluidos dentro de esos lemas. Está la fórmula "voy ir", la fórmula "ir ir" y "va ir". Estos de aquí, estos tres sabemos que no son casos correctos. Aún así, pues bueno, podemos ver que con "ir", aunque saquemos tres, quedaría nueve, ocho, siete, seis. Quedaría seis. Con "ir", con "ver", con "hacer", con "comer", con "trabajar", aparecen mucho más, bueno, mucho más. Aparecen más veces que pues con "ayudar", con "ser", con "cerrar", que aparece una vez. Puede ser por el contexto de, bueno, porque además suelen ser verbos más frecuentes o podría haber alguna otra explicación que se nos escape, ¿vale?, es un objeto interesante de estudio.

Vale, bueno, hemos visto ya un ejemplo de búsqueda de elementos gramaticales. Vais viendo un poco el potencial de la herramienta. Vamos a hacer otro ejemplo ahora, también con elementos gramaticales, pero vamos a intentar usar comodines y operadores booleanos que también tiene la aplicación. Vamos a, por ejemplo, a ver, palabras con el prefijo "super", ¿vale? ¿Qué podemos hacer con las palabras con el prefijo "super"? Vamos a ver qué palabras hay con el prefijo "super". Entonces, podemos buscar en palabras ortográficas las palabras que empiezan por "super". Las palabras que empiezan por "super" es "super" asterisco. Ese asterisco dice que puede venir después de "super" lo que sea. Si le damos a buscar en concordancias, fijaos que "supera" no es una palabra con prefijo "super", es una palabra que empieza por "super". Sí que hay algunas ahí como "superarregladas", "superbien", hay, bueno, bastantes, pero hay otras que no, como "supera", "superábamos", etcétera. Por eso se utilizan más las búsquedas de elementos gramaticales, porque podemos afinar esto un poquito más. ¿Cómo lo podemos afinar? Pues podemos afinarlo poniendo búsqueda de elementos gramaticales, vamos a ver, aquí, y le vamos a decir que queremos que aparezca "super", perdón, "super" asterisco, pero, por ejemplo, que me limite las búsquedas a adjetivos. Vamos a buscar y ahí pues vemos "superabierta", "superagobiante", "superagradable", ¿vale?, veis que "supercaro", que, bueno, el resultado es más lo que buscamos, pero, bueno, ¿solo los adjetivos tienen prefijo "super"? No, bueno, también los adverbios. Vale, vamos a cambiar aquí adjetivo por adverbio. Buscar, pues también tenemos aquí "superpronto", "superguay", "superbien".

Vale, con el menú amigable solo podemos poner una categoría ahí. Si vemos un poquito mejor cómo está estructurado el corpus, tenéis en la guía unos documentos estupendos en los que, bueno, os describe todo el sistema, hay una parte de las etiquetas morfosintácticas, hay otra donde describen más ejemplos de los que estamos viendo aquí. Tenéis ejemplos de este tipo también en la guía. Si lo veis allí un poquito, os daréis cuenta de que, bueno, en etiqueta hasta ahora usamos el menú amigable. Si yo ahora quiero aquí que ponga adjetivo o adverbio, que los trate conjuntamente, tengo que cubrir algo en etiqueta. Podemos verlo aquí en el interrogante. La etiqueta W es la etiqueta adverbio. Si yo le digo que me ponga la de adjetivo, fijaos que ahí me dice 12 etiquetas seleccionadas. Veis que, bueno, empiezan por A y luego hay 12 etiquetas diferentes que empiezan por A. Bueno, de aquí podéis deducir algo del estilo que yo no quiero eso, yo lo que quiero es W o A asterisco. Fijaos que me da 13, las 12 del adjetivo y la del adverbio. ¿Qué puse aquí? Una barra vertical. Ese "o" que dije es una barra vertical. La barra vertical es un "o" que se puede usar tanto en el elemento gramatical como en la etiqueta o el lema. Quiero que me busques las palabras que empiezan por "super", que además sean o adverbios o adjetivos.

Si le damos aquí, pues deberían salirnos. Tenéis ahí "superagobiada", "superancho", "superbonita", "superchunga", "superguay". Vamos a ver en la segunda página. Fijaos, en la segunda página aparece "superior", que es un adjetivo que empieza por "super", pero no estamos interesados. ¿Podríamos eliminar del resultado eso? Pues sí, le podríamos decir aquí. Si le ponemos admiración, admiración es "not". Es el operador "not". Le decimos que sean las palabras con prefijos, o sea que empiezan por "super", pero que no sea "superior". Por si aparece "superior" o algo así, le voy a poner también asterisco. ¿De acuerdo? Entonces, esto nos debería eliminar "superior" de ahí. Vamos a verlo. "superguay", segunda página, "superinteresante", "superior". Salía aquí después. Ya no sale. Entonces la admiración es el "not", la barra vertical, el "or". Podemos decir esto o lo otro, o esto y no, pero no lo otro. Se podría poner aquí más "not" a continuación. ¿De acuerdo? Bueno, vamos a echar un ojo también aquí. Más que nada, por curiosidad, vamos a poner aquí en frecuencia completa, palabras con prefijo "super", frecuencia completa. Fijaos, aquí podemos ver que la franja ahora, perdón, la franja de edad en la que más se utiliza, hay bastante diferencia con respecto al resto, es del 19 al 34. Las personas más jóvenes, que bueno, puede tener sentido. Los informantes más que los entrevistadores y también en las conversaciones más que en las entrevistas. También puede llegar a ser interesante.

Bien, vamos a ver entonces ahora otro ejemplo y vamos a ver, a trabajar con el sufijo, el uso del sufijo "ísimo", "ísima", "ísimos", "ísimas". ¿Cómo podemos buscar aquí? Vamos a trabajar con elementos gramaticales y vamos a ver cómo podemos buscar las palabras o las formas, en este caso, que acaban en "ísimo", "ísima", "ísimos", "ísimas", ¿vale? Entonces podemos ver, podemos hacer uso de los comodines otra vez, el asterisco ahora lo ponemos al principio, entonces podemos poner asterisco "ísimo", pero nosotros queremos "ísimo", "ísima"... "ísimos", "ísimas" lo podemos hacer con un interrogante, el interrogante es una letra cualquiera, vale, "ísimo", "ísima", "ísime", si existiera, "ísimi", lo que fuera. Vale, entonces con esto tenemos "ísimo" e "ísima", pero podemos decirle también que nos coja "ísim", "ísim", interrogante "s", vale, de esta manera, con esta expresión, tenemos "ísimo", "ísima", "ísimos" e "ísimas", ¿de acuerdo?

Bien, pues si le damos a buscar, vemos ahí pues "abriguísimo", "aburridísimo", "adelantadísimo", "agobiadísimo", "altísima", vale, podemos ceñirlo, bueno, ese "abriguísimo", es un sustantivo, el resto son adjetivos, "borrachísima", podemos, digamos, delimitar la búsqueda a adjetivos también si queremos, ¿vale?, aquí tenemos los ejemplos, también podemos ver los inventarios para ver qué formas en "ísimo" se están usando, vamos a dejar agrupación por elemento gramatical, "buenísimo", "buenísima", "carísimo", "riquísimo", "buenísimos", tenemos aquí pues las que más se utilizan y podríamos comparar esto con la forma "muy" adjetivo, ¿sí?, podemos comparar el uso, podríamos comparar el uso de las formas en "ísimo", "ísima" con el uso de las formas en "muy" + adjetivo, ¿cómo podemos buscar aquí? En este caso tendríamos que hacer dos búsquedas separadas, primero en "ísimo", esto lo podríamos descargar, lo podéis descargar en CSV o en Excel y luego cargarlo en el Excel o lo que sea, le dais aquí pues podéis descargar la página o descargar todo el resultado, y por otro lado pues podemos buscar "muy", "muy" + adjetivo, por ejemplo, "muy abierta", "muy activo", "muy adecuado", etcétera, podemos ir aquí también a los inventarios etcétera, podemos descargar este resultado y compararlo.

También lo podríamos... en el de "ísimo", voy a volver a hacer el de "ísimo" en la frecuencia completa, elementos gramaticales, vamos a buscar "ísimo", "ísima", "ísimos" e "ísimas", y le decimos adjetivos. Primero voy a las concordancias, voy a las concordancias para confirmar que lo que estoy buscando es lo que quiero buscar, fijaos me ha dicho que no, o sea que he escrito algo mal, a ver lo voy a escribir otra vez que no veo bien aquí, ah me falta el asterisco, claro, me falta el asterisco, palabras que empiezan por cualquier cosa y continúan con "ísimo", "ísimas", ahora que veo que me da bien el resultado voy a la frecuencia completa y podemos echar un ojo allí también, aquí no veo grandes diferencias en la frecuencia en la frecuencia relativa, lo siguen diciendo más los informantes que los entrevistados, aquí, bueno, hombre mujer no sé si hay bastante diferencia y bastantes casos en ambos casos, no sé si... estaría bien aplicar aquí algún estadístico que nos diga si esto es estadísticamente significativo, si, por ejemplo, las mujeres tienden a utilizar más las formas en "ísimo" que los hombres, estaría bien para investigarlo.

Aquí, bueno, aquí también pasa algo raro, bueno algo raro, se ve que en los universitarios parece que lo dicen más, que los que tienen estudios medios sobre todo y en los primarios pues también hay un repunte, estaría bien ver si esto es estadísticamente significativo o no y aquí fijaos también en conversaciones pues mucho más que en entrevistas. Hemos visto en los ejemplos que apunta a que, bueno, en las entrevistas, como es lógico también, a lo mejor la gente, las personas que se entrevistan, aunque es una entrevista bastante informal de temas bastante informales, igual la gente controla un poco más el vocabulario que si hay una conversación de varias personas sobre cualquier tema, eso es lo que a lo que apuntan las cosas que estamos viendo, algunos de estos ejemplos.

Bien y, bueno, un último ejemplo que podemos ver sería, por ejemplo, ver el verbo "quedar" + preposición, vamos a ver el uso del verbo, qué usos hay del verbo "quedar" + preposición, elementos gramaticales, "quedar" en lema, para que me coja cualquier forma del verbo "quedar", "quedar" + y aquí preposición pues aquí tenemos "queda como", "quedar como", "queda como Barcelona", "quedar con", "queda con", "queda de", "queda dentro de", "queda en", "queda entre", etcétera, ¿vale?, vale, lo que decíamos antes, en las concordancias vemos los ejemplos pero vamos a las, vamos a los inventarios, vale aquí tenemos quedar con, aquí sí que vuelve a ser interesante para que nos agrupe todo esto, "quedó con", "quedar con", "quedo con", "queda en", para que nos agrupe los mismos elementos por lema, vamos a ponerle aquí agrupación por lema porque yo creo que va a ser más interesante lo que vamos a ver ahí porque bueno veis que sólo hay 12 resultados, hay mucha variabilidad y 71 casos de "quedar con", 68 de "quedar en", "quedar a", "quedar sin", "quedar de", "quedar por", "quedar para", "quedar hasta", "quedar como", "quedar entre", "quedar dentro de" y "quedar en vez de". ¿Veis?, aquí en los inventarios sí que se obtienen cosas interesantes.

Aquí en estos parámetros que tenéis aquí cuando vais al inventario podéis desglosar por ejemplo, grupo de edad, pues podéis desglosar en qué grupo de edad se utiliza más estas... cada una de las expresiones, ¿vale? tenéis el desglose. Puede ser por grupo de edad, o si no queremos grupo de edad, nivel de estudios, por ejemplo, podéis poner todos, ¿eh?, podéis poner también grupo de edad, lo que pasa que cada vez ocupa más, ¿vale?. Bueno, un tema interesante aquí, bueno, aquí aparecen 12 casos, un tema interesante aquí es si a lo mejor aparece... imaginaos que alguien dice "quedar eee con", por ejemplo, y aparece "quedar" y "con" pero hay alguna interjeción en el medio, o una pausa, o una repetición o lo que sea, pues para esos casos resulta interesante los elementos gramaticales próximos, ¿vale?, y aquí lo que vamos a hacer es: ponemos "quedar" en el primer caso y preposición, perdón, en el primer elemento gramatical, y preposición en el segundo. Esta búsqueda es la misma que la de antes, si yo le doy a buscar... porque aquí pone distancia 1, o sea, es quedar y después preposición. Bueno, aquí lo pinta de otra manera, pero es lo mismo. Vamos a ponerle aquí lema, al final es lo mismo, ¿veis?, los mismos 12 casos, pero vamos a ponerle aquí que la distancia sea menor igual que 3, es decir, que el "quedar" y la preposición pueden aparecer a una distancia mayor a uno, no justo a continuación, por lo que sea, bien porque haya algún tipo de estructura sintáctica que puede meter cosas en el medio, bien porque en estructuras propias del habla pues cortamos la narración o el discurso de alguna manera.

Aparece un caso más, que no sé cuál es, "a cargo de", "quedar a cargo de", vamos a ver al anterior, fijaos, el "a cargo de" no estaba, sale uno más, ¿veis?, a ver, esperad que... menor igual que 3. El "a cargo de", "quedar a cargo de", no estaba. Si lo vamos a ver, fijaos, vamos a ver el ejemplo, aquí, nos dice "y quedamos eeh a cargo de", mira, justo el caso que estaba comentando "y quedamos eeh a cargo de", fijaos, pues con elementos gramaticales próximos, al trabajar con la distancia, podemos paliar un poco los efectos de... pues, bueno, o no paliar, simplemente que a veces en la manera de hablar las estructuras no son rígidas en el sentido de, bueno, primero "quedar" y después la preposición. Pueden aparecer cosas en el medio, en este caso es una interjeción, pero a veces hay estructuras que permiten meter sintácticamente, incluso es correcto, meter cosas en el medio, o hacer incisos o lo que sea.

Podríamos jugar también aquí con distancias más grandes, pero a medida que metamos distancias más grandes, tened en cuenta que sería conveniente ir a concordancias porque igual ya son preposiciones que van más bien con cosas que vienen después. Si aquí le metemos una distancia muy grande empieza a haber mucho ruido, ¿vale? tenemos que ir con cuidado con esto. Vamos otra vez a los inventarios y agrupar por lema. Seguro que en siete, bueno, estaba..., es que vine de un resultado... déjame volver hacia atrás. "A cargo de" no, estábamos viendo un ejemplo y entonces había aquí cosas cubiertas. Aquí, estábamos con menor o igual que tres, entonces vamos a ponerle menor o igual que siete ahora. Buscar. Bueno, veis que aparecen más cosas, "quedar cara", por ejemplo, vamos a ver este ejemplo, bueno, lo podemos ver ya desde allí directamente, "quedar cara", "ya que te quedaba con esa cara y ya estaba", bueno, aquí no sé por qué esto está como preposición, recordad que el ESLORA está etiquetado automáticamente y a veces comete algunos errores de etiquetación, por eso también conviene ver las concordancias, pero bueno, en cualquier caso, aunque esto fuera una preposición, veis que ya tiene que ver con la estructura siguiente, entonces, bueno, hay que tener cuidado cuando jugamos con las distancias de no pasarnos, porque sino vamos a meter mucho ruido en los resultados, ¿vale?

Bueno, yo creo que con esto queda más o menos visto lo más importante de la aplicación, vamos a ver con María, en un próximo vídeo, o próximamente, con María Sampedro, vamos a ver el tema de las intervenciones, ¿vale?, este marcado que se ha hecho y creo que más o menos le hemos dado un repaso a la aplicación. Tenéis en la guía cosas muy interesantes, ¿vale?, tenéis en la descripción general hay algunos ejemplos de este tipo que os acabo de contar, ¿vale?, tenéis ahí más ejemplos, si queréis aprender a manejar bien la aplicación, en las novedades de las versiones 2 también se hablan de los operadores booleanos y los inventarios y, bueno, tenéis ahí también la parte del etiquetario morfosintáctico, por si queréis, bueno, hacer búsquedas más sofisticadas que a lo mejor el entorno amigable no os lo permite, pero sí que se pueden hacer sabiendo cómo se construyen las etiquetas, y nada más. Espero que os haya gustado, hasta luego.

Y eso ha sido todo por hoy. Espero que os haya gustado el vídeo si queréis estar al tanto de todo lo que hacemos podéis suscribiros en la campanita que aparece en nuestra web palabrasbinarias.com a nuestro boletín informativo. En ese boletín os informamos de todo lo que hacemos, los cursos que organizamos, etcétera, etcétera. Venga! Nos vemos en la próxima entrega!

Utilizamos cookies para analizar el tráfico del sitio web y optimizar tu experiencia. Puedes aceptar o rechazar las cookies haciendo clic en los botones a continuación.

Política de cookies