Proyecto «Angarmegia: Ciencia, Cultura y Educación». Portal abierto y colaborativo de Investigación y Docencia
 InicioNavegarBuscar /

Disponibilidad léxica

DIRECTORIO

de la

SECCIÓN

LA FÓRMULA DE LÓPEZ MORALES Y LORÁN

Los documentos a los que desde aquí se accede han sido realizados expresamente para desarrollar los programas académicos que trabajamos con nuestros alumnos. También está disponible una estructura tipo «Wiki» colaborativa, abierta a cualquier docente o alumno que quiera participar en ella. Para acceder a estos contenidos se debe utilizar el «DIRECTORIO de la SECCIÓN». Para otras áreas de conocimiento u opciones use el botón: «Navegar»

Los índices de disponibilidad. Primeros intentos

Los índices de disponibilidad nacen con la intención de ordenar las unidades léxicas según su posibilidad de aparecer en contextos específicos. Se parte de las listas de vocablos proporcionadas por informantes que se jerarquizan atendiendo a sus frecuencias y orden de mención. El método se basa en la petición al encuestado de una relación de términos vinculados al centro de interés que sirve de estímulo.

López Morales y Lorán [LÓPEZ MORALES, H. 1983] elaboran una primera ecuación matemática con la finalidad de medir la fuerza que mueve a actualizar unas palabras antes que otras. Cuando defienden su modelo se apoyan sobre un principio que fundamenta toda la argumentación: dentro de un grupo social, una frecuencia baja en primeras posiciones puede significar más disponibilidad para el término que una frecuencia mayor de otro que aparece en lugares posteriores. Enuncian [BUTRÓN. G. 1987:33-45], además, cuatro axiomas o condiciones que debe satisfacer el índice buscado:

1. Si, en dos o más vectores de frecuencias relativas, los valores correspondientes a posiciones homólogas son iguales, la ordenación resultante no debe alterarse aunque cambien las cantidades de esas posiciones siempre que continúen siendo iguales. Es el axioma de la independencia de los componentes 

2. La tasa de sustitución funciona como una constante. Entienden por tasa de sustitución de una posición respecto de la siguiente “la razón entre una variación en la frecuencia relativa en la primera posición y el cambio necesario en la siguiente posición para compensar la variación”. [BUTRÓN, G. 1987:39]. Es, en definitiva, un factor que pondera las frecuencias de cada posición otorgando más peso a las menciones iniciales.

3. Cuando dos palabras cuentan con la misma frecuencia en todas las posiciones menos en dos, el índice declarará más disponible aquella mencionada más veces en lugar más adelantado.

4. El valor de la palabra en primera posición siempre debe ser igual a uno con objeto de facilitar las comparaciones.

Con esas premisas López Morales y Lorán proponen la formula siguiente:

n  es máxima posición alcanzada.

xpi es frecuencia relativa de la palabra en la posición.

fpi es frecuencia absoluta de la palabra en la posición.

i es posición.

Ni es número de informantes que cuyas listas contienen la posición i.

λ es tasa de sustitución.

Su índice de disponibilidad léxica es fácil de calcular. Basta sumar los productos resultantes de multiplicar su frecuencia relativa en cada posición por la tasa de sustitución. De este modo:

El valor de λ ha de ser inferior a 1 por exigencia del segundo axioma y, dado que λ0 siempre es igual a 1, se verifica que la tasa correspondiente a la primera posición equivale a la unidad.

La constatación de que esta formulación sólo es aplicable a listados de palabras de la misma longitud, lo que obliga al recorte de todas las series para igualarlas a la relación más corta con la consiguiente pérdida de información, lleva a los investigadores a modificar la ecuación inicial con el propósito de respetar la integridad de los datos recogidos [BUTRÓN, G. 1987:39]. Para conseguirlo, sin alterar esencialmente sus principios, corrigen el segundo axioma, que mantenía constante la variación de λ, y calculan la tasa de sustitución como sigue:

El cambio considera el número de los informantes que alcanzan la posición actual y los que pasaron por la posición anterior. Se relacionan en el cociente:

Sustituyendo la antigua tasa por la nueva en la fórmula original resulta:

Un ejemplo ayuda a comprender el procedimiento descrito en ambas fórmulas e ilustra algunas precisiones que pueden derivarse de su aplicación. Sea la matriz abajo el punto de inicio de un supuesto cálculo de disponibilidad.

 

Se trabaja sobre una hipotética encuesta realizada entre 60 informantes que alcanzan un rango máximo de 10 posiciones y muestra cinco vectores de frecuencias que corresponden a las menciones a, b, c, d y e.

Para aplicar la primera fórmula [LML1] se calculan los valores de la tasa de sustitución correspondiente a cada posición, es decir:

Se ha jugado en el ejemplo con tres valores de λ (0.9; 0.7 y 0.6). La intención es seleccionar aquel que mejor cumple las condiciones establecidas en los axiomas enunciados. El resultado se refleja en la Tabla:

Procede ahora efectuar el producto de las tasas de cada posición por las frecuencias relativas de las palabras que las alcanzan. La suma de los productos incluidos en cada vector de frecuencias otorga el índice de disponibilidad del vocablo.

En un caso real los expertos optan por una de las bases ensayadas. En el ejemplo se opera con las tres para establecer comparaciones. Los índices de disponibilidad que se deducen en cada caso se presentan en las Tablas siguientes.

Sin entrar en un análisis profundo de los números que recogen, actuación reservada para ecuaciones más elaboradas, se observan dos hechos de indudable trascendencia:

  1. Aparece la puntuación 0 valorando las posiciones 8, 9 y 10. Es consecuencia de la limitación, ya apuntada, de la fórmula que obliga a trabajar con listados de la misma longitud. En el ejemplo supone ignorar 174 menciones, más de 29% de la información total aprovechable.

  2. Se comprueba que la elección del coeficiente de base para establecer la tasa de sustitución (λ), repercute en las cifras del índice de disponibilidad (4ª posición para e en todos los casos, pero con índices 0.9927; 0.6061 y 0.4201), lo que hace imposible el contraste de experiencias si no han sido tabuladas con los mismos criterios de ponderación y puede alterar drásticamente la ordenación de los vocablos en función de la base de cálculo elegida.

Aceptando algunos de los reparos expuestos por otros estudiosos, aunque alegando que también Gougenheim [BUTRÓN, G. 1987:41] utilizó listas cerradas en su encuesta con escolares, López Morales y Lorán, diseñan su segunda fórmula. Las Tablas  ahora contienen la consecuencia de trabajar los datos del ejemplo supuesto con el nuevo índice.

Son de notar las importantes diferencias que se aprecian en su evolución. Si λ = 0.9, su valor decrece de forma casi uniforme. No sucede así para λ = 0.75, que proporciona tasas más distanciadas en las menciones primeras que en las fina-les. Las desproporciones son especialmente significativas cuando se hace λ = 0.6. En este caso los saltos entre posiciones se hacen insignificantes a partir de la 6ª. El detalle es relevante, sobre todo si el rango de las listas es alto, porque la opción por una u otra λ pondera más o menos, hasta en la práctica anularlas, las posiciones medias y últimas y nos traslada de nuevo al problema de las escalas ordinales, y su transformación mediante la asignación de pesos, ya apuntado anteriormente.

La teoría de las decisiones utiliza, efectivamente, este recurso para escoger el modelo, método o individuo que mejor se ajusta al perfil de una demanda. Es muy usado en economía, ciencia política, educación o psicología aplicada. Facilita, por ejemplo, la selección del empleado más adecuado para la empresa en el colectivo de candidatos posibles. Los rangos, intervalos o valores así obtenidos son realmente eficaces para el objetivo buscado porque respetan escrupulosamente las condiciones y principios irrenunciables impuestos a priori, en el caso de López Morales y Lorán, su razonamiento axiomático. Por eso prueban las posibles λ y eligen, en un primer momento, el puntaje 0.9. Otros expertos más cercanos a los mecanismos psicológicos de la asociación semántica posiblemente se inclinarían por el coeficiente 0.6 que produce diferencias más acusadas para las posiciones iniciales, sólo condicionadas por el estímulo o centro de interés, y cierta horizontalidad  en las finales,  influidas, además, por todas las menciones que las han precedido[1].

Es en este aspecto donde incide la crítica de López Chávez y Strassburger Frías [LÓPEZ CHÁVEZ y STRASSBURGER. 1987] que detectan diferencias inapreciables para λ = 0.9 a partir de la posición 23, e inexistentes, en la práctica, a partir de la 40. La censura es recogida por los autores, teniendo en cuenta que se trabaja con rangos que superan los 60 vocablos en tres minutos, y se decantan finalmente por un coeficiente λ = 0.75.       

Son los mismos investigadores mejicanos quienes rechazan el mecanismo seguido para extender la primera fórmula a matrices de frecuencias con listados de tamaño diferente. Denuncian que el factor

puede vulnerar el tercer axioma y producir índices de disponibilidad incongruentes dependiendo del número de informantes que alcanzan una u otra posición [LÓPEZ CHÁVEZ y STRASSBURGER. 1987:6-7].

El supuesto está recogido en la Tabla 10, donde se observa que el índice que se atribuye a cada palabra es justamente el inverso al esperado según la lógica y los principios sobre los que se levanta el concepto de disponibilidad.

El vocablo enunciado en el tercer lugar obtiene la cuantificación más baja, mientras que aparece con la mayor disponibilidad el último que se actualiza. El origen de la contradicción se explica en un vicio de la ecuación:

Si, como se indicó anteriormente,

se puede rescribir la fórmula de este modo:

que, después de simplificar, y valorar λ como 0.9, queda en:

        La causa de la desproporción se encuentra en la razón

Este cociente se hace mayor en la medida que disminuye el número de informantes que alcanzan la posición (i-1) llegando, incluso, a anular el efecto ponderador de la tasa de sustitución en situaciones medias y finales.

Queda patente, de nuevo, la falta de fijeza de las cifras y ordenación de los índices condicionados siempre por la elección de λ.

Hay otro aspecto que interesa considerar en relación con el planteamiento de López Morales y Lorán. El cuarto axioma, que iguala a 1 la tasa de sustitución para la primera posición, tiene el propósito de “establecer las condiciones para efectuar comparaciones entre diferentes ordenaciones o estudios” [BUTRÓN, G. 1987:40]. Sin embargo, si se aplica un estadístico adecuado a los resultados halla-dos al trabajar las diferentes opciones sobre el ejemplo, se aprecia que los índices de disponibilidad conseguidos son tan dispares, en cuanto a medidas centrales y de variación, que ni siquiera son reconocidos como procedentes de una misma muestra.

Es habitual, en todos los ámbitos de investigación, la comparación entre grupos o medidas de la misma variable experimental para determinar si las diferencias que se aprecian son, o no, significativas. La Estadística Descriptiva dispone de muchos procedimientos para contrastar hipótesis relativas a diferencias de variabilidad; entre ellos están la distribución F y el análisis de la varianza   que se articulan sobre las propiedades de la distribución normal [QUESADA PALOMA, V. 1982:336-379; AMÓN J. 1982:262-285; SIEGEL, S. 1983:25-38].

“Una hipótesis estadística es simplemente una afirmación que se hace sobre una o más características de una población. [...] En todos estos casos existe una población en estudio y el modelo matemático que se crea para el estudio de estos problemas presupone la existencia de una variable aleatoria cuya función de densidad o de distribución dependerá de un cierto parámetro. [...] Para contrastar, pues, la hipótesis que se hace acerca de la población, podríamos tomar todos y cada uno de los elementos de la población y ver su la afirmación que se hace es cierta o falsa. Sin embargo, esto puede no ser posible realizarlo. Es necesario conformarse, para realizar la investigación que nos sirva para contrastar la afirmación con observar una muestra de la citada población”. [QUESADA PALOMA, V. 1982:336]

 El método, bastante sencillo, confronta matemáticamente las diferencias que se dan “entre los grupos” con las que existen “dentro de cada grupo”. Si las discrepancias son significativas hay que concluir que se trata de poblaciones distintas con relación a la característica investigada. 

En la distribución F se aplica la regla habitual para determinar una significación: si el valor obtenido de F en un estudio es numéricamente menor al valor crítico de la tabla, ya establecido, de la distribución, el investigador deduce que las varianzas no son significativamente distintas; cuando el valor de F es mayor se considera que las varianzas son significativamente distintas.

Se aporta a continuación el análisis de la varianza de un factor de los índices de disponibilidad conseguidos en los ejemplos. 

En ambos casos los valores de F son muy superiores a los niveles de significación establecidos en la escala adecuada. Ello delata una disparidad absoluta entre los conjuntos de medidas contrastados a pesar del puntaje 1 que los seis atribuyen a la primera posición de la distribución de frecuencias.

Es evidente, por tanto, que las comparaciones que se pueden establecer en este tipo de datos sólo son expresivas si proceden de la misma estructura de cálculo y que, en las propuestas de López Morales y Lorán, los índices de disponibilidad se ven fuertemente condicionados por las tasas de sustitución adoptadas. 

Como resumen final de la argumentación desarrollada hasta aquí, se han elaborado la Tabla  y el Gráfico que siguen. Tienen como objeto comparar las tasas de sustitución deducidas de la aplicación de las dos fórmulas con los valores de λ ensayados. Llama la atención en el dibujo la superposición de líneas que confirman, sin lugar a duda, la ecuación primera como un caso particular de la segunda, según se ha comentado.

REFERENCIAS:

LÓPEZ MORALES y LORÁN,  R. (1983b). "Nouveau calcul de l´indice de disponibilité". Ms.

BUTRÓN, Gloria Izaskun.  (1987). El léxico disponible: índices de disponibilidad. Disertación presentada en la Universidad de Puerto Rico como requisito para la obtención del grado de Doctor en Filosofía y Letras. Puerto Rico.

LÓPEZ CHÁVEZ, Juan y STRASSBURGER FRÍAS, Carlos. (1987). Otro cálculo del índice de disponibilidad léxica, (comunicación). noviembre de. 4ª Simposio de la Asociación Mexicana de Lingüística Aplicada.  México.

QUESADA PALOMA, V.; ISIDORO MARTÍN, A. y LÓPEZ MARTÍN, L. A. . (1982). Curso y ejercicios de estadística. 2ª ed. Alhambra, Madrid.            

AMÓN, Jesús. (1982). Estadística para psicólogos (Probabilidad y estadística inferencial). Tomo II. Neurociencia. Editorial Pirámide. Madrid.

----, (1990). Estadística para psicólogos I. (Estadística descriptiva). Psicología, 12. Pirámide, Madrid.

SIEGEL, Sidney. (1983).Estadística no paramétrica aplicada a las ciencias de la conducta. 8ª ed.. Biblioteca Técnica de Psicología. Editorial Trillas, México.


ADEMÁS

 

Responsables últimos de este proyecto

Antonio García Megía y María Dolores Mira y Gómez de Mercado

Son: Maestros - Diplomados en Geografía e Historia - Licenciados en Flosofía y Letras - Doctores en Filología Hispánica

Apunte estadístico

Portal activo desde abril de 2004. Los auditores de seguimiento que contabilizan las visitas desde esa fecha acreditan una suma entre 4.000 y 10.000 visualizaciones diarias para el conjunto de secciones que lo integran. Las visitas en el servidor «https» son privadas y no quedan reflejadas en  los contadores visibles