EL EFECTO MAGNÉTICO EN LA PERCEPCIÓN DE LAS VOCALES ESPAÑOLAS. ESTUDIO PERCEPTIVO SOBRE LA VOCAL /i/.
JULIO GONZÁLEZ ÁLVAREZ
Universidad Jaume I de Castellón
TERESA CERVERA CRESPO
Universitat de València
Correspondencia con:
Julio González
Departamento de Psicología Básica, Clínica y Psicobiología.
Universidad “Jaume I”. Castellón 12080
gonzalez@psb.uji.es. tfno: 964-729321. Fax: 964-729350.
Introducción
Primer Experimento
Segundo Experimento
Tercer Experimento
Conclusiones
Referencias
ABSTRACT
The perceptual magnet effect is a phenomenon that recent investigations
reveal problematic [Lively & Pisoni, 1997; Lotto, Kluender, & Holt,
1998]. According to Kuhl (1991), a magnet effect occurs when discrimination
around the best exemplar of a phonetic category is worse than discrimination
around a poor exemplar of the category. However, when this effect has been
clearly found, the possibility of some cross-category comparison is not
discarded. In this study the perceptual magnet effect was searched for
Spanish language. In this work we have assuring that all discrimination
judgments were made inside a single category. Three experiments were performed
with Spanish speaking adults. In Experiment 1, participants categorized
49 synthetic vowels, varying in the frequency of the first (F1) and second
formant (F2). Data allowed us to establish the perceptual area of Spanish
/i/ vowel. In Experiment 2, subjects rated the goodness of each variant
of /i/ on a scale from 1 to 7. The data showed a graded internal structure
and that finding allowed us to select a prototype (P) and a non-prototype
(NP) of the /i/ category. In Experiment 3, a Same-Different (AX) discrimination
task was performed around P and NP, inside of the formant space of /i/,
and using signal detection theory to assess discrimination in both conditions.
Results based in a bias-free measure (d-prime) did not support the perceptual
magnet effect and revealed the listeners showed similar sensitivity around
P than around NP. Also, generalization scores were not different in both
conditions. This finding suggests that the magnet effect is not a robust
and universal phenomenon in speech perception. Our results don’t agree
with those in which the magnet effect was found. We attributed those findings
to the involvement of several phonetic categories.
1. INTRODUCCIÓN.
Dentro del campo de investigación sobre la percepción
del lenguaje, Kuhl y cols. (Iverson & Kuhl, 1995; Kuhl, 1991, 1993;
Kuhl & Iverson, 1995; Kuhl, Williams, Lacerda, Stevens & Lindblom,
1992) han sugerido que la percepción de los sonidos lingüísticos
no está gobernada únicamente por los principios funcionales
del sistema auditivo, sino también por prototipos perceptivos almacenados
en la memoria a largo plazo del oyente. En este sentido la Teoría
de los prototipos (Rosch, 1973; Posner & Keele, 1968) ha ejercido una
relevante influencia cuando intenta responder a la pregunta de cómo
son aprehendidas las categorías perceptivas o cognitivas por la
mente humana (Estes, 1993). Los defensores de la misma mantienen que las
categorías se organizan en torno a representaciones abstractas,
o prototipos, en los que se recogen los rasgos más representativos
de los elementos de esa categoría. En ese sentido, los prototipos
corresponderían más a entidades abstractas que a realizaciones
físicas del entorno estimular.
La introducción de la teoría de los prototipos en la
percepción del lenguaje refleja un cambio desde el énfasis
inicial puesto sobre la delimitación de las categorías fonéticas
hacia el interés por el estudio de su estructura interna (Miller,
1994). Hoy sabemos que los hablantes nativos de un idioma pueden, bajo
determinadas condiciones experimentales, discriminar muy bien entre sonidos
de una misma categoría fonética (Pisoni & Tash, 1974;
van Hessen & Schouen, 1992) y hay evidencia creciente a favor de la
existencia de una rica estructura interna en las mismas, en la que ciertos
estímulos son percibidos como mejor ejemplares de la categoría
que otros.
La aplicación de la teoría de prototipos a la percepción
del habla es particularmente atractiva porque proporciona un medio de salvar
el problema de la invarianza perceptiva, ayudando a entender la compleja
relación que media entre una señal acústica extraordinariamente
variable y un conjunto relativamente estable y limitado de representaciones
fonológicas. Según esta teoría, el oyente llevaría
a cabo comparaciones entre la señal acústica entrante y sus
representaciones prototípicas internas. Si la señal es suficientemente
parecida al prototipo, entonces es clasificada como miembro de la categoría
fonética. Dependiendo del grado de similaridad, unos estímulos
serán considerados como mejores miembros que otros. De hecho, la
evidencia experimental muestra que algunos ejemplares son más efectivos
que otros en tareas de adaptación selectiva (Miller, Connine, Schermer,
& Kluender, 1983; Samuel, 1982), competencia dicótica entre
los dos oídos (Miller, 1977; Repp, 1977), tiempos de reacción
en tareas de identificación (Massaro, 1987), o en el grado en que
son percibidos como buenos ejemplares de la categoría (Grieser &
Kuhl, 1989; Kuhl, 1991; Miller & Volaitis, 1989; Samuel, 1982; Volaitis
& Miller, 1992).
En este marco teórico basado en los prototipos, una parte de
la investigación reciente se ha centrado en el fenómeno del
“efecto perceptivo imán, o magnético”, desde el trabajo seminal
de Kuhl (1991). Esta autora da a conocer que algunos sonidos de la /i/
inglesa son juzgados como mejor ejemplos de esa vocal que otros. Y además,
y esto es lo específico del efecto magnético, encuentra que
la discriminación entre un buen ejemplar de /i/ -prototípico-
y otros estímulos próximos circundantes es más difícil
que la discriminación entre un pobre ejemplar de /i/ -no prototípico-
y otros estímulos igualmente próximos. De este modo el prototipo
actúa de modo análogo a un imán atrayendo hacia sí
los estímulos vecinos, acortando las distancias perceptivas y comprimiendo,
o “encogiendo” (shrinking), el espacio perceptivo circundante. Kuhl (1991)
sintetizó diferentes ejemplares de la vocal /i/ modificando sistemáticamente
los valores de sus dos primeros formantes (F1 y F2) y los sujetos tenían
que dar una puntuación a cada uno de ellos sobre una escala de valoración
que iba desde 1 (ejemplar pobre de /i/) a 7 (ejemplar excelente de /i/).
Los oyentes otorgaron de forma consistente puntuaciones más altas
a los sonidos que ocupaban una área particular del espacio fonético.
Basándose en estas puntuaciones, la autora seleccionó un
buen ejemplar, que se le consideró prototípico (P), y un
pobre ejemplar, que se le consideró como no prototípico (NP).
A continuación sintetizó 32 variantes vocálicas alrededor
de P y otras 32 alrededor de NP, variando en ambos casos las frecuencias
de F1 y F2 en pasos de 30 meles. En una tarea de discriminación
perceptiva encontró que los oyentes discriminaban mejor entre NP
y sus variantes vecinas (90.5 % de juicios correctos) que entre P y sus
vecinos (78.6 %). Esto sucedía no sólo con sujetos adultos
sino también con bebés de seis meses de edad y, por tanto,
con una experiencia fonética del inglés muy limitada. En
un último experimento pudo comprobar que, sin embargo, este fenómeno
no aparecía en las respuestas discriminativas dadas por monos Rhesus
a los mismos estímulos. Esto hacía pensar que el efecto magnético
era exclusivo de la especie humana y probablemente de naturaleza lingüística.
Adicionalmente, Iverson & Kuhl (1995) han profundizado en los hallazgos
de Kuhl (1991) aplicando la Teoría de la Detección de Señales
(TDS) y técnicas de Escalamiento Multidimensional, demostrando cómo
las distancias perceptivas se reducen en la región vocálica
(en el plano F1 x F2) próxima a P y se alargan en la región
próxima a NP. Los autores también encuentran que el parámetro
d’ (d prima), que mide la sensibilidad libre de sesgos en el marco de la
TDS, es más bajo en torno a P que a NP.
Sin embargo la aceptación de este efecto imán, o magnético,
no es unánime en el seno de la comunidad científica. Cierta
evidencia empírica más reciente cuestiona metodológicamente
algunos de lo resultados obtenidos por Kuhl. Las dos críticas más
importantes tienen que ver con los estímulos utilizados y los sujetos
participantes. En primer lugar, no está claro que todos los sonidos
sintetizados por Kuhl, y previamente usados en Grieser y Kuhl (1989), fueran
identificados por los sujetos como la vocal /i/. Los sujetos emplearon
la escala de valoración del 1 al 7, pero sólo tuvieron la
oportunidad de responder en qué grado cada sonido era un buen o
mal ejemplo de /i/. En ningún caso se les hizo clasificar previamente
los estímulos desde el punto de vista fonético. Kuhl da por
sentado que los oyentes identificaron NP y sus vecinos circundantes como
miembros de la categoría fonética de /i/, pero la escala
de valoración no permite responder a esa cuestión. Como recientemente
declaran Lively & Pisoni (1997) “es crítico a la lógica
subyacente del efecto perceptivo magnético que todos los ejemplares
del conjunto estudiado pertenezcan a la misma categoría fonética.
Sin embargo, todavía se han publicado pocos datos que demuestren
que todas las vocales usadas por Kuhl fueran de hecho percibidas como /i/s”
(pag. 1666). Por tanto, sin la seguridad de que todos los juicios discriminativos
ocurridos en los experimentos de Kuhl (1991) -especialmente los del conjunto
de NP, que es el que ocupa una posición más periférica
en el territorio vocálico- han tenido lugar en el interior de una
única categoría fonética, no puede descartarse el
que los oyentes podrían haber respondido sobre la base de una percepción
transcategorial, a través de categorías distintas. En este
sentido, estudios posteriores han puesto en cuestión la pertinencia
de los estímulos de Kuhl. Así, Sussman y Lauckner-Morano
(1995) reconstruyeron el conjunto estimular original siguiendo las especificaciones
de Kuhl y encontraron que muchos ejemplares del conjunto de NP, incluso
el propio NP, eran identificados como /i/s en menos del 50 % de los casos.
Su conclusión es que “los resultados... muestran que el estímulo...
previamente usado por Kuhl como no prototípico (NP) en los tests
de discriminación tal vez no fuera un sonido de /i/... Por tanto,
hubiera sido posible que los sujetos... hubieran demostrado una mejor ejecución
discriminatoria simplemente porque efectuaban una gran número de
juicios basados en una comparación entre-categorías, en lugar
de intra-categoría. Está demostrado que las comparaciones
entre-categorías resultan más fáciles que las intracategóricas.
De esta manera, los sujetos podrían haber obtenido una proporción
más alta de respuestas correctas cuando el NP era el estímulo
estándar de comparación en los ensayos discriminativos, debilitando
la evidencia a favor de la teoría de prototipos” (pág. 544).
Otra investigación (Iverson & Kuhl, 1995) con un subconjunto
de los estímulos originales reveló que varios de ellos habían
sido identificados como /e/ en la mayoría de los casos; especialmente
algunas vocales del conjunto NP con valores frecuenciales más altos
en F1 y bajos en F2. Un año más tarde, Lotto, Kluender y
Holt (1996) publicaron los datos de un experimento en el que los sujetos
tuvieron la oportunidad de identificar los estímulos usados por
Iverson y Kuhl (1995) como las vocales /i/, /ae/, /e/, /I/, /?/, /u/, o
“ninguna de las anteriores”. Las variantes del conjunto NP fueron identificados
como /i/ en sólo un 7.3 % de los ensayos. Recientemente, Lively
y Pisoni (1997) también ha encontrado que sus oyentes han identificado
algunos de los estímulos del conjunto NP de Kuhl como vocales distintas
de /i/
La segunda razón metodológica aducida como problemática
es la participación en los experimentos de Kuhl (1991) de sujetos
entrenados en Fonética (estudiantes de trastornos de audición
y habla en la Universidad de Washington). Se sabe que los oyentes con formación
fonética podrían dar respuestas con un sesgo distinto de
las que emiten oyentes nativos de un idioma sin entrenamiento fonético
(Elman, Diehl, & Buchwald, 1977). De hecho, Sussman & Lauckner-Morano
(1995) comparan las respuestas de sujetos fonéticamente entrenados
con las de sujetos inexpertos y encuentran resultados distintos en las
tareas de identificación, sugiriendo que tanto Grieser y Kuhl (1989)
como Kuhl (1991) podrían haber obtenido puntuaciones más
altas en las escalas de valoración de la vocal /i/ por el hecho
de utilizar como sujetos experimentales a oyentes con entrenamiento fonético.
Otros hallazgos que ponen en cuestión el efecto perceptivo magnético
provienen de trabajos experimentales basados en conjuntos distintos de
estímulos. Renda, Hawks, y Klich (1995) obtuvieron un efecto magnético
para la /i/ sólo cuando emplean los estímulos de Kuhl (1991),
pero fueron incapaces de encontrar dicho efecto en otro conjunto formado
por variantes sintéticas de la vocal /?/. Lively y Pisoni (1997),
en una tarea de discriminación igual-diferente (AX) no encontraron
evidencias del efecto magnético tanto en estímulos creados
siguiendo las especificaciones de Kuhl (1991), como en otros estímulos
de nuevo cuño. Gracias a un experimento preliminar, estos autores
consiguen determinar para cada sujeto un prototipo (P) y un no-prototipo
(NP) idiosincrásico. La predicción era que el efecto imán
tendría mejores oportunidades de manifestarse sobre prototipos auto-seleccionados
por los propios sujetos ya que, en principio, nada obliga a que un mismo
estímulo funcione como prototipo para todos los sujetos, habida
cuenta de la gran variabilidad inter-individual que se observa en la percepción
fonética. No obstante, pese a condiciones tan favorables, los datos
no mostraron evidencia del efecto magnético, llevando a los autores
a concluir que el fenómeno hallado por Kuhl (1991) era debido a
la implicación de más de una categoría fonética.
Aaltonen, Eerola, Hellstrom, Uusipaikka, y Lang (1997) encontraron,
utilizando vocales del finés, importantes diferencias individuales
en las manifestaciones de este hipotético efecto. En aquel trabajo
los sujetos filandeses categorizaban series de vocales sintéticas
que variaban en la frecuencia del segundo formante (F2) desde los valores
característicos de la vocal finesa /y/ a los característicos
de la vocal, también finesa, /i/. Según la consistencia y
sensibilidad de las respuestas, aparecieron dos tipos distintos de sujetos:
“buenos” y “pobres” categorizadores. En una tarea de discriminación
igual-diferente (AX) empleando estímulos P y NP, también
seleccionados individualmente, comprobaron que a los “buenos” categorizadores
les resultaba más difícil detectar pequeñas desviaciones
de F2 en torno a P, que en torno a NP. Sin embargo para los “pobres” categorizadores
se observó el efecto opuesto, por lo que sólo los “buenos”
categorizadores mostraban evidencias del efecto imán. Se ponía,
así, en cuestión la universalidad de este efecto.
Lotto, Kluender y Holt, (1998) han considerado que una posible causa
de confusión es que las tareas de identificación o de puntuación
de los sonidos tienen lugar sobre estímulos individuales, mientras
que las tareas de discriminación se realizan sobre pares de estímulos.
Estos investigadores efectuaron un primer experimento en el que tanto las
identificaciones como las valoraciones de bondad en una escala tenían
lugar sobre pares de estímulos. En su segundo experimento los sujetos
participaron en una tarea típica de discriminación AX, que
lógicamente, también se realiza sobre parejas de estímulos.
Las funciones de discriminabilidad que obtuvieron Lotto et al. (1998) se
explicaban bien a partir de los datos de la identificación fonética,
pero no hubo restos de varianza adicional que pudieran ser explicados por
un hipotético efecto magnético. Los autores concluyen con
un argumento ya repetido varias veces: el pretendido efecto imán
probablemente no es más que una manifestación del hecho más
general, y sobradamente conocido, de que la discriminación es mejor
entre pares de estímulos de categorías distintas que entre
miembros de una misma categoría.
Dado que la posible existencia del efecto magnético tendría
relevantes implicaciones teóricas en conexión con el marco
teórico de los prototipos, es importante un cuidadoso estudio experimental
del mismo. A la luz de la literatura científica, se comprueba que
cuando se obtiene el efecto magnético la principal debilidad metodológica
es que no está completamente garantizado que los juicios discriminativos
ocurran dentro de una única categoría fonética.
El propósito del trabajo que aquí se presenta es estudiar
el efecto magnético adoptando estrictas medidas que aseguren que
todos los estímulos utilizados pertenecen a una única categoría.
Por este motivo sólo se han considerado estímulos con un
alto porcentaje de identificación fonética. Por otra parte
es de gran interés comprobar su existencia en otras lenguas distintas,
y distantes, del inglés, como es el caso del español. Dentro
del Modelo de Lenguaje Nativo propuesto por Kuhl (ver Kuhl, 1993, 1994;
Kuhl & Iverson, 1995), el efecto magnético aparece desde la
primera infancia fruto de un análisis muy temprano de las propiedades
distribucionales de la vocales del entorno lingüístico. De
esta manera, las capacidades innatas interactúan con las primeras
experiencias fonéticas para crear un patrón representacional
específico de cada lengua. En este contexto teórico, el efecto
magnético sería específico de cada idioma, dependiendo
de cada estructura vocálica particular, pero su existencia habría
de ser universal y sería el reflejo de mecanismos profundos de la
percepción del habla humana. Desde este punto de vista, si este
efecto realmente existe, sería también esperable su hallazgo
en la percepción de las vocales españolas.
El objetivo del Experimento 1 ha sido determinar qué estímulos,
dentro de un amplio conjunto de ellos en el plano F1 x F2 , son identificados
consistentemente como vocal /i/ por parte de hablantes nativos del español.
Los participantes clasificaron un total de 49 vocales sintéticas
creadas artificialmente en torno a los valores frecuenciales medios obtenidos
en Bradlow (1995) para el primer y segundo formantes de la /i/ castellana
(1). En el Experimento 2 los sujetos puntuaron la “bondad” de cada estímulo
como ejemplos de /i/. Los resultados de estos dos experimentos permitieron
seleccionar un estímulo como prototipo adecuado (P) y otro como
ejemplo de no-prototipo (NP) de dicha vocal. En el Experimento 3 se llevó
a término una tarea de discriminación igual-diferente (AX)
en torno a P y NP. Todos los estímulos empleados pertenecían
a la región del espacio formántico que había alcanzado
altos porcentajes de identificación de /i/. Si el efecto magnético
aparece, la sensibilidad en torno a P debe ser menor que en torno a NP.
Para comprobarlo se han utilizado los procedimientos estadísticos
de la Teoría de Detección de Señales (TDS).
2. PRIMER
EXPERIMENTO: IDENTIFICACIÓN DE VOCALES
Como se ha adelantado, este experimento se diseñó para
determinar qué estímulos son categorizados consistentemente
como /i/ castellana por hablantes nativos. Como estudios perceptivos precedentes
en nuestro ámbito lingüístico contamos con el trabajo
de Romero (1988) a partir de las vocales cardinales primarias y secundarias
del Alfabeto Fonético Internacional, y el de Fernández Planas
(1993) con réplicas sintéticas de las vocales castellanas.
Una conclusión común en ambos estudios es que el campo de
dispersión de las vocales desde el punto de vista perceptivo es
más amplio que desde el punto de vista productivo. Por esta razón,
nuestro experimento tiene un enfoque extensivo, cubriendo una amplia región
del espacio formántico utilizado.”
2.1. Sujetos
Los participantes fueron 35 estudiantes de Psicología de la
Universidad Jaume I de Castellón. Todos tenían audición
normal y ausencia de cualquier trastorno del lenguaje o del habla.
2.2. Estímulos
Se sintetizaron 49 vocales utilizando la configuración en cascada
del sintetizador de formantes de Klatt (1980), implementado en el programa
CSRE (Jamieson, Ramjii, Kheirallah, & Nearey, 1992). Fueron creados
siguiendo los parámetros de síntesis generales descritos
en Kuhl (1991) e Iverson y Kuhl (1995). La duración de cada estímulo
fue de 435 milisegundos y la frecuencia fundamental (Fo) empezaba a 112
Hz, ascendía hasta 130 Hz en los primeros 100 mseg. y bajaba hasta
92 Hz a lo largo de los restantes 335 mseg, para producir un apropiado
contorno de subida y bajada silábica. Los estímulos se crearon
manipulando los valores frecuenciales del primer (F1) y segundo (F2) formante.
Los valores del tercero, cuarto y quinto formantes permanecieron constantes
para todas las vocales en 3010, 3300, y 3850 Hz, respectivamente. Los anchos
de banda de los formantes fueron: 50 Hz para F1 (B1), 77 Hz para B2, 111
Hz para B3, 175 Hz para B4, y 281 Hz para B5.
Se crearon 48 estímulos alrededor de una vocal central cuyos
F1 y F2 coincidían con los valores medios obtenidos por Bradlow
(1995) para la vocal castellana /i/ por informantes adultos varones (F1=286
Hz y F2=2147 Hz). Cada estímulo estaba separado de su vecino por
una diferencia de 30 meles a lo largo y ancho del plano F1-F2, y localizados
sobre seis órbitas y ocho vectores radiales (ver Figura 1) (2).
Como la escala mel (3) es esencialmente linear en las frecuencias bajas
y logarítmica en las altas, se corresponde bastante bien a la localización
espacial de las frecuencias sobre la membrana basilar del oído humano,
razón por la que se emplea en este trabajo, al igual que en otros
anteriores. La escala mel (Fant, 1973; Stevens, Volkmann, & Newman,
1937) fue usada originalmente por Kuhl (1991) y después por otros
estudiosos del efecto magnético (Aaltonen et al., 1997; Iverson
& Kuhl, 1995; Lotto et al., 1998; Lively & Pisoni, 1997; Sussman
& Lauckner-Morano 1995) para intentar igualar la magnitud de los cambios
percibidos en las diferentes frecuencias. Los estímulos variaron
en pasos de 30, 60, 90, 120, 150, y 180 meles desde el estímulo
central, formando seis órbitas que cubren un amplio espacio formántico.
Al mismo tiempo, como se muestra en la Fig. 1, los estímulos se
disponen sobre ocho vectores radiales: creciendo sólo F2 (V1), creciendo
F1 y F2 (V2); creciendo sólo F1 (V3); creciendo F1 y decreciendo
F2 (V4); decreciendo sólo F2 (V5); decreciendo F1 y F2 (V6); decreciendo
sólo F1 (V7); y finalmente, decreciendo F1 y creciendo F2 (V8).
Los 49 estímulos fueron administrados junto con otras 21 vocales
sintéticas de relleno, formando un conjunto de 70 sonidos que correspondían
a las cinco vocales castellanas. Todos los estímulos de relleno
se sintetizaron siguiendo los mismos parámetros y procedimientos
de los estímulos experimentales, a excepción de que los valores
de los tres primeros formantes variaron de acuerdo con los obtenidos en
otros trabajos para las vocales españolas /e/, /a/, /o/, /u/ (Celdrán,
1994, 1996; Quilis, 1981).
-----------------------------------------------------------------------------------------------
Por favor, situar Figura 1
-----------------------------------------------------------------------------------------------
2.3. Procedimiento
Cada sujeto participó individualmente en una sesión experimental.
Los estímulos eran presentados a través de un ordenador personal
desde el entorno CSRE con una tarjeta de sonido de 16 bits. La presentación
se hizo a un nivel confortable de 70 dB SPL a través de auriculares
en una sala silenciosa del laboratorio.
Se escucharon primero todos los estímulos con el fin de que
los sujetos se familiarizaran con la tarea. Después se administraron
tres series consecutivas de los 70 estímulos en un orden aleatorio.
El intervalo entre dos estímulos consecutivos era un periodo aleatorio
que oscilaba entre 1.5 y 2 segundos. Los oyentes debían identificar
cada estímulo como una de las cinco vocales castellanas, registrándolo
en una hoja de respuestas.
2.4. Resultados y Discusión
Los datos de identificación se ofrecen en la Figura 1. Ahí
se aprecian los porcentajes de ensayos en los que cada ejemplar es categorizado
cono vocal /i/. Excepto en un ensayo, todas las respuestas distintas de
/i/ que recibieron los 49 estímulos correspondían a la vocal
/e/. El patrón de resultados muestra dos áreas perceptivas
delimitadas claramente: una que corresponde a la vocal /i/ y otra a la
vocal /e/. Todos los sonidos vocálicos de los vectores 1, 8, 7,
6 y 5 fueron clasificados principalmente como /i/. Los sonidos de los vectores
2, 3 y 4 (excepto el sonido de la primera órbita, O1, del segundo
vector, V2) fueron identificados principalmente como /e/ (más del
55 % de los ensayos). La línea interrumpida de la Fig. 1 señala
el límite entre las dos regiones perceptivas vocálicas: /i/
en el lado izquierdo y /e/ en el derecho
En consecuencia, las medias de F1 y F2 de Bradlow (1995) no ocupan
una posición central dentro del espacio de la /i/, sino que se hallan
cerca de la frontera con la vocal /e/. Parece que es crítico el
valor frecuencial en torno a 286 Hz para el primer formante, porque cuando
el estímulo tienen un F1 un más alto suena a los oyentes
como /e/ castellana, al menos con F2 igual o inferior a 2174 Hz. Probablemente,
cuando F2 es mayor, el valor crítico de F1 se desplaza hacia la
derecha, como así se muestra por la variante O1 del vector V2, que
teniendo F1=313 Hz y F2=2214 Hz es identificada como /i/ en el 64 % de
las ocasiones. Probablemente, el mismo F1 con un F2 más alto sería
identificado como /i/, pero estos sonidos no están incluidos en
el conjunto utilizado.
3. SEGUNDO EXPERIMENTO:
VALORACIÓN DE LA PROTOTIPICIDAD.
Los datos del primer experimento han permitido encontrar una amplia
área en el espacio F1-F2 que corresponde perceptivamente a la vocal
española /i/. Tal como resumen Lively y Pisoni (1997) en su trabajo,
hacen falta dos resultados par demostrar la presencia del efecto imán
o magnético. En primer lugar, algunos miembros de la categoría
fonética deben ser juzgados como mejores ejemplos de esa categoría
que otros. En segundo lugar, los ejemplos que se aproximan a un hipotético
e idealizado prototipo de la categoría deben ser más difícilmente
discriminables que los que se hallan lejanos de dicho prototipo. En este
experimento se intenta dar respuesta a la primera cuestión. De forma
típica, Kuhl (1991), y otros como Iverson & Kuhl (1995), Renda
et al., (1995), Aaltonen et al., (1997), Lively y Pisoni, (1997), o Lotto
et al., (1998), han establecido esa primera condición haciendo que
los sujetos puntúen en una escala de valoración el grado
de “bondad”, o prototipicidad, de cada sonido como ejemplo representativo
de la vocal estudiada. En este experimento se les pedía a los participantes
que valoraran en qué grado cada uno de los estímulos anteriores
constituye un buen ejemplo de /i/ castellana.
3.1. Sujetos
Los sujetos en este experimento fueron los mismos 35 estudiantes que
participaron en el primero.
3.2. Estímulos
Se utilizó el mismo conjunto de 49 estímulos experimentales
del experimento anterior. Aquí se administraron en exclusiva, sin
otros estímulos de relleno.
3.3. Procedimiento
Los sujetos participaron individualmente, siguiendo las mismas condiciones
generales del experimento primero. También aquí, se escucharon
previamente todos los estímulos para la familiarización con
los mismos. Después se administraron tres series de los 49 estímulos
en un orden cuasialeatorio. El intervalo entre ensayos oscilaba entre 2
y 4 segundos y se introdujo un corto descanso entre cada una de las tres
series. Los sujetos otorgaron por escrito una puntuación a cada
estímulo sobre una escala de valoración que iba del 1 al
7. Se trataba de valorar en qué medida cada sonido constituía
un buen ejemplo de la vocal /i/, en donde 1 significaba “un mal ejemplo
de i”, y 7 significaba “un excelente ejemplo de i”. Se les instruyó
para que utilizaran todo el rango de puntuaciones posibles
3.4. Resultados y Discusión
Los datos muestran que, aunque hay bastante coincidencia entre los
oyentes, las valoraciones subjetivas de prototipicidad presentan un importante
nivel de variabilidad. Varias vocales (19 de las 49) fueron valoradas con
la puntuación máxima (7 puntos) por al menos un participante.
Por tanto, la estabilidad de los hipotéticos prototipos a través
de los sujetos es más reducida que la referida por Kuhl en 1991.
En el estudio de Kuhl, todos los oyentes seleccionaron la misma vocal como
ejemplo más representativo de la categoría fonética.
Sin embargo, en el presente experimento han sido varias las vocales que
han recibido la puntuación máxima, al menos por algún
sujeto. Este hecho está más en consonancia con lo encontrado
en los estudios posteriores (Aaltonen et al., 1997; Lotto et al., 1998;
Lively & Pisoni, 1997).
El promedio de las valoraciones de los 49 estímulos se ofrecen
en la Figura 2. Los resultados muestran una estrecha relación con
los datos de identificación del primer experimento, alcanzando una
correlación significativa (r= 0.959, p<.001), a través
de los ítems. Si una vocal es considerada como un buen ejemplar
representativo de la categoría fonética, tendrá, lógicamente,
más posibilidades de ser identificada como perteneciente a esa categoría.
Dentro del espacio perceptivo de la /i/, las puntuaciones se extienden
desde 3.3 a 6.4 puntos, mientras que en el espacio de la /e/ oscilan entre
1.1 y un máximo 3.5 puntos.
-----------------------------------------------------------------------------------------------
Por favor, situar Figura 2
-----------------------------------------------------------------------------------------------
Conviene destacar que no todos los estímulos fueron valorados
igual. Por el contrario, como cabría esperar, algunos sonidos fueron
considerados mejores ejemplos de /i/ que otros. 5 estímulos alcanzaron
puntuaciones superiores a 6 puntos. La máxima puntuación
media (6.4) es obtenida por la vocal de la tercera órbita (O3) y
octavo vector (V8) y la vocal de la primera órbita (O1) y séptimo
vector (V7). Los sonidos próximos a las mismas en sus respectivos
vectores obtienen también puntuaciones altas, observándose
un gradiente en los juicios de prototipicidad en la medida que baja F1
y asciende F2.
En segundo lugar, el patrón general de resultados es distinto
del obtenido por Kuhl. La autora refirió la existencia de simetría
radial en torno al estímulo central, es decir, los valores medios
de F1 y F2 obtenidos en varones en el estudio clásico de Peterson
& Barney (1952)-, recibiendo este estímulo central la máxima
puntuación y reduciéndose las puntuaciones a medida que se
alejaban del centro. Sin embargo Lively y Pisoni (1997) comprueban que
sus oyentes seleccionan una vocal extrema como más representativa
que la vocal central. Johnson (1989) obtuvo un patrón similar en
un trabajo en el que no se investigaba el efecto magnético, pero
en el que los sujetos tenían que seleccionar las mejores vocales
dentro de un conjunto amplio de ítems. De hecho, la simetría
radial referida por Kuhl tampoco ha sido replicada en trabajos posteriores.
En el primer experimento de Iverson & Kuhl (1995), se les presentó
a los sujetos un subconjunto de vocales en las que variaba F1 (aumentando)
y F2 (disminuyendo) para su identificación y valoración.
Esta serie de vocales era en realidad equivalente a la diagonal de la distribución
original de Kuhl (1991). Los datos mostraron que la serie tendía
a alcanzar puntuaciones más altas a medida que F1 era más
bajo y F2 más alto, de manera que el prototipo que había
usado Kuhl no alcanzaba la máxima puntuación media, obteniendo
5.9 puntos, mientras que otros sonidos más extremos recibían
puntuaciones mayores (por encima de 6). Los mismos estímulos fueron
presentados formando pares por Lotto et al. (1998) y obtuvieron un patrón
semejante. En un estudio realizado por Kluender, Lotto, Holt, & Bloedel
(1998), los juicios de bondad de la vocales inglesas /i/ y /I/ mostraron
distribuciones basadas en la distintividad de las vocales. Dado que las
versiones extremas de /i/, con bajos F1 y altos F2, son más distintivas
respecto a las otras vocales del inglés, recibieron las puntuaciones
más altas como ejemplos de /i/. Sin embargo fueron las versiones
centrales de /I/ las que se valoraron como más representativas de
esta vocal, ya que en este caso eran ellas las más distintivas y
lejanas de su entorno vocálico en el sistema inglés.
En el presente experimento el vector con mejor valoración media
es el V8, en el que F1 y F2 varían de manera inversa. Este vector
corresponde a los ejemplares de /i/ más extremos y lejanos del territorio
de la /e/, la única vocal adyacente en el sistema vocálico
español.
En consecuencia, el estímulo elegido como central en el conjunto
no ha recibido la valoración más alta y los datos muestran
que en realidad, ocupa una posición periférica en el área
perceptiva de la /i/, obteniendo una valoración de prototipicidad
de 5.4 puntos sobre 7, siendo identificado como /i/ en el 81 % de los ensayos.
El próximo estímulo en su lado derecho, sobre el vector V3,
alcanza sólo 3.5 puntos y el 43 % de las identificaciones. El próximo
en el vector V4 obtiene 3.4 puntos y 17 %, respectivamente. Este estímulo
central corresponde a los valores formánticos medios de la /i/ pronunciada
por cuatro hablantes españoles estudiados por Bradlow (1995). Los
sujetos eran varones adultos de la ciudad de Madrid y proporcionaron un
total de 20 realizaciones fonéticas (4 hablantes x 5 repeticiones)
que arrojaron medias de F1= 296 Hz y F2= 2147 Hz. Los datos procedentes
de otros estudios son bastante variables, pero en general tienen a presentar
promedios más bajos de F1 y más altos de F2 (Celdrán,
1994; Quilis y Esgueva, 1980). Por ejemplo, Quilis y Esgueva (1980) analizaron
la producción de las cinco vocales en posiciones átonas y
tónicas y obtienen valores de /i/ en torno a 250 Hz para F1 y 2550
Hz para F2.
4. TERCER EXPERIMENTO:
TAREA DE DISCRIMINACIÓN
El segundo experimento proporcionó los datos necesarios para
seleccionar un estímulo como buen prototipo (P) perceptivo de vocal
/i/ y otro como no-prototipo (NP),o pobre ejemplo de la misma. En este
experimento se utilizó la tarea de discriminación igual-diferente
(AX) y se diseñó para su análisis matemático
en el marco de la TDS o Teoría de Detección de Señales
(Green & Swets, 1966), comúnmente empleada en la investigación
sobre percepción del habla (Iverson & Kuhl, 1995; Sussman &
Lauckner-Morano, 1995). Durante el transcurso de la tarea, los sujetos
escuchaban pares de estímulos vocálicos sucesivos y debían
juzgar si se trataba del mismo sonido o de dos sonidos distintos. Desde
la TDS, la comparación entre el porcentaje de detección de
diferencias (respuestas “diferente” correctas) y el de falsas alarmas (respuestas
“diferente” incorrectas) permite el cálculo de la medida de sensibilidad
d’ (d prima) como un parámetro separado del criterio de decisión
-más arriesgado o más conservador- utilizado por cada sujeto
su tarea. Se trata, por tanto, de una medida genuinamente perceptiva independiente
de otras variables ligadas al proceso de decisión.
4.1. Sujetos
Los sujetos del tercer experimento fueron 33 estudiantes que habían
participado en los experimentos anteriores.
3.2. Estímulos
Se crearon dos conjuntos de vocales sintéticas, uno en torno
a la escogida como prototípica (P) y otro en torno a la no-prototípica
(NP). La principal condición impuesta es que todos ellos habían
de pertenecer a la región perceptiva de la /i/, es decir aquella
cuyos estímulos habían sido principalmente clasificados como
/i/ en el primer experimento. En concreto, se tratan de estímulos
con F1 igual o inferior a 363 meles (286 Hz). De esta forma se garantizaba
que todos los juicios discriminativos tuvieran lugar en el seno de una
única categoría fonética.
Todos los estímulos se crearon con el sintetizador de formantes
de Klatt (1980) utilizando los mismos parámetros generales de los
experimentos 1 y 2. Los valores frecuenciales de F1 y F2 se seleccionaron
de acuerdo con las siguientes condiciones.
El estímulo seleccionado como P fue el O3 del vector V8 (tal
como se indica en la Fig. 2) porque recibió la puntuación
más alta de prototipicidad (media de 6.4 puntos) en el segundo experimento
y había sido identificado como /i/ en el 100 % de los ensayos del
primero. El estímulo seleccionado como NP fue el O3 del vector V5
(ver también Fig. 2) porque había obtenido igualmente una
alta tasa de identificación (87.5 %) y, al mismo tiempo, no era
considerado un buen ejemplo de /i/, recibiendo una valoración moderada
de 4.9 puntos, dentro del rango 3.3 - 6.4 de las variantes de /i/. Por
otra parte, no había que olvidar que los estímulos circundantes
a NP debían mantenerse dentro del espacio de la /i/ y presentar
valoraciones de prototipicidad inferiores a las de los circundantes de
P
Para asegurar la intra-categorialidad de los juicios fue necesario
crear la variantes de NP sólo a lo largo de cinco vectores: V1,
V5, V6, V7 y V8, con el propósito de no invadir el espacio contiguo
de la vocal /e/ (lo que habría sucedido con la inclusión
de los vectores V2, V3 y V4). En justa correspondencia, también
se consideraron los mismos cinco vectores para el conjunto de estímulos
circundantes de P. Por tanto, como se muestra en la Figura 3, el conjunto
de P se compuso con el propio P (F1= 273 meles (208 Hz), F2= 1174 meles
(2350 Hz)) y 15 variantes. Cada una de ellas estaba separada de sus vecinas
por una diferencia de 30 meles a través de tres órbitas (O1,
O2 y O3) y a lo largo de los vectores radiales V1, V5, V6, V7 y V8. Es
decir, las vocales estaban a 30, 60, ó 90 meles de P dispuestas
a lo largo de vectores donde: sólo se incrementaba F2 (V1); sólo
decrecía F2 (V5); tanto F1 como F2 decrecían (V6); sólo
decrecía F1 (V7); o F1 decrecía y F2 aumentaba (V8). Ningún
estímulo quedó localizado más allá del área
estudiada en los experimentos 1 y 2. Homólogamente, el conjunto
de NP se dispuso de forma semejante, esta vez en torno a NP (F1= 363 meles
(286 Hz), F2= 1564 meles (1957 Hz))
-----------------------------------------------------------------------------------------------
Por favor, situar Figura 3
-----------------------------------------------------------------------------------------------
4.3. Procedimiento
Los sujetos participaron individualmente según las mismas condiciones
generales de los experimentos anteriores. Los estímulos fueron administrados
por medio del controlador de experimentos (EcosCon) del entorno CSRE (Jamieson,
et al. 1992) y presentados a través de auriculares a un nivel confortable
de 70 dB SPL.
En cada ensayo, los sujetos escuchaban dos estímulos consecutivos
separados por un intervalo de 250 milisegundos. Se instruyo a los sujetos
a no responder cuando creyeran que se trataba del mismo sonido presentado
dos veces. Si los percibían como dos sonidos distintos debían
de apretar una tecla del ordenador etiquetada con el rótulo de “diferentes”.
El orden de los ensayos fue aleatorizado, con la única condición
de que no se produjeran más de tres parejas consecutivas del mismo
tipo (igual o diferente).
Los sujetos se enfrentaron a dos bloques distintos de ensayos. Un bloque
(bloque P) estaba formado por parejas de estímulos constituidas
por P y cada uno de sus 15 estímulos circundantes. Las parejas se
formaron en ambos sentidos, alternando los dos órdenes posibles:
es decir, 15 pares en los que P figuraba como primer estímulo, y
otros 15 en los que P figuraba como segundo estímulo. Estos constituían
los ensayos “diferentes” del bloque. A ellos se le unían otros 30
ensayos “iguales” hechos del siguiente modo: 15 formados por el estímulo
P repetido dos veces, y otros 15 formados al repetir cada uno de los restantes
estímulos. Así, el bloque P estaba compuesto por un total
de 60 ensayos: 30 ensayos “diferentes” más 30 ensayos “iguales”.
El otro bloque (bloque NP) se formó exactamente del mismo modo
con los estímulos del conjunto de NP.
A cada sujeto le fueron administrados los dos bloques, dos veces cada
uno, con periodos cortos de descanso entre sesiones. La mitad de los sujetos
recibieron el bloque P en primer lugar, mientras que la otra mitad recibió
primero el bloque NP. Antes de los ensayos experimentales, los sujetos
recibieron una primera sesión de práctica con feedback tras
cada ensayo.
4.4. Resultados y Discusión
Los resultados se sometieron a los procedimiento estadísticos
de la TDS o Teoría de Detección de Señales (Green
& Sweets, 1966), calculándose la sensibilidad de cada sujeto
en cada una de las dos condiciones (P y NP). Los cálculos se efectuaron
de acuerdo con las fórmulas propuestas por Macmillan & Creelman
(1991) y utilizando un programa informático proporcionado por Creelman.
Por tanto, para cada sujeto se obtuvo un par de valores de sensibilidad
(d´), uno procedente del bloque P y otro del bloque NP. Estos valores
fueron comparados entre sí por medio de la prueba t de grupos emparejados.
Las medias generales de cada condición se representan en la Figura
4; como puede apreciarse, ambos valores están muy próximos
entre sí. La prueba t no encontró diferencias entre la sensibilidad
de los juicios discriminativos del bloque P (d’ media = 2.5096, sd= 0.522)
y la sensibilidad en el bloque NP (d’media = 2.4992, sd=0.471); t(32)=0.11,
p= 0.910).
-----------------------------------------------------------------------------------------------
Por favor situar Figura 4
-----------------------------------------------------------------------------------------------
Otra forma de analizar los datos de una tarea de discriminación
es por medio del porcentaje de generalización. Consiste en el porcentaje
de ensayos “diferentes” omitidos, es decir, no detectados por el sujeto.
Esta ausencia de respuesta indica, que pese a ser estímulos distintos,
los sujetos los perciben como el mismo sonido vocal, siendo insensibles
a la diferencia de los valores de los formantes que les separa. La Figura
5 (datos en la Tabla I) presenta los porcentajes de generalización
para cada condición (P y NP) en función de las órbitas,
poniéndose de manifiesto un marcado gradiente a través de
las mismas. Sin embargo no aparece evidencia de efecto magnético,
ya que los valores de ambas condiciones están estrechamente unidos
entre sí.
Se sometieron los datos a un ANOVA, o Análisis de Varianza,
incluyendo como efectos las condiciones experimentales (P vs NP) y las
órbitas (O1, O2, O3). No aparecieron diferencias significativas
entre las órbitas, obteniéndose puntuaciones de generalización
semejantes (P = 33.64 %, NP= 33.99 %). Tampoco la variable condición
fue signiicativa (F(1,32)= 0.04, p = 0.839). Como era de esperar, la generalización
decrece a medida que avanzamos en las órbitas, por lo que se obtiene
un efecto principal de éstas (F(2,64)=216.03, p<.001), pero no
aparece interacción condición x órbita ( F(2,64)=1.66,
p=0.198), de manera que en ninguna de las tres órbitas las dos condiciones
arrojaron diferencias significativas entre sí.
De haberse manifestado el efecto perceptivo magnético,
hubiéramos encontrado un gradiente de generalización más
marcado en la condición P, como clara consecuencia de una peor discriminación
del estímulo central (P) respecto a sus circundantes. Por el contrario,
es patente el estrecho paralelismo entre las dos líneas.
-----------------------------------------------------------------------------------------------
Por favor, situar Tabla I y Figura 5
-----------------------------------------------------------------------------------------------
5. CONCLUSIONES
En este trabajo se ha buscado el efecto magnético en la percepción
de una vocal española, pero no ha sido hallada ninguna evidencia
del mismo. El tercer experimento, crítico para su comprobación,
se ha llevado a cabo adoptando las medidas necesarias para que los juicios
discriminativos tuvieran lugar entre estímulos pertenecientes a
la misma categoría fonética. Se trata de un aspecto fundamental
habida cuenta de que las principales críticas dirigidas a trabajos
anglosajones anteriores cuestionaban el carácter intra-categórico
de las discriminaciones que lo ponían de manifiesto.
Por definición, el efecto magnético debe tener lugar
en el seno de una única categoría fonética. Si la
selección de estímulos no permite descartar posibles discriminaciones
entre categorías distintas, los resultados nos remitirían
al conocido efecto experimental, de que es más fácil distinguir
entre sonidos de distintas categorías fonéticas que entre
sonidos de la misma categoría. Lo cierto es que en aquellos trabajos
en los que el efecto se ha encontrado de forma nítida, la selección
de estímulos empleada no permite descartar la hipótesis de
intercategorialidad, especialmente para el conjunto que acompaña
al estímulo no prototípico (NP). Por el contrario, los estudios
que han puesto el énfasis en asegurar la pertenencia de todos los
estímulos a la misma categoría, no hallan el efecto de forma
clara, o los datos que obtienen son ambiguos. Nuestros resultados se alinean
en esta última dirección. En este trabajo se ha puesto especial
cuidado en el requisito de intracategorialidad de los sonidos vocálicos,
al tiempo que se ha estudiado una lengua distinta del inglés. Nuestros
datos no arrojan el mínimo indicio de efecto magnético en
la percepción de la vocal /i/ española, y tanto las medidas
de sensibilidad como las puntuaciones de generalización son prácticamente
las mismas en torno a una variante prototípica (P) que en relación
a una no prototípica (NP). En consecuencia, estos resultados junto
con los de otras investigaciones anteriores cuestionan la robustez y universalidad
del efecto imán en la percepción de las vocales.
No obstante, esta ausencia del efecto imán no cuestiona necesariamente
la validez de la teoría de prototipos aplicada a la percepción
del habla. Sus defensores (Eimas & Corbit, 1973; Grieser & Kuhl,
1989; Kuhl, 1991; Massaro & Oden, 1980; Miller & Volaitis, 1989;
Samuel, 1982) sostienen que las categorías fonéticas están
organizadas en torno a prototipos que contienen representaciones abstractas
de sus propiedades, y la señal extraordinariamente variable del
habla es clasificada en el proceso perceptivo según su encaje con
estas representaciones prototípicas. Según esta teoría,
no todos los miembros de la categoría son igualmente prototípicos
o representativos de la misma; antes al contrario, las categorías
presentan una rica estructura interna con gradientes de prototipicidad.
Los datos del Experimento 2 son congruentes con esta hipótesis y,
al igual que se ha encontrado en otros trabajos para el inglés (Hodgson
& Miller, 1996; Miller, 1994; Miller & Eimas, 1996), el grado de
prototipicidad de los distintos ejemplares o variantes de /i/, medido en
una escala de valoración de siete puntos, se distribuye de acuerdo
con una clara estructura interna.
La postulación del efecto magnético pretende dar un paso
más allá: el espacio perceptivo dentro de esa estructura
interna se “encoge” (shrink) en la zona más prototípica acortando
en su interior la distancias perceptivas. En realidad no se trataría
de una propiedad esencial e imprescindible para la teoría prototípica
y la debilidad de la evidencia empírica obtenida hasta la fecha
aconseja mantener serias reservas al respecto. El primer hallazgo del efecto
magnético se debe a Kuhl (1991), sugiriendo que la discriminación
de los estímulos vocálicos no está determinada sólo
por parámetros acústicos sino, sobre todo, por el grado de
tipicalidad o prototipicidad de los mismos. El prototipo actuaría
como un imán ejerciendo atracción sobre los miembros de la
categoría próximos, acercándolos y acortado sus distancias
en un espacio perceptivo. Su manifestación práctica sería
una peor discriminación entre el prototipo y sus vecinos, como así
obtiene esta autora. La fuerza de esta concepción se ve reforzada
cuando Kuhl no halla ese efecto en animales no humanos (monos Rhesus) desprovistos
de un sistema lingüístico. Este primer estudio ha sido el primero
de una serie en la que la replicación de los resultados no ha sido
clara y el efecto magnético se ha revelado, cuando menos, controvertido.
Como se ha expuesto, el examen detenido de la literatura científica
indica que cuando los datos apuntan claramente hacia su existencia, no
se puede descartar el que en realidad estén involucradas más
de una categoría fonética. En el trabajo de Kuhl (1991) los
sujetos sólo podían responder sobre el grado de tipicalidad
de cada estímulo y no tuvieron la oportunidad de señalar
aquellos que podrían pertenecer a otra categoría próxima.
Esta reserva no es ociosa porque, de hecho, otros trabajos posteriores
con los mismos materiales han encontrado que varios de los estímulos
no eran categorizados como /i/ (Iverson & Kuhl, 1995; Lively, 1993;
Lively & Pisoni, 1997; Lotto et al., 1996, 1998; Sussman & Lauckner-Morano,
1995). Un hecho bien establecido es que la discriminación entre
sonidos es mejor a través de los límites entre categorías.
No es sorprendente que, si algunos de los estímulos del conjunto
no prototípico (NP), por su posición más periférica,
pertenecen a otra categoría distinta adyacente, sean mejor discriminados
y eleven espúreamente el promedio del conjunto NP frente al conjunto
P. Los resultados de Iverson y Kuhl (1995) sobre un subconjunto de los
estímulos originales son muy ilustrativos al respecto: encuentran
cuatro de los trece estímulos estudiados son identificados como
vocal /i/ en menos del 50 % de las ocasiones. Lotto et al. (1996) comunicaron
datos de un experimento hecho sobre este mismo subconjunto de estímulos
y encontraron que incluso el propio estímulo que había sido
empleado por Kuhl como no-prototípico (NP) era identificado como
/i/ en sólo el 7.3 % de las veces. Resultados en la misma línea
son obtenidos también por Sussman & Lauckner-Morano (1995),
con el conjunto estimular completo: 22 de los 33 sonidos del conjunto NP
de Kuhl fueron identificados como /i/ en menos de la mitad de los ensayos.
También los sujetos de Lively y Pisoni (1997) efectuaron identificaciones
por debajo del 50 % en 17 estímulos del mismo conjunto.
Como conclusión, a la luz de los resultados obtenidos en este
trabajo, la defensa de un efecto imán o magnético como parte
de un mecanismo universal de percepción de los sonidos del lenguaje,
debe mantenerse por el momento en una prudente reserva, sin que ello invalide
la posible aplicación de la teoría de prototipos como intento
de explicación de los procesos perceptivos del habla humana.
NOTAS
1. En este trabajo se emplean los términos vocales españolas
y castellanas como equivalentes.
2. Las Figuras 1 y 2 son semejantes a las representaciones gráficas
incluidas en los estudios que usan estímulos organizados en órbitas
(ver, por ejemplo, Sussman & Lauckner-Morano, 1995, pag. 542). Los
valores de F1 y F2 están dados en la abscisa y ordenada respectivamente.
Los valores individuales de los estímulos colocados en dirección
horizontal (vectores V3 y V7) y vertical (vectores V1 y V5) vienen dados
por las proyecciones directas desde los ejes. Los valores del resto (vectores
diagonales V2, V4, V6 y V8) se determinan “siguiendo” su órbita
hasta los vectores horizontal y vertical próximos.
3. Para la escala mel se ha aplicado la fórmula más
utilizada, y propuesta por Fant, siguiente: y = (1000 / log 2) . log (1
+ f / 1000); donde y son meles y f es la frecuencia en hercios.
AGRADECIMIENTOS
Parte de los materiales e instrumentos utilizados en este trabajo han sido financiados por el Proyecto P1A99-01 de la Fundació Caixa-Castelló y la Universidad Jaume I de Castellón
AALTONEN, O., EEROLA, O., HELLSTROM, A., UUSIPAIKKA, E., & LANG,
A.H. (1997) Perceptual magnet effect in the light of behavioral and psychophy-sio-logical
data. Journal of the Acoustical Society of America, 101, pp. 1090-1105.
BRADLOW, A.R. (1995) A comparative acoustic study of English and Spanish
vowels. Journal of the Acoustical Society of America, 97, pp. 1916-1924.
EIMAS, P.D., & CORBIT, J.D. (1973) Selective adaptation of linguistic
feature detectors. Cognitive Psychology, 4, pp. 99-109.
ELMAN, J., DIEHL, R., & BUCHWALD, S. (1977) Perceptual switching
in bilinguals. Journal of the Acoustical Society of America, 62, pp. 971-974.
ESTES, W.K. (1993) Concepts, categories, and psychological science.
Psychological Science, 4, pp. 143-153.
FANT, G. (1973) Speech sounds and features. Cambridge, MA: MIT Press.
FERNÁNDEZ PLANAS, A. (1993). Estudio del campo de dispersión
de las vocales castellanas. Estudios de Fonética Experimental, vol
V, pp. 129-162.
GREEN, D. M., & SWEETS, J.A. (1966) Signal Detection Theory and
Psychophysics. New York: John Wiley.
GRIESER, D., & KUHL, P.K. (1989) Categorization of speech by infants:
Support for speech-sound prototypes. Developmental Psychology, 25, pp.
577-588.
HODGSON, P., & MILLER, J.L. (1996) Internal structure of phonetic
categories: Evidence for within-category trading relations. Journal of
the Acoustical Society of America, 100, pp. 565-575.
IVERSON, P., & KUHL, P.K. (1995) Mapping the perceptual magnet
effect for speech using signal detection theory and multidimensional scaling.
Journal of the Acoustical Society of America, 97, pp. 553-562.
JAMIESON, D.J., RAMJII, K.V., KHEIRALLAH, I., & NEAREY, T.M.
(1992) CSRE: A speech research environment. Proceedings ICSLP 92. Edmonton,
AB: University of Alberta.
JOHNSON, K.A. (1989) On the perceptual representation of vowel categories
(Research on Speech Perception , Progress Report No. 15, pp. 343-358) Bloomington,
IN: Speech Research Laboratory, Indiana University.
KLATT, D.H.(1980) Software for a parallel/cascade formant synthesizer.
Journal of the Acoustical Society of America, 67, pp. 971-995.
KLUENDER, K.R., LOTTO, A.J., HOLT, L.L., & BLOEDEL, S.L. (1998)
Role of experience for language-specific functional mappings of vowel sounds.
Journal of the Acoustical Society of America, 104, pp. 3568-3582
KUHL, P.K. (1983) Perception of auditory equivalence classes for speech
in early infancy. Infant Behavior and Development, 6, pp. 263-285.
KUHL, P.K. (1991) Human adults and human infants show a ‘perceptual
magnet effect’ for the prototypes of speech categories, monkeys do not.
Perception & Psychophysics, 50, 93-107.
KUHL, P.K. (1993) Early linguistic experience and phonetic perception:
implications for theories af developmental speech perception. Journal of
Phonetics, 21, pp. 125-139.
KUHL, P.K. (1994) Learning and representation in speech and language.
Current Opinion in Neurobiology, 4, pp. 812-822.
KUHL, P.K. & IVERSON, P. (1995) Linguistic experience and the ‘perceptual
magnet effect’. In Speech perception and linguistic experience. Issues
in cross-language research (W. Strange, editor), pp. 121-154. Baltimore:
New York Press.
KUHL, P.K., WILLIAMS, K.A., LACERDA, F., STEVENS, K.N., & LINDBLOM,
B. (1992) Linguistic experience alters phonetic perception in infants by
6 month of age. Science, 255, pp. 606-608.
LIVELY, S.E. (1993) An examination of the perceptual magnet effect.
Journal of the Acoustical Society of America, 93, p. 2423.
LIVELY, S.E., & PISONI, D.B. (1997) On prototypes and phonetic
categories: A critical assessment of the perceptual magnet effect in speech
perception. Journal of Experimental Psychology: Human Perception and Performance,
23, pp. 1665-1679.
LOTTO, A.J., KLUENDER, K.R., & HOLT, L.L. (1996) Effects of language
experience on perceptual organization of vowel sounds. Paper presented
at the Fifth Conference of Laboratory Phonology, Northwestern University.
LOTTO, A.J., KLUENDER, K.R., & HOLT, L.L. (1997) Depolarizing the
perceptual magnet effect. Journal of the Acoustical Society of America,
103, pp. 3648-3655.
MACMILLAN, N.A., & CREELMAN, C.D. (1991) Detection Theory: A User’s
Guide. Cambridge: Cambridge University Press.
MARTÍNEZ CELDRÁN, E. M. (1994) Fonetica. Barcelona: Teide.
MARTÍNEZ CELDRÁN, E. M. (1996) El sonido en la comunicación
humana. Barcelona: Octaedro.
MASSARO, D.W. (1987) Categorical partition: A fuzzy logical model of
categorization behavior. In Categorical perception (S. Harnard, editor)
pp. 254-283. Cambridge: Cambridge University Press.
MASSARO, D. W., & ODEN, G. C. (1980) Evaluation and integration
of acoustic features in speech perception. Journal of the Acoustical Society
of America, 67, pp. 996-1013.
MILLER, J.L. (1977) Properties of features detectors for VOT: The voiceless
channel of analysis. Journal of the Acoustical Society of America, 62,
pp. 641-648.
MILLER, J.L. (1994) On the internal structure of phonetic categories:
a progress report. Cognition, 50, pp. 271-285.
MILLER, J.L., CONNINE, C.N., SCHERMER, T.M., & KLUENDER, K.R. (1983)
A possible auditory basis for internal structure of phonetic categories.
Journal of the Acoustical Society of America, 73, pp. 2124-2133.
MILLER, J. L., & EIMAS, P.D. (1996) Internal structure of voicing
categories in early infancy. Perception & Psychophysics, 58, pp. 1157-1167.
MILLER, J.L., & VOLAITIS, L.E. (1989) Effect of speaking rate on
the perceptual structure of a phonetic category. Perception & Psychophysics,
46, pp. 505-512.
PETERSON, G.E., & BARNEY, H.L. (1952) Control methods used in a
study of the vowels. Journal of the Acoustical Society of America, 24,
pp. 175-184.
PISONI, D.B., & TASH, J. (1974) Reaction times tp comparisons within
and across category. Journal of the Acoustical Society of America, 15,
pp. 285-290.
POSNER, M.I., & KEELE, S.W. (1968) On the genesis of abstract ideas.
Journal of Experimental Psychology, 77, pp. 28-38.
QUILIS, A. (1981) Fonetica acustica de la Lengua Española. Madrid:
Gredos.
QUILIS, A. y Esgueva, M. (1980) Realizacion de los fonemas vocalicos
españoles en posicion fonetica normal. Madrid: RFE.
RENDA, S.C., Hawks, J.W., & Klich, R. (1995) An investigation of
the perceptual magnet effect in adults. Journal of the Acoustical Society
of America, 97, 3420.
REPP, B. H. (1977) Dichotic competition of speech sounds: The role
of acoustic stimulus structure. Journal of Experimental Psychology: Human
Perception and Performance, 3, pp. 37-50.
ROMERO, J. (1995). Campos de dispersión auditivos de las vocales
del castellano. Percepción de las vocales. Estudios de Fonética
Experimental, vol III, pp. 181-206.
ROSCH, E.H. (1973) On the internal structure of perceptual and semantic
categories. In Cognitive development and the acquisition of language (T.E.
Moore, editor), pp. 111-114. New York: Academic Press.
SAMUEL, A.G. (1982) Phonetic prototypes. Perception & Psychophysics,
31, pp. 307-314.
STEVENS, S.S., VOLKMANN, J., & NEWMAN, E.B. (1937) A scale for
the measurement of the psychological magnitude pitch. Journal of the Acoustical
Society of America, 8, pp. 185-190.
SUSSMAN, J., & LAUCKNER-MORANO, V.J. (1995) Further tests of the
‘perceptual magnet effect’ in the perception of /i/: Identification and
change/no change discrimination. Journal of the Acoustical Society of America,
96, pp. 539-552.
van HESSEN, A.J., & SCHOUEN, M.E.H. (1992) Modeling phoneme perception.
II: A model of stop consonant discrimination . Journal of the Acoustical
Society of America, 92, pp. 1856-1868.
VOLAITIS, L.E., & MILLER, J.L.(1992) Phonetic prototypes: influence
of place of articulation and speaking rate on the internal structure of
voicing categories. Journal of the Acoustical Society of America, 92, pp.
723-735.
Porcentaje de Generalización
P
V1 V5 V6
V7 V8 Total
O1 71.22 69.70 50.00 61.36 55.30 61.52
O2 36.36 38.64 14.39 20.45 18.18 25.61
O3 16.67 18.18 12.12 12.88 9.09 13.79
Total 41.41 42.17 25.50 31.57 27.53 33.64
NP
V1 V5 V6
V7 V8 Total
O1 78.03 79.55 27.27 53.03 55.30 58.64
O2 41.67 43.18 6.06 25.76 28.79 29.09
O3 21.97 20.46 7.58 9.85 11.36 14.24
Total 47.22 47.73 13.64 29.55 31.82 33.99
Pies de Figuras
Figura 1. Experimento1: Porcentajes de las respuestas de identificación de la vocal /i/. Los estímulos están distribuidos en el plano F1-F2 sobre ocho vectores y seis órbitas alrededor del estímulo central, en pasos de 30 meles. De acuerdo con los datos obtenidos, la línea interrumpida separa las regiones perceptivas de las vocales /i/ (izquierda) y /e/ (derecha).
Figura 2. Experimento 2: Promedios de prototipicidad en la escala de valoración de 1-7 puntos, sobre la misma distribución de estímulos de la Figura 1. La línea interrumpida separa las regiones perceptivas de las vocales /i/ (izquierda) y /e/ (derecha). Se indican los estímulos seleccionados como Prototipo (P) y No Prototipo (NP) para el Experimento 3
Figura 3. Experimento 3: Distribuciones de estímulos para el conjunto P (Prototipo) y el conjunto NP (No Prototipo). Cada distribución tiene quince estímulos dispuestos sobre cinco vectores (V1, V5, V6, V7, and V8) y tres órbitas (O1, O2, O3) alrededor del estímulo central en pasos de 30 meles. Los valores individuales se ofrecen en Hz para el primer (abajo) y segundo (arriba) formante.
Figura 4. Experimento 3: Puntuaciones medias del parámetro de sensibilidad (d’) en la Teoría de Detección de Señales para las condiciones experimentales P (Prototipo) y NP (No Prototipo).
Figura 5. Experimento 3: Porcentajes de Generalización a través de las órbitas para los estímulos en torno a P (Prototipo) y NP (No Prototipo)