3.4 Nordic cooperation and the European Dimension
3.4.3 The Nordic Cooperation and the Bologna process
Nous avons montré dans la simulation du paradigme DRM que les capacités d’abstrac- tion de MINERVA2 se retrouvaient dans le modèle ATHENA à partir d’une mémoire épi- sodique. Cependant, ce dernier n’apprend pas directement des exemplaires pour construire une abstraction par synergie, il apprend la manière dont il serait capable de re-présenter ces exemplaires, dont il peut généraliser l’ensemble par inférence. Cette simulation a per- mis de s’assurer que l’abstraction n’est pas nécessairement une question de représentation, mais que la mise en commun de toutes les manières de traiter les informations passées permet de faire émerger une abstraction prototypique. La simulation de l’expérience de Whittlesea (1987) a exposé le fait que le prototype n’est pas un contenu récupéré mais un appariement construit. Cependant, ces deux expériences ne font que mettre en confron- tation les expériences apprises avec le prototype de ces expériences, il ne s’agit toujours que d’abstraire une information conforme avec ce que les modèles ont appris. Mais qu’en est-il du traitement de nouvelles informations complètement différentes du prototype des expériences apprises ? L’énactivisme étant à l’origine une question d’adaptation à l’envi- ronnement, il serait intéressant de regarder comment les modèles essaient d’abstraire une information nouvelle et inattendue à partir des expériences passées (une nouvelle catégorie différente de celle du prototype). L’expérience de Whittlesea (1987) sur la prototypie nous semble être tout à fait indiquée pour tester la capacité des modèles à simuler le processus d’abstraction en œuvre quand nous sommes confrontés à des événements nouveaux, mais elle demande certains ajustements.
Expérience originelle. L’expérience de Whittlesea (1987) a pu montrer que l’abs-
traction par synergie des exemplaires épisodiques était plus efficace que par une dissocia- tion entre mémoire épisodique et abstraction mnésique. Une liste de pseudo-mots différents de la liste d’apprentissage est moins bien reconnue que les exemplaires appris, mais qu’en est-il de la surprise provoquée par la présentation de cette nouvelle liste ? La différence entre familiarité et surprise se situe au niveau de la fluence d’un traitement (Whittlesea, 1997) : un traitement fluent provoque un sentiment de familiarité, tandis qu’un traitement non-fluent provoque un sentiment de surprise. Pour en rendre compte, une modification de
Simulations 3.1. ATHENA et MINERVA2
l’expérience originelle de 1987 a été proposée et simulée sur MINERVA2 (Brouillet & Ji- menez, 2007) dans le but de quantifier la surprise provoquée par la présentation d’un mot nouveau et la comparer à l’intensité de familiarité. Et ce, afin de montrer que dans une mémoire d’appariement global la surprise est plus surprenante que ce que la familiarité est familière.
Dans cette simulation, une série de pseudo-mots est présentée comme liste d’apprentis- sage où chaque présentation est une légère modification d’un pseudo-mot prototypique non présenté. Par exemple, pour le pseudo-mot prototypique FURIG, la série présentée peut être : FYREP, PURIT, FEKIG, FUREG, FYRYG. Après la phase d’apprentissage, une phase de reconnaissance présente le prototype de cette liste (FURIG dans notre exemple) ainsi qu’un nouveau pseudo-mot issu de la modification du prototype (PUKIG dans notre exemple). Si le prototype FURIG est représenté par le vecteur (1, 1, 1, 1, 1) où chaque composante du vecteur est une lettre, la liste de pseudo-mots de notre exemple peut être présentée à MINERVA2 sous la forme d’une liste de vecteurs telle que : ((1, -1, 1, -1, -1), (-1, 1, 1, 1, -1), (1, -1, -1, 1, 1), (1, 1, 1, -1, 1), (1, -1, 1, -1, 1)). Lors de la phase de recon- naissance, les pseudo-mots FURIG (1, 1, 1, 1, 1) et PUKIG (-1, 1, -1, 1, 1) sont présentés au modèle et l’intensité de MINERVA2 est observée. Le prototype donne une intensité de 0.12 et le nouveau pseudo-mot de -1,22. La nouveauté est donc plus surprenante que ce que la prototypie est familière. Simuler cet exemple sur ATHENA donne des résultats similaires avec un prototype ayant une intensité de 0.22 et un nouveau pseudo-mot ayant une intensité de -0.40. Ce type de simulation donne des résultats intéressants, mais nous considérons que l’emploi de valeurs positives pour définir une lettre semblable au proto- type (ainsi qu’une valeur négative pour définir ce qui doit être considéré comme nouveau) n’est pas suffisamment rigoureux. Ce problème ne peut pas être efficacement contreba- lancé par l’emploi de sondes aléatoires, ce qui ne nous permet pas d’en faire des analyses statistiques. De plus, un pseudo-mot nouveau fait forcément partie d’une catégorie déjà étudiée par le sujet, ce qui limite l’étude des capacités d’adaptation à la nouveauté. Nous proposons alors une autre procédure de simulation utilisant deux catégories différentes pour remédier à ces problèmes.
Procédure de simulation. Pour pouvoir confronter les exemplaires de deux caté-
gories différentes il est nécessaire d’utiliser deux types de distinction d’information (une différenciation entre les catégories et une différenciation entre les exemplaires d’une ca- tégorie). Intuitivement nous pourrions proposer une différenciation inter-composantes et une différenciation intra-composante, mais MINERVA2 n’est pas capable de confronter les informations de traces ayant une distinction inter-composantes totale (i.e., sans qu’au- cun lien ne soit établi entre les composantes ; e.g., les vecteurs (1, -1, 0 0) et (0, 0, 1, 1) n’auront jamais aucun lien dans une simulation de MINERVA2). Ce modèle y parvient sans problème à la condition qu’une corrélation inter-composantes soit apprise (comme
Simulations 3.1. ATHENA et MINERVA2
pour les catégories nom/visage de la simulation du rappel indicé), mais nous cherchons justement à utiliser des catégories n’ayant aucune corrélation apprise. Cette particularité sera intéressante pour mettre les modèles à l’épreuve sur des critères temporels sans que d’autres interactions ne viennent perturber les résultats, mais elle n’est pas judicieuse pour la simulation que nous mettons en place dans le chapitre présent. Nous utiliserons dès lors une différenciation intra-composante de signes (positif et négatif) pour la géné- ration de catégories, ainsi qu’une différenciation intra-composante de valeurs (comprises dans l’intervale [0 ;1]) pour générer des exemplaires. Pour pouvoir générer aléatoirement des pseudo-mots capables de rendre compte de différences catégorielles, nous employons dans cette simulation des vecteurs ne contenant plus de simples valeurs entières, mais des valeurs flottantes. MINERVA2 n’est pas prévu pour analyser des vecteurs de valeurs flottantes, mais devrait pouvoir analyser efficacement la notion de catégorie. ATHENA est fait de manière à prendre en compte l’intensité relative des composantes de la sonde, nous allons ainsi pouvoir mettre cette particularité à l’épreuve à travers l’emploi de va- leurs flottantes. De la même manière que dans une composante de vecteur l’activation (1) est différente de l’inhibition (-1), différentes valeurs flottantes de cette composante donnent des interprétations différentes (-0.5 est différent de 0.3, mais 0.9 est lui aussi différent de 0.3). En partant de ce principe, nous pouvons artificiellement créer plusieurs catégories en fonction des activations et inhibitions des composantes de vecteur, ainsi que plusieurs exemplaires dans ces catégories en jouant avec les valeurs flottantes de ces com- posantes. Par exemple, les vecteurs (0.5, -0.8, 0.3) et (0.2, -0.4, 0.8) sont des exemplaires d’un vecteur catégoriel composé d’une activation, d’une inhibition puis d’une activation. Le prototype de ces exemplaires en est la moyenne, soit (0.35, -0.6, 0.55). Et un exem- plaire d’une catégorie différente peut être (-0.7, 0.6, 0.3), soit un vecteur composé d’une inhibition, et de deux activations.
La génération de sondes aléatoires demande de produire deux catégories différentes de valeurs entières (dans notre exemple : (1, -1, 1) et (-1, 1, 1)), puis des valeurs flottantes aléatoires pour chaque exemplaire ayant le signe des composantes du vecteur de sa ca- tégorie. Pour pouvoir générer aléatoirement des catégories différentes, nous utilisons la méthode de similarité des vecteurs développée dans la simulation du rappel indicé. Deux vecteurs aléatoires de valeurs entières sont générés jusqu’à ce que leur valeur de similarité soit inférieure à -0.6 (soit environ l’espérance de cette fonction à laquelle on soustrait sept fois l’écart-type : la valeur de -0.6 a été choisie pour avoir la valeur la plus basse possible sans trop ralentir les calculs de la simulation). Les exemplaires sont alors générés avec des valeurs flottantes aléatoires selon le signe de la catégorie correspondante : cinq exemplaires de cinq composantes pour la catégorie d’apprentissage ainsi qu’un exemplaire de cinq composantes pour la catégorie différente. Le prototype est calculé en faisant la moyenne de toutes les sondes d’apprentissage. Lors de la phase d’apprentissage, les cinq exemplaires de la catégorie d’apprentissage sont présentés aux modèles. Lors de la phase
Simulations 3.1. ATHENA et MINERVA2
de reconnaissance, les cinq exemplaires d’apprentissage, l’exemplaire de la catégorie diffé- rente ainsi que le prototype sont présentés aux modèles. La simulation est reproduite 5000 fois pour les deux modèles, et les intensités générées par ces sondes sont ensuite analysées.
Prédictions. Malgré l’emploi de valeurs flottantes, les signes des composantes catégo-
rielles devraient permettre à MINERVA2 d’obtenir des résultats similaires à la simulation de Brouillet & Jimenez en confrontant le prototype à une nouvelle information. Mais l’ab- sence de méthode propre aux valeurs flottantes ne devrait pas lui permettre de reproduire les résultats du paradigme DRM en comparant les résultats des exemplaires d’appren- tissage au prototype. Ce n’est pas une limite directe du fonctionnement de MINERVA2 puisque ce modèle n’est pas prévu pour, mais cela nous permettra de nous assurer que la méthode d’utilisation de valeurs flottantes du modèle ATHENA parvient à généraliser le paradigme DRM dans son fonctionnement. En effet, ATHENA devrait non seulement être capable de reproduire le fonctionnement de MINERVA2 quant à la distinction pro- totype/nouveauté, mais aussi de conserver ses capacités d’abstraction quelles que soient les catégorisations possibles des données.
Figure 7 – FURIG : Intensités moyennes en valeurs absolues selon le type catégoriel de
sonde présenté aux modèles MINERVA2 et ATHENA
Résultats. Par souci de clarté — et bien que la moyenne de l’intensité des exemplaires
d’une nouvelle catégorie soient toujours négative — nous présentons ces résultats dans la figure 7 en valeurs absolues afin de pouvoir comparer visuellement l’intensité de familiarité à l’intensité de surprise.
Pour MINERVA2, nous pouvons voir que l’intensité moyenne des prototypes (0.49(0.16)) est inférieure à l’intensité moyenne en valeur absolue des exemplaires de la nouvelle ca- tégorie (-0.85(0.22)). Cette différence est significative : (T(9998) = 92.239 ; p < 0.001). Pour ATHENA, la même chose se retrouve avec une intensité moyenne des prototypes (0.62(0.04)) inférieure à l’intensité moyenne en valeur absolue des exemplaires de la nou- velle catégorie (-0.63(0.04)). Avec une différence significative : (T(9998) = 13.537 ; p <
Simulations 3.1. ATHENA et MINERVA2
0.001). La différence de résultats est, à nouveau, visiblement plus marquée pour MI- NERVA2 que pour ATHENA, ce qui est dû au fait que certaines intensités des exem- plaires de la nouvelle catégorie dépassent largement -1 (tandis que l’intensité d’ATHENA est bornée). Cette différence ne remet pas en cause la pertinence du pattern de réponses, et la distinction catégorielle de Brouillet & Jimenez se retrouve dans les deux modèles : la nouveauté est plus surprenante que ce que la prorotypie est familière. MINERVA2 y par- vient par abstraction d’exemplaires représentationnalistes, tandis qu’ATHENA parvient à généraliser l’emploi de processus non représentationnels pour obtenir les mêmes résul- tats. L’emploi de représentations n’est pas nécessaire pour la comparaison d’émergences catégorielles abstraites.
En ce qui concerne la comparaison entre le prototype et les exemplaires de la catégorie apprise (le paradigme DRM), pour MINERVA2 nous pouvons voir que l’intensité moyenne des exemplaires appris (0.51(0.24)) est significativement supérieure à l’intensité moyenne du prototype (T(29998) = 5.963 ; p < 0.001). Tandis que pour ATHENA, l’intensité moyenne des exemplaires appris (0.59(0.06)) est significativement inférieure à l’intensité moyenne du prototype (T(29998) = 39.92 ; p < 0.001).
Nous avions pu voir dans la simulation du paradigme DRM que — bien qu’un proto- type des exemplaires rencontrés ne soit pas appris — la présentation d’une information prototypique est autant (si ce n’est plus) fluente que la présentation des exemplaires ap- pris. C’est une particularité propre au fonctionnement de MINERVA2 qui se retrouve dans ATHENA, mais nous pouvons voir ici que MINERVA2 ne peut pas généraliser le paradigme DRM à des distinctions de catégorisation par valeurs flottantes, tandis que ATHENA en est capable. L’emploi de valeurs flottantes pour quantifier l’activité d’une composante (au lieu de se contenter d’activations ou d’inhibitions) est efficacement géré par notre modèle : une faible activation de composante est différente d’une forte activation de la même composante. Ce qui permet à notre modèle d’effectuer un appariement global de valeurs flottantes et de reproduire le pattern du paradigme DRM.