chapitre :

 B A S E S   T E X T U E L L E S 

Recherche : laboratoires et revues - Bases et bibliothèques : littérature française, langues anciennes Le projet Basile, les principes de l'édition électronique - Utilisation des bases de textes dans le secondaire - Liens sur des usages pédagogiques

apprendre avec les bases textuelles

 Édition électronique et enseignement des Lettres

PROBLÉMATIQUE

Danièle Valentin, Direction de la Technologie (SDTICE)

Développement de la micro-informatique Influence des réseaux Des bases adaptées Nouvelles attentes Textes, images

UN BREF HISTORIQUE

Les professeurs de Lettres du second degré se sont intéressés à l'étude quantitative du vocabulaire des textes dès les années 1970, lorsque le Ministère de l'Éducation nationale prit les premières mesures visant à intégrer l'informatique dans l'enseignement en mettant en place des stages " lourds " de formation à l'informatique pour des enseignants de toutes les disciplines. Ces stages se déroulèrent, en 1970-71, dans des entreprises informatiques, mais dès l'année suivante, leur organisation fut confiée à des Centres Universitaires, dont l'École normale supérieure de Saint-Cloud. Or celle-ci abritait le Laboratoire de lexicologie politique dirigé par Maurice Tournier, et les stagiaires ont ainsi pu prendre connaissance des recherches conduites dans ce Laboratoire.

Les enseignants, formés à la programmation, même si les objectifs pédagogiques de ces stages étaient clairement affirmés, étaient invités à concevoir des applications utilisables dans leur discipline. Pour ce faire, il est apparu nécessaire de leur donner un langage spécifique, pouvant aussi servir à la formation des élèves : le LSE (langage symbolique pour l'enseignement) développé à l'école Supérieure d'électricité sous la direction de Jacques Hebenstreit et de Jacques Arsac, langage en français qui comportait des fonctions de traitement de chaînes de caractères et des fonctions graphiques. Les professeurs de français et de langues anciennes ont travaillé dans deux directions complémentaires.

- La première est celle de l'enseignement assisté par ordinateur (EAO) : de premières applications visant à renforcer l'apprentissage de la lecture et de la maîtrise de la langue ont été réalisées, comprenant des modules d'évaluation, une individualisation de la progression, un suivi de l'élève, des batteries d'exercices, avec analyse de l'erreur et correction adaptée, etc. Le LSE a bientôt été relayé par des langages auteurs, les premiers d'ailleurs écrits en LSE, offrant de nouvelles fonctions d'analyse de réponse et de traitement des erreurs de l'élève.

- La seconde, explorée en liaison avec le Laboratoire de lexicologie politique de Saint-Cloud, visait à transposer soit les méthodes de ce Laboratoire (numérisation des textes et traitements statistiques appliqués à ces textes), soit les résultats de ses travaux (sur la presse, le surréalisme) dans l'enseignement secondaire.

   LE DÉVELOPPEMENT DE LA MICRO-INFORMATIQUE ET D'INTERNET

L'équipement des établissements en micro-ordinateurs a permis aux enseignants de s'affranchir des Centres de calcul universitaires et de mettre en œuvre individuellement, dans leurs classes, les mêmes types de traitement sur des textes de leur choix. La mise à la disposition des enseignants du logiciel Pistes (1989), développé par Pierre Muller (INRP) à partir de la méthodologie élaborée par le Laboratoire de lexicologie politique de Saint-Cloud concernant la numérisation et le codage des textes, les traitements statistiques et le calcul des spécificités (INRP), la publication d'exemples d'applications pédagogiques : analyses de Tartuffe, des Fleurs du Mal, des Catilinaires dans la série " Logitexte " (INRP/CNDP), ont permis de montrer aux enseignants l'apport de l'informatique pour une investigation systématique des textes (Pistes). Parallèlement, le logiciel " Lexis " (CNDP) se proposait d'expliquer à des élèves du second degré les traitements statistiques effectués sur les textes.

Certains enseignants ont utilisé les corpus de la série Logitexte, d'autres en ont créé et les serveurs académiques (Rouen, notamment) proposent aujourd'hui encore des textes saisis et préparés (codés) pour être traités avec le logiciel Pistes. L'intérêt de travailler avec des textes numérisés est tel que les enseignants n'hésitent pas à saisir eux-mêmes les textes au clavier (ou à les numériser en mode image et à les traiter ensuite avec un logiciel de reconnaissance de caractères), à les coder manuellement, puis à les traiter avec Pistes, d'abord, puis avec " Hyperbase " (logiciel développé par Etienne Brunet, Université de Nice).

Les enseignants ressentent aussi assez vite les insuffisances d'un tel système : la numérisation des textes reste limitée et les études sont restreintes à un roman, une pièce de théâtre, un recueil de poèmes. Il leur faudrait disposer d'un ensemble cohérent de textes numérisés afin de pouvoir effectuer des recherches sur l'ensemble de l'œuvre d'un auteur, comparer des auteurs entre eux, etc.

La constitution de la base Frantext par l'Inalf (même si les objectifs poursuivis sont différents (l'établissement du TLF) semblait répondre à ces aspirations. Un cédérom comprenant 300 œuvres de 1827 à 1923, extraites de la base Frantext, et le moteur de recherche Stella, est coproduit par Hachette et le CNRS, en 1992. Discotext 1 est expérimenté dans les établissements secondaires avec succès, mais son interface (sous DOS) devient vite obsolète. Le logiciel n'est pas adapté à d'autres systèmes d'exploitation et il n'y aura pas de Discotext 2.

L'édition publique et privée s'oriente vers des productions multimédias centrées sur une œuvre (Bel Ami de Maupassant - CRDP de Toulouse, L'Écume des jours de Boris Vian - MEN/CRDP de Champagne-Ardenne) ou un auteur dont elles proposent l'œuvre intégrale : Alexandre Dumas, Chateaubriand, Balzac (Acamédia), Pascal, Rimbaud, Proust (Éditions Champion), Léopold Sedar Senghor (Jericho). Des documents éclairant le contexte culturel, des guides méthodologiques et pédagogiques aident à la contextualisation et à la compréhension de l'œuvre, à l'exploitation des fonctions de recherche.

   L'INFLUENCE DES RÉSEAUX : INTRANET, INTERNET

Sur cédérom, les œuvres apparaissent prisonnières de leur support. Internet va révéler d'autres possibilités, une souplesse incomparable. Les éditeurs en ligne (00h00, Bibliopolis, Éditions du Boucher, etc.) offrent un accès immédiat à des textes inédits et/ou des rééditions et souvent des services spécifiques aux enseignants et aux élèves. Des institutions (Universités, laboratoires du CNRS) permettent d'effectuer des recherches dans de grands corpus (Rabelais et son temps, Balzac ), des dictionnaires en ligne tel " Le Trésor informatisé de la langue française ", etc.

Les bibliothèques virtuelles réalisées par des associations (ABU, Athena), des particuliers (Maupassant par les textes de Thierry da Selva) permettent de télécharger des textes, offrent des traitements (indexation, recherche contextuelle dans une œuvre ou dans l'ensemble de la base).

L'utilisateur, en utilisant des moteurs de recherche ou des portails spécialisés tel celui de l'Internet culturel mis en place par le Ministère de la culture et de la communication, peut trouver sur le réseau des textes français et étrangers (langue originale et traduction), des textes en langues anciennes, des textes de littérature de jeunesse, etc.

Revers de cette profusion : les éditions utilisées ne sont pas toujours mentionnées, les textes ne sont pas sûrs, et une fois qu'il les a téléchargés, l'utilisateur doit les présenter, leur adapter des outils de recherche, etc. Cependant, il gagne la liberté de composer le corpus de son choix, de le découper en fonction d'un projet, de lui attacher des annotations (notes, images, sons), d'autres textes (critiques), des créations personnelles ou collectives (pastiches, illustrations, par exemple), des liens vers d'autres sites complémentaires. On peut citer des exemples particulièrement réussis de constitution et d'exploitation pédagogique d'un corpus : La Vénus d'Ille de Mérimée, Châtiments de Victor Hugo, annotés par des élèves de collège et de lycée, Ruy Blas, préparé pour guider les élèves dans l'étude d'un drame romantique, " Victor Hugo contre la peine de mort ". En langues anciennes, les corpus présentés sur le site Musagora : " Les Muses ", " Dionysos ". Les corpus ainsi préparés peuvent être placés sur le réseau interne de l'établissement et ainsi accessibles hors ligne de n'importe quel poste, et/ou publiés sur Internet et utilisables alors par d'autres classes.

Pour que ces nouvelles pratiques pédagogiques liées au développement des réseaux puissent se développer avec toutes les garanties scientifiques et dans la légalité, de multiples problèmes doivent être résolus, concernant notamment la qualité des textes, et les droits d'utilisation et de publication.

DES BASES ADAPTÉES AUX BESOINS DES ENSEIGNANTS ET LIBRES DE DROITS

Comment concilier l'aspiration des enseignants à une liberté totale d'utilisation des bases de textes en ligne avec l'investissement scientifique et financier important exigé par leur réalisation, surtout si l'on veut qu'elles réunissent qualité éditoriale et logiciel d'interrogation performant et évolutif ?

Une action d'innovation, conduite de 1998 à 2000 par la Direction de la technologie, a permis d'expérimenter les bases en ligne et outils de recherche existants (notamment Frantext, le moteur de recherche Stella et le logiciel Hyperbase), de définir et de construire une base expérimentale avec de nouvelles fonctionnalités.

Le projet BASILE (une base libre de droits, permettant la navigation dans l'œuvre intégrale et l'accès aux fonctions de recherche), conduit par le CNED et les Éditions Champion dans la continuité de cette expérimentation, a été soutenu par le Ministère de la jeunesse, de l'éducation nationale et de la recherche. Une première section de 1000 œuvres appartenant au genre narratif a pu être exploitée par les enseignants à l'occasion du colloque "0L'édition électronique et dictionnairique " - Université de Rouen - juin 2002). La base doit progressivement s'enrichir de deux autres sections : poésie et théâtre, puis d'une sélection de textes de critique littéraire. Elle offre également des dictionnaires historiques. D'autres éléments seront progressivement intégrés : biographies, bibliographies, fac-similés de manuscrits… Elle sera expérimentée à partir de janvier 2003 dans le cadre du projet d'Espace numérique européen d'éducation (ENEE) mis en place par la Direction de la technologie.

UN ÉLARGISSEMENT DES ATTENTES

La mise à disposition de ressources numériques par les éditeurs et les institutions (bibliothèques, universités…), tant qu'elle n'est ni coordonnée, ni complète, a pour corollaire une augmentation des attentes et des exigences des enseignants.

Autant, les professeurs de grec ancien semblent trouver dans " The Persus Digital Library " (base textuelle et iconographique) de quoi satisfaire leurs besoins tant au niveau des textes que des documents iconographiques, autant les enseignants de français se sentent encore frustrés. La plus importante bibliothèque virtuelle en ligne, le serveur Gallica de la Bibliothèque nationale de France, offre 80 000 documents numérisés, mais pour la majorité d'entre eux en mode image. La sélection Gallica classique préparée pour les élèves et les étudiants avec un millier de textes fondateurs de la littérature française est également (sauf certains accords conclus avec Acamédia, Bibliopolis, Frantext) en mode image. Bien entendu, le serveur Gallica est précieux car il permet d'accéder de n'importe quel point du territoire au patrimoine littéraire, de lire, imprimer ou télécharger des textes rares, mais le mode image ne permet ni un travail direct sur les textes, ni une recherche plein texte. Les seuls repères sont la table des matières - et celle-ci n'est pas présente dans toutes les éditions - et les numéros de page. De plus, l'utilisateur n'a pas la possibilité de feuilleter le livre électronique très rapidement comme il peut le faire avec son homologue papier.

De nouvelles éditions sur Internet montrent ce qui pourrait exister et " aiguisent les appétits ". La Bibliothèque nationale de France a mis en ligne, en liaison avec l'exposition consacrée à Proust et en collaboration avec les Éditions Champion, une édition du Temps retrouvé qui permet de consulter simultanément les fac-similés des manuscrits et le texte du dernier livre de La Recherche.

La mise en ligne par l'Université de Hull de l'édition génétique d'un chapitre de L'Éducation sentimentale de Flaubert (le premier chapitre de la troisième partie) ouvre des perspectives alors que l'écriture est abordée dans les nouveaux programmes. L'édition électronique réunit tous les documents préparatoires : scénarios d'ensemble, esquisses, brouillons. Elle permet de consulter simultanément les documents originaux (fac-similés des manuscrits et leur transcription), dans la continuité des séquences ou selon les différents états d'un même passage. Les notes documentaires et commentaires génétiques sont accessibles directement en cliquant sur les mots auxquels ils sont attachés. On peut voir à quel point l'électronique facilite la consultation d'une édition savante.

BASES DE TEXTES ET BASES ICONOGRAPHIQUES

La lecture de l'image (fixe et mobile) fait partie du programme de français et de langues anciennes. Michel Tichit et Mireille de Biasi indiquent les liens entre étude des textes et découverte des sites archéologiques et des œuvres d'art en langues anciennes. En français, au collège et au lycée, l'élève observe les relations entre texte et image, aborde les différentes fonctions de l'image (illustrative, narrative, argumentative), confronte les textes à d'autres langages : " On utilisera des images fixes et mobiles, pour s'attacher à dégager les spécificités du discours de l'image et mettre en relation le langage verbal et le langage visuel " (BO N°28 du 12 juillet 2001 - Le Français au lycée - Préambule).

Les professeurs de Lettres utilisent donc, en liaison avec les bases textuelles, des services en ligne et des bases de données iconographiques. Citons :
- les expositions virtuelles de la BNF en liaison avec les expositions réelles (" Victor Hugo, l'homme océan ", " Maîtres de la BD européenne ", etc.), et les dossiers pédagogiques préparés pour un public scolaire et étudiant (" Brouillons d'écrivains ", " Le portrait ", etc.) qui permettent une découverte interactive des fonds iconographiques de la bibliothèque,
- le service éducatif en ligne du Musée du Louvre, Louvre.edu (Louvre/Pagesjaunes Édition), qui offre environ quatre mille œuvres en ligne, des commentaires sonores et animations, une bibliothèque de textes (feuillets, notices d'œuvres, dictionnaires),
- les dossiers pédagogiques et les parcours (" Le paysage dans tous ses états ") du Centre national d'Art contemporain, en liaison avec ses expositions, les services de la RMN tels que " L'Histoire par l'image ", ou liés à des expositions : " Matisse-Picasso ".

On peut citer là aussi des exemples de corpus mis à la disposition des élèves réunissant textes et images :
- " Balzac et la peinture " (académie de Rouen) : une étude du Chef d'oeuvre inconnu est enrichie par une présentation des grandes galeries de peinture que Balzac décrit, des tableaux ou des œuvres dont il s'est inspiré dans ses descriptions, portraits et paysages ;
- " Réalisme, naturalisme, impressionnisme " (académie d'Orléans-Tours) : une base documentaire réunissant histoire littéraire, philosophie et peinture.

CONCLUSION

Différents exemples d'utilisation pédagogique des bases textuelles et iconographiques sont présentés sur ce site. Ils ne recouvrent pas l'étendue des usages qui se dessinent dans les établissements mais ils ont des objectifs communs :

- favoriser la compréhension et l'appropriation des textes par les élèves (pose de signets, annotations, recherches guidées ou nées de la curiosité)

- diversifier les pratiques pédagogiques (corpus et parcous " sur mesure ", questionnements et recherches adaptés aux intérêts des élèves, recherches guidées permettant une approche globale de l'œuvre et en facilitant la lecture, etc.)

- mutualiser les pratiques et les productions (ce qui suppose une libération des droits pour la publication des textes, des résultats de recherche, etc.).

tête de chapitre accueil du site haut de page-