Page d'accueil Le Club Les Textes Les Projets A propos de ce site Pour nous écrire

Texte et hypermonde

Club de l'hypermonde. 15 octobre 1996

En termes de volumes binaires, le texte va devenir presque imperceptible dans la masse du multimédia. 500 000 octets pour un livre déjà substantiel, de 100 000 à dix millions d'octets pour une image, 3 méga-octets pour une minute de son, et des giga-octets à la pelle pour l'image animée de qualité raisonnable.

Un rôle central

Cela ne retire pas au texte son rôle central dans l'hypermonde. De même que trois mots tiennent des années de violence révolutionnaire. Que la combinaison de deux hélices d'ADN, après les passions et les furies, résume l'amour en une trace microscopique qui, des années plus tard, cherchera à son tour à conquérir le monde. Au fondement est le verbe.

Le mot seul, isolé, ou l'expression, garde une grande importance. Pour une recherche dans AltaVista, par exemple. Mais c'est la phrase, même petite, qui compte surtout. Un "verbe" suffit, mais c'est qu'il suppose au moins un sujet. Le texte n'est jamais simple.

Le texte, un peu au dessus du zéro absolu de la formalisation

Précisons: le texte est une représentation fortement formalisée. Mais le texte courant n'est pas le sommet (ou le fond) de la formalisation possible. Même codé en binaire. Il porte des caractères "anecdotiques", "locaux" , "idiosyncratiques". Il passe toujours par une langue, ou un langage. Et même les langages de programmation suscitent les passions.

De même d'ailleurs que les trois mots de la Révolution française sont des symboles flous plutôt que des concepts opérationnels. Que l'ADN, comme langage, est chargé de mots inutiles pour autant que nous le sachions. D'ailleurs il ne prend son sens qu'après son enroulement physique. Et le Verbe, pour se faire entendre des humains, a pris chair.

Le texte, avec ses contraintes de linéarité, a l'avantage de s'exprimer aussi bien par une image structurée (le texte écrit, imprimé) que par un son structuré (le texte parlé).

Il comporte des structures et des opérations naturelles puissantes. En particulier l'ordre alphabétique (lexicographique).

Langages et systèmes formels

Les formalisations les plus élevées se trouvent sous des formes mathématiques (logique formelle) ou informatiques (Lisp).

Le droit lui-même (a expliqué au club Danièle Bourcier) est pour une part à la recherche de formalismes plus avancés. D'une part la "codification". D'autre part, une expression sous forme de "système" dépassant le texte.

Le texte passablement formalisé des langages de programmation apportent une propriété complémentaire importante: l'automatisation. Tout ce qui est formalisable est programmable. Et même, dans certaines conditions, auto-reproductible (virus).

Il y a donc une sorte d' "hyper-conductivité" du texte (un peu) formalisé. Comme a proximité du zéro absolu. A ce niveau fusionnent les deux chimies de l'humain, le carbone et le silicium.

Avec deux limites possibles, et antinomiques, quand on va vers l'idée de ce coeur " parfait". On le voit particulièrement nettement en matière judiciaire. D'une part on vourait un juge parfaitement impartial, opérant en quelque sorte comme une machine à partir du texte du droit. Mais avec une froideur monstrueuse. D'autre part, on recherche son " intime conviction ", avec toute la profondeur de l'humain... et les limites de son subjectivisme.

Situation actuelle: la puissance d'HTML

La radio avait sur-valorisé le texte, dans sa version orale. Avec les conséquences que l'on sait découlant de ce média "chaud" (Mc Luhan). Hitler. De Gaulle.

La télévision est plus "cool". Elle pousse au "politiquement correct". Loin du texte. Et tuant même l'efficacité du texte avec la langue de bois et la "langue de coton" (que, dans les bons journaux, les journalistes font l'impossible pour éviter).

Traitement de texte et PAO, relayant l'imprimerie) ont aussi beaucoup poussé le texte. Aux dépens de l'image pour tous ceux qui n'ont pas de moyens puissants de création, d'impression, de diffusion.

La nouveauté actuelle, c'est Internet. Et surtout HTML.

Avec, centrale, une structure à base textuelle, mais allant plus loin que le texte traditionnel.

On circule dans un univers très imagé, mais l'architecture repose sur le langage. URL, critères de recherche. Images, sons et même vidéo se branchent sur ces branches un peu comme l'ADN génère des protéïnes.

Situation demain: image et intelligence?

Montée de l'image: Exploitation d'Ismap (HTML) ou carrément VRML. Difficile encore de savoir. Peu de travaux, malgré les explorations visionnaires du PARC (Palo Alto Research Center) de Xerox. Peut-on imaginer une descente de l'image vers un zéro absolu, avec les caractéres relevé:es plus haut, et non textuel?

Et de même pour le son ?

Texte et intelligence.

- scanner/OCR/dictée: marche de mieux en mieux, mais encore limité

- analyse de texte plus ou moins automatisée

Mais cela fait longtemps que chantent les sirènes du langage naturel, de la traduction automatique. Jusqu'à maintenant, les choses importantes se sont passées ailleurs. Demain?

ANNEXE

Texte paru dans Le Monde Informatique du 14/10/1994 (no 605)

L'avenir du texte dans l'entreprise

La montée de l'image ne retire pas au texte son rôle central, entre les données et les images. Difficile à maîtriser, il continuera de stimuler la création de nouveaux formalismes et de nouvelles applications.

Les informaticiens n'aiment pas le texte, et le texte le leur rend bien. Il devrait pourtant rester au coeur des évolutions de l'informatique, dans les entreprises en particulier.

Ils n'aiment pas le texte? Chacun sait qu'ils répugnent à rédiger des documentations, et même des commentaires dans leurs programmes. Au fil des années, la puissance des processeurs, la capacité des mémoires et la souplesse de l'impression laser leur a permis des présentations toujours plus élaborées de l'information écrite. Mais il ne s'y intéressent qu'exceptionnellement.

Et le texte le leur rend bien. Même au niveau le plus théorique. Le laboratoire linguistique de Grenoble espérait, dès les années 60, venir à bout de la traduction automatique. Trente ans plus tard, c'est à peine si les outils de traduction "assistée" parviennent à séduire les traduction professionnels. Quant à la dictée automatique, dont rêvent tant d'utilisateurs depuis toujours, elle ne se voit encore réalisée que sous d'étroites contraintes, malgré la belle avancée réalisée récemment par IBM (LMI du 30/9/94).

Il ne faut donc pas s'étonner que le "traitement de texte" se soit d'abord développé en dehors de l'informatique, d'abord sur des machines spécialisées (de 1975 à 1985), puis sur micro-ordinateur. Donnant naissance à une bureautique (en 1977) que les directions informatiques ont mis des années a ramener dans le droit chemin, si même c'est aujourd'hui chose faite.

Mais n'ont-ils pas eu raison? Le texte se voit aujourd'hui fortement menacé par l'image. Les tirages et les revenus de la presse écrite baissent au profit de la télévision. L'orthographe, hier condition sine qua non d'une embauche et même d'un mariage bourgeois, devient l'apanage de quelques passionnés dans la lignée de Bernard Pivot. Sur tous les bureaux, les GUI (graphical user interface) ont chassé le bon vieux mode caractère. Malgré leur stagnation actuelle, les ardoises électroniques (notepads) nous laissent espérer la disparition du clavier, hérité de la machine à écrire. Mieux, la réalité virtuelle s'apprête à nous plonger dans des univers de synthèse, radicalement visuels, intuitifs, transparents, sans papier autant que sans écriture.

Le texte, foyer vivant de la nébuleuse informatique

La résistance même du texte à se laisser robotiser devrait pourtant inciter à la réflexion. D'autant plus que, GUI ou pas, l'informatique reste quasi exclusivement construite sur une machine textuelle, celle de Von Neumann. Les réseaux neuronaux et autres machines plus ou moins floues, malgré quelques communiqués ronflants, ne menacent pas sa suprématie. La programmation reste au coeur de tout développement, même quand elle se cache derrière des outil "visual" (Basic, C++, etc.).

En fait, le texte se situe à un point charnière entre le strict formalisme des données et l'indéfinie liberté des images. On a pu croire hier que les données absorberaient tout (métaphoriquement, c'est un peu le message de Jules Verne, en 1863, dans son "Paris au XXe siècle", qui vient d'être édité chez Hachette). On se prend à croire aujourd'hui que l'image va tout absorber. "Le visuel l'emportera toujours sur l'écrit", dit Jean-Yves Saulou dans son récent "Le pilotage du décideur" (Tec et Doc). Mais l'écrit appartient au visuel, il n'en est qu'une espèce fortement formalisée.

Le texte continue de stimuler l'informatique à la construction de nouveaux formalismes, comme une nébuleuse autour de la "langue naturelle". Il peut s'agir de techniques de programmation (Prolog, systèmes experts et à base de connaissances, voire calcul formel). D'outils de traitement de texte prenant en compte des structures laissées de côté au début du traitement de texte: formalismes typographiques de la PAO (publication assistée par ordinateur), texte scientifique. De liaisons avec la forme vocale du texte (dictée, mais aussi lecture intelligente, avec génération d'une prosodie (*) adaptée au contenu). De génération automatique de texte à partir de données, par exemple pour commenter des résultats comptables.

Dans les espaces nouveaux de la réalité virtuelle, il reste à inventer de nouvelles formes d'écriture. Qui sachent exploiter à fond la richesse d'un espace à trois dimensions, voire à quatre avec le temps. Par exemple en dépassant les limites des alphabets traditionnels par l'appel aux icones. Mais sans tomber dans les excès inefficaces des idéogrammes orientaux. Ou encore en dépassant la planéité du "bureau" simulée par Windows pour offrir une navigation en trois dimensions dans l'espace de travail. Tâche difficile: malgré les travaux de Xerox ou du Média Lab, nous n'avons pas dépassé les balbutiements.

Le texte, constitutif de l'entreprise

Tel qu'il est, le texte reste seul porteur efficace du concept abstrait, du raisonnement logique, mais aussi du droit, de la législation, de la constitution même de nos sociétés comme de nos entreprises. Tout en gardant sa puissance d'évocation et de conviction. Napoléon, certes, a dit "Un petit croquis vaut mieux qu'un long discours". Il n'en a pas moins rédigé le Code civil et, en quelques mots, galvanisé ses troupes au pied des Pyramides. Tout utilisateur de messagerie sait la force de quelques lignes de texte "bien envoyées". Et d'ailleurs les effets dévastateurs d'un message mal rédigé.

L'informatique va donc devoir aider l'entreprise à soigner les textes qu'elle émet. Déjà le traitement de texte a conduit la correspondance commerciale à un niveau de présentation qui stupéfierait les secrétaires des années 60. Le ciblage de plus en plus fin des clients appelle une rédaction différenciée des messages. Bientôt, l'entrée massive d'Internet dans l'arène commerciale conduira à soigner l'émission de messages sur ces nouveaux canaux. Une part des outils de groupware s'oriente d'ailleurs sur la gestation en commun de documents textuels avant tout.

En sens inverse, les outils vont se perfectionner pour exploiter au mieux les textes reçus de tous les partenaires. Ou acquis sur CD-Rom ou par réseau. Les diffuser et les stocker efficacement sous forme image par la GED (gestion électronique de documents). En extraire la substantifique moelle textuelle par la reconnaissance de caractère complétés par les correcteurs orthographiques. Et de là, utiliser de plus en plus leur contenu pour orienter la décision voire pour l'automatiser.

Les professionnels de l'informatique resteront peut-être en dehors de ces développements. Trop occupés déjà par l'évolution des architectures techniques, l'exploitation des réseaux et la sécurité des systèmes. Les activités textuelles resteront alors l'apanage des utilisateurs et de spécialistes embauchés par les directions opérationnelles. L'informatique se limitant à l'intendance, à moins qu'elle ne mette en place une cellule spécialisée en son sein.

Entre l'image et les données, le texte ne représentera sans doute jamais le gros des volumes traités, transmis ou échangés. Mais il gardera un rôle central. Tantôt informel dans les messageries. Tantôt strictement régi par le droit ou la normalisation (Iso 9000 par exemple). Tantôt formalisé pour la programmation des machines. Mais toujours essentiel. Dans une cellule, le code génétique, porté par l'ADN, ne pèse pas lourd. Et pourtant, il régit tout.

(*) Prosodie: règles concernant les rapports de quantité, d'intensité, entre les temps de la mesure et les syllabes des paroles, dans musique vocale (Petit Robert), et plus généralement dans toute lecture à haute voix.