Traitement de formules mathématiques en édition électronique

Le titre de ce billet est imprécis à dessein. Il vise à ouvrir la discussion (sur mon blogIndispensables mathématiques, sur mon blog Bibliothèques numériques et édition scientifique, sur le blog Autour de BibNum – ces divers publics sont concernés) sur deux sujets auxquels je suis confronté dans plusieurs de mes travaux d’édition électronique, dans BibNum notamment.

Le premier sujet est la façon dont on peut faire figurer les formules de mathématiques dans une page HTML, si possible dans la même graphie que la page HTML. Par exemple, voir l’onglet analyse de ce dossier BibNum, il n’est pas facile d’harmoniser les formules avec le reste du texte. Certes, existe MathML – mais j’aimerais voir concrètement ce que sont des pages avec du MathML.

Le deuxième sujet (qui m’est plus proche) concerne les formats d’édition avec des formules mathématiques. Les mathématiciens professionnels utilisent LaTex (les physiciens très rarement). Or, dans BibNum, nous avons une mise en forme (vers Verdana + logos en bas de page + divers formats d’intertitres) et des corrections (de forme, ou de fond à proposer à l’auteur) – bref le travail que tout éditeur est en droit et en devoir de faire. C’est pourquoi j’ai longtemps cherché des convertisseurs PDF vers Word – puisque le LaTeX a pour format d’affichage le PDF. Je n’ai trouvé aucun convertisseur qui traite correctement les formules mathématiques (vers MS Equation ou MathType sous Word) – tous ne font que d’horribles pâtés quand ils voient des formules de mathématiques. En revanche, si l’on prend les fichiers de compilation du LaTeX (avant l’affichage en PDF), ce sont des .tex et je viens de trouver un convertisseur TEX vers Word qui a l’air correct pour les formules mathématiques (GrindeQ).

Je serais heureux de vos commentaires sur ces deux sujets.

LaTeX.png

Une remarque complémentaire de l’éditeur électronique que je suis, sur le second sujet. Certains mathématiciens s’offusquent auprès de moi que « l’État » (le ministère qui a le site BibNum en tutelle – encore que les liens soient un peu lâches – on pourrait dire pareild’un labo de recherche) utilise des formats Word, Microsoft, etc. au détriment des logiciels  gratuits. D’abord, je m’identifie assez peu à « l’État » , et travaille avec des outils que je m’achète moi-même. Ensuite, comme me le fait remarquer judicieusement un auteur BibNum (un autre mathématicien), les formats DOC ne sont pas réservés à Microsoft – beaucoup de suites gratuites, telles OpenOffice, utilisent ce format – donc on a quand même le deuxième problème. Toujours suivant ce même auteur, et c’est aussi mon avis, ce qui est scandaleux, c’est que les suites MS Office soient proposées à prix très bas au monde de l’éducation nationale, l’État complétant lui-même la différence par un abondement ! D’un autre côté y a-t-il beaucoup d’entre nous qui se sont réellement mis à travailler avec OpenOffice, sans continuer par paresse à travailler avec MS Office qu’ils ont déjà sur leur ordinateur ?

Autre remarque sur LaTeX et les mathématiciens. C’est évidemment un logiciel magnifique. Mais existe-t-il des éditeurs (au sens humain donné plus haut à ce terme) qui entrent dans le LaTeX de leurs auteurs pour faire les changements de fond et de forme mentionnés plus haut ? S’il en existe, qu’ils se dénoncent ! Je pousse même plus loin mon hypothèse heuristique : certes LaTeX est un logiciel extraordinaire pour gérer les maths (d’où son succès), mais n’est-ce pas aussi un moyen pour son utilisateur d’éviter d’avoir à subir toutes corrections (ou du moins les gérer soi-même en tant qu’auteur) que d’envoyer le PDF produit sous LaTeX ? Manière de dire « Voici mon fichier, à prendre ou à laisser »…Peut-être y a-t-il de cela, aussi, non ?

14 comments for “Traitement de formules mathématiques en édition électronique

  1. H
    14 mai 2011 at 07:40

    Pour les pages web, MathJax donne des résultats fabuleux.

     

  2. 14 mai 2011 at 07:50

    La plupart des éditeurs scientifiques (ceux qui génèrent de la littérature primaire, type UCP, AMS, ACS, Royal Society, dans une moindre mesure Elsevier, Springer et consorts) ont une possibilité
    de soumettre en LaTeX. Ce qu’il faut savoir, c’est qu’on soumet les PDF pour la version des referees, mais que la prod se fait sur le fichier tex, ce qui permet de faire les ajustements de
    fond/forme, justement.

    Réduire LaTeX aux maths, ça serait injuste. Ce serait passer à côté de la puissance de gestion de la biblio, des renvois multiples, de l’indexation, et surtout de ses capacités
    microtypographiques qui font que Word (et encore plus open office), c’est nul.

  3. 14 mai 2011 at 08:09

    Quand on publie un papier, les auteurs font les corrections de grammaire & co, et la prod. est assurée par l’éditeur.

  4. RM
    14 mai 2011 at 08:12

    Mais existe-t-il des éditeurs (au sens humain donné plus haut à ce terme) qui entrent dans le LaTeX de leurs auteurs pour
    faire les changements de fond et de forme mentionnés plus haut ? S’il en existe, qu’ils se dénoncent !

     

    En fait, toutes les revues mathématiques et de nombreuses revues scientifiques en général fonctionnent de la même manière:

    • un format « image » est envoyé pour avis de rapporteurs (même les revues acceptant les formats .doc demandent une version image comme un pdf) pour que cela soit
      portable et lisible par toute personne amenée à intervenir sur la décision éditoriale indépendamment de son matériel informatique.
    • des corrections sont renvoyées à l’auteur qui les intégre dans son manuscrit (et s’il ne le fait pas, l’article est rejeté).
    • un fichier source est renvoyé par l’auteur et doit être adapté par la composition de la revue. L’expérience montre que l’on passe en général plus de temps à
      retoucher un fichier word (changer police, interligne, marges, style de titre et de bibliographie…) qu’à reprendre un fichier LaTeX où il suffit en général de changer le fichier document
      class et recompiler (voire ne rien faire si le fichier cls est disponible au préalable). En trois ans de rédacteur en chef, les deux articles qui m’ont demandé le plus de travail étaient en
      Word. Les auteurs voyant la « simplicité » de taper en Word oublient la plupart du temps l’effort qu’il faut ensuite pour la composition (ou le piètre état du résultat sinon). 

     

  5. ecjs
    14 mai 2011 at 09:34

    En outre, il est bien plus aisé de comparer deux fichiers .tex, car ce sont des fichiers de texte du type .txt, que des fichiers Word. Les outils comme WinMerge (Win pour Windows) prennent tout
    leur sens ici.

    Et des outils comme LyX ou TexMaker rendent l’écriture aussi simple que Word.

  6. 14 mai 2011 at 00:06

    Les mathématiciens professionnels utilisent LaTex (les physiciens très rarement)

     

    Juste pour réagir là-dessus : non, les physiciens théoriciens utilisent tout autant Latex que les mathématiciens. Je ne vois d’ailleurs
    pas comment ils pourraient faire autrement; il suffit de faire un tour sur l’arXiv pour reconnaître la « patte » Latex. J’ai pour ma part rédigé tous mes papiers d’abord en Latex, même s’il m’est
    arrivé quelques fois de devoir les « convertir » en word pour des soumissions. Mais de plus en plus, les revues acceptent directement les pdf, ce qui est très utile.

    Le problème majeur de Latex par rapport à d’autres formats comme Word (par exemple) est qu’il est très difficile je trouve d’écrire un
    papier à plusieurs. Plusieurs raisons :

    – tout le monde n’a pas les mêmes packages ni les mêmes macros, du coup ça peut créer des problèmes

    – il n’y a tout simplement pas de façon simple de gérer l’édition simultanée du même papier

    – il n’y a pas d’éditeur standard qui s’est imposé. A titre d’exemple, il m’est arrivé d’ouvrir avec emacs des fichiers Latex écrits
    avec d’autres éditeurs, et de me retrouver avec des tas de caractères illisibles « retour chariot » qui avaient été « ajoutés » involontairement

    Ces problèmes vont se poser tout autant lorsqu’un éditeur de revue va ouvrir un fichier Latex, c’est pour ça que les éditeurs des
    revues de physique essaient de fournir des classes, des macros et des templates spécifiques pour leurs revues. Mais du coup, cela joue aussi contre l’homogénéisation du software, car chaque revue
    va proposer ses propres macros, etc… Word n’a pas ces problèmes.

    Une solution concernant l’édition par les revues est aussi, via le site de soumission du papier, de faire soumettre le fichier source
    .tex uniquement et de compiler sur les serveurs de la revue, afin que les auteurs vérifient par eux-mêmes si ce qu’ils ont fait est compatible avec les styles de la revue.

  7. H
    14 mai 2011 at 00:22

    Toutes les pages d’Images des Maths, par exemple http://images.math.cnrs.fr/Geometrie-Anamorphique-II.html sont
    en MathJax. Au début on voit du code tex, comme $x$, après quelques secondes le moteur javascript y substitue le résultat « graphique ».

  8. ecjs
    14 mai 2011 at 01:18

    Un outil comme SVN utilisé par les programmeurs est très utile pour l’édition d’un fichier .tex à plusieurs.

    Rien n’interdit non plus de gérer un fichier par section et un fichier principal qui les inclut, chacun travaillant sur sa section.

    Pour les caractères illisibles, il suffit de préciser que l’on travaille en utf8 plutôt que latin9. Quant au retour chariot, c’est plutôt lié au passage de Windows à Linux et vice versa, qu’à
    LaTeX. Cela se produirait avec n’importe quel fichier .txt.

  9. H
    14 mai 2011 at 03:20

    Et il y a un éditeur standard pour TeX, c’est vim 

  10. 15 mai 2011 at 04:18

    Pour répondre au commentaire de Tom sur les difficultés d’édition à plusieurs…

    On est en train de collaborer à pas mal de monde sur un papier, et le coup de SVN + FileMerge (sur mac, diff ou WinMerge chez les autres) marche bien. L’avantage d’avoir un SVN, c’est qu’on peut
    mettre tous les packages non standard dans le dossier principal, et quand on checkout, on peut compiler sans difficulté. La classe AASTeX est géniale pour éditer les papiers.

    En ce qui concerne les problèmes de fins de ligne, un petit script perl doit faire l’affaire, non?

  11. RM
    15 mai 2011 at 05:46

    – tout le monde n’a pas les mêmes packages ni les mêmes macros, du coup ça peut créer des problèmes

    Je ne vois pas le souci. Il suffit de se fixer au préalable la liste des packages à utiliser (en général fixée par l’éditeur).
    Personnellement, je pense que si la revue a bien prévu sa classe, cette situation ne devrait pas se présenter.

    – il n’y a tout simplement pas de façon simple de gérer l’édition simultanée du même papier

    Est ce vraiment plus simple avec Word?

    – il n’y a pas d’éditeur standard qui s’est imposé. A titre d’exemple, il m’est arrivé d’ouvrir avec emacs des fichiers Latex
    écrits avec d’autres éditeurs, et de me retrouver avec des tas de caractères illisibles « retour chariot » qui avaient été « ajoutés » involontairement

    Ce n’est pas un problème d’éditeur mais de codage (comme pour tous les fichiers). La plupart des éditeurs Windows fonctionne en Latin1
    alors que le codage le plus fréquent (hors mac) ailleurs semble désormais être l’UTF8.

  12. C.Bernizet
    16 mai 2011 at 02:05

    Et bien avec LibreOffice (successeur d’OpenOffice développé par une communauté indépendante de Oracle) Il est possible de générer des pdf « hybrides », dans lequel le fichier original est
    incorpporé de manière transparente au pdf.

    Doc à priori on a un fichier pdf standard, mais i on l’ouvre avec LibreOffice, on a acces au fichier odt, dans lequel on peu faire des modifications (et en loccurence sur les formules
    mathématiques). Il suffit ensuite de réenregistrer le fichier et de faire un nouvel export en pdf hybride.

  13. 17 mai 2011 at 03:28

    Bonjour,

    J’en rajoute une couche : LateX est très utilisé dans le monde des physiciens, en particulier en physique des particules et astrophysique. J’ai rédigé ma thèse avec ainsi que mes articles, les
    revues d’astrophysique acceptent le format tex (historiquement bien avant le format doc). Les seules fois où je dois utiliser word, c’est en général pour des rapports ou des demandes de
    financement : je ne sais combien de cheveux je me suis arraché en rédigeant une demande ANR sous word. L’horreur ! En plus le rendu final est moche comparé à ce qu’on peut faire avec latex.

    Ceci étant, je voulais pouvoir utiliser des formules mathématiques sur mon site web. C’est pourquoi je suis passé sous SPIP (http://www.spip.net/fr), qui permet d’utiliser du latex dans les
    articles. Cela donne des choses comme ça : http://snovae.free.fr/spip.php?article57 ; en revanche je ne sais pas trop quelle recette utilise ce gestionnaire de sites web pour parvenir à ses fins
    !

    Guillaume

  14. Ethaniel
    25 mai 2011 at 08:54

    Je sais bien que j’arrive après la bataille et que deux autres contributeurs ont déjà évoqué ce point, mais m’étant insurgé en cours de lecture de l’article, j’y vais de ma petite prose : je m’insurge contre l’affirmation selon laquelle les physiciens utiliseraient très rarement LaTeX.

    J’ai bien lu la réponse en commentaire comme quoi il fallait lire « (les physiciens auxquels j’ai affaire pour BibNum, très rarement) », mais je ne l’ai pas lu dans le corps du texte, d’où
    vitupération .

    Sans revenir sur le cas d’arXiv qui a déjà été mentionné, je me contenterai de ma propre expérience en disant que, dans le labo où j’étais, c’était LaTeX à tous les étages !

    Commentaire inutile du jour : ça, c’est fait !

Comments are closed.