Discussion:Traduction automatique

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Discussion de 2005[modifier le code]

Une bonne âme peut-elle me dire si le fichier audio http://www.tous-les-savoirs.com/index.php?op=conferenciers&f=120&a=audio est bien lisible ? Je voudrais le mettre dans les liens (faute d'avoir trouvé le texte sur le site de l'auteur). Apokrif 16 fev 2005 à 01:56 (CET)

Je ne sais pas s'il est lisible, en tout cas il est audible et m'a assez intéressé. Il y a cependant une difficulté de la traduction automatique sur laquelle peu de gens insistent: les erreurs d'écriture qui empêchent les logiciels de faire leur travail. Et il ne faut pas seulement penser aux fautes d'orthographe: les fautes de langue, même courantes, compliquent singulièrement la tâche. Prenons l'exemple de:
Nous avons résolu le problème
Systran vous donnera tout de suite:
We solved the problem
Mais il est probable qu'un jeune, voire un neutralisateur habituel de Wikipédia, écrira plutôt:
On à résolut le problème
en combinant fautes d'orthographe et emploi populaire de «on» pour «nous». Cela donnera:
One with solved the problem
Il est permis de se demander jusqu'à quel point un pur anglophone pourra saisir. Quand on constate le niveau orthographique de certains articles sur le Wikipédia francophone, on voit mal des étrangers se fier à un traducteur automatique pour essayer de savoir au moins de quoi on parle; et s'ils veulent faire un tour dans les discussions ce sera la catastrophe, puisqu'ils y rencontreront des illettrés qui se vantent de leur inculture. Gustave G. 16 mai 2005 à 11:38 (CEST)[répondre]


Je conseille de jeter un coup d'oeil amusé sur [1], qui montre la première version de l'article sur Jean Baptiste de la Salle, manifestement le fruit d'une traduction automatique.

Implanter / Implémenter[modifier le code]

Dans le paragraphe Situation Actuelle, avertissement de Google, on peut lire: La traduction automatique reste une technologie très complexe et difficile à implanter, [...]. J'utiliserais "implémenter". Néanmoins je n'ai pas corrigé car il s'agit d'une citation de l'avertissement Google. A vous de voir! Plouceur

Je vous propose de mettre en note dans le texte de Google : « Sans doute faut-il lire implémenter ». Mais je ne suis jamais arrivé à mettre des notes en bas de page. Je ne suis pas doué pour tous ces codes. Merci. Gustave G. 30 août 2006 à 23:53 (CEST)[répondre]
En fait, la page de Google a ete modifiee et le nouveau texte n'utilise ni implanter ni implementer... une petite mise a jour de la citation resoudrait naturellement le probleme :) Plouceur

Traducteur japonais[modifier le code]

Il m'est arrivé, au cours de mes recherches sur l'Internet, de tomber sur des pages écrites en japonais. Étant incapable de déchiffrer/comprendre le moindre symbole, j'ai cherché un moyen de traduire la (ou une partie de la) page automatiquement. J'ai trouvé le site suivant http://www.excite.co.jp/world/ qui propose de traduire le japonnais en anglais, chinois, coréen, français, allemand, italien, espagnol et portugais (et vice et versa). J'avoue que le premier abord est déconcertant car il n'y a presque que des idéogrammes mais les résultats me semblent à la hauteur.

Si vous voulez bien tester le lien, me dire votre avis et pourquoi pas l'ajouter au tableau comparatifs "Traducteurs en ligne gratuits" Merci

PS : Je n'ai testé que la traduction jp<->en et je crois qu'il y a une restriction sur l'utilisation .. à voir donc

Je ne suis pas arrivé à voir comment fonctionnait ce site puisque j'ignore le japonais. De toutes façons il existe ce lien mais je déconseille cette technique de traduction automatique autrement que pour un usage purement privé et ludique. On peut vous dire les pires erreurs et vous pouvez dire vous-même les pires horreurs sans que vous vous en aperceviez. Gustave G. (d) 22 juillet 2008 à 01:51 (CEST)[répondre]

Prérequis[modifier le code]

Je ne comprends pas la correction de Dhatier. Le mot « prérequis » s'écrit normalement attaché ; qu'on voie entre des milliers d'exemples ce site. Merci de répondre. Gustave G. (d) 27 juillet 2008 à 02:20 (CEST)[répondre]

Intitulé de l'article[modifier le code]

Cet article en l'état actuel ne présente pas la "Traduction Automatique", mais uniquement des exemples et des difficultés de la tâche de traduction (automatique ou non). Il conviendrait de l'intituler "Difficultés et exemples de traductions automatiques", ou quelque chose dans le genre.

La "Traduction Automatique" est avant tout un thème de recherche faisant parti de l'informatique linguistique (ou Traitement des langues). Ce thème de recherche a une longue histoire (c'est un des thèmes de recherches les plus anciens de l'informatique), et de nombreuses méthodes ont été expérimentées, certaines commercialement, d'autres en laboratoires (notamment en France, cf le CETA (Centre d'Ètude pour la Traduction Automatique), devenu GETA (Groupe d'Étude pour la traduction Automatique) à Grenoble).

L'article devrait mentionner les différentes stratégies développées, Traductions directes, par transfert ou par interlingue (pivot), ainsi que les méthodes utilisées pour implanter ces stratégies (basées sur des règles, statistiques, basées sur des exemples, ...).

Enfin, l'article, dans son état actuel présente une sorte "d'évaluation" de résultats de traductions. Une telle évaluation ne peut être faite de manière aussi informelle, car elle dépends de la tâche à accomplir (traduction pour lecture ou pour diffusion, pré-traduction pour révision), du contexte (compétence linguistique de l'utilisateur, nécessité de fidélité (manuels, textes normatifs, etc.) ou simple appréhension du contenu d'un texte en langue étrangère. L'évaluation en traduction automatique est aussi un domaine de recherche complexe (et d'actualité pour les traducteurs statistiques), cf. travaux de Margaret King, ISCCO, U. de Genève antérieurs aux évaluations statistiques). L'évaluation des systèmes de traduction automatique devraient faire l'objet d'une page indépendante. — Le message qui précède, non signé, a été déposé par Dodecaplex (discuter), le 2 mars 2009 à 13:13

Le grand traducteur Claude Piron racontait dans Le Défi des langues qu'il avait un jour été invité (par erreur sans doute) à un débat sur la traduction automatique. Il y rencontra des informaticiens, des théoriciens du langage etc. Mais il constata qu'il était le seul traducteur : de tous les autres participants aucun ne s'était jamais heurté aux problèmes réels que la traduction peut poser. J'ai eu la même impression en parcourant dans les wikipédias allophones les articles consacrés à la traduction automatique : je croyais entendre discuter les médecins de Molière, très capables de beaux discours en grec et en latin mais qui restaient courts quand on leur demandait : « Qu'est-ce qu'il faut faire ? ».
Que Systran, traduisant en français du néerlandais (et dans une moindre mesure de l'allemand) fasse glisser la négation sur l'idée suivante, cela me semble important ; on me dira que c'est un TI puisque j'ai l'impression d'avoir été le premier à le remarquer, mais le premier imbécile venu peut le vérifier. Que Google n'ait toujours pas maîtrisé le cas possessif en anglais, cela me semble grave mais les autres apparemment s'en moquent.
Ce que souhaite, me semble-t-il, le lecteur moyen de Wikipédia, c'est de trouver des connaissances utilisables. Le jeune étudiant se demande si la traduction est une voie d'avenir, le chef d'entreprise voudrait savoir s'il pourra se passer de traducteurs etc. Si vous pensez que ces gens ne valent pas la peine qu'on s'occupe d'eux, allez-y et alignez l'article sur les autres Wikipédias dont le lecteur moyen ne peut rien tirer. Au moins vous serez content, c'est l'essentiel. Gustave G. (d) 5 mars 2009 à 15:02 (CET)[répondre]

Un fantasme trop répandu[modifier le code]

Une I.P a corrigé la phrase : « La traduction automatique désigne au sens strict le fait de traduire entièrement un texte grâce à un ou plusieurs programmes informatiques, sans qu'un traducteur humain n'ait à intervenir » en lui faisant dire : « La traduction automatique désigne au sens strict le fait de traduire entièrement un texte grâce à un ou plusieurs programmes informatiques, avant qu'un traducteur humain n'ait à intervenir. » Voilà qui est criant de vérité pour nous montrer les fantasmes chez ceux qui ne sont pas au courant ; ils se figurent en effet que la traduction automatique donne un texte presque parfaitement au point, avec seulement quelques petites lourdeurs qu'on n'aura pas grand mal à corriger. C'est ainsi qu'une traductrice a reçu cette offre : « Nous recherchons des traducteurs ayant l'expérience de textes de l'UE et d'organismes officiels dans le cadre d'un appel d'offres pour l'UE. Le projet consiste en la relecture de textes de l'UE générés par un programme de traduction automatique », et pour un salaire de misère bien sûr. En fait tout traducteur professionnel vous dira qu'il passerait plus de temps à revoir un texte traduit automatiquement qu'à le traduire lui-même directement ; et je m'en rends bien compte quand, sur Wikipédia, je tombe sur une traduction automatique qui a par la suite été retouchée : je n'ose pas tout balayer et repartir de zéro, par égard pour ceux qui se sont donné du mal, mais j'enrage. Et je bénis au contraire les administrateurs au courant qui n'hésitent pas à envoyer aux oubliettes les traductions automatiques qu'on leur signale. Je reverte donc cette correction fautive. Gustave G. (d) 6 juin 2009 à 17:53 (CEST)[répondre]

Quand une I.P. « vérifie » mais ne va pas plus loin[modifier le code]

J'avais donné l'exemple de « In such a case, you can make a very good case for wooden cases », qu'une machine traduisait en 1991 par « Dans un tel cas vous pouvez faire un très bon cas pour des cas inexpressifs » et conclu (il y a quelques années) : « Il ne semble pas qu'on fasse mieux à l'heure actuelle ». Une I.P. s'écrie dédaigneusement : « Faux (verification sur google traduction) ». Je constate en effet que Promt et Systran traduisent aujourd'hui « wooden » par « de bois » ou « en bois » et que Google va même jusqu'à parler de « caisses en bois ». Seulement c'est en rendant désormais « wooden » par « en bois » dans tous les cas ; or, si je m'aventure à demander : « Her voice was wooden (Sa voix était inexpressive) », Google et Systran me donneront avec un bel ensemble : « Sa voix était en bois » et Promt : « Sa voix était de bois ». On voit qu'on ne s'en sort pas. Il faudra que je mette à jour ma phrase mais j'entends d'ici des imbéciles hurler en chœur : « T.I. ! » Gustave G. (d) 7 juin 2010 à 03:55 (CEST)[répondre]

Pas moi Émoticône : il s'agit d'un simple exemple reproductible. Romainhk (QTx10) 7 juin 2010 à 10:24 (CEST)[répondre]

Je reste bien perplexe[modifier le code]

Lgd (d · c · b) vient d'ajouter en tête de cet article les lignes suivantes :

Cet article ou section peut contenir un travail inédit ou des déclarations non vérifiées.
Vous pouvez aider en ajoutant des références. Voir la page de discussion pour plus de détails.

La dernière phrase (Voir la page de discussion pour plus de détails) laisserait supposer que Lgd a doctement exposé son point de vue. Eh bien, pas du tout ! Il n'a pas daigné intervenir jusqu'ici et il continue à ne pas le faire. C'est à nous d'essayer de savoir ce qu'il veut et d'y porter remède. Voilà qui ne nous simplifie pas la vie. Gustave G. (d) 10 juin 2010 à 13:24 (CEST)[répondre]

L'analyse que j'ai retirée est un TI dans le sens où elle provient du propre travail de recherche de GG et non pas de travaux publiés. La règle WP:TI s'applique à tous, dura lex sed lex. Et ce quelque soit la qualité, la justesse desdites analyses. Si le grand Braudel était venu sur WP pour y publier La Méditerranée... on lui aurait dit la même chose. En d'autres mots, quelles que soient les compétences du rédacteur, il se doit de respecter les règles édictées par la communauté.--Kimdime (d) 12 juin 2010 à 14:26 (CEST)[répondre]
Il ne faut pas appeler TI n'importe quoi. Si on se réfère à J. Wales on constate que celui-ci voulait écarter les polémiques et ne garder que ce qui est accepté par tous, mais il n'est pas nécessaire de sourcer ce que personne ne conteste. Je prends l'exemple de cette phrase en néerlandais sur Lilian Baels que j'ai souvent citée : « Lilian kreeg geen staatsbegrafenis, maar rust - op verzoek van Leopold - naast haar echtgenoot en Koningin Astrid. » Contestera-t-on qu'elle est dans l'article en néerlandais ? contestera-t-on que Systran la traduit par : « Lilian a obtenu d'enterrement d'état, mais ne repose pas - à la demande de Léopold - à côté de son conjoint et de la reine Astrid » ? Contestera-t-on que cela semble signifier pour tout esprit normal que Lilian a eu droit à des funérailles officielles mais ne repose pas à côté de son mari et de la reine Astrid ? Contestera-t-on qu'on ne trouvera aucun bilingue néerlandais-français pour ne pas dire que c'est exactement le contraire ? Contestera-t-on que Systran (involontairement, bien sûr) donne un renseignement faux ?

Dans toutes les querelles que j'ai plus ou moins suivies (en essayant de m'en mêler le moins possible) comme l'existence historique de Jésus ou l'importance de l'UJFP on ne s'accordait ni sur les faits ni sur leur interprétation. Prière donc à Kimdime de me dire dans l'exemple que j'ai donné plus haut où est l'erreur de fait et en quoi j'interprète mal. Gustave G. (d) 12 juin 2010 à 14:39 (CEST)[répondre]
Un article n'a pas à contenir vos interprétations, quelqu'en soit leur justesse et leur qualité, c'est non négociable. Voir WP:TI--Kimdime (d) 12 juin 2010 à 16:08 (CEST)[répondre]
C'est une sorte de remake des Provinciales. Kropotkine a confraternellement bloqué l'article sur la version de Kimdime (alors que celui-ci en était à son 3ème revers et que je n'en avais fait qu'un seul) et maintenant, comme les jésuites se bornaient à dire que les propositions condamnées étaient dans Jansénius sans jamais dire à quel endroit, mon contradicteur se contente de répéter avec un automatisme de robot : « TI… TI… TI… », sans jamais citer les passages litigieux et expliquer en quoi ils constituent des TIs. Il est incapable d'aucun autre argument mais il sait bien qu'au bout d'une semaine c'est moi qui recevrai l'injonction ferme de ne plus me mêler de cette question. Il aura eu gain de cause sans avoir plaidé. Je tiens tout de même à montrer l'absurdité de la conception de Kimdime (dans la mesure où je puis la deviner puisqu'il continue à jouer les muets du sérail) ; je lis sur le site Cetadir des exemples de traductions automatiques fautives : « Urgence sort seul » pour « Emergency exit only » (Sortie de secours), « Baraque de la photographie » pour « photograph booth » (photomaton), « Inscription de la tournée » pour « Tour registration » (Guichet d'inscription aux visites guidées). Voilà qui était sourcé et donc incontestable, je pense que j'aurais eu le droit de le dire, même si on ne sait pas le logiciel utilisé ni où et quand cela a été fait. En revanche j'aurais été dans mon tort en donnant la traduction Google, immédiatement vérifiable par tout le monde : « des issues de secours ne », « stand photo » et « Tour d'enregistrement ». Je pense qu'adopter cette attitude c'est se moquer du lecteur sous prétexte de lui rendre service. Gustave G. (d) 12 juin 2010 à 17:20 (CEST)[répondre]
Effectivement vous pouvez reprendre des exemples et des analyses publiées par des sources notables, vous ne pouvez pas en forger par vous même.--Kimdime (d) 13 juin 2010 à 10:52 (CEST)[répondre]
Si vous êtes fatigué et que vous n'ayez pas bien lu (à mon âge j'aurais plus d'excuses que vous), je vous rappelle que dans mon exemple je n'avais forgé aucune des phrases que je me suis contenté de reprendre ; je me contentais, ce que tout le monde peut faire, de donner les traductions accessibles en ligne. Notez que vous n'êtes pas le premier Wikipédien de cette espèce, il y a quatre ans déjà en traduisant Codex de Léningrad j'avais parlé des neutralisateurs-vandalisateurs qui ne connaissent rien à une question mais sont trop heureux d'intervenir là où ils n'entendent rien. Je vais donc laisser tomber ce problème et laisser l'article dans cet état où il n'a ni queue ni tête (et fait par là votre bonheur) et je retourne à mes traductions dans des domaines où un solide rempart de spécialistes tient en respect les importuns. Gustave G. (d) 13 juin 2010 à 13:27 (CEST)[répondre]

Étant donné que vous semblez être tombés d'accord pour arrêter la guerre d'édition et laisser l'article dans la version actuelle, je déprotège l'article. Kropotkine_113 13 juin 2010 à 16:00 (CEST)[répondre]

Protection[modifier le code]

Je viens de protéger l'article une semaine. Trop de révocations depuis deux jours. Je vois qu'une discussion est entamée juste au dessus. Quand elle aura abouti je déprotégerai l'article. Bon courage. Kropotkine_113 12 juin 2010 à 14:28 (CEST)[répondre]

Déprotégé suite à l'issue de la discussion plus haut. Kropotkine_113 13 juin 2010 à 16:01 (CEST)[répondre]
Je ne dis pas que je sois d'accord, je suis simplement obligé de laisser tomber puisque Kimdime a la force pour lui à défaut d'avoir la raison. C'est la première fois que je vois que l'on qualifie de TI un article où l'on ne conteste l'exactitude d'aucun des faits cités et d'aucune interprétation. L'article est donc déprotégé mais n'évoluera plus, puisque moi-même, qui suis un peu au courant, je n'ai plus le droit d'écrire tandis que Kimdime, qui peut fourrer tout ce qu'il veut, ne connaît rien à la question. Évidemment le grand spécialiste de la traduction qu'il est pourrait traduire l'article en anglais, dont une I.P. de ses amis m'a fait le plus grand éloge. Voilà d'ailleurs un article merveilleux, au moins du point de vue de Kimdime : on n'y donne pas le moindre exemple concret, la moindre phrase réelle avec sa traduction automatique, on ne trouve pour le sauver un peu qu'une citation du grand Claude Piron, qui malheureusement n'est plus de ce monde et à qui je ne puis écrire pour lui demander son avis. Gustave G. (d) 13 juin 2010 à 16:58 (CEST)[répondre]
Le résultat de cette brillante intervention de Kimdime est que, si je me suis permis de supprimer la plus grande partie de Université wesleyenne de l'Ohio qui était issue d'une traduction automatique, c'était désormais aller contre un technique jugée parfaitement respectable, il est donc possible que ma suppression soit à son tour supprimée et que l'on revienne au charabia antérieur qui sera ainsi sanctifié. Gustave G. (d) 14 juin 2010 à 02:54 (CEST)[répondre]
Je ne sais pas si Sa Majesté Kimdime acceptera le site ProZ comme une source valable ; c'est un forum où se rencontrent et discutent des traducteurs professionnels sous leur véritable nom, avec renvoi à leurs infos personnelles car ils cherchent à se faire connaître. On discutait récemment de la grossière erreur de traduction (« parité » rendu par « parity ») qui a fait brutalement tomber l'euro le 4 juin dernier ; j'ai été surpris de constater que seul un certain Jeff Whittaker avait eu la même idée que moi : « As an aside, dit-il, I put the sentence into Google translate and Google fell into the same trap. » Mais je suppose qu'il ne faut pas le dire. Gustave G. (d) 14 juin 2010 à 09:18 (CEST)[répondre]
Comme je suis intervenu en annulant une action de Kimdime, je vais expliquer mon point de vue. C'est un peu par hasard que je suis revenu sur cette page pour la trouver bien plus succincte que ce dont je me souvenais. Un simple coup d'oeil à l'historique des versions m'a montré que la suppression de pans entiers de l'article provenait du dernier intervenant et était très récente : un cas typique de vandalisme non corrigé.
Quand au motif évoqué : (suppression TI), le sigle TI n'évoque rien pour le contributeur moyen.
J'ai donc annulé la dernière modification sans même me préoccuper de qui était Kindime ni des débats sur cette page de discussion.
Ce n'est que plus tard que j'ai regardé les discussions et découvert également que le vilain vandale est un administrateur (ce qui ne remet nullement en cause mon action réparatrice).

Je pense que ce qui s'est passé pour cet article est significatif d'une évolution malsaine de Wikipedia. Il y a 2 ou 3 ans (ou plus), même s'il pouvait y avoir des querelles rédactionnelles, et si tous les contributeurs n'étaient pas à 100 % sans arrière pensée, la plupart contribuaient en toute honnêteté le plaisir de partager ses connaissances.

Et puis, il y a eu différentes modes donc celle du sourçage. Les textes qui pendant des années convenaient sont à présent décorés de plusieurs bandeaux. Il devient de plus en plus difficile de contribuer sans que ce qu'on rédige soit critiqué (pas corrigé, juste critiqué comme non conforme à des normes qu'à peu près seuls les admins de wikipedia connaissent).

Sur un texte que j'avais complété à mon arrivée sur wikipedia, il y a eu un jour une accusation de copyvio (violation de copyright), car la partie qui existait avant que j'intervienne reproduisait un morceau de page web. Aujourd'hui, avec l'article Traduction automatique, je découvre l'accusation de TI (comme travail inédit), justement parce que les exemples cités ne sont pas ailleurs sur le web !
Il vaudrait mieux vaut en rire. Le problème est que les administrateurs de wikipedia en mettant de plus en plus de normes que pratiquement seuls eux connaissent découragent les contributeurs.

Par rapport à l'évolution de ce texte, je pense qu'en cas de désaccord entre des contributeurs sincères et un administrateur têtu qui n'hésite pas à saboter le travail réalisé sur plusieurs années, ce sera l'administrateur qui aura le dernier mot, quite à ce qu'il soit soutenu par d'autres administrateurs. Autant en pareil cas laisser pourrir l'article de Wikipedia et publier le texte ailleurs (il n'y a pas que wikipedia sur le web). Bech (d) 24 juin 2010 à 22:24 (CEST)[répondre]

L'échec du projet DLT[modifier le code]

Cher ArnoLagrange,
Vous vous étonnez avec raison du titre « Un échec significatif » qui ne correspond pas à ce qu'on voit après, mais tenez compte du fait que Kimdime a « taillé à la hache » selon ses propres termes dans ce que j'avais écrit, comme un gamin de six ans qui prétend arracher les mauvaises herbes du jardin et saccage tout parce qu'il n'y connaît rien. Si le projet DLT a échoué, ce n'est pas manque d'argent (on en aurait toujours trouvé s'il avait été viable), c'est parce qu'il était interactif. Voyez par exemple Systran dans sa version haut de gamme : quand on veut introduire un nouveau mot il demande s'il s'agit d'un nom, d'un adverbe, d'un adjectif etc. alors que nos jeunes, formés par des professeurs qui ont fait Mai 68, seraient presque tous incapables de distinguer une conjonction d'une préposition. On leur a appris à faire des « arbres » qui ne leur servent à rien alors que Promt et Systran se réfèrent à la grammaire traditionnelle, la seule utilisable. L'échec de DLT est donc l'échec d'un projet qui demandait un petit effort à l'utilisateur alors que Google translate fournit immédiatement un résultat sans rien exiger ; peu importe que le résultat soit souvent castrophique, on en jugera d'ailleurs en comparant mes traductions d'articles à ce que Google translate aurait donné. Cordialement. Gustave G. (d) 15 juin 2010 à 18:21 (CEST)[répondre]

Si Sa Très Grande Majesté Gustave Greatzlin pouvait cesser de prendre tous les informaticiens travaillant sur le sujet des langages, grammaires, et traductions automatiques pour des demeurés incultes, peut-être Wikipédia gagnerait en informations utiles sur ce sujet, plutôt qu'en considérations de forum. FrançoisD 16 juin 2010 à 08:17 (CEST)[répondre]
Que FrançoisD chausse ses lunettes, qu'il regarde une nouvelle fois le paragraphe que j'ai écrit et qu'il me dise où il y voit la moindre attaque contre les informaticiens dont je ne parle même pas. La discussion de forum commence quand on part au quart de tour dans une diatribe complètement hors du sujet au lieu d'examiner calmement ce qui a été dit... et c'est justement ce que vient de faire FrançoisD. Gustave G. (d) 16 juin 2010 à 08:59 (CEST)[répondre]
Mon commentaire porte sur l'ensemble de votre oeuvre, pas seulement le paragraphe ci-dessus. Votre réaction consistant à supposer d'abord que je ne sais pas lire m'amuse, elle est tellement habituelle de votrre part... FrançoisD 16 juin 2010 à 09:29 (CEST)[répondre]
Pour se tirer d'affaire, FrançoisD parle de « l'ensemble de [mon] œuvre » sans plus de précision comme l'Index librorum prohibitorum condamnait chez un écrivain opera omnia. J'ai toujours eu au contraire beaucoup d'estime et même d'admiration pour les informaticiens grâce auxquels je me sers de mon ordinateur ; d'ailleurs, ayant lu « l'ensemble de [mon] œuvre », il a pu constater que selon moi les logiciels de traduction automatique sont des outils fort bien faits et très utiles quand ils sont utilisés par des personnes compétentes et non par des amateurs pressés. Je ne demande pas mieux qu'un informaticien complète l'article en nous apprenant l'histoire de la traduction automatique depuis la Tour de Babel jusqu'à nos jours et qu'un autre nous explique les principes théoriques sur lesquels elle repose. Seulement il reste une petite question à laquelle le brave homme moyen voudrait une réponse : est-ce que cela marche ou non ? Je n'ai trouvé pour m'éclairer er l'éclairer qu'un article de Christian Boitet selon qui ça ne marche pas dans les systèmes proposés au commun des mortels mais « il existe aussi des systèmes spécialisés, inconnus du grand public, qui traduisent extrêmement bien, et en fait mieux, et pas seulement beaucoup plus vite, que des traducteurs humains ». Seulement c'est le black-out total sur ces systèmes et ceux qui les utilisent. Gros utilisateur de Wikipédia pour mon travail, je suis heureux de constater que l'immense majorité des articles techniques ne sont pas aussi sibyllins et j'aimerais que celui-ci pût renseigner le chef d'entreprise qui se demande si oui ou non il a intérêt à se servir d'un logiciel de T.A. ou s'il doit plutôt continuer de faire appel à des traducteurs professionnels. Gustave G. (d) 16 juin 2010 à 11:15 (CEST)[répondre]

La question de sécurité...[modifier le code]

En attendant qu'un contributeur plus compétent que moi ne rédige un paragraphe, je mets ici ce lien sur les très gros problèmes de sécurité et de copyright : [1]. Je ne sais pas qu'en penser, mais le problème est incontestablement d'une gravité extrême. Ces problèmes s'étendent-ils aussi aux pièces jointes sur Gmail ? (...merci à Gustave... ...j'espère qu'il ne m'en voudra pas...)--Plijno (d) 9 janvier 2012 à 18:09 (CET)[répondre]

On pense bien que je ne vais pas me hasarder à rédiger quelque chose qui serait immédiatement « taillé à la hache » ; mais nous avons sur Wikipédia assez d’omniscients qui seront capables de le faire à ma place (je ne donne pas des noms : cela me vaudrait un blocage immédiat). Enfin c’est une nouvelle qui a fait du bruit dans le petit monde de la traduction ; remarquez entre autres ce qu’en dit cette chère Aurélie Duclos et quelques réactions de traducteurs. Maintenant, Dieu merci, les gens du métier sont prévenus ; tant pis pour les autres qui chercheront à s’informer dans l’article « neutralisé » de Wikipédia et conclurons que cette innovation est géniale et absolument sans danger : ce n’est pas à moi qu’ils devront adresser leurs réclamations. Gustave G. (d) 9 janvier 2012 à 20:27 (CET)[répondre]

Quand Skype traduit votre voix en temps réel ![modifier le code]

Un article du Point nous annonce que le Messie (je veux dire Babel fish) est arrivé. Voyez et entendez deux personnes s’entretenir chacune dans sa langue et avoir l’air de se comprendre.

Voilà qui me rappelle des publicités pour des logiciels de traduction automatique où, en se servant de phrases soigneusement composées, on peut donner l’illusion que le problème des langues est résolu. Nous avons ici affaire, apparemment, à une conversation préparée, devant un public évidemment gagné d’avance et dont les applaudissements me rappellent les rires enregistrés. Un point important est que tous les employés de Microsoft vous garantiront que ce système de Microsoft fonctionne « très bien » ; d’accord, mais à l’heure où Microsoft annonce des licenciements on les verrait mal parler d’autre manière. Ce que je sais, c’est que là où je puis vérifier moi-même, c’est-à-dire sur Google Translate, les résultats sont loin d’être satisfaisants.

Mais peu importe : l’article est là. C’est une source secondaire intéressante et je ne doute pas que nos neutralisateurs omniscients sauront en tirer quelque chose de merveilleux. Gustave G. (discuter) 29 juillet 2014 à 02:32 (CEST)[répondre]

Quelques points ?[modifier le code]

  • En rapport avec l'UE
    • peut-être des renseignements intéressants dans les rapports d'activité du Service de Traduction Automatique (à Luxembourg) de la Direction Générale de la Traduction de l'Union Européenne (la traduction absorberait 37% du budget de fonctionnement de l'UE)
    • peu de choses sur les travaux de la BSO ??
  • modèles de traducteurs (langue(s) d'entrée / langue de sortie)
    • 1:1
    • 1:n (exemple : manuels techniques d'une firme)
    • n:1 (exemple : service de renseignement)
    • n:n (le Graal pour l'UE); l'usage d'une langue pivot est semble-t-il préférable à partir de 4 langues; au-delà, l'investissement croitrait comme le nombre de langues, et non plus comme leur carré.
  • traduction semi-automatique : au fur et à mesure de la traduction, un traducteur lève les ambiguités que le logiciel lui soumet.
  • il semble que sur les textes longs, la traduction automatique démarre lentement, le temps de se caler sur le domaine du texte, pour accélérer par la suite.

--Lf69100 (discuter) 28 mai 2016 à 17:06 (CEST)[répondre]

Un article en panne[modifier le code]

Depuis que les administrateurs de Wikipédia m’ont pratiquement mis à la porte, l’article n’a pas évolué : on demande nonchalamment des sources en faisant taire ceux qui peuvent en donner parce qu’on ne comprend pas la complexité du problème. Si certains lecteurs cependant veulent vraiment s’informer et seraient tentés de confier à Google Translate ou d’autres des documents trop confidentiels, je les renvoie à cet avertissement : Traduction: La gratuité, c'est bien. Quid de la confidentialité ?. J’espère qu’ici on ne le supprimera pas, j’aimerais aussi parler de DeepL qui mériterait un article à part alors qu'il envoie à linguee, mais je pense qu’un de nos omniscients (*** ou un de ses amis) seront ravis de s’en charger. Gustave G. (discuter) 19 octobre 2017 à 17:47 (CEST)[répondre]

Il est vrai que cet article est en panne. Sans doute — et sans jeter la pierre à personne — par une incapacité collective à créer du consensus. C'est bien dommage. La réalité est qu'avec la mondialisation des échanges, et avec la montée d'Internet, la traduction automatique gagne de plus en plus de visibilité. Par exemple, en 2017, le navigateur Google Chrome offre une fonctionnalité de traduction automatique activée par défaut [1]. Mais il serait complètement trompeur de limiter le focus la traduction automatique au seul google. — Le message qui précède, non signé, a été déposé par l'IP 77.199.96.193 (discuter), le 29 décembre 2017 à 12:53 (CET)[répondre]
Il faut jeter la pierre, au contraire, à ceux qui ne connaissent rien aux problèmes de traduction mais s’obstinent à vouloir en parler et, comme ils ont des administrateurs dans leur manche, en profitent pour bloquer toute progression.Gustave G. (discuter) 8 octobre 2019 à 12:25 (CEST)[répondre]

Lacunes: désambigüisation et Discours non standard[modifier le code]

Bonjour, je voudrais signaler quelques lacunes dans l'article. L'article ne parle pas des Major Issues; pourquoi ne pas en parler?

désambigüisation

La désambigüisation de sens de mot concerne la recherche d'une traduction appropriée quand un mot peut avoir plus d'une signification. Le problème a été soulevé pour la première fois dans les années 1950 par Yehoshua Bar-Hillel.Il a souligné que sans une "encyclopédie universelle", une machine ne serait jamais capable de distinguer les deux sens d'un mot. Il existe aujourd'hui de nombreuses approches pour surmonter ce problème. Elles peuvent être approximativement divisées en approches "peu profondes" et "profondes".

Les approches superficielles ne supposent aucune connaissance du texte. Elles se contentent d'appliquer des méthodes statistiques aux mots qui entourent le mot ambigu. Les approches profondes supposent une connaissance approfondie du mot. Jusqu' à présent, les approches superficielles ont été plus efficaces.

Claude Piron, traducteur de longue date pour les Nations Unies et l'Organisation mondiale de la santé (OMS), a écrit que la traduction automatique, dans le meilleur des cas, automatise la partie la plus facile du travail d'un traducteur; la partie la plus difficile et la plus fastidieuse consiste généralement à faire des recherches approfondies pour résoudre les ambiguïtés du texte source, ce qui exige de résoudre les exigences grammaticales et lexicales de la langue cible:

Pourquoi un traducteur a-t-il besoin d'une journée de travail entière pour traduire cinq pages, et non d'une heure ou deux? Environ 90% d'un texte moyen correspond à ces cas simples. Mais malheureusement, il y a les 10% restants. C'est cette partie qui exige plus de six heures de travail. Il y a des ambiguïtés qu'il faut résoudre. En particulier lorsque l'auteur d'un texte source est un médecin australien qui cite le cas d'une épidémie déclarée pendant la Seconde Guerre mondiale dans un "camp de prisonniers de guerre japonais". Parlait-il d'un camp américain avec des prisonniers japonais ou d'un camp japonais avec des prisonniers américains? L'Anglais a deux sens. Il est donc nécessaire de faire des recherches, peut-être même un appel téléphonique en Australie.

L'approche profonde idéale nécessiterait que le logiciel de traduction effectue toutes les recherches nécessaires à ce type de désambiguïsation, mais cela nécessiterait un degré d'intelligence artificielle plus élevé que ce qui a été atteint jusqu' à présent. Une approche superficielle qui ne fait que deviner le sens de l'expression anglaise ambiguë que Piron mentionne (en se basant, peut-être, sur quel genre de camp de prisonniers de guerre est le plus souvent mentionné dans un corpus donné) aurait une chance raisonnable de se tromper assez souvent. Une approche superficielle qui consiste à "interroger l'utilisateur sur chaque ambiguïté" n'automatiserait, selon l'estimation de Piron, qu'environ 25 % du travail d'un traducteur professionnel, laissant les 75 % les plus difficiles à faire par un humain.

Discours non standard

L'un des principaux écueils de la traduction automatique est son incapacité à traduire un langage non standard avec la même précision que le langage standard. L'heuristique ou la statistique du processus de traduction automatique prend la contribution de diverses sources sous forme standardisée d'une langue. La traduction basée sur des règles, par nature, n'inclut pas les usages non standard courants. Cela entraîne des erreurs de traduction à partir d'une source vernaculaire ou dans un langage familier. Les limitations de la traduction à partir de discours occasionnels posent des problèmes dans l'utilisation de la traduction automatique dans les appareils mobiles. — Le message qui précède, non signé, a été déposé par l'IP 77.199.96.193 (discuter), le 22 décembre 2017 à 12:07 (CET)[répondre]

Pourquoi ne pas parler des usages de la traduction automatique? Il y a sans doute de quoi dire, si l'on considère que:

Bien qu'aucun système n'offre le Saint-Graal d'une traduction automatique entièrement automatique et de haute qualité pour toutes formes de textes sanslimite, de nombreux systèmes entièrement automatisés produisent des résultats raisonnables. La qualité de la traduction automatique est considérablement améliorée si le domaine est restreint et contrôlé.

Malgré leurs limites inhérentes, les programmes de MT sont utilisés dans le monde entier. La Commission européenne est probablement le principal utilisateur institutionnel. Le projet MOLTO, par exemple, coordonné par l'Université de Göteborg, a reçu plus de 2,375 millions d'euros de l'UE pour créer un outil de traduction fiable couvrant la majorité des langues de l'UE. La poursuite du développement des systèmes d'AT intervient à un moment où les réductions budgétaires dans la traduction humaine risquent d'accroître la dépendance de l'UE à l'égard de programmes d'AT fiables. La Commission européenne a contribué à hauteur de 3,072 millions d'euros (via son programme ISA) à la création de MT@EC, un programme de traduction automatique statistique adapté aux besoins administratifs de l'UE, destiné à remplacer un ancien système de traduction automatique fondé sur des règles.

Google a affirmé que des résultats prometteurs ont été obtenus à l'aide d'un moteur de traduction automatique statistique breveté. Le moteur de traduction statistique utilisé dans les outils linguistiques Google pour les traductions entre arabe ⇄ anglais et chinois ⇄ anglais a obtenu un score global de 0,4281 par rapport au score BLEU-4 d'IBM (0,3954 en été 2006) lors des tests effectués par le National Institute for Standards and Technology.

Avec l'accent mis récemment sur le terrorisme, les sources militaires aux États-Unis ont investi des sommes considérables dans le génie du langage naturel. In-Q-Tel (un fonds de capital-risque, financé en grande partie par la communauté américaine du renseignement, pour stimuler les nouvelles technologies par l'intermédiaire d'entrepreneurs du secteur privé) a apporté/supporté des entreprises comme Language Weaver. Actuellement, la communauté militaire s'intéresse à la traduction et au traitement de langues comme l'arabe, le pachtou et le dari. Dans ces langues, l'accent est mis sur les phrases clés et la communication rapide entre militaires et civils par le biais d'applications de téléphonie mobile. Le Bureau des technologies de traitement de l'information du DARPA héberge des programmes comme TIDES et Babylon Traducteur. L'US Air Force a octroyé un contrat de 1 million de dollars pour le développement d'une technologie de traduction linguistique.

L'essor notable des réseaux sociaux sur le Web au cours des dernières années a créé une autre niche pour l'application de logiciels de traduction automatique — dans les utilitaires tels que Facebook, ou les clients de messagerie instantanée tels que Skype, GoogleTalk, MSN Messenger, notamment — permettant aux utilisateurs parlant différentes langues de communiquer les uns avec les autres. Des applications de traduction automatique ont également été lancées pour la plupart des appareils mobiles, y compris les téléphones portables, les ordinateurs de poche, les PDA, notamment. En raison de leur portabilité, ces instruments sont devenus des outils de traduction mobiles qui permettent aux entreprises de créer des réseaux d'affaires mobiles entre des partenaires parlant différentes langues ou de faciliter à la fois l'apprentissage des langues étrangères et les voyages non accompagnés vers des pays étrangers sans avoir recours à l'intermédiation d'un traducteur humain.

Bien qu'elle ait été considérée comme un concurrent indigne de la traduction humaine en 1966 par le Comité consultatif sur le traitement automatisé du langage mis sur pied par le gouvernement des États-Unis, la qualité de la traduction automatique a maintenant atteint des niveaux tels que son application dans la collaboration en ligne et dans le domaine médical est à l'étude. Dans le laboratoire Ishida et Matsubara de l'Université de Kyoto, des méthodes visant à améliorer la précision de la traduction automatique en tant qu'outil de soutien à la collaboration interculturelle dans la société mondialisée d'aujourd'hui sont à l'étude. L'application de cette technologie dans les milieux médicaux où les traducteurs humains sont absents est un autre sujet de recherche, mais des difficultés surgissent en raison de l'importance de traductions exactes dans les diagnostics médicaux. — Le message qui précède, non signé, a été déposé par l'IP 77.199.96.193 (discuter), le 22 décembre 2017 à 12:21 (CET)[répondre]

Lacunes: évaluation[modifier le code]

Pourquoi ne pas parler de l'évaluation de la traduction automatique? Il y a sans doute de quoi dire, si l'on considère que:

De nombreux facteurs influent sur la manière d'évaluer des systèmes de traduction automatique. Ces facteurs comprennent l'utilisation prévue de la traduction, la nature du logiciel de traduction automatique et la nature du processus de traduction.

Différents programmes peuvent bien fonctionner à différentes fins. Par exemple, la traduction automatique statistique (TAS) est généralement plus performante que la traduction automatique basée sur l'exemple (EBMT), mais les chercheurs ont constaté qu'en évaluant la traduction de l'anglais vers le français, la'EBMT donne de meilleurs résultats. Le même concept s'applique aux documents techniques, qui peuvent être plus facilement traduits par SMT en raison de leur langue formelle.

Cependant, dans certaines applications, comme par exemple les descriptions de produits rédigées dans un langage contrôlé, un système de traduction automatique basé sur un dictionnaire a produit des traductions satisfaisantes qui ne nécessitent aucune intervention humaine, sauf pour le contrôle de la qualité.

Il existe différents moyens d'évaluer la qualité de sortie des systèmes de traduction automatique. La plus ancienne est l'utilisation de juges humains pour évaluer la qualité d'une traduction. Même si l'évaluation humaine prend beaucoup de temps, elle demeure la méthode la plus fiable pour comparer différents systèmes, comme les systèmes fondés sur des règles et les systèmes statistiques. Les moyens automatisés d'évaluation comprennent BLEU, NIST, METEOR et LEPOR.

S'en remettre exclusivement à la traduction automatique non éditée ne tient pas compte du fait que la communication en langage humain est contextuelle et qu'il faut une personne pour comprendre le contexte du texte original avec un degré raisonnable de probabilité. Il est certainement vrai que même les traductions purement humaines sont sujettes à l'erreur. Par conséquent, pour s'assurer qu'une traduction générée par ordinateur sera utile à un être humain et qu'une traduction de qualité publiable est réalisée, ces traductions doivent être révisées et corrigées par un être humain. — Le message qui précède, non signé, a été déposé par l'IP 77.199.96.193 (discuter), le 22 décembre 2017 à 12:21 (CET)[répondre]

Pourquoi ne pas parler de ceci ou de cela ? écrivez-vous. Mais ne vous gênez pas, cher ami : personne ne vous en empêchera, il n’y a que moi qui suis interdit de parole pour le crime impardonnable de m’y connaitre un peu sur la question. Gustave G. (discuter) 5 août 2018 à 19:24 (CEST)[répondre]

Trop de place à Google Translate / outils de traduction : indications techniques[modifier le code]

De manière générale, cet article fait trop de place à Google Translate. Or d'autres outils, comme DeepL, donnent des résultats de traductions bien meilleurs. DeepL permet de traduire de longues phrases, certes pas parfaitement, mais avec un résultat très supérieur que celui de Google Translate. Je ne travaille pas pour DeepL, je n'ai aucun intérêt dans DeepL, mais j'ai constaté les très bons résultats obtenus, notamment de l'anglais à l'allemand. Apparemment, c'est parce que DeepL s'appuie sur un corpus énorme de phrases (le projet Linguee) et non une traduction mot à mot. Bref, je sais pas trop comment ça marche et ce qui manque justement dans cet article, c'est comment les logiciels sont fabriqués, sur quelle type de théorie linguistique ils s'appuient, etc. Je ne peux malheureusement pas aider, faute de connaissance dans ce domaine. Mais quand je lis un article encyclopédique qui s'appelle "Traduction automatique", je m'attends à y trouver quelques indications de ce type. Pas seulement une liste des logiciels existants, mais qui les a developpés (ou les développe encore)et dans quel contexte (recherches universitaires ?)Braveheidi (discuter) 20 mars 2018 à 19:22 (CET)[répondre]

Que ce soit DeepL ou Google Translate, faites-leur traduire en allemand ces deux phrases : « Mon voisin a épousé ma cousine » et « Ma cousine a épousé mon voisin » ; dans les deux cas on vous donnera : « Mein Nachbar heiratete meinen Cousin » ou « Mein Nachbar hat meinen Cousin geheiratet ». Vous me direz que, par la grâce de Mme Taubira, c’est maintenant possible, mais enfin ce n’est pas ce qui est écrit. Essayez Promt au contraire, ou Systran, et vous aurez un résultat plus correct. Pourquoi ? Ce n’est pas à une érudite comme vous que je l’apprendrai. Gustave G. (discuter) 25 avril 2018 à 19:52 (CEST)[répondre]

Travail inédit ou des déclarations non vérifiées?[modifier le code]

Quelles sont les section concernées par un Travail inédit ou des déclarations non vérifiées?

Pour répondre au bandeau

  1. Bandeau TI + déclarations non vérifiées apposé en novembre 2017; pour réduire la porté du bandeau, il faut vérifier s'il s'applique à une section, et s'il existe un problème de TI ou de non vérifiabilité

Quelques informations sur le nombre de sources par section (le résumé introductif n'a pas besoin de sources s'il résume les sections) :

Vérifiabilité des sections
Section Nombre de références au 21 mars 2021 Action envisageable Réalisation
1 Histoire et évolutions  6
2 Traduction automatique et transcription automatique 1 (présente deux fois)
3 Le processus de traduction 5
3.1 Prérequis 0 Apposer le bandeau sur cette section et/ou la supprimer et/ou apporter des sources de vérification icône « fait » Fait ! (bandeau Section à sourcer)
3.2 Approches[15] 1 (dans le titre de section) Déplacer la source dans le corps du texte icône « fait » Fait !
4 Notoriété 1
5 Qualité de la traduction 1
5.1 Mesure de la qualité 1
5.2 Évaluation humaine 1
6 Risques 2
7 Savoir faire 0 Apposer le bandeau sur cette section et/ou la supprimer et/ou apporter des sources de vérification icône « fait » Fait ! (bandeau Section à sourcer)
8 Applications 0 Aucune action immédiate ici, des sources sont présentes dans les sous-sections ✔️ Terminé.
8.1 Services en ligne 1
9 Prospective 1
total 23

✔️ Terminé. Comme expliqué ci-dessus, le point concernant l'ensemble de la page a été traité. La bandeau peu donc être enlevé de la page principale.