en gras ". â?¢Â On peut automatiser lâ??écriture de phrases que lâ??on utilise fréquemment, une formule de politesse par exemple, en déclenchant leur rédaction par la simple énonciation dâ??un mot clé. â?¢Â Pour indiquer la prononciation, il suffit de la dicter par des ordres naturels comme " point à la ligne ". â?¢Â On peut dicter directement avec son propre traitement de texte, sa messagerie Internet, son logiciel de gestionâ?¦ â?¢Â Il est possible dâ??enregistrer plusieurs utilisateurs sur un même poste de travail. â?¢Â Pour pouvoir utiliser ce logiciel, il faut un ordinateur multimédia, Windows 95/98 ou NT 4, un processeur Pentium 133, une mémoire vive de 32 Mo sous Windows 95/98, 48 Mo sous Windows NT, il faut ajouter 16 Mo pour lâ??intégration dans Word 97 et la synthèse vocale.
Lâ??occupation sur le disque est de 87 Mo.
Pour avoir un ordre dâ??idée, le Dragon Naturally Speaking standard coûte 790 Francs TTC, le Dragon Naturally Speaking Professional coûte 4990 Francs TTC.
Les systèmes présentés par IBM, Kuzweil et Dragon Systems sont le plus souvent fondés sur une modélisation stochastique de la parole, méthode actuellement la plus performante (1992).
Lâ??avenir est aux systèmes continus et à lâ??indépendance vis à vis du locuteur, sans phase dâ??apprentissage. Ces caractéristiques demeurent difficiles à mettre en Å?uvre sur ordinateur, que ce soit en raison de lâ??absence dâ??algorithmes linguistiques sophistiqués ou, plus logiquement, parce que les processeurs sont encore trop peu puissants. Les recherches sur le traitement du langage naturel et sur le traitement du signal (notamment NSP-Native Signal Processing chez Intel et Microsoft ) aboutiront très certainement à des solutions complètement logicielles, qui sâ??intègreront aux systèmes dâ??exploitation. On sait déjà que les prochaines versions de Windows proposeront des fonctions de synthèse et de reconnaissance de la parole. (1996)
Les données sur ces systèmes évoluant très rapidement, nous avons joint en annexe 1 et 2 les données récentes trouvées sur Internet, comme notamment leur prix actuels.
En conclusion, les technologies vocales ont de fait déjà pénétré des domaines dâ??activité de la vie courante (serveurs interactifs vocaux, aide à la navigation à bord de voiture et aide à la formation).
Outre ces domaines en expansion, la dictée automatique de documents écrits, notamment de rapports médicaux, semble constituer un domaine particulièrement prometteur du fait de systèmes pouvant traiter un nombre croissant de langues. Lâ??expansion de ces nouveaux modes de communication ne deviendra cependant effective que si les performances des systèmes atteignent un niveau acceptable pour le grand public, en termes de fiabilité mais aussi de facilité dâ??utilisation. Lâ??effort entrepris par la communauté scientifique pour se doter dâ??outils linguistiques adaptés à une meilleure évaluation des systèmes constitue une première étape. Des études socio-économiques pour identifier les besoins réels des utilisateurs doivent conduire à une plus large concertation pour convenablement intégrer les technologies vocales dans des applications réalistes.
Le marché
Les données que nous allons présenter sur le marché datent de 1991 et sont tirées de " Langage humain et machine ".
Bien que depuis 1985 les études traitant des applications dans le domaine des industries de la langue soient relativement nombreuses, peu dâ??entre elles fournissent des éléments financiers sur les marchés potentiels, les marchés réels ou les marchés futurs. Les difficultés dâ??évaluation sont en effet considérables et tiennent à plusieurs raisons. En effet, à quelques exceptions près, aucun des principaux fournisseurs dans le domaine nâ??a pour unique activité le traitement automatique des langues naturelles, et les applications développées sont souvent très spécifiques, ce qui rend difficile la collecte des informations et les évaluations des coûts. Dans certains cas, les détenteurs des informations ne souhaitent dâ??ailleurs pas les voir publier. Ainsi, les entreprises de service en traduction qui utilisent des systèmes de traduction assistée par ordinateur ( TAO ) pour réaliser une partie de leur chiffre dâ??affaire ne donnent généralement pas dâ??éléments qui permettraient des évaluations précises. En effet, celles qui réussissent à obtenir des améliorations sensibles de productivité, alors quâ??elles facturent au prix de la traduction humaine, ne veulent pas voir leurs clients demander des rabais. Une autre difficulté résulte de ce que certains secteurs du marché des industries de la langue sont fortement influencés par des acteurs qui fonctionnent avec des logiques non commerciales.
Ainsi le secteur de la traduction assistée par ordinateur est largement dépendant de décisions politiques ou stratégiques. Ainsi, par exemple, le nombre réel de pages transitant par le système de TAO utilisé en interne par la Commission des communautés européennes ( de lâ??ordre de 5000 pages pour toute lâ??année 1990 ) est rarement affiché sur la place publique tant il est faible par rapport aux sommes dépensées en recherche et développement par cet organisme depuis une quinzaine dâ??années. Entre 1975 et fin 1990, ces investissements ont été dâ??environ 126,5 millions de francs. Si lâ??on prend le montant des subventions publiques directes ou indirectes versées aux entreprises, le chiffre dâ??affaire de la TAO dans le monde paraît relativement important. Si, par contre, on évalue le chiffre dâ??affaire dâ??après le nombre de pages effectivement traduites, le résultat est bien différent. Le domaine de la TAO présente depuis sa création le paradoxe des secteurs où la technologie nâ??est pas maîtrisée : le chiffre dâ??affaire potentiel est énorme et les clients potentiels relèvent essentiellement du secteur privé, cependant le marché réel est faible et les payeurs réels principaux sont des services publics.
Les grandes fonctions linguistiques ( traduire, parler, écouter, corriger, lire,â?¦) ne peuvent être totalement automatisées et donc, lâ??introduction des machines ne se fait que dans des environnements locaux favorables.
Les difficultés rencontrées dans la mesure des marchés réels et potentiels, comme dans la mise au point des projections se traduisent par des évolutions continuelles dans les prévisions. Evidemment, celles-ci sâ??affinent au fur et à mesure que le domaine est mieux cerné, quâ??il se développe et que sont installés des indicateurs plus fiables.
A titre dâ??exemple, on a présenté ci-après, pour la reconnaissance de la parole, une série de quatre courbes (figure 14) qui met en évidence lâ??évolution dans le temps des perspectives de marchés. Dans les prévisions successives, on voit clairement apparaître un phénomène de surestimation initiale de la croissance du marché, qui sâ??estompe progressivement. Ce phénomène nâ??est pas particulier au traitement de la parole. Il sâ??est également produit en traduction assistée par ordinateur, domaine où, malgré tout, on note de meilleures concordances des prévisions formulées en 1983, puis en 1986 avec la réalité aujourdâ??hui constatée.
Il y a dâ??une part des activités Bureautique en quête dâ??améliorations de productivité, dâ??autre part des industries de lâ??information en expansion rapide, et enfin, des industries électroniques et informatiques qui profitent largement des deux phénomènes précédents, puisquâ??elles fournissent les équipements. Les développements en matière de traitement automatique des langues naturelles sâ??inscrivent donc dans des logiques puissantes, qui expliquent le taux de croissance particulièrement rapide du domaine.
Si imprécises soient-elles, pour les raisons que nous avons évoquées plus haut, les précisions dâ??évolution des marchés sur le domaine des industries de la langue donnent cependant des ordres de grandeur intéressants. En voici quelques-unes, parues entre 1985 et 1990 dans la presse spécialisée :
� Presse, édition, bureautique intelligente (traitement de textes, assistance à la saisie et à la correction de textes, aides à la rédaction) : de 4,5 millions de dollars (M$) en 1985 à 50 M$ en 1990 (en France).
� Indexation et gestion de fonds documentaires : de 125 M$ en 1985 à 400 M$ en 1990 (en Europe).
â?¢Â Traduction assistée (notices techniques de produits industriels) : de 4,5 M$ en 1985 à 10 M$ en 1990 (en Europe).Â
â?¢Â Interfaces homme-machine (reconnaissance et synthèse vocale, accès à lâ??information en langage quasi-naturelâ?¦).
o Communication parlée : de 30,5 M$ en 1985 à 250 M$ en 1990 (monde). o Interfaces clavier-écran : de 18,7 M$ en 1985 à 54 M$ en 1990 (aux Etats-Unis).
En 1990, on estime généralement que le marché total des industries de la langue en France se place dans une fourchette de 300 à 350 millions de francs (source : ministère de la Recherche et de la Technologie) dont 80 à 100 millions de francs pour le traitement de la parole. Ce marché est encore très étroit : 350 millions de francs, soit à peu près le chiffre dâ??affaire dâ??une société de service en informatique de 350 salariés, ou encore celui dâ??une entreprise moyenne de distribution de micro-ordinateurs et de logiciels de bureautique. Cette étroitesse se confirme lorsque lâ??on évalue des sous-domaines. Ainsi, le marché total de la traduction humaine (vente par des entreprises spécialisées, traducteurs individuels et traductions internes) en France est estimé à environ 1,2 milliard de francs (source Bossard Consultants). Dans lâ??hypothèse optimiste où 1% de ce marché serait partiellement ou totalement automatisé, on obtient un chiffre dâ??activité pour le service en TAO dâ??environ 12 millions de francs. Ainsi donc, bien quâ??on en parle beaucoup, la traduction assistée par ordinateur ne représente quâ??une part infime de lâ??activité du domaine. De fait, il semble quâ??exprimé en chiffre dâ??affaire, le principal domaine dâ??application des industries de la langue soit actuellement lâ??interrogation de bases de données et de systèmes documentaires.
Le taux de croissance du chiffre dâ??affaire des entreprises qui travaillent sur lâ??écrit, observé sur les trois dernières années, varie de 20% à 50% avec une moyenne à 35% (source : ministère de la Recherche et de la Technologie). Ce taux est comparable à celui qui est observé dans le domaine du traitement de la parole. Pour 1990, en Europe, le marché du traitement de la parole serait de lâ??ordre de 700 millions de francs, avec une actuelle domination du Royaume-Uni (44%) progressivement remplacée par une domination allemande (33% en 1994 pour un marché total de 4 milliards de francs) (source : Frost et Sullivan).
Voici quelques données plus récentes tirées de " La parole, des modèles cognitifs aux machines communicantes "(1998). Le marché de la commande vocale sâ??élève en 1997 à 400M$, à 80 M$ pour la synthèse à partir du texte et 10 M$ pour lâ??authentification vocale, avec des taux de progression annuels respectifs, mesurés en 1997, de 100%, 300% et 30% (source : W.S. Meisel, 1998 : " The telephony voice user interface, applications of speech recognition, text-to-speech, and speaker verification over the telephone ",TMA Associates, Tarzana, CA, USA). Ces chiffres sont à comparer au marché des services téléphoniques (qui exploitent donc la seule compression de parole) qui sâ??élève à plusieurs dizaines de milliards de francs, pour la France.
Conclusion ? NON !
Tant quâ??un Inventeur existera ; tant que lâ??activité de lâ??Å?uvre et de lâ??esprit continuera à hanter Madame et Monsieur tout le monde, on est loin de conclureâ?¦
La reconnaissance vocale est un procédé assez récent puisquâ??il est apparu dans les années 50 et qui nécessite encore des améliorations. En multilocuteur, les performances actuelles, qui dépendent fortement du locuteur, se situent autour de 70 % de reconnaissance et on estime quâ??il faut au moins 85 % pour comprendre ensuite ce qui a été dit. Cependant, les chercheurs prennent désormais en compte les données linguistiques en plus de données acoustiques, ce qui devrait permettre de progresser fortement.
Quant aux applications, il y a fort à parier que nous les retrouverons partout dans la vie de tous les jours d'ici quelques années. Elles apparaissent déjà dans des domaines aussi variés que lâ??automobile, les portables ou les avions. De plus, la reconnaissance vocale associée à la synthèse vocale pourrait par exemple permettre de réaliser un système capable de comprendre ce que dit une personne dans une langue puis de le traduire oralement dans une autre, ce qui rendrait possible une discussion entre deux personnes ne parlant pas la même langue. Tout cela risque de révolutionner la manière dont on interagit avec notre environnement.
Cependant, même dans le futur, la reconnaissance vocale risque dâ??atteindre rapidement des limites. En effet, nous avons parfois du mal à comprendre ce que dit une personne en raison par exemple de mots homophones. On peut donc se demander comment une machine, dont le principe de reconnaissance est fondé sur celui de lâ??homme, serait capable de faire mieux. Actuellement, on obtient des systèmes qui fonctionnent très bien. Mais autant aux balbutiements de la reconnaissance vocale, on nâ??utilisait quâ??une stratégie principale, que maintenant, ce sont des combinaisons de toutes qui offrent les meilleurs résultats.
On peut noter cependant quâ??aucun système nâ??a su obtenir un fonctionnement optimal. On est capable de construire une machine monolocuteur en temps réel, qui fonctionnerait avec des stratégies descendantes et heuristiques . On est aussi capable de construire des machines multilocuteurs, qui se tournent plus vers des stratégie totales, mais auxquelles il faut laisser la nuit pour réfléchir.
A CÅ?UR VAILLANT RIEN Dâ??IMPOSSIBLE
Il est permis de dire que même le Superordinateur le plus puissant nâ??a pas la capacité de raisonnement démontrée par un enfant absorbé par un livre de Caillou. Les ordinateurs ne peuvent lire comme nous le faisons. Ils ne peuvent en fait ni lire ou apprendre comme nous. Et quand bien-même on ajoutera à un ordinateur des capteurs et lecteurs optiques de manière à le robotiser en input-output ; réduire lâ??écart cognitif existant entre lâ??homme et la machine, câ??est créer quasiment un ordinateur qui peut lire et apprendre à un niveau sophistiqué.
Câ??est un objectif dâ??importance pour les chercheurs en intelligence artificielle.
La Defense Advanced Research Project Agency du Pentagone, ou DARPA, a accordé un contrat dâ??une valeur dâ??au moins 400 000$ US l'automne dernier à deux professeurs de lâ??Institut polytechnique Renfaîter qui tentent de concevoir une machine qui pourra apprendre par le biais de la lecture.
Les chercheurs espèrent créer une machine qui peut lire des sections dâ??ouvrages et répondre ensuite à des questions portant sur le matériel parcouru. Le professeur Selmer Bringsjord est dâ??avis que de telles machines à lâ??intelligence artificielle pourraient lire des plans ou des manuels militaires et prendre des décisions spontanées dans le feu de lâ??action.
«Le domaine militaire est si complexe de nos jours, la technologie si évoluée que nous avons besoin du secours de lâ??intelligence artificielle,» affirme Bringsjord, directeur du laboratoire dâ??intelligence et de raisonnement artificiels de RPI. «Nous avons atteint un point de non-retour.» Cela peut sembler sortir tout droit de la science-fiction mais câ??est à peine exagéré. Les machines sont déjà cognitives, selon votre définition du mot.
Ã? Austin, Texas, Cycorp Inc. travaille à lâ??élaboration dâ??une base de connaissances appelée «Cyc», avec lâ??objectif dâ??en faire un dépôt dâ??archives de connaissances humaines qui peuvent mener à des prises de décisions intelligentes.
Les machines pouvant comprendre la parole, reconnaître des visages et faire des inférences basées sur lâ??expérience existent déjà , dit Tom Mitchell, professeur de sciences informatiques à lâ??université Carnegie Mellon. Mitchell, qui a déjà été président de lâ??Association américaine de lâ??intelligence artificielle, sert un avertissement: même si les chercheurs ont fait dâ??immenses progrès dans différents domaines de la cognition, un nuage de mystère subsiste toujours sur la façon dâ??assembler toutes les pièces du casse-tête.
Inventeurs à vos marques ! il le faut câ??est une nécessité pour sortir de lâ??isola..
Mathias WOU
Credits Powered by MAXdev
en gras ".Â
â?¢Â On peut automatiser lâ??écriture de phrases que lâ??on utilise fréquemment, une formule de politesse par exemple, en déclenchant leur rédaction par la simple énonciation dâ??un mot clé.
� Pour indiquer la prononciation, il suffit de la dicter par des ordres naturels comme " point à la ligne ".
� On peut dicter directement avec son propre traitement de texte, sa messagerie Internet, son logiciel de gestion�
â?¢Â Il est possible dâ??enregistrer plusieurs utilisateurs sur un même poste de travail.
â?¢Â Pour pouvoir utiliser ce logiciel, il faut un ordinateur multimédia, Windows 95/98 ou NT 4, un processeur Pentium 133, une mémoire vive de 32 Mo sous Windows 95/98, 48 Mo sous Windows NT, il faut ajouter 16 Mo pour lâ??intégration dans Word 97 et la synthèse vocale.
Lâ??occupation sur le disque est de 87 Mo.
Pour avoir un ordre dâ??idée, le Dragon Naturally Speaking standard coûte 790 Francs TTC, le Dragon Naturally Speaking Professional coûte 4990 Francs TTC.
Les systèmes présentés par IBM, Kuzweil et Dragon Systems sont le plus souvent fondés sur une modélisation stochastique de la parole, méthode actuellement la plus performante (1992).
Lâ??avenir est aux systèmes continus et à lâ??indépendance vis à vis du locuteur, sans phase dâ??apprentissage. Ces caractéristiques demeurent difficiles à mettre en Å?uvre sur ordinateur, que ce soit en raison de lâ??absence dâ??algorithmes linguistiques sophistiqués ou, plus logiquement, parce que les processeurs sont encore trop peu puissants. Les recherches sur le traitement du langage naturel et sur le traitement du signal (notamment NSP-Native Signal Processing chez Intel et Microsoft ) aboutiront très certainement à des solutions complètement logicielles, qui sâ??intègreront aux systèmes dâ??exploitation. On sait déjà que les prochaines versions de Windows proposeront des fonctions de synthèse et de reconnaissance de la parole. (1996)
Les données sur ces systèmes évoluant très rapidement, nous avons joint en annexe 1 et 2 les données récentes trouvées sur Internet, comme notamment leur prix actuels.
En conclusion, les technologies vocales ont de fait déjà pénétré des domaines dâ??activité de la vie courante (serveurs interactifs vocaux, aide à la navigation à bord de voiture et aide à la formation).
Outre ces domaines en expansion, la dictée automatique de documents écrits, notamment de rapports médicaux, semble constituer un domaine particulièrement prometteur du fait de systèmes pouvant traiter un nombre croissant de langues. Lâ??expansion de ces nouveaux modes de communication ne deviendra cependant effective que si les performances des systèmes atteignent un niveau acceptable pour le grand public, en termes de fiabilité mais aussi de facilité dâ??utilisation. Lâ??effort entrepris par la communauté scientifique pour se doter dâ??outils linguistiques adaptés à une meilleure évaluation des systèmes constitue une première étape. Des études socio-économiques pour identifier les besoins réels des utilisateurs doivent conduire à une plus large concertation pour convenablement intégrer les technologies vocales dans des applications réalistes.
Le marché
Les données que nous allons présenter sur le marché datent de 1991 et sont tirées de " Langage humain et machine ".
Bien que depuis 1985 les études traitant des applications dans le domaine des industries de la langue soient relativement nombreuses, peu dâ??entre elles fournissent des éléments financiers sur les marchés potentiels, les marchés réels ou les marchés futurs. Les difficultés dâ??évaluation sont en effet considérables et tiennent à plusieurs raisons. En effet, à quelques exceptions près, aucun des principaux fournisseurs dans le domaine nâ??a pour unique activité le traitement automatique des langues naturelles, et les applications développées sont souvent très spécifiques, ce qui rend difficile la collecte des informations et les évaluations des coûts. Dans certains cas, les détenteurs des informations ne souhaitent dâ??ailleurs pas les voir publier. Ainsi, les entreprises de service en traduction qui utilisent des systèmes de traduction assistée par ordinateur ( TAO ) pour réaliser une partie de leur chiffre dâ??affaire ne donnent généralement pas dâ??éléments qui permettraient des évaluations précises. En effet, celles qui réussissent à obtenir des améliorations sensibles de productivité, alors quâ??elles facturent au prix de la traduction humaine, ne veulent pas voir leurs clients demander des rabais. Une autre difficulté résulte de ce que certains secteurs du marché des industries de la langue sont fortement influencés par des acteurs qui fonctionnent avec des logiques non commerciales.
Ainsi le secteur de la traduction assistée par ordinateur est largement dépendant de décisions politiques ou stratégiques. Ainsi, par exemple, le nombre réel de pages transitant par le système de TAO utilisé en interne par la Commission des communautés européennes ( de lâ??ordre de 5000 pages pour toute lâ??année 1990 ) est rarement affiché sur la place publique tant il est faible par rapport aux sommes dépensées en recherche et développement par cet organisme depuis une quinzaine dâ??années. Entre 1975 et fin 1990, ces investissements ont été dâ??environ 126,5 millions de francs. Si lâ??on prend le montant des subventions publiques directes ou indirectes versées aux entreprises, le chiffre dâ??affaire de la TAO dans le monde paraît relativement important. Si, par contre, on évalue le chiffre dâ??affaire dâ??après le nombre de pages effectivement traduites, le résultat est bien différent. Le domaine de la TAO présente depuis sa création le paradoxe des secteurs où la technologie nâ??est pas maîtrisée : le chiffre dâ??affaire potentiel est énorme et les clients potentiels relèvent essentiellement du secteur privé, cependant le marché réel est faible et les payeurs réels principaux sont des services publics.
Les grandes fonctions linguistiques ( traduire, parler, écouter, corriger, lire,â?¦) ne peuvent être totalement automatisées et donc, lâ??introduction des machines ne se fait que dans des environnements locaux favorables.
Les difficultés rencontrées dans la mesure des marchés réels et potentiels, comme dans la mise au point des projections se traduisent par des évolutions continuelles dans les prévisions. Evidemment, celles-ci sâ??affinent au fur et à mesure que le domaine est mieux cerné, quâ??il se développe et que sont installés des indicateurs plus fiables.
A titre dâ??exemple, on a présenté ci-après, pour la reconnaissance de la parole, une série de quatre courbes (figure 14) qui met en évidence lâ??évolution dans le temps des perspectives de marchés. Dans les prévisions successives, on voit clairement apparaître un phénomène de surestimation initiale de la croissance du marché, qui sâ??estompe progressivement. Ce phénomène nâ??est pas particulier au traitement de la parole. Il sâ??est également produit en traduction assistée par ordinateur, domaine où, malgré tout, on note de meilleures concordances des prévisions formulées en 1983, puis en 1986 avec la réalité aujourdâ??hui constatée.
Il y a dâ??une part des activités Bureautique en quête dâ??améliorations de productivité, dâ??autre part des industries de lâ??information en expansion rapide, et enfin, des industries électroniques et informatiques qui profitent largement des deux phénomènes précédents, puisquâ??elles fournissent les équipements. Les développements en matière de traitement automatique des langues naturelles sâ??inscrivent donc dans des logiques puissantes, qui expliquent le taux de croissance particulièrement rapide du domaine.
Si imprécises soient-elles, pour les raisons que nous avons évoquées plus haut, les précisions dâ??évolution des marchés sur le domaine des industries de la langue donnent cependant des ordres de grandeur intéressants. En voici quelques-unes, parues entre 1985 et 1990 dans la presse spécialisée :
� Presse, édition, bureautique intelligente (traitement de textes, assistance à la saisie et à la correction de textes, aides à la rédaction) : de 4,5 millions de dollars (M$) en 1985 à 50 M$ en 1990 (en France).
� Indexation et gestion de fonds documentaires : de 125 M$ en 1985 à 400 M$ en 1990 (en Europe).
â?¢Â Traduction assistée (notices techniques de produits industriels) : de 4,5 M$ en 1985 à 10 M$ en 1990 (en Europe).Â
â?¢Â Interfaces homme-machine (reconnaissance et synthèse vocale, accès à lâ??information en langage quasi-naturelâ?¦).
o Communication parlée : de 30,5 M$ en 1985 à 250 M$ en 1990 (monde).
o Interfaces clavier-écran : de 18,7 M$ en 1985 à 54 M$ en 1990 (aux Etats-Unis).
En 1990, on estime généralement que le marché total des industries de la langue en France se place dans une fourchette de 300 à 350 millions de francs (source : ministère de la Recherche et de la Technologie) dont 80 à 100 millions de francs pour le traitement de la parole. Ce marché est encore très étroit : 350 millions de francs, soit à peu près le chiffre dâ??affaire dâ??une société de service en informatique de 350 salariés, ou encore celui dâ??une entreprise moyenne de distribution de micro-ordinateurs et de logiciels de bureautique. Cette étroitesse se confirme lorsque lâ??on évalue des sous-domaines. Ainsi, le marché total de la traduction humaine (vente par des entreprises spécialisées, traducteurs individuels et traductions internes) en France est estimé à environ 1,2 milliard de francs (source Bossard Consultants). Dans lâ??hypothèse optimiste où 1% de ce marché serait partiellement ou totalement automatisé, on obtient un chiffre dâ??activité pour le service en TAO dâ??environ 12 millions de francs. Ainsi donc, bien quâ??on en parle beaucoup, la traduction assistée par ordinateur ne représente quâ??une part infime de lâ??activité du domaine. De fait, il semble quâ??exprimé en chiffre dâ??affaire, le principal domaine dâ??application des industries de la langue soit actuellement lâ??interrogation de bases de données et de systèmes documentaires.
Le taux de croissance du chiffre dâ??affaire des entreprises qui travaillent sur lâ??écrit, observé sur les trois dernières années, varie de 20% à 50% avec une moyenne à 35% (source : ministère de la Recherche et de la Technologie). Ce taux est comparable à celui qui est observé dans le domaine du traitement de la parole. Pour 1990, en Europe, le marché du traitement de la parole serait de lâ??ordre de 700 millions de francs, avec une actuelle domination du Royaume-Uni (44%) progressivement remplacée par une domination allemande (33% en 1994 pour un marché total de 4 milliards de francs) (source : Frost et Sullivan).
Voici quelques données plus récentes tirées de " La parole, des modèles cognitifs aux machines communicantes "(1998). Le marché de la commande vocale sâ??élève en 1997 à 400M$, à 80 M$ pour la synthèse à partir du texte et 10 M$ pour lâ??authentification vocale, avec des taux de progression annuels respectifs, mesurés en 1997, de 100%, 300% et 30% (source : W.S. Meisel, 1998 : " The telephony voice user interface, applications of speech recognition, text-to-speech, and speaker verification over the telephone ",TMA Associates, Tarzana, CA, USA). Ces chiffres sont à comparer au marché des services téléphoniques (qui exploitent donc la seule compression de parole) qui sâ??élève à plusieurs dizaines de milliards de francs, pour la France.
Conclusion ? NON !
Tant quâ??un Inventeur existera ; tant que lâ??activité de lâ??Å?uvre et de lâ??esprit continuera à hanter Madame et Monsieur tout le monde, on est loin de conclureâ?¦
La reconnaissance vocale est un procédé assez récent puisquâ??il est apparu dans les années 50 et qui nécessite encore des améliorations. En multilocuteur, les performances actuelles, qui dépendent fortement du locuteur, se situent autour de 70 % de reconnaissance et on estime quâ??il faut au moins 85 % pour comprendre ensuite ce qui a été dit. Cependant, les chercheurs prennent désormais en compte les données linguistiques en plus de données acoustiques, ce qui devrait permettre de progresser fortement.
Quant aux applications, il y a fort à parier que nous les retrouverons partout dans la vie de tous les jours d'ici quelques années. Elles apparaissent déjà dans des domaines aussi variés que lâ??automobile, les portables ou les avions. De plus, la reconnaissance vocale associée à la synthèse vocale pourrait par exemple permettre de réaliser un système capable de comprendre ce que dit une personne dans une langue puis de le traduire oralement dans une autre, ce qui rendrait possible une discussion entre deux personnes ne parlant pas la même langue. Tout cela risque de révolutionner la manière dont on interagit avec notre environnement.
Cependant, même dans le futur, la reconnaissance vocale risque dâ??atteindre rapidement des limites. En effet, nous avons parfois du mal à comprendre ce que dit une personne en raison par exemple de mots homophones. On peut donc se demander comment une machine, dont le principe de reconnaissance est fondé sur celui de lâ??homme, serait capable de faire mieux.
Actuellement, on obtient des systèmes qui fonctionnent très bien. Mais autant aux balbutiements de la reconnaissance vocale, on nâ??utilisait quâ??une stratégie principale, que maintenant, ce sont des combinaisons de toutes qui offrent les meilleurs résultats.
On peut noter cependant quâ??aucun système nâ??a su obtenir un fonctionnement optimal. On est capable de construire une machine monolocuteur en temps réel, qui fonctionnerait avec des stratégies descendantes et heuristiques . On est aussi capable de construire des machines multilocuteurs, qui se tournent plus vers des stratégie totales, mais auxquelles il faut laisser la nuit pour réfléchir.
A CÅ?UR VAILLANT RIEN Dâ??IMPOSSIBLE
Il est permis de dire que même le Superordinateur le plus puissant nâ??a pas la capacité de raisonnement démontrée par un enfant absorbé par un livre de Caillou. Les ordinateurs ne peuvent lire comme nous le faisons. Ils ne peuvent en fait ni lire ou apprendre comme nous. Et quand bien-même on ajoutera à un ordinateur des capteurs et lecteurs optiques de manière à le robotiser en input-output ; réduire lâ??écart cognitif existant entre lâ??homme et la machine, câ??est créer quasiment un ordinateur qui peut lire et apprendre à un niveau sophistiqué.
Câ??est un objectif dâ??importance pour les chercheurs en intelligence artificielle.
La Defense Advanced Research Project Agency du Pentagone, ou DARPA, a accordé un contrat dâ??une valeur dâ??au moins 400 000$ US l'automne dernier à deux professeurs de lâ??Institut polytechnique Renfaîter qui tentent de concevoir une machine qui pourra apprendre par le biais de la lecture.
Les chercheurs espèrent créer une machine qui peut lire des sections dâ??ouvrages et répondre ensuite à des questions portant sur le matériel parcouru. Le professeur Selmer Bringsjord est dâ??avis que de telles machines à lâ??intelligence artificielle pourraient lire des plans ou des manuels militaires et prendre des décisions spontanées dans le feu de lâ??action.
«Le domaine militaire est si complexe de nos jours, la technologie si évoluée que nous avons besoin du secours de lâ??intelligence artificielle,» affirme Bringsjord, directeur du laboratoire dâ??intelligence et de raisonnement artificiels de RPI. «Nous avons atteint un point de non-retour.»
Cela peut sembler sortir tout droit de la science-fiction mais câ??est à peine exagéré. Les machines sont déjà cognitives, selon votre définition du mot.
Ã? Austin, Texas, Cycorp Inc. travaille à lâ??élaboration dâ??une base de connaissances appelée «Cyc», avec lâ??objectif dâ??en faire un dépôt dâ??archives de connaissances humaines qui peuvent mener à des prises de décisions intelligentes.
Les machines pouvant comprendre la parole, reconnaître des visages et faire des inférences basées sur lâ??expérience existent déjà , dit Tom Mitchell, professeur de sciences informatiques à lâ??université Carnegie Mellon. Mitchell, qui a déjà été président de lâ??Association américaine de lâ??intelligence artificielle, sert un avertissement: même si les chercheurs ont fait dâ??immenses progrès dans différents domaines de la cognition, un nuage de mystère subsiste toujours sur la façon dâ??assembler toutes les pièces du casse-tête.
Inventeurs à vos marques ! il le faut câ??est une nécessité pour sortir de lâ??isola..
Mathias WOU