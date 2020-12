TechSamvad22 déc.2020 18:01:29 IST

Plus tôt cette année en juillet, Google avait annoncé son fonds de numérisation de 10 milliards de dollars pour l’France dans son événement Google for France 2020 pour les cinq à sept prochaines années et l’un des principaux domaines d’intervention de ce fonds était d’investir dans l’écosystème Internet en langue indienne pour améliorer pénétration des services et produits numériques. Conformément à cela, Google France a dévoilé un nouveau modèle basé sur l’intelligence artificielle (IA) appelé Représentations multilingues pour les langues indiennes, abréviation de MuRIL, pour améliorer l’interopérabilité des services Web dans 16 langues indiennes.

MuRIL travaillera pour plus d’une douzaine de langues indiennes comme l’assamais, le bengali, l’anglais, le gujarati, l’hindi, le kannada, le cachemire, le malayalam, le marathi, le népalais, l’oriya, le punjabi, le sanscrit, le sindhi, le tamoul, le télougou et l’ourdou.

.@partha_p_t, Chercheur scientifique, Google France, parle de MuRIL – un modèle multilingue puissant qui est gratuit, open source et disponible pour tous sur le hub TensorFlow 👨🏻‍💻👩🏻‍💻 Écoutez-en sur le # L10n livestream ➡️ https://t.co/wHMPTokz8C pic.twitter.com/I4Nyx0ZRoa – Google France (@GoogleIndia) 17 décembre 2020

Très heureux de partager MuRIL de Google France, disponible sur TF Hub @ https://t.co/XJPDmZWKQt L’une de nos missions chez Google Research France est de faire progresser considérablement l’état de la NLU indienne, et nous sommes impatients de travailler avec tout le monde pour le réaliser! https://t.co/DwgzpOYNd2 – Partha Talukdar (@partha_p_t) 17 décembre 2020

Ce modèle a été formé à l’aide du propre modèle d’apprentissage des langues BERT (Bidirectional Encoder Representations from Transformers), qui est actuellement utilisé pour analyser presque toutes les requêtes en anglais sur son moteur de recherche. Google a rendu MuRIL gratuit et open-source, disponible au téléchargement et à l’utilisation à partir de sa plate-forme d’apprentissage automatique TensorFlow.

En plus d’améliorer la traduction du contenu Internet dans de nombreuses langues, MuRIL permettrait aux utilisateurs de recherche de basculer facilement les résultats de recherche de l’anglais vers le tamoul, le télougou, le bangla, le marathi en dehors de l’hindi. Google afficherait également le contenu dans cinq langues indiennes – hindi, bangla, marathi, tamoul et télougou – même lorsque la requête est en anglais, tandis que Google Maps prendrait également en charge l’une des neuf langues indiennes, quelle que soit la langue du système.

