Un tas de documents ouverts

Science : Une IA révèle de nouvelles connaissances en faisant le lien entre des documents de recherche

 

Des chercheurs du laboratoire national américain Lawrence-Berkeley ont mis au point une Intelligence Artificielle (IA) particulière. Elle serait capable de révéler de nouvelles connaissances scientifiques cachées, en faisant le lien entre d’anciens documents de recherche. Très prometteuse, la technologie pourrait également servir dans la recherche médicale ou la découverte de médicaments.

L’Intelligence Artificielle (IA) semble ne plus connaitre de limites. Une autre de ses possibilités a été dénichée par des chercheurs du laboratoire national américain Lawrence-Berkeley. Ils ont mis au point un « machine learning » capable de révéler de nouvelles connaissances scientifiques à partir d’anciens documents de recherche mis en lien.

Les chercheurs sont partis du constat que la majorité des connaissances scientifiques existent uniquement sous formes d’articles. Le format texte rend difficile toute analyse globale, ce qui a fait passer les scientifiques à côté de nombreuses découvertes. Il fallait donc trouver un outil assez puissant pour faire un lien entre les articles ou une analyse panoramique.

3,3 millions d’articles soumis à l’algorithme

Les chercheurs ont alors fait appel au deep learning, une méthode d’apprentissage automatique de l’IA reposant sur des réseaux neuronaux, pour créer un algorithme appelé Word2vec. Ce dernier a été mis à l’épreuve avec 3,3 millions d’articles traitant de la science des matériaux. Il en a analysé des abstracts (résumés) et généré un vocabulaire d’environ 500.000 mots. L’algorithme a ensuite produit des vecteurs représentatifs des relations entre les différents mots et compris la structure du tableau, ainsi que la composition des matériaux, sans un moindre pré-acquis.  Sur cette base, l’équipe de l’université de Lawrence-Berkeley a sélectionné les dix matériaux les plus susceptibles d’être associés au terme « thermoélectrique ». En comparant les éléments retenus avec différentes bases de données, les chercheurs ont pu établir que leur potentiel est au-dessus de la moyenne des matériaux thermoélectriques connus.

Les chercheurs ont pu prédire la découverte de CuGaTe2

Enfin, les scientifiques ont voulu savoir si l’intelligence artificielle pouvait prévoir des découvertes passées, en plus de faire des liens entre des documents anciens. Ils ont donc soumis un corpus de 18 textes différents au Word2vec. L’algorithme a donné à chaque fois cinq matériaux considérés comme les plus prometteurs pour une application thermoélectrique d’après les associations faites dans la littérature. Les chercheurs ont ainsi pu prédire la découverte de CuGaTe2, l’un des meilleurs matériaux thermoélectriques modernes, quatre ans avant sa première publication en 2012.

Au regard des résultats obtenus, l’équipe d’université peut voir plus loin. Elle prévoit maintenant l’utilisation de son algorithme dans la recherche médicale ou la découverte de médicaments.

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.