KI entdeckt verborgenes Wissen
Ein selbstlernender Algorithmus wird beim Durchforsten
wissenschaftlicher Artikel zum Entdecker. Und das, ohne jegliche
Vorkenntnisse über das Forschungsgebiet.
Angesichts der Flut an täglich einströmenden wissenschaftlichen Publikationen sind viele Forscher kaum noch in der Lage, einigermaßen den Überblick auf ihren Gebieten zu behalten. Wichtige Forschungsergebnisse werden zu spät bemerkt oder ganz übersehen trotz moderner Datenbankrecherchen. Allen Wissenschaftlern, die überfordert sind und zu resignieren drohen, könnte eine auf Textverarbeitung spezialisierte Künstliche Intelligenz zu Hilfe eilen, die Informatikern vom Lawrence Livermore National Laboratory in Berkeley entwickelt haben.
Vahe Tshitoyan und seine Kollegen haben einen selbstlernenden Algorithmus entwickelt, der die Texte von Abermillionen von Veröffentlichungen durchforsten kann und darin neue wissenschaftliche Erkenntnisse entdeckt.
KI erkennt heiße Kandidaten
Der Algorithmus sucht beim Lesen von
Artikeln nach textlichen Zusammenhängen und stellt allein über
Assoziationen inhaltliche Verbindungen her. Und dabei – und das ist der
Clou – hat die KI keinerlei Vorkenntnis über das jeweilige
Forschungsgebiet, schreiben die Forscher um Tshitoyan in der Zeitschrift „Nature“.
Zur Feuerprobe fütterten die Forscher „Word2vec“, einen KI-Algorithmus, der normalerweise für Übersetzungen genutzt wird, mit unzähligen Abstracts, die auf dem Gebiet der Materialforschung zwischen 1922 und 2008 erschienen waren. Die Forscher interessierten sich besonders für thermoelektrische Materialien, also Stoffe, die Wärme in elektrischen Strom umwandeln. Das Programm extrahierte bei der Literaturrecherche Fachbegriffe und Konzepte aus der Thermoelektrik und fand Elemente und Verbindungen, die in den Kurzartikeln regelmäßig erwähnt wurden.
Das System schlug nach dem Lesen tatsächlich einige thermoelektrische Stoffe vor, die bis 2008 noch unbekannt waren. Fünf Verbindungen sind inzwischen als vielversprechende Kandidaten identifiziert worden, darunter Kupfer-Gallium-Tellurid. Diese Verbindung ist erst im Jahre 2012 von Materialforschern beschrieben worden. Der Algorithmus lernte bei seinen Recherchen, Konzepte wie das Periodensystem, Kristall- und Bandstrukturen und weitere Materialeigenschaften richtig zu interpretieren und in den Kontext einzuordnen.
Zur Feuerprobe fütterten die Forscher „Word2vec“, einen KI-Algorithmus, der normalerweise für Übersetzungen genutzt wird, mit unzähligen Abstracts, die auf dem Gebiet der Materialforschung zwischen 1922 und 2008 erschienen waren. Die Forscher interessierten sich besonders für thermoelektrische Materialien, also Stoffe, die Wärme in elektrischen Strom umwandeln. Das Programm extrahierte bei der Literaturrecherche Fachbegriffe und Konzepte aus der Thermoelektrik und fand Elemente und Verbindungen, die in den Kurzartikeln regelmäßig erwähnt wurden.
Das System schlug nach dem Lesen tatsächlich einige thermoelektrische Stoffe vor, die bis 2008 noch unbekannt waren. Fünf Verbindungen sind inzwischen als vielversprechende Kandidaten identifiziert worden, darunter Kupfer-Gallium-Tellurid. Diese Verbindung ist erst im Jahre 2012 von Materialforschern beschrieben worden. Der Algorithmus lernte bei seinen Recherchen, Konzepte wie das Periodensystem, Kristall- und Bandstrukturen und weitere Materialeigenschaften richtig zu interpretieren und in den Kontext einzuordnen.
Nota. - Wer weiß, wie viele kluge Gedanken zu ihrer Zeit unbeachtet blieben, deren Datenträger - Bücher, Journale - inzwischen verschollen sind? Wissenschaft ist ihrem Begriff nach öffentliches Wissen. Was aber, wenn die Quellen verborgen bleiben oder keiner nach ihnen sucht?
Im Prinzip wirft also die heutige Springflut wissenschaftlicher Publikationen kein neues Problem auf - es war immer da. Sollte sich die neue Technik bewähren, wäre Wissenschaft nicht nur virtuell, sondern fast aktuell öffentliches Wissen.
JE
Keine Kommentare:
Kommentar veröffentlichen