Top

Textmining-Verfahren in den Life Sciences

October 21, 2004 by  

Die Bedeutung des Textmining in Pharmazie, Medizin, Chemie und Biologie wird in Zukunft weiter wachsen. Das ist das Fazit eines Symposiums zum Einsatz von Textmining-Verfahren in den Life Sciences am 5. Oktober auf Schloss Birlinghoven in Sankt Augustin. Bereits zum zweiten Mal hatten das Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen (SCAI) und das Softwareunternehmen TEMIS (Heidelberg) Experten aus Industrie und akademischer Forschung zu einem Erfahrungsaustausch eingeladen.

In diesen Gebieten Fachleuten ist es aufgrund der enormen Menge der Literatur längst praktisch unmöglich, selbst in eng umrissenen Arbeitsgebieten alle relevanten Veröffentlichungen zu verfolgen und zu berücksichtigen. Daher ist der Bedarf nach automatischen Verfahren zur Analyse großer Textmengen, dem so genannten Textmining, in den Life Sciences seit jeher groß und nimmt weiter zu. Wo und in welcher Form derartige Methoden heute bereits eingesetzt werden, aber auch, was an Fragen in der nahen Zukunft noch zu lösen sein wird, stellten Experten in Fachvorträgen und Systemvorführungen vor.

Die Beteiligung von circa 50 Experten vorwiegend aus der europäischen pharmazeutischen Industrie verdeutlichte nicht nur, welche Bedeutung dem Thema Textmining dort inzwischen beigemessen wird, sondern kann auch als Beleg für ein erfolgreiches Beispiel der Zusammenarbeit zwischen öffentlicher Forschung und Privatwirtschaft gesehen werden: Die beiden Veranstalter SCAI und TEMIS kooperieren seit zwei Jahren eng bei der Entwicklung innovativer Produkte und Dienstleistungen. Wie nahe auf diesem Gebiet Systeme im produktiven Einsatz einerseits und offene Forschungsfragestellungen andererseits beieinander liegen, wurde im Vortragsprogramm deutlich.



Georg Rosenfeld von der Zentralverwaltung der Fraunhofer-Gesellschaft (FhG) unterstrich die Bedeutung und das Potenzial von Textmining als Zukunftstechnologie, und erklärte, das Thema sei für die FhG einer der Schwerpunkte der anwendungsorientierten Forschung, denen man in den kommenden Jahren besondere Bedeutung beimessen werde. Sophia Ananiadou vom nationalen Zentrum für Textmining in Großbritannien beschrieb in ihrem Beitrag die enormen Anforderungen an die Verarbeitung biomedizinischer Daten, die sich nicht zuletzt aus der Größe und Komplexität der verwendeten Terminologien ergeben. Udo Hahn von der Universität Jena gab den Zuhörern einen breiten Überblick über die notwendigen sprachverarbeitenden Verfahren, die die Computerlinguistik für derartige Aufgaben bereithält.

Wie die Umsetzung der Analyse-Anforderungen aus der Pharma- und Chemiebranche bei einer industriell einsetzbaren Software aussieht, beschrieb Günther Kurapkat von TEMIS in Heidelberg. Eine offene Architektur, die die Möglichkeit zur Integration aufgabenspezifischer Wissensquellen einerseits mit generellen Verfahren der Verarbeitung von geschriebener Sprache andererseits unterstützt, ist die Voraussetzung für eine breite Einsetzbarkeit in unterschiedlichen Szenarien in den Life Sciences.

Dass dieses Konzept bei TEMIS keine Zukunftsmusik ist, sondern sich heute bereits vielfach im produktiven Einsatz befindet, wurde in den anschließenden Präsentationen von Eric Ferrandis von IPSEN Pharma, Helmut Grotz von MDL Informationssysteme und Mathias Göschl von LION Bioscience deutlich. Bei IPSEN werden mit einer von TEMIS und SCAI gemeinsam entwickelten Software Informationen über die Interaktion von Proteinen aus wissenschaftlichen Publikationen extrahiert. MDL verwendet dieselben Systeme, um automatisch Informationen über chemische Reaktionen zu ermitteln, während LION die Software von TEMIS als Basis der Text-Mining-Funktionalitäten seiner Systeme SRS und LTE gewählt hat.

Ein Anwendungsbeispiel aus der Pflanzenbiologie beschrieb Juliane Fluck vom SCAI, die mithilfe einer angepassten Komponente zur Erkennung von Proteinen der Arabidopsis thaliana den normalerweise rein manuellen Prozess der Annotierung von Information in eine Pflanzenontologie erheblich effizienter gestalten konnte. Martin Hofmann, Leiter der Abteilung Bioinformatik am SCAI, betrat in seinem abschließenden Vortrag Neuland, als er Arbeiten am SCAI vorstellte, die die automatische Ermittlung chemischer Strukturinformationen aus Grafiken beschrieb.

Kommentare

Feel free to leave a comment...
and oh, if you want a pic to show with your comment, go get a gravatar!

You must be logged in to post a comment.

Bottom