Rechenzentrums-arscombinatoria

Der Beginn des Gesprächs ist nicht aufgezeichnet, weil wir uns nur warmreden wollten für ein ganz anderes Thema. Es ging zunächst um die Frage, ob die Wortvorschläge der Smartphonetastaturen auf simplen Markow-Ketten beruhen. Arnes Antwort war: Nein, dahinter steckt Doc2Vec, aber erst seit ein oder zwei Jahren. Irgendwie gelangten wir von dort in das übliche Gestrüpp miteinander verbundener Konzepte. Ich sagte: “Ich kenne diesen Zustand, den du da beschreibst, unter dem Einfluss von Pilzen, wenn sich die unhandliche Komplexität der Welt so aufdrängt. Ich wedle dann mit der Fliegenklatsche wie in ‘Fear and Loathing’, und nach vier Stunden geht es wieder vorbei.” Arne sagte sinngemäß: “Willkommen in meinem Leben, bei mir hört das nie auf.” Wir redeten über die Frage, ob Versuche, diese Komplexität in den Griff zu bekommen, grundsätzlich traurig enden wie bei Paul Otlet oder ob die, die sich bisher daran versucht haben, nur noch nicht die nötigen technischen Mittel zur Verfügung hatten. Und ungefähr hier setzt die Aufzeichnung ein.

Arne Janning: ‚Entfernte Ähnlichkeiten’, das ist ein Begriff von Baumgarten, dem Erfinder der Ästhetik Mitte des 18. Jahrhunderts, später dann auch in der Vorschule der Ästhetik auftauchend bei Jean Paul, wo es darum geht, wie komme ich denn jetzt zur inventio, wie komme ich jetzt zu neuen Ideen. Und es wird schon sehr lange darüber nachgedacht, wie man sich Verfahren, also auch mechanisierte Verfahren ausdenken könnte, um an neue Dinge zu kommen. Da wir gerade schon über Raimundus Lullus gesprochen haben…

Kathrin Passig: Du, nicht wir. Ich spreche eigentlich nie über Raimundus Lullus.

A.J.: … kommen wir zur ars combinatoria, wie man sich also ein mechanisches Modell ausdenken könnte, um auf neue Gedanken zu kommen.

K.P.: Ich benutze in letzter Zeit eigentlich immer die Zufallsshirt-Maschine, wenn ich mir Titel für Vorträge oder Texte ausdenken soll. Manchmal nicht nur für den Titel, sondern auch für das Thema.

A.J.: Das ist ein ganz interessanter Punkt, denn manchmal kommen ja Sachen zusammen, die eigentlich überhaupt nicht zusammen gehören. Ich habe vorgestern diesen Tweet geschrieben über eine Suche nach Joseph Vogl, bei der ich rausgekommen bin bei einem viehwirtschaftlichen Text, der irgendetwas mit Medikamentierung von Milchkühen zu tun hatte.

K.P.: Als ich das bei Twitter gesehen habe, bin ich davon ausgegangen, dass das an der Biographie von Joseph Vogl liegt, der ja auch aus einem niederbayerischen Dorf kommt. (Später nachgesehen: Ich dachte an Viechtach, es ist aber wohl Eggenfelden.)

A.J.: Ja, das müsste man dann fragen: wie kommt jetzt eigentlich die Maschine darauf, mir genau diesen Text vorzuschlagen? Aber so kommen plötzlich so Satzgebäude von innen zustande, auf die man vorher nie gekommen wäre. Das passiert mir in der Arbeit mit meinen Maschinen ständig, permanent. Auf der einen Seite findet diese Maschine ‚entfernte Ähnlichkeiten’ und ständig auch Texte, die zu einem Thema gehören, von denen ich aber gar nicht wusste, dass sie dazugehören. Auch zum Teil aus unterschiedlichen Kontexten, weil mein Archiv keine Disziplinengrenzen kennt. Das sind dann Texte aus der Soziologie, aus der Germanistik, aus der Literaturwissenschaft, philosophische oder eben auch viehwirtschaftliche Texte. Und die Frage ist immer, wie kommen neue Ideen zustande, wie finde ich überhaupt die Zusammenhänge, über die ich dann zum Beispiel schreiben will? Wie finde ich die interessanten Stellen?

K.P.: Ich denke manchmal bei meinen Texten darüber nach, was davon eigentlich neu ist. Also ganz vieles davon ist ja einfach nur Zusammentragen von Dingen, die anderswo schon stehen.

A. J.: Genau.

K.P.: Und in einem guten Text gibt es ein oder zwei Ideen, wo ich sagen würde: Die sind jetzt tatsächlich von mir und die sind neu. Ich vermute aber, wenn ich dem genauer nachgehen würde, dann würde ich feststellen, dass das wahrscheinlich auch immer noch nicht stimmt. Die Ideen stehen irgendwo schon, ich weiß nur nichts davon oder habe es wieder vergessen. Wie ist das bei dir?

A.J.: Du kennst doch bestimmt den Punkt, an dem es dann bei dir im Kopf irgendwann so ‚klick’ macht und und dir denkst: also da habe ich gerade was gelesen und da habe ich jetzt auch gerade was gelesen; habe ich also etwas unabhängig voneinander gelesen und jetzt merke ich, das gehört ja eigentlich zusammen.

K.P.: Aber du bist wahrscheinlich nicht der erste mit dieser Einsicht.

A.J.: Ja, aber du hast diese Einsicht, du hast diesen Moment, in dem es ‚klick’ macht. Und die Frage ist: welche Techniken, welche Praktiken benutzt man, um diese Einsichten zu erzeugen? Wenn du jetzt zwei Texte hast und du stellst jetzt plötzlich die Verbindung zwischen diesen Texten her: wo hast du zum Beispiel diese Texte abgelegt oder hast du diese Texte irgendwo exzerpiert, hast du dir irgendwo aufgeschrieben, was in diesen Texten drin stand?

K.P.: Wenn man das ab demnächst automatisieren kann, bedroht das meine Existenzgrundlage. Ich glaube, das ist tatsächlich das Einzige, was ich ein bisschen besser kann als andere Leute, nämlich eine vage Erinnerung an die Form der Idee eines Textes behalten und die irgendwann mit einer anderen, ähnlich geformten Idee zusammenbringen. Ein Beispiel, ich habe 2013 bei ZEIT Online einen Text geschrieben über die Parallelen zwischen dem Einfluss natürlicher und künstlicher Bewässerungssysteme auf Gesellschaftsformen und der Art, wie Geldströme im Internet fließen. Da hast du ganz ähnliche Unterschiede, je nachdem, ob das Geld von zentralen Stellen kommt oder eher wie Regen verteilt wird, also als kleine Beträge, die von den Nutzern kommen … Aber was ich eigentlich fragen wollte: An welcher Stelle hast du bei dem, was du machst, das Gefühl, das ist jetzt tatsächlich dein Beitrag?

A. J.: Wenn wir jetzt dieses Beispiel nehmen würden: Bewässerungssysteme. Dann würde ich jetzt nach Literatur zu ‚Bewässerungssystem’ und ‚Sozialstruktur’ suchen. Ich weiß, dass ich dazu Texte finde; ich weiß auch, dass gerade eben eine Ausschreibung erschienen ist einer literaturwissenschaftlichen Zeitschrift, ein Call for Papers zum Wasser in der Literatur. Daraufhin habe ich dann angefangen zu sehen, dass es wirklich viele Texte zu diesem Thema gibt. Dann würde man in diesen Texten vielleicht auch auf neue Ideen stoßen, die einem dann weiterhelfen, diese Literaturproduktion: ‚Wie finanziere ich mich im Internet?’ noch weiter zu bestärken: Ich bin mir ziemlich sicher, dass man dazu etwas finden würde. Jetzt ist nur die Frage, wenn du diese Volltextsuchmaschine hast, die dir diese Texte sucht und zwar in ganz anderer Qualität als Google Books oder einfach nur eine Google-Suche, dann kommst du – halt auch dadurch, dass du diese Suchmöglichkeit hast – zu Texten, von denen du geahnt hast, dass es sie geben müsste, nur dass du sie jetzt in der Hand hast und in denen es genau darum geht, wie der Zusammenhang zum Beispiel zwischen Bewässerungssystemen und Sozialstruktur ist; dann liest du es durch und denkst: „Ja genau, da ist ja jetzt noch ein weiterer Punkt, an den ich bislang nicht gedacht habe, der ja auch ganz gut zu meiner These passt.“ – Und das ist exakt das, was wir gerade inventio nennen; wo es dann wiederum bei dir im Kopf ‚klick’ machen würde und dann kommst du vielleicht über diesen Text auf eine neue Idee und diese neue Idee kannst du dann wieder in die Volltextsuchmaschine eingeben. Aus dem heraus erkenne ich dann nicht nur der Zusammenhang zwischen Bewässungssystem und Sozialstruktur, sondern auch zwischen Bewässerungsystem und Religion und Organisation; und dann kriegt man darüber vielleicht auch eine weitere Verknüpfung hin. Das ist exakt das, was diese Maschine für mich jeden Tag und leider im Überfluss leistet, so dass man dann auch immer mehr findet, als man eigentlich noch verarbeiten kann und das man immer mehr Kontext geliefert bekommt. Denn, um jetzt das Wasserbeispiel zu nehmen, ich weiß, dass es dazu kulturwissenschaftliche, soziologische und archäologische Literatur gibt; das Ganze ist durchdekliniert für sämtliche Kulturen dieser Welt.

K.P.: Ich höre aus dem, was du beschreibst, immer deine Vorstellung heraus, du müsstest als Ergebnis einen Text schreiben, in dem du eine Synthese aus diesen zwölftausend Ideen herstellst – und das ist wahrscheinlich genau der Irrweg, diese Vorstellung, dass man daraus persönlich, mit eigener Kraft, einen neuen Text herzustellen hätte.

A.J.: Richtig, genau. Wie ich sagte: ich glaube, ich bin da in bester Gesellschaft, denn dass man überbordendes Wissen, das man selber nicht mehr durchdringen kann, dann einfach ausstellt – das ist keine ganz neue Idee, denn diese Überforderungssituation haben wir in jeder medientechnischen Revolution – und ich glaube wir sind gerade in einer, nämlich in der Art und Weise, wie wir mit Machine Learning an Buchtexte rangehen. Mit dieser Überforderungssituation müssen wir jedesmal wieder neu fertig werden und da kann man aus der Geschichte viele Beispiele heranziehen. Man kann, um nur eins zu nennen, auf Benjamins Passagenwerk verweisen, der da sagt: ‚Ich habe nichts zu sagen, ich stelle nur aus.’

K.P.: Hast du das zufällig gelesen, das Kapitel in “Internet – Segen oder Fluch”, in dem es darum geht, um das fragile Gleichgewicht zwischen Findewunsch und Ergebnisüberforderung? Das handelt genau davon, dass es in der Botanik vor Linné genau dieses Problem gab, also dass man plötzlich sehr viel mehr Pflanzen entdeckt hat, so dass man sich von der antiken Vorstellung verabschieden musste, dass es nur ein paar Hundert Pflanzen gibt, und überall dieselben. Dass man dann plötzlich vor einer unbewältigbaren Vielfalt stand und lange damit gekämpft hat, dass es eben noch kein neues brauchbares System und auch noch keine neuen Nachschlagewerke dafür gab. Das Material für das Kapitel stammt größtenteils aus “Early Modern Information Overload” von Daniel Rosenberg (DOI 10.1353/jhi.2003.0017, Volltext bei Sci-Hub). Da sind auch noch andere schöne Aspekte drin, ob zum Beispiel die Enzyklopädie auch eine Reaktion auf dieses Problem ist. Ich glaube nicht, dass das nur bei Medienrevolutionen passiert, sondern dass das ein kontinuierlicher Prozess ist und an unterschiedlichen Stellen der Forschung ständig passiert. Wenn man Glück hat, dann lebt man mal ein paar Jahre in einer Zeit, in der die technischen Mittel mithalten, und dann passiert wieder was und man wird überholt von einer grauenvollen Menge an Material. (Bei dieser Formulierung war ich vermutlich beeinflusst von einem im selben Buchkapitel erwähnten Leibniz-Text über die “horrible masse de livres”.)

A.J.: Wir haben sehr viele elektronische Texte und können darin suchen und müssen der Überforderung irgendwie wieder Herr werden und müssen uns dazu auch neue Darstellungs- und Textformen überlegen. Ich selber bin gerade damit am Experimentieren … dass man die Ergebnisse präsentiert, das ist ja noch nicht das Problem, aber dass man auch die Suchanfragen und das Korpus, an das man diese Suchanfrage gestellt hat, mit ausstellen kann. Ich bin mir noch nicht ganz sicher, wie man das technisch realisiert; wie man das Ganze handhabbar macht. Es gibt derzeit so ganz interessante Bestrebungen, Dokumente herzustellen, in denen Code drinsteht, aber der Code ist jetzt nicht mehr nur im Text, sondern der Code ist tatsächlich ausführbar. Ausführbar zum Beispiel gegen die Datenbank, gegen die Fragen, die ich an sie gestellt habe. Das ist halt noch ein experimentelles Feld.

K.P.: Angenommen du bist schon zehn, zwanzig Jahre weiter, oder vielleicht dauert es auch nur eins oder zwei, bis es eine Form der Darstellung gibt, die dich von der Idee befreit, einen Text schreiben zu müssen. Was wäre denn die Folge und der Nutzen für andere Leute, die mit diesen Ergebnissen arbeiten? Die triviale Idee ist natürlich erst mal, dass es ihnen wieder beim Schreiben eigener Texte hilft, aber eigentlich kann das ja nicht die Antwort sein, dass man das neue Werkzeug nur als eine Art Hilfsmittel benutzt, um mit weniger Aufwand als bisher irgendwas Feuilletonistisches herzustellen, indem man zwei ähnliche Ideen zusammenbringt.

A.J.: Was man zumindest zeigen könnte, ist, wie viele Kontexte grundsätzlich zu jeder Frage und zu jedem Problem schon existieren.

K.P.: Wenn wir uns mal vorstellen, wir schauen von einem Zeitpunkt hundert Jahre in der Zukunft auf das Auftauchen dieser neuen Techniken zurück. Was ist dadurch möglich geworden?

A.J.: Es wird möglich, dass man die ungeheure Menge an Texten, die es derzeit gibt, besser durchdringen kann; dass man nicht einfach ein paar Texte liest, die man halt so lesen kann und – ich rede jetzt natürlich eher aus der Wissenschaftsperspektive – dass man sich nicht nur so auf Abstracts beziehen muss, sondern auf Volltexte beziehen kann; und dadurch gerät eigentlich auch dieses ganze Relevanz-Konzept ins Wanken, denn in dem Moment, wo diese Volltextdatenbanken zur Verfügung stehen, musst du dir darüber klar werden: „Okay, welche Texte habe ich jetzt gelesen, welche Texte habe ich nicht gelesen? Warum habe ich sie nicht gelesen? Welche Texte waren für mich anschlussfähig und was heißt überhaupt ‚anschlussfähig’? Was habe ich alles ausgelassen; warum habe ich es ausgelassen? Und wie kam eigentlich meine Frage oder meine Kontexterzeugung zustande? Wie hat die überhaupt stattgefunden, wie habe ich mit dieser Maschine gearbeitet? Wie sah meine Kontexterzeugung aus?”

K.P.: Mir ist das immer noch zu nah am aktuellen Zustand, das klingt ein bisschen nach: „Ich habe jetzt einen besseren Bleistift erfunden, mit dem man dasselbe machen kann wie mit dem bisherigen Bleistift, nur besser.“ Ich vermute, dass sich etwas Grundsätzlicheres ändern müsste im Umgang mit Wissen.

A.J.: Ich nenne dir ein Beispiel: Ich war vor ein paar Wochen auf einem Workshop am Zentrum für Literatur- und Kulturforschung hier in Berlin. Da war eine Wissenschaftlerin, die über ‚medizinische Handbücher in der frühen Neuzeit’ berichtete. Sie hatte ein medizinisches Handbuch von 1750, wenn ich es richtig im Kopf habe, und beschrieb dann dieses Handbuch und sagte, es sei erstaunlich, was 1750 alles so in medizinischen Handbüchern gestanden hätte. Es hätte also ganz große thematische Bandbreite, da ginge es selbst um solche Dinge wie Kanarienvogelzucht und welche Auswirkungen sie auf die menschliche Gesundheit hätte. Das beschrieb sie so und dann kam später in der Diskussion die Frage: „Ja, aber ist das jetzt wirklich so neu um 1750 mit dieser thematischen Breite und der Kanarienvogelzucht – kam das nicht auch schon in Handbüchern um 1700 vor?“ Und dann sagte sie, naja, also natürlich hätte sie jetzt nicht alle medizinischen Handbücher des 17. Jahrhunderts durchgelesen, sondern irgendwie nur so ein paar so um 1650; sie hätte das jetzt auch nicht komplett lesen können natürlich, sondern sich so punktuell auf ein paar Sachen bezogen – da kam bei mir sofort die Frage hoch: „Ja, warum hast du denn nicht alle medizinischen Handbücher des 17. oder des 18. Jahrhunderts gelesen?“ Denn interessant war, dass auf dieser Konferenz alle, die über frühneuzeitliche Medizin geredet haben, mit digitalen Quellen gearbeitet haben. Keiner von denen ist in ein Archiv gegangen und hat dort Bücher aus dem 18. Jahrhundert durchgestöbert. Die hatten alle Bücher von Google Books oder von archive.org, auch von der Bayerischen Staatsbibliothek digitalisiert; aber sie haben alle mit Digitalisaten gearbeitet. D. h. das ganze Zeug ist ohnehin digitalisiert, wäre vorhanden. Dann kann man auch eine Texterkennung machen und selbst wenn die dann nicht so toll ist, kann man zumindest mal rausfinden, wie so der Kanarienvogeldiskurs im 18. Jahrhundert in medizinischen Handbüchern verläuft. Das kann man sehr einfach mit bestehenden Techniken, die auf der Straße liegen, rauskriegen. Und ich hab das dann später auch angesprochen, als wir abends dort beim Essen saßen und dann stimmte man mir auch zu: „Ja, naja, das ist ja eigentlich, was wir hermeneutisch hier so machen, doch ein bisschen rückständig.“ Und „Jaja, wir sehen das ein, eigentlich müssten wir das machen, aber wir haben halt niemanden, der so etwas macht und wissen auch nicht, wie es geht.“ Seltsam. Anderes Beispiel, selbe Konferenz: Da hat ein Wissenschaftler sich Lexika aus der Frühen Neuzeit angeschaut, wie Leben definiert wird. Er hatte dann ungefähr zwanzig Lexika so ungefähr seit dem Mittelalter bis zum letzten Brockhaus und fand dann raus, dass die Beschreibung, was Leben ist, doch eigentlich schon so seit der Antike immer dieselbe wäre: es gehört irgendwie Stoffwechsel dazu, es gehört Fortpflanzung dazu und noch so ein paar andere Sachen und er sagte, es sei eigentlich sehr stabil über die Zeit. Und damit wollte er Foucault widerlegen, der gesagt hat: Um 1800 setzt ein fundamentaler Wandel des Begriffs des Lebens ein, der zu der Zeit überhaupt erst etabliert wird. Er sagt jetzt also dagegen, nein, wenn ich in die Lexika schaue, bleibt der Begriff immer gleich. Da frage ich mich als Erstes: Ja, gut, das ist Lexikon-Literatur, das wird wahrscheinlich eine ganz eigene Tradition haben. Warum hast du nicht auch mal in etwas anderes reingeschaut als in die Lexikon-Literatur? Und zweitens ist ja Begriffsgeschichte in dem Fall nicht nur ‚was gehört zu einem Begriff’ – in dem Fall ‘Leben’, also so etwas wie ‚Fortpflanzung’ und ‚Stoffwechsel’ – sondern möglicherweise wird ja der Begriff des Lebens auch noch ganz anders kontextualisiert; also schau doch mal, was sich semantisch vielleicht um 1800 dann eben doch ganz anders an diesen Lebensbegriff ‚dranpappt’. Nämlich zum Beispiel, dass da plötzlich die Kombination von ‚Leben’ und anderen Wörtern explodiert: so etwas wie Lebensphilosophie, Lebenspraktik und Lebensweisheit und was auch immer noch alles – das ist ein klassischer Fall für natural language processing. Man hätte ein Korpus nehmen können, ein Korpus aufbauen können und alle diese Fragen beantworten können. Ich muss jetzt nicht einfach nur ein paar Werke nehmen, dreißig Lexika, gucken was da in den ‚Leben’-Artikeln drinsteht und dann hinterher versuchen, von dort aus irgendwelche Aussagen zu treffen, die eigentlich aus diesem Korpus extrapoliert sind; das hätte ich alles auch empirisch machen können.

K.P.: Insofern schon wieder nahe an dem Botanik-Problem, bei dem es ja auch erst mal selbstverständlich war, dass man ein paar Pflanzen beschreibt und von denen ausgehend dann eine Theorie über alle Pflanzen aufstellt. Da man mangels Zugang ja auch dachte, es gäbe gar nicht wesentlich mehr als diese paar.

A.J.: Ja, genau. Und das beschränkt ja die Relevanz der Forschung.

(Fortsetzung)


1 Kommentare

Kommentar schreiben

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *