20 Jahre Wikipedia und andere Informationsgeschichten aus der Informationsgeschichte

„20 Jahre Wikipedia“ ist wie etwa auch das 10-jährige Jubiläum 2011 eine gute Gelegenheit, darauf hinzuweisen, dass Information und ihre Medien, wie etwa Enzyklopädien und Nachschlagewerke, auch eine Geschichte haben, so wie auch die Offenheit von Wissen eine Geschichte hat.

Der Wissenschaftshistoriker Mathias Grote hat in Form mehrerer Aufsätze – auch anläßlich des Wikipedia-Jubiläums – sich ebenfalls mit der Geschichte von Nachschlagewerken befasst.

Dieser Blog-Beitrag ist vielleicht auch die Gelegenheit, kleine Geschichten zur Information noch einmal zu publizieren, die in dem 2005 online gestellten und heute nicht mehr verfügbaren Informationskompetenz-Tutorial DISCUS (Projektbericht unter https://doi.org/10.15480/882.202) enthalten waren.

 

„Informationsgeschichten aus der Informationsgeschichte (Information stories from information history)“

George Booles Definition von Logik

1854 veröffentlichte der Brite George Boole ein Werk mit dem Titel „An investigation of the laws of thought on which are founded the mathematical theories of logic and probabilities“, mit dem er die Grundlagen der später in elektronischen Informationssystemen verwendeten Logik beschrieb. Seine binäre Algebra erlaubte nur zwei Werte (‘0’ und ‘1’) für jedes Symbol.

Für Boole bestehen die Prozesse logischen Denkens einerseits aus einer „Addition“ verschiedener Ideen, Begriffe oder „Klassen von Objekten“, um komplexere Begriffe zu formen, andererseits in der Trennung komplexer Begriffe in individuellere, einfachere.

Sprache als Instrument logischen Denkens besteht nach Boole aus Zeichen, Wörtern und mathematischen Symbolen. Mentale Operation zum Zusammenfügen von Begriffen zu neuen Ausdrücken oder Mengen sind das logische „und“ und „oder“. Dabei verknüpft „Und“ Begriffe miteinander, die notwendig im entstehenden neuen Ausdruck enthalten sein müssen. Bei „Oder“ können beide Begriffe enthalten sein, müssen es aber nicht, jedoch muss einer der beiden mit „oder“ verknüpften Begriffe im neuen Ausdruck vorkommen.

Erste Ideen zu modernen Publikationsformen

In seinem Buch mit dem Titel „Die chemische Literatur und die Organisation der Wissenschaft“ (1919) schlug der Leipziger Physiko-Chemiker und Nobel-Preisträger Wilhelm Ostwald neue Publikationsformen vor. Die wissenschaftliche Zeitschrift sollte nur noch in einzelnen Aufsätzen verteilt werden, da kein Wissenschaftler alle Aufsätze eines Zeitschriftenbandes lese. Sein Prinzip der unabhängigen Handhabung des einzelnen Stückes, oder „Monographieprinzip“, hatte Ostwald schon seit 1889 bei der Herausgabe seiner „Klassiker der exakten Wissenschaften“ angewandt.

Ostwald wollte mit seinen Klassikern den wachsenden Umfang der Zeitschriftenliteratur mit seiner Auswahl von Aufsätzen mit anhaltender Bedeutung nutzbarer machen. Mit dem Monographieprinzip sollte die „Beweglichkeit des Gedankens“ erhalten bleiben und ein Medium geschaffen werden, „welches die einzelnen Produktionen zueinander ordnet und in geordneter Weise jedem Bedürftigen zugänglich macht“.

1946 erschien in der bekannten Zeitschrift Nature ein anonymer Artikel mit dem Titel „Rationalization of the literature of scientific research“ (Nature, 1946, 157, No. 3997: 745-748). Der Aufsatz stellt überlegungen in den Dreissiger Jahren von Watson Davis, dem Begründer des American Documentation Institute, der heutigen American Society for Information Science and Technology, und auf ihn basierend John D. Bernal, einem britischen marxistisch orientierten Kristallographen und Wissenschaftshistoriker vor. Beide wollten Aufsätze an zentralen nationalen Stellen sammeln. Deren Bekanntmachung sollte durch Verteilung von Abstracts auf Karteikarten für Abonnenten fachbezogen möglich sein.

Erste Dokumentsuche mit elektronischen Hilfsmitteln

Die erste „elektronische“ Dokumentsuche wurde 1931 von Emanuel Goldberg entwickelt, der als Photochemiker bei der Firma Zeiss Ikon arbeitete und in den dreissiger Jahren nach Palästina emigrierte. 1931 wurde Goldberg für seine „Statistical Machine“ ein US Patent erteilt (Patentnummer US 1 838 389). Noch 1938 wurde Goldberg zusammen mit Zeiss Ikon auf seine Erfindung ein Patent erteilt (Patentnummer: DE 670 190).

Goldberg ordnete Abbildungen von Dokumenten auf Mikrofilm bestimmte Helligkeitsmarkierungen bzw. Punkte zu. Dann wurde Licht, das durch Löcher auf einer Suchkarte fiel, auf eine hinter dem Film liegende Photozelle gesandt, die bei übereinstimmung zwischen Suchkarte und Dokument auf dem Mikrofilm dadurch übereinstimmung anzeigte, dass kein Licht mehr bei der Photozelle ankam.

Boole’sche Logik und elektronische Schaltkreise

1938 erkannte Claude E. Shannon am Massachusetts Institute of Technology eine Ähnlichkeit zwischen Boole’schen Verknüpfungen und elektronischen Schaltkreisen. Diese können nur zwei Zustände annehmen, geschlossen = „Strom fließt nicht“ oder offen = „Strom fließt“. Shannon publizierte diese in einem Aufsatz mit dem Titel „A symbolic analysis of relay and switching circuits“ in der Zeitschrift „Transaction of the American Institute of Electrical Engineers“ (57 (1938) S. 713-723). Shannon’s Schaltalgebra wurde Grundlage aller Computeranwendungen, ohne die die heutige Suche nach Information und deren Speicherung undenkbar wäre.

Jimmy und die PC’s von gestern

Ende der vierziger Jahre des 20. Jahrhunderts arbeitete am MIT der amerikanische Chemie-Ingenieur James W. Perry. Beim zur gleichen Zeit dort laufenden Computerprojekt Whirlwind wurde ein Computer das erste Mal dazu benutzt, Informationen zu verarbeiten anstatt „nur“ zu rechnen. Perry arbeitete am Einsatz von Lochkarten (Punched Cards – PC’s) zur Verarbeitung und Suche chemischer Informationen. Ein spezielles Problem war hier zum Beispiel die Darstellung chemischer Formeln und Strukturen auf den Lochkarten.

Zusammen mit dem Studenten Phil R. Bagley schrieb Perry die erste Arbeit über die Nutzung von Computern bei einer Literatursuche (1951 zur „Applicability of newer electronic techniques to information searching“). Ende der Fünfziger Jahre arbeitete Perry am Center for Documentation and Communication Research an der Western Reserve University in Cleveland. Dort entwickelte er eine relais-betriebenes Gerät zur Suche nach Daten, die auf Lochstreifen gespeichert sind, den „WRU Searching Selector“.

Eine Chronologie zur Geschichte der Chemie-Information, zusammengestellt von Robert V. Williams und Mary Ann Bowden hat sich bei archive.org erhalten.

Erste Anwendungen Boole’scher Logik beim Suchen

Die Anwendung der Boole’schen Logik bei der Indexierung gespeicherter Information wurde in den fünfziger Jahren vom Amerikaner Mortimer Taube beschrieben. Taube ging davon aus, dass Disziplinen aber auch die wissenschaftlichen Inhalte und Begriffe in Veröffentlichungen durch grundlegende Teilbegriffe beschrieben bzw. zerlegt werden können, die dann bei einer Suche wiederverwendet werden können, wobei Boole’sche Operatoren zur Verknüpfung dienen. Diese Methode wurde „coordinate indexing“ genannt, weil Informationssuchende die Indexbegriffe zu kombinieren hatten, die vorher ausgewählt wurden, um eine bestimmte Information, d.h. normalerweise ein bestimmtes Dokument, zu beschreiben.

Die technische Realisierung erfolgte in den fünfziger Jahren durch Lochkarten. So konnte z.B. bei den Randlochkarten („Edge punched cards“) jede Karte ein Dokument mit seiner bibliografischen Beschreibung repräsentieren. Die Indexbegriffe wurden durch Löcher am Rande dargestellt, so bedeutete z.B. ein Loch an der Stelle 7, dass im Dokument das Thema Korrosion behandelt wurde, ein Loch bei 12, dass es bei diesem Stoff um Zink ging.

Bei einer Recherche in einer Sammlung von solchen Karten, quasi einer Datenbank, führte man Nadeln durch die Löcher 7 und 12 und erhielt so alle Karten die sowohl in 7 als auch 12 ein Loch hatten, auf denen also Dokumente beschrieben war, die sich mit dem Thema „Korrosion und Zink“ beschäftigten.

Eine Übersicht über amerikanische Pioniere des Dokumentations- und Informationswesens hat sich bei archive.org erhalten.

Eine erste Online-Recherche

Am 15. April 1957 fand zwischen dem Gmelin-Institut in Frankfurt/ Main, das bis in die Neunziger Jahre das berühmte „Handbuch der anorganischen Chemie“ herausgab, und einem „Symposium on Systems for Information Retrieval“ an der Western Reserve University in Cleveland, Ohio das erste „transatlantische Informationsgespräch“ statt. Eine Suchanfrage wurde von Erich Pietsch über Fernschreiber nach Cleveland gesandt und dort in das System der Ethyl Corporation eingegeben, das mit maschinensortierten Lochkarten suchte: „Does the ethyl corporation have information regarding assignment of fuel additive patents to the Standard Oil Development Co. If do, which patents have been assigned“. Kurze Zeit später wurde das Ergebnis per Fernschreiber zurück übertragen: „patents assigned to Standard Oil Development Co. 1,589,885 1,820,983 1,857,761 1,882,887 1,9433,808 plus 181 later patents“.

Drei Bedeutungen für die Zukunft wurden schon damals hervorgehoben: Es gibt nicht nur ein Bedürfnis etwas zu wissen, sondern auch etwas schnell zu wissen. Zweitens reicht kein lokales Suchsystem allein für alle Suchanfragen aus. Und es ist einfach nicht genug Speicher-Platz vorhanden, alle veröffentlichten Informationen an jedem Ort, wo sie gebraucht werden, vorzuhalten.

 

„Information stories from information history (Informationsgeschichten aus der Informationsgeschichte)“

George Boole’s definition of logic

In 1854 the British George Boole published his book „An investigation of the laws of thought on which are founded the mathematical theories of logic and probabilities“, in which he described the logic later used when searching information electronically. His binary algebra has only two possible values for any symbol, the values of 0 and 1.

To Boole the processes of reasoning were either the addition of different concepts or „classes of objects“ to form more complex objects, or the separation of complex concepts into individual simpler ones.

Language as instrument of reasoning was to Boole composed of signs including words and mathematical symbols. Mental operations to combine concepts to new, more complex concepts or sets are the logical „and“ and „or“. „And“ combines concepts to a new concept which requires them to be essentially present both in the new expression. In the case of „Or“ both concepts may be included but they needn’t. But it is necessary that at least one of both with „or“ combined concepts occurs in the new expression.

First ideas of modern forms of publishing

In his book on „the chemical literature and the organization of science“ (1919) the physico-chemist and Nobel laureate Wilhelm Ostwald from Leipzig predicted new ways of publication. Periodicals should be handed out as separate papers so that the readers wouldn’t be overwhelmed by the vast of information.

Since 1889 when he published „Klassiker der exakten Wissenschaften“ („Classics of the exact sciences“) he applied the „principle of the independent use of the individual piece“, or „Monographieprinzip“. He republished scientific classics in separate volumes for easy access. He wanted to counterbalance the growing quantity of journal literature with his selection of papers of lasting importance.

With the aid of the monographic principle the „mobility of thoughts“ should be preserved as well as a medium should be created to organize the individual works and to make them accessible in an ordered manner to anybody who needed them.

In 1946 an anonymous article was published with the title „Rationalization of the literature of scientific research“ (Nature, 1946, 157, No. 3997: 745-748) reflecting ideas of substituting the periodicals, by Watson Davis, the founder of the American Documentation Institute, today the American Society for Information Science and Technology, and, based on Davis, by John D. Bernal, a British Marxist-oriented crystallographer and science historian. Both wanted to collect articles at national centers and to distribute abstracts of those articles distinguished by subject on index cards to subscribers.

A chronology on the history of chemical information, compiled by Robert V. Williams and Mary Ann Bowden survived via archive.org.

The first electronic research for documents

Emanuel Goldberg was the first to use electronics for document retrieval in 1931. Goldberg worked as photo chemist at the company Zeiss Ikon and emigrated to Palestine in the 1930th. In 1931 he was granted a US Patent (Patent number US 1 838 389) for his „Statistical Machine“. In 1938 (sic!) Goldberg, together with Zeiss Ikon, was granted a German patent for his invention (Patent number: DE 670 190).

Goldberg attached special patterns of lightness or dots to microfilm images of documents. A „search card“ with holes was placed between a light source and the film. Behind the film was a photocell. In case of an exact match of the dots on the film and the holes in the search cards no light reached the photocell and the searched for document was detected.

Boolean logic and switching circuits

In 1938 Claude E. Shannon from the Massachusetts Institute of Technology described the similarity of Boolean conjunction with electric circuits. These devices have only two signal states, the open state (power on) and the closed state (power off). Shannon published his famous paper „A symbolic analysis of relay and switching circuits“ in the journal „Transaction of the American Institute of Electrical Engineers“ (57 (1938) S. 713-723). His Boolean algebra laid the foundations for the use of computers, without them the today’s search for information and its storage would be unimaginable.

Jimmy and the PC’s of yesterday

At the end of the 1940th the American chemical engineer James W. Perry worked at the MIT. His work was influenced by the Whirlwind computer project. It was the first time that the computer was used for processing information rather than for calculating. The idea of freeing the user from information overload emerged during the Whirlwind project. Perry was engaged in the application of punched cards (PCs) for processing and searching chemical information.

A special problem was the representation of chemical formulas and structures through punched cards. Together with his student Phil R. Bagley Perry wrote the first article on using computers for bibliographic searching (1951 on „Applicability of newer electronic techniques to information searching“). In 1955 he changed to Cleveland, to the Center for Documentation and Communication Research (CDCR) in the School of Library Science at Western Reserve University (WRU).

There Perry „designed a relay-operated device to search data stored on punched paper tape“, the WRU Searching Selector.

First application of Boolean logic when searching

The application of Boolean logic to the indexing of stored information was described in the fifties of the 20th century by the American Mortimer Taube. Taube assumed that disciplines and also the contents of scholarly publications can be broken down into or described with single ideas with associated terms, which can later for retrieve them by using Boolean combinations. This method was called „coordinate indexing“, because the person looking for information had to combine or coordinate the index terms that were selected, either free or from a thesaurus, to describe the desired information.

The technical realization took place in the Fifties through punched cards. For example a so-called „Edge punched cards“ represented a document with ist bibliographical description. The index terms were coded around the periphery of the card by notched-out holes. So a notch at notch number 7 stand for the index term „corrosion“, a notch at 12 for „zinc“ as representation of the contents of the document.

When retrieving a collection of punched cards – quasi a database – you have to insert needles through locations 7 and 12 and then you get all cards containing a hole in 7 as well as in 12, representing documents whose topic is „corrosion and zinc“.

An overview on American pioneers of documentation and information science survived via archive.org.

A first online-research

The Gmelin Institute in Frankfurt/Main, which edited the famous Handbook of Inorganic Chemistry, was a partner in the first so called „transatlantic information conversation“ („Transatlantisches Informationsgespräch“). A research inquiry was sent by Erich Pietsch via Teletype network to the Western Reserve University in Cleveland, Ohio to show „high-speed transmission methods“ as well as „rapid searching techniques“, something that we would call today „online retrieval“ or „online search“.

On April 15, 1957 the following question was sent from Gmelin to Cleveland: „Does the ethyl corporation have information regarding assignment of fuel additive patents to the Standard Oil Development Co. If do, which patents have been assigned“. This question was used by the systems demonstration of the Ethyl Corporation (Ferndale, Michigan) using machine-sorted punch cards. The answer followed the next day: „patents assigned to Standard Oil Development Co. 1,589,885 1,820,983 1,857,761 1,882,887 1,9433,808 plus 181 later patents“.

Three reasons for the necessity of this transmission in the future were mentioned: „There is a need not only to know, but also to know quickly. This time-factor in research has not yet been established.“ The second was that no information system is self-sufficient, and the third was the growth of information: „There simply is not enough space available to accommodate in perpetuity all the published information in every place it is needed.“