Welche Information trägt ein Bit?

Die Frage erscheint Ihnen vermutlich banal. Schliesslich weiss jedermann, was ein Bit ist, nämlich die Möglichkeit einmal aus zwei Zuständen auszuwählen.

Wo ist das Problem?

Ich möchte zu bedenken geben, dass die Frage nach der Information im Bit damit noch nicht beantwortet ist. Welche Information in einem Bit enthalten ist, hat nämlich auch mit der Frage zu tun, welche zwei Zustände zur Auswahl stehen. Klassische Beispiele sind:

– 0 und 1
– Wahr und Falsch
– Positiv
und Negativ
– Ein
und Aus

Selbstverständlich erschöpft sich die Auswahl dadurch nicht. Auch männlich/weiblich, innen/aussen, gut/schlecht oder beliebige andere binäre Paare können in einem Bit stecken, genauso wie ihre jeweiligen Umkehrungen, also neben 0/1 genauso auch 1/0.

Woher weiss das Bit, welche beiden Zustände es anbietet?

Vielleicht denken Sie, dass dies einfach eine Sache im Bit sei. Das eine Bit enthält 0/1 als Paar und das andere Bit Wahr/Falsch. Die beiden Zustände wären somit natürliche Eigenschaften eines jeden individuellen Bits. Das ist allerdings technisch nicht zutreffend, denn der Hersteller eines Chips hat die Bits des Chips nicht mit individuellen Eigenschaften versehen. Technisch gesehen sind die Bits alle genau gleich, ihre Simplizität und Neutralität macht ja gerade den Charme der binären Technologien aus.

Erst wenn im Computer ein Programm abläuft, werden den neutralen Bits individuelle Wertpaare wie 0/1, Wahr/Falsch usw. zugeordnet. Der Charakter, d.h. die eigentliche Bedeutung der beiden Zustände, wird erst durch das Programm in das Bit hineingelegt.

Das ist natürlich praktisch, weil so je nach Programm dem gleichen Bit im Chip eine immer wieder neue Bedeutung gegeben werden kann. Allerdings müssen wir jetzt zugeben, dass die Bedeutung nicht mehr im Bit steckt, sondern im aufrufenden Programm, mithin in ganz anderen Bits, nämlich denen des Programms.

Woher aber haben diese Bits ihre Bedeutung? Bei denen verhält es sich natürlich genau gleich, auch ihnen werden erst von aussen konkrete Wertpaare zugeordnet. Es geht also weitere nach aussen, immer kann die Bedeutung des Wertpaares eines Bits nur mit weiteren Bits von aussen geschrieben werden – mit anderen Worten: Es handelt sich einen unendlichen Regress, jedes Bit, das ein anderes erklärt, muss erneut erklärt werden.

Wo ist das Ende der Kette?

Die Suche nach den Bits, mit denen man die anderen Bits erklären kann, findet somit nie ein Ende. Das ist die Natur eines unendlichen Regresses. Doch wir haben trotzdem eine Chance, das Ende des Regresses zu finden. Die Suche ist nämlich nur solange hoffnungslos, wie wir innerhalb des Computers bleiben. Als Mensch jedoch können Sie über den Computer hinausdenken. Das Programm ist ja zu einem bestimmten Zweck geschrieben worden und Menschen, Programmierer und Anwender legen fest, welche Bedeutungen die Bits jeweils haben sollen. Die Bedeutung, und damit die konkreten individuellen Wertpaare der Bits entstehen am Ende des Regresses – offline als Abmachung in den Köpfen der Menschen.

Allerdings sind wir auf diese Weise aus der Welt der Bits herausgerutscht, anders geht es nicht. Solange wir in der Welt der Bits bleiben, bleiben wir in einer zwar präzisen, doch völlig „unbedeutenden“ Welt. Diese erlangt ihre Bedeutung erst, wenn wir den einzelnen Bits von aussen eine Bedeutung geben. Das heisst, wir verbinden ein bestimmtes Bit mit einer Information, die uns als Menschen etwas sagt. So lässt sich der unendliche Regress auflösen.

Isoliert gesehen, sind die beiden Zustände des Bits vollständig neutral und lassen sich deshalb von aussen mit beliebigen Bedeutungen belegen. Technisch gesehen ist das genial. Doch dürfen wir uns dadurch nicht verleiten lassen, mit Bits allein bedeutungstragende Information generieren zu können. Es braucht immer ein aussen, das den Bits die Bedeutung zuweist.

Wir haben somit zwei Arten von Information:

A) Das isolierte Bit:
Dieses sagt aus, welcher der beiden Zustände des Bits gewählt wird, ohne die Zustände selber zu beschreiben. Es handelt sich um das „technische“ Bit der Informationstheorie.

B) Die dem Bit zugedachte Bedeutung:
Diese Information sagt aus, worum es beim Bit geht, welche beiden Zustände es sind, die mit dem Bit gewählt werden können. Es handelt sich um die qualitative Information, die mit dem Bit ausgedrückt werden kann. Obwohl wir sie dem Bit selber zuordnen, verschwindet sie, sobald wir das Bit isoliert betrachten.

Die beiden Arten von Information sind von prinzipiell unterschiedlicher Natur. Trotz oder gerade wegen ihrer unterschiedlichen Natur gehören sie zusammen. Erst ihre Kombination macht eine sinnvolle, das heisst bedeutungstragende Information aus.

Und aussen war das Wort (1)

Was ist Semantik? Eine einfache und gut verständliche Antwort ist, dass Semantik die Bedeutung von Information ist. Die Information kann in irgendeiner Form vorliegen, als Text, als Bild usw. Am häufigsten wird die Semantik von Wörtern gesucht.

Ein guter Grund also, das Verhältnis der Sprachwissenschaft (Linguistik) zur Semantik zu untersuchen. Kann Semantik als ein Untergebiet der Linguistik angesehen werden?

Linguistik als Lehre von Sprache und Sprachen hat schon immer die Grammatiken der Sprachen untersucht. Wenn die Grammatik (Syntax) eines Satzes verstanden ist, sehen die Linguisten zwei weitere Aufgaben, nämlich als zweites die Semantik des Satzes und als drittes seine Pragmatik zu untersuchen. Bei der „Semantik“ geht es ihnen um die Bedeutung der Wörter, bei der „Pragmatik“ um das „Warum“ einer Aussage, also um den grösseren Zusammenhang.

Es gibt somit in den Augen der Linguisten einen Dreischritt beim Verstehen von Sprache: Syntax -> Semantik -> Pragmatik. Diese drei Aufgaben werden von den Linguisten ganz unterschiedlich gewichtet: ein konventionelles Lehrbuch behandelt vorwiegend Fragen der Syntax, während Semantik und Pragmatik nur am Rand vorkommen – und stets auf der Basis der vorher durchgeführten Syntaxanalyse. Die Syntaxanalyse stellt somit bereits die Weichen für das Nachfolgende.

Das ist für die Semantik nicht wirklich ideal. Wenn man sich näher mit Semantik befasst, wird klar, dass Grammatik und andere Eigenheiten der jeweiligen Sprachen Äusserlichkeiten darstellen, welche den Kern der Aussagen – ihre Bedeutung – zwar auf gelegentlich sehr elegante Weise umschreiben, aber eben nur umschreiben und nicht vollständig und schon gar nicht direkt repräsentieren. Eine direkte formale Darstellung des mit dem Text Gemeinten wäre aber für eine wissenschaftliche Semantik das eigentliche Ziel.

Ist das Ziel erreichbar? Wir müssen uns als erstes über das Verhältnis von Wörtern und Begriffen klar werden – Wörter und Begriffe sind nicht dasselbe! Begriffe sind die Grundelemente der Semantik und sie haben einen speziellen, aber nicht ganz einfachen Bezug zu den Wörtern der Sprache.

Man könnte leichtfertig annehmen, dass eine 1-zu-1-Beziehung zwischen Wörtern und Begriffen besteht, dass also hinter jedem Wort ein Begriff steht, der zusammenfasst, was die Bedeutung des Wortes ist. Doch genau dies ist falsch. Wörter und Begriffe lassen sich nicht eindeutig aufeinander abbilden. Dass das so ist, kann jeder selbst erkennen, der sich beim Lesen, Sprechen und Denken beobachtet.

Es ist offensichtlich, dass ein Wort mehrere Bedeutungen haben kann, je nachdem in welchem Zusammenhang es gesprochen wird. Ein Wort kann gelegentlich auch gar keine Bedeutung haben, z.B. wenn es ein Fachwort ist und ich das Gebiet nicht kenne. Dann kann ich das Wort zwar nachsprechen, aber es bleibt für mich bedeutungsleer. Das Wort hat für mich somit keinen Begriff. Trotzdem kann es jemand verstehen, der das Sachgebiet versteht.

Wenn wir über diesen Sachverhalt noch etwas länger nachdenken, wird uns klar, dass Fachwörter wie Zitronensäurezyklus oder II-V-I-Progression für die meisten Leute keine Bedeutung haben. Aber nicht nur Fachwörter, auch ganz normale Wörter, die wir alle kennen, haben keine sichere, eindeutige Bedeutung, sondern können je nach Zuhörer oder Kontext eine jeweils leicht unterschiedliche Vorstellung (Bedeutung) hervorrufen. Dabei handelt es sich nicht nur um abstrakte Wörter oder Wörter mit wechselnden Wertvorstellung, wie Glück, Demokratie, Wahrheit usw., auch ganz konkrete Begriffe wie Hund, Wasser, Haus werden von verschiedenen Menschen verschieden bewertet.

Auch in uns selber existieren für das gleiche Wort ganz unterschiedliche Vorstellung, je nach Situation verbinden mit dem gleichen Wort wir unterschiedliche Vorstellungen.

Umgekehrt kann die gleiche Vorstellung mit ganz unterschiedlichen Wörtern belegt werden. So können das deutsche Tisch und das englische table problemlos für die gleiche Vorstellung, den gleichen Begriff verwendet werden. Ganz problemlos ist die Geschichte aber nicht: Tisch und table sind keineswegs Synonyme: Zum Beispiel meint das enlische table auch Tabelle, das deutsche Tisch aber nicht. Weitere Beispiele für die Inkongruenz von Wort und Begriff kann leicht jeder selber finden.

Wir müssen akzeptieren, dass ein Wort und ein Begriff sich nicht so einfach auf einander abbilden lassen. Obwohl es im Einzelfall durchaus so scheinen kann, als stünde hinter jedem Wort genau ein Begriff (eine Semantik), ist dies in Wirklichkeit eine völlig unangebrachte Vorstellung. Und diese verhindert, dass das Spiel der Bedeutungen korrekt verstanden wird. Doch genau dieses Spiel der Bedeutungen ist es, das m.E. die Semantik als Wissensgebiet ausmacht.

Selbstreferentialität 2 (Paradoxie)

(Fortsetzung von „Selbstreferentialität 1“)

Anweisung zur Generierung von Paradoxien

Der Trick mit dem sich formale Systeme sprengen lassen besteht wie gesagt aus zwei Anweisungen:
1: Eine Aussage bezieht sich auf sich selber.
2: Im Bezug oder in der Aussage gibt es eine Verneinung.
Durch diese Konstellation entsteht immer eine Paradoxie.

Ein berühmtes Beispiel dafür ist der Barbier, der alle Männer des Dorfes rasiert, ausser natürlich diejenigen, die sich selber rasieren (die haben es ja nicht nötig). Die formale Paradoxie entsteht durch die Frage, ob dieser Barbier sich selber rasiert. Falls er es tut, gehört er zu den Männern, die sich selber rasieren, und diese rasiert er wie gesagt nicht. Also rasiert er sich nicht. Somit gehört er zu den Männern, die sich nicht selber rasieren – und diese rasiert er.

Auf diese Weise wechselt der Wahrheitsgehalt der Aussage, ob er sich selber rasiert, dauernd zwischen WAHR und FALSCH hin und hier. Diese Oszillation ist typisch für alle echten Paradoxien, so z.B. auch für den lügenden Kreter oder den formalen Beweis in Gödels Unvollständigkeitssatz, auch dort oszilliert der Wahrheitsgehalt einer Aussage kontinuierlich zwischen wahr und falsch und ist somit nicht entscheidbar. Im Barbierbeispiel sind neben der typischen Oszillation auch klar die oben erwähnten beiden Bedingungen für die echte Paradoxie erkennbar:
1. Selbstreferentialität: Rasiert er SICH SELBER?
2. Verneinung: Er rasiert sich selber rasierende Männer NICHT.

An dieser Stelle kann auf Spencer-Brown verwiesen werden, der einen Kalkül entwickelt hat, mit dem sich diese Verhältnisse klar zeigen lassen. Der Kalkül wird in seinem Text „Laws of Form“ dargestellt. Wer sich dafür interessiert, dem sei das Buch „Die Form der Paradoxie“ von Felix Lau empfohlen, das nicht nur den Kalkül für uns Laien nachvollziehbar macht, sondern sich auch sehr intensiv mit den Konsequenzen dieser Art Paradoxie beschäftigt.

Unechte Paradoxien

Diesen „klassischen“ Paradoxien möchte die „unechten“ Paradoxien gegenüberstellen, z.B. die „Paradoxie“ von Achilles und der Schildkröte. Hier handelt es sich nicht um echtes logisches Problem wie beim Barbier, sondern um ein inadäquat gewähltes Modell. Die Zeiten und Strecken, die die beiden Konkurrenten rennen, werden nämlich immer kürzer und nähern sich einem Wert, der innerhalb des gewählten Modells nicht überschritten werden kann. Somit kann Achilles die Schildkröte im Modell nicht überholen. In der Realität besteht aber kein Grund, dass die Zeiten und Strecken derart verzerrt und nicht linear betrachtet werden.

Die Unmöglichkeit zu überholen, besteht nur im Modell, das auf eine raffinierte Weise falsch gewählt ist. Ein Messsystem, das auf diese Weise verfälscht, ist natürlich nicht zulässig. Es handelt sich in Wirklichkeit um eine perfide Modellwahl, nicht um eine wirkliche Paradoxie. Entsprechend sind die beiden Kriterien für echte Paradoxa auch nicht vorhanden.

Modellwahl

Das Beispiel von Achilles und der Schildkröte zeigt die Bedeutung der korrekten Modellwahl. Die Modellwahl findet stets ausserhalb der Darstellung der Lösung statt und ist nicht Gegenstand eines logischen Beweises. Die Modellwahl hat vielmehr mit dem Bezug der Logik zur Realität zu tun. Sie findet auf einer übergeordneten Metaebene statt.

Mein Postulat ist es nun, dass zum Gebiet der Logik unbedingt auch die Modellwahl und nicht nur das Kalkül innerhalb des Modells gehört. Wie wählen wir ein Modell? Wenn Logik die Lehre vom richtigen Denken ist, dann muss diese Frage von der Logik mit behandelt werden.

Rolle der Metaebene für Modellwahl und Paradoxie

Das Zusammenwirken von zwei Ebenen, nämlich einer betrachteten Ebene und einer übergeordneten, betrachtenden Metaebene spielt nicht nur bei der Modellwahl, welche stets auf der Metaebene stattfindet, eine Rolle, sondern auch in der Form der echten Paradoxie. Die Selbstreferentialität in der echten Paradoxie führt nämlich unweigerliche die beiden Ebenen ein.

Eine Aussage, die sich auf sich selber bezieht, existiert zweimal, einmal auf der betrachteten Ebene, auf der sie quasi das „Objekt“ ist, das andere Mal auf der Metaebene, auf der sie sich auf sich selber bezieht. Die Oszillation der Paradoxie entsteht durch einen „Loop“, d.h. durch einen Kreisprozess zwischen den beiden Ebenen, dem das logische System nicht entrinnen kann.

Oszillierender Loop der Paradoxie, Selbstreferentialität und „Metasprung“

Es gibt übrigens zwei Arten solcher Loops, wie Felix Lau in seinem Buch aufzeigt: – eine negative (mit Verneinung), die zur Paradoxie führt – eine positive (mit Bestätigung), die zu einer Tautologie führt. Mit anderen Worten: Selbstreferentialität in logischen Systemen ist immer gefährlich! Es lohnt sich, zur Vermeidung, bzw. zur korrekten Behandlung von Paradoxien in logische Systeme den „Metasprung“ einzuführen – dieser ist der Bezug zwischen der betrachteten Ebene und der betrachtenden Metaebene.

Selbstreferentialität 1

Vor 20 Jahren las ich fasziniert Douglas Hofstadters Kultbuch „Gödel-Escher-Bach“. Zentral darin ist Gödels Unvollständigkeitssatz. Dieser Satz zeigt eine (die?) Grenze für die klassische mathematische Logik auf und Gödel bewies sie 1931 zusammen mit der Tatsache, dass sie prinzipiell für alle klassischen mathematischen Systeme unüberwindbar ist.

Das ist schon erstaunlich – insbesondere, da wir als Kinder der Aufklärung und überzeugte Jünger der Ratio nichts für stabiler und sicherer ansehen als die Gesetze der Mathematik.

Hofstadters Buch hat jedenfalls einen enormen Eindruck auf mich ausgeübt. Allerdings hatte ich an gewissen Stellen, z.B. beim Thema der „Kodierung“ von Information den Eindruck, dass hier bestimmte Aspekte über Gebühr vereinfacht werden. Bei einem solchen Vorgang spielt doch die Art des Einbaus in das interpretierende System unweigerlich eine Rolle, eine Information ist vor und nach dem Einbau nicht genau dieselbe. Zusätzlich erschien mir der Aspekt der „Zeit“ nicht genügend berücksichtigt, Informationsverarbeitung findet jedenfalls immer innerhalb einer gewissen Zeit statt. Hat die Zeit etwa keinen Einfluss auf die bestehende Information? Zeit und Information sind m.E. untrennbar miteinander verbunden, weshalb berücksichtigt Hofstadter das nicht?

Meine Rezeption von Hofstadter wurde weiter herausgefordert durch Hofstadters Einordnung als Vertreter der „starken KI“. Die „starke KI“-Hypothese besagt, dass menschliches Denken, ja menschliches Bewusstsein, durch Computer auf Basis von mathematischer Logik simuliert werden könne, eine Hypothese, die mir damals, und auch heute, reichlich gewagt erscheint.

Roger Penrose soll zu seinem Buch „Emperor´s New Mind“ durch eine BBC-Sendung provoziert worden sein, in der Hofstadter, Dennett und andere begeistert die starke KI-These vertreten haben, die Penrose offensichtlich nicht teilen mag. Ich wie gesagt auch nicht.

Aber natürlich sind Frontlinien nie so einfach. Obwohl ich hier sicher auf der Seite von Penrose stehen will, bleibt mir Hofstadters Vermittlung von Gödels Unvollständigkeitssatz als einer zentralen Erkenntnis der Wissenschaft des 20. Jahrhunderts doch unvergesslich. Mit Begeisterung las ich auch das Interview mit Hofstadter, das diesen Frühling im Spiegel erschien (DER SPIEGEL 18/2014: „Sprache ist alles“). Darin postuliert er u.a. dafür, dass Analogien im Denken von Wissenschaftlern entscheidend seinen und er grenzt seine Interessen von denen der profitorientierten IT-Industrie ab. Gedanken, denen man sich sehr wohl anschliessen mag.

Doch zurück zu Gödel. Was ist – in Laiensprache – der Trick in Gödels Unvollständigkeitssatz?

Der Trick besteht darin, einen Satz (eine Aussage):
1. auf sich selber zu beziehen
2. sie zu verneinen.

Das ist der ganze Trick. Mit dieser Kombination lässt sich jedes formale System sprengen.

Ich fürchte, ich muss dies näher erläutern …

(–> siehe „Selbstreferentialität 2“)

Der blinde Fleck

Wenn Semantik als Wissenschaftsthema eingeordnet werden soll, bieten sich z.B. folgende Fächer an:

a) Linguistik
b) Informationstheorie
c) Mathematik
d) Psychologie
e) Philosophie

Die breite Auswahl zeigt, dass eine Zuordnung nicht selbstverständlich ist. Vielleicht haben ja alle diese Fächer recht, Semantik auf ihre Weise zu behandeln. Ich plädiere aber dafür, Semantik als ein eigenes Gebiet zu betrachten, mit eigenen Problemstellung und Lösungen und insbesondere auch mit eigenen formalen Methoden. Diese bauen nicht auf linguistischen oder mathematischen Methoden auf, sondern nehmen solche gegebenenfalls für klar definierte Aufgaben zu Hilfe, so wie die Physik mathematische Methoden zu Hilfe nimmt.

Überhaupt hat jedes Fachgebiet seine eigene Semantik. Wenn Semantik als Bedeutung von Wörtern oder Daten definiert wird, so ist klar, dass die Wörter in jedem Fachgebiet ihre eigene Bedeutung, d.h. ihre eigene Semantik haben. Diese aber ist die Semantik des Fachgebietes und nicht die Semantik als Fachgebiet selber. Semantik als Fachgebiet hat mit der Darstellung und dem Prozessieren von Bedeutungen zu tun. Es handelt sich um zwei verschiedene Ebenen:

a) Die Bedeutungen des Untersuchungsgegenstandes (des jeweiligen Fachgebietes)
b) Die Methode, mit welcher die Bedeutungen dargestellt werden

Es ist klar, dass letzteres eine Metaebene darstellt. Diese Metaebene ist unsere Semantik.

Im Auge werden die eingehenden Lichtstrahlen auf der Netzhaut abgebildet. Die über die ganze Netzhaut verstreuten Signale werden in einem eng umschriebenen Gebiet gebündelt, wo sie in den Sehnerv eintreten. An diesem Ort sehen wir nichts, da eintreffende Lichtsignale dort keine Lichtrezeptoren vorfinden, weil dieses Gebiet bereits vollständig von der Infrastruktur der Weiterleitung, dem Sehnerv,  beansprucht wird. Es handelt sich dabei um eine Metastruktur. Bemerkenswerterweise fällt uns die Blindheit an dieser Stelle nicht auf. Sobald wir nämlich einen Gegenstand ansehen wollen, der sich an dieser Stelle befindet, fokussieren wir ihn. Das bedeutet, dass wir das Auge so bewegen, dass wir den anvisierten Gegenstand neu an der Stelle des schärfsten Sehens haben. Der blinde Fleck fällt uns dadurch nicht mehr auf. Wir sind an dieser Stelle doppelt blind. Der blinde Fleck  ist nicht nur blind, weil wir dort nichts sehen, wir sind darüberhinaus blind bezüglich der Tatsache, dass wir dort nichts sehen.

Soviel zum blinden Fleck und zur Metaebene. Soviel zur Semantik.

Dieser Beitrag ist fortgesetzt in: Und aussen war das Wort (1)