Escolar Documentos
Profissional Documentos
Cultura Documentos
Hausarbeit
Seminar: Transzendentale Physikbegründung bei Kant und C. F. v. Weizsäcker
Dozent: Prof. Dr. Holm Tetens
Wintersemester 2007/2008
2
Inhalt
1 Einleitung
3 Sehen
3.1 Vom ungeordneten Nervenbündel zur 2D-Abbildung
3.2 Indirekter Vergleich
5 Schluss
Anhang
Literatur
3
1 Einleitung
Das Programm transzendentaler Physikbegründung, so wie von Kant und C. F. v. Weizsäcker
verfolgt, sucht nach notwendigen Bedingungen der Möglichkeit von Erfahrung mit dem Ziel
zu zeigen, wie die Physik, die die von uns wahrnehmbare Welt beschreiben soll, aufgebaut
sein muss. Zu der Frage, was überhaupt der Gegenstand einer physikalischen Theorie ist und
wovon die Rede ist, wenn ein Physiker von einzelnen Objekten spricht, schreibt Weizsäcker:
„Wie es möglich ist, ... [ein bestimmtes Objekt als dieses Objekt wahrzunehmen], ist nicht
Gegenstand unserer physikalischen Theorie; daß es möglich ist, ist Voraussetzung jeder
solchen Theorie. ... Daß wir Objekte aus dem Weltganzen sinnvoll gedanklich herauslösen
können, versteht sich nicht von selbst“ ([1], S. 199). Dieses Herauslösen der Objekte ist aber
die Grundlage für ein Verständnis der Welt, das ist nicht nur in der Physik so. Die Entstehung
einzelner Begriffe, die ein rationales Verständnis der Welt erst ermöglichen, beinhaltet
ebenfalls ein solches Herauslösen. Dabei entsteht sowohl eine größere Ordnung als auch die
Fähigkeit differenziert wahrzunehmen, was eng miteinander verknüpft ist. Der Mensch, so
wie er auf die Welt kommt, ist nicht einmal in der Lage ein Objekt mit den Augen zu fixieren.
Es sieht aus, als müsste er zuerst lernen, was ein Objekt überhaupt ist und sich somit die
Grundlage seiner Erkenntnis selbst legen. Wie aber kann er das lernen, wenn ihm nichts als
bloße Sinneswahrnehmungen gegeben sind?
Diese Frage hat mich zu den Überlegungen des ersten Teils dieser Arbeit motiviert: Ich wollte
zeigen, dass sich unter minimalen theoretischen Voraussetzungen eine komplexe Ordnung der
Wahrnehmung schaffen lässt. Das Ergebnis ist ein mathematisches Modell, das auf der Basis
elementarer Vergleiche eine gegebene Menge von Wahrnehmungen strukturiert. Ich glaube
zeigen zu können, dass es möglich ist zu lernen, dass Augen zum Sehen, Ohren zum Hören,
Händen zum Fühlen usw. da sind.
Im zweiten Teil der Arbeit beschäftige ich mich damit, wie bestimmte Phänomene auf
höheren Ebenen des menschlichen Geistes beschrieben werden können, wenn man davon
ausgeht, dass sich alle geistigen Fähigkeiten eines Menschen nach den von mir beschriebenen
Prinzipien zum Erschließen der Welt entwickeln. Ich werde untersuchen wie Zeichen und
begriffliche Strukturen entstehen können und versuche zu erklären, wie wir einzelne,
voneinander abgegrenzte Begriffe haben können.
4
Ich möchte hier kein neuro-physiologisches Modell aufstellen, es soll ein funktionales Modell
sein, mit dem Ziel zu zeigen, dass bestimmte Vorgänge prinzipiell möglich sind (und zwar
sogar unter relativ geringen Voraussetzungen). Solche funktionalistischen Ansätze 1 haben den
Vorteil, dass sie auf verschiedene (auch nicht-physische) Weisen realisiert sein können. Das
Modell ist aber von der Vorstellung inspiriert, dass unsere Wahrnehmungen durch eine
Wechselwirkung mit der Umwelt zustande kommen und in Form von neuronalen Impulsen
vorliegen und verarbeitet werden. Ich werde die Wahrnehmungen als einen Informationsstrom
in Form einer zeitlichen Folge von Inputs beschreiben. Die Inputs werden über einen längeren
Zeitraum derart verarbeitet, dass einerseits Information über die innere Struktur eines Inputs
gewonnen wird und andererseits neue Inputs auf der Basis der bis dahin eingetroffenen Inputs
(der „Erfahrung“) sinnvoller interpretiert werden können.
2.1 Inputs
Ich beschreibe die Wahrnehmung zu einem Zeitpunkt t durch einen N-dimensionalen Input-
Vektor I (t ) , dessen Koordinaten Werte aus dem Intervall [0,1] annehmen können, wobei ich
die einzelnen Koordinaten mit Indizes bezeichne (z.B. Ik). In einem physiologischen Bild
wäre N die Anzahl der Nervenfasern aller Rezeptoren. Eine Festlegung der Koordinaten auf
die Werte Null oder Eins entspräche einer digitalen Funktionsweise des Zentralnervensystems
(feuern/nicht-feuern), das Modell setzt dies jedoch nicht voraus.2 An der Einschränkung auf
endlich viele Dimensionen werde ich aus Gründen der Anschaulichkeit festhalten, es
widerspricht jedoch nichts einer mathematischen Erweiterung.
1
vgl. z.B. den Ansatz von Warren S. McCulloch, den Menschen als Turingmaschine zu beschreiben, in der nur
zwei Rückkopplungsmechanismen determiniert sind: „a desire to play and a desire to win“ (Warren S.
McCulloch nach [3], S. 54).
2
vgl. dazu die Diskussionen zur Digital-Analog-Problematik auf den Macy Konferenzen ([4]), dort insbesondere
den Beitrag von Ralph W. Gerard: Some of the Problems Concerning Digital Notions in the Central Nervous
System, S. 171-202.
5
die Möglichkeit besteht die Werte zweier Koordinaten eines Inputs zu vergleichen. 3 Ich wähle
als Vergleichsfunktion den Betrag der Differenz | Ii – Ij |. Aus den Vergleichen der Werte der
Koordinaten zu einem Zeitpunkt bildet sich über einen längeren Zeitraum hinweg die
Fähigkeit nicht nur die Werte der Koordinaten, sondern die Koordinaten selbst miteinander zu
vergleichen: Der Vergleichswert zweier Koordinaten ist der zeitliche Mittelwert der
Vergleiche ihrer Werte, zu jedem Paar von Koordinaten existiert also genau ein
Vergleichswert. Die Menge dieser Werte lässt sich in einer N × N − Matrix darstellen:
Aij := | I i (t ) − I j (t ) | t .
Aij gibt also den mittleren Abstand der Werte der i-ten und j-ten Koordinate an. Ein Maß dafür
wie ähnlich sich die Werte zweier Koordinaten im Mittel waren ist
Wij := 1− | I i (t ) − I j (t ) | t .
Wij und Aij sind beide aus [0,1], wobei im digitalen Bild (Input-Koordinaten Null oder Eins)
Wij und Aij für große Zeiten gegen die Wahrscheinlichkeit konvergieren, dass die
entsprechenden Koordinaten zu einem Zeitpunkt gleiche bzw. verschiedene Werte haben. Im
Allgemeinen konvergiert Aij gegen den Erwartungswert des Abstandes der entsprechenden
Koordinaten und Wij gegen 1 – Aij. Ich nenne W und A Ähnlichkeitsmatrix und
Abstandsmatrix. In ihnen schlagen sich alle Erfahrungen nieder, die ein Mensch macht, und
sie beeinflussen wie zukünftige Erfahrungen interpretiert werden (siehe unten). Die zeitliche
Mittelung erfolgt vom Zeitpunkt der Geburt bis zur Gegenwart.4
1
d ( I 1 , I 2 ) := || I 1 − I 2 ||1
N
3
Ich denke eine grundlegende Fähigkeit zu vergleichen ist eine notwendige Voraussetzung für Leben überhaupt,
da sonst eine Reaktion auf die Umwelt gar nicht möglich wäre.
4
Es wäre auch denkbar andere Mittelungen zu verwenden. Ein exponentiell geglätteter Mittelwert würde z.B.
berücksichtigen, dass Erfahrungen mit der Zeit verblassen.
6
N
|| x ||1 := ∑ | x i | .
i =1
Der Abstand zweier Inputs entspricht also dem Mittelwert der Abstände ihrer Koordinaten
und liegt wieder in [0,1].5 Diese Möglichkeit zwei Inputs miteinander zu vergleichen nenne
ich einen direkten Vergleich. Die Ähnlichkeitsmatrix W bietet eine zusätzliche Möglichkeit
zwei Inputs miteinander zu vergleichen. Sie induziert einen Endomorphismus V auf dem
Raum der Inputs:
1 1 N
V ( I ) := W ⋅ I
N
bzw. Vk ( I ) =
N
∑W
i =1
ki ⋅ Ii .
Von einem indirekten Vergleich über A spreche ich, wenn die Inputs zunächst transformiert
und anschließend direkt verglichen werden:
d ind . ( I 1 , I 2 ) = d (V ( I 1 ),V ( I 2 )) .
Anschaulich gesprochen führt die Transformation dazu, dass sich der Wert einer Koordinate
auf alle ihr ähnlichen Koordinaten überträgt. Je ähnlicher sich zwei Koordinaten in der Matrix
sind d.h. je ähnlicher sich ihre Werte im Mittel waren, desto ähnlicher sind sich ihre Werte
nach der Transformation, selbst wenn sie sich vor der Transformation stark unterschieden
haben. Zwei Inputs, die sich im direkten Vergleich nicht ähneln, sind sich also im indirekten
Vergleich unter Umständen sehr ähnlich. Diese Ähnlichkeit besteht aber nur aufgrund
bestimmter Erfahrungen. Ein indirekter Vergleich realisiert in formaler, mathematischer
Weise das, was ich im zweiten Teil der Arbeit (in Einklang mit dem üblichen Sprachgebrauch
) als Assoziation bezeichnen werde.
5
Die Betragsnorm ist eine p-Norm für p = 1. Die p-Norm für einen N-dimensionalen Vektorraum ist definiert
N
als || x || p := ( ∑| x
i =1
i | p ) 1 / p . Für die euklidische Norm (p=2) müsste man schon mehr als die Betragsfunktion
und Mittelwertbildung voraussetzen, nämlich Multiplizieren und Radizieren.
7
1. | x − y |= 0 ⇔ x = y (Definitheit)
2. | x − y |=| y − x | (Symmetrie)
3. | x − y |≤| x − z | + | z − y | (Dreiecksungleichung)
Diese Eigenschaft überträgt sich auf die Abstandsmatrix, was unter anderem daran liegt, dass
die zeitliche Mittelung mit der Addition kommutiert, so dass auf A die Dreiecksungleichung
erfüllt
AXY = | X − Y | t ≤ | X − Z | + | Z − Y t
= | X − Z | t + | Z − Y | t = AXZ + AZY
Mit Aij ist also eine erfahrungsabhängige Metrik auf der Menge der Koordinaten K gegeben.
Auf dem metrischen Raum (K,A) ist die ε -Umgebung eines Punktes x definiert als
Die ε -Umgebungen erzeugen als Basis eine Topologie, so dass man auch von der
erfahrungsabhängigen Topologie der Inputs sprechen kann. Ich verweise hier auf den Begriff
der Topologie, weil es eine allgemeinere, mengentheoretische Struktur ist, die nicht das
Messen von Abständen voraussetzt. Zwei metrische Objekte, die topologisch äquivalent sind,
müssen nicht zwangsläufig dieselbe Metrik besitzen. Viele Überlegungen im zweiten Teil der
Arbeit setzen nur die Existenz einer Topologie nicht aber einer Metrik voraus. Auf diese
Weise kann ich auch den Begriff des Messens in Bezug auf geistige Vorgänge weitgehend
vermeiden. Für einige abschließende Überlegungen bezüglich der Bildung von Begriffen
werde ich allerdings wieder konkreter und setze eine Metrik voraus. Ich führe deshalb noch
einige Konzepte ein, die aber erst im Abschnitt zur Familienähnlichkeits-Konzeption wichtig
werden und vorerst übersprungen werden können. Das erste Konzept baut auf dem Begriff der
ε -Umgebung auf und kann zum Ordnen eines metrischen Raumes genutzt werden.
Die ε -Ordnung einer Grundmenge G mit einer zugeordneten Metrik ist das mächtigste
Mengensystem disjunkter Mengen deren Vereinigung G ist, wobei jeder Punkt in
derselben Menge wie seine ε -Umgebung liegt.
8
Die ε -Ordnung einer Grundmenge lässt sich iterativ konstruieren. Man beginnt mit einem
Mengensystem, in dem jeder Punkt der Grundmenge als einziges Element in genau einer
Menge liegt. Man sucht nun Paare von Punkten verschiedener Mengen deren Abstand kleiner
als ε ist und vereinigt die zugehörigen Mengen. Existiert kein solches Paar von Punkten
mehr, stellt das vorliegende Mengensystem die ε -Ordnung der Grundmenge dar. Jede ε -
Ordnung einer Menge erzeugt (als Basis) eine Topologie auf der Menge. Je kleiner ε ist,
desto feiner ist dabei die Topologie.
Das zweite und dritte Konzept bauen aufeinander auf und sind verwandt mit dem der ε -
Ordnung. Ich definiere zunächst die Isolation I eines Punktes x aus R in einer Teilmenge
U ⊆ R unter Rückgriff auf die Metrik d des Raumes R als
I ( x, U ) := min{d ( x, y ) | y ∈U }
τ (U ) := max{I ( x, U ) | x ∈U }
Die lokale Toleranz einer Menge gibt also an, wie groß die größte in ihr vorkommende
Isolation eines Punktes ist. Für die lokale Toleranz τ einer Menge M ε einer ε -Ordnung gilt
immer τ (M ε ) ≤ ε .
2.5 Mehrstufigkeit
Mit Mehrstufigkeit meine ich, dass primäre Inputs, denen eine Ähnlichkeitsmatrix zugeordnet
ist, zu Elementen von sekundären Inputs, also Inputs einer zweiten Stufe werden können. Es
ist auch möglich primäre Inputs mit sekundären Inputs zu „verschalten“, sie also als
gemischten Input auf einer höheren Stufe zu verwenden. Die Nervenfasern unserer Augen,
Ohren usw. bilden unseren visuellen, akustischen usw. Sinn; unsere Sinne bilden eine
Wahrnehmung zu einem Zeitpunkt; die Wahrnehmungen in einem bestimmten Zeitraum
bilden eine Erfahrung; die Erfahrungen bilden so etwas wie das Weltbild.
Diese Struktur soll nur eine grobe Idee darstellen. Das vorgelegte Modell beinhaltet die
Mehrstufigkeit nur, wenn man es wiederholt anwendet. Folgende Grafik soll diesen Aufbau
verdeutlichen:
9
Koordinaten
Inputs
? d(Ii, Ij)
gleich I1, I2, I3, …
gleich
2.Stufe K’1, K’2, K’3, ... d(K’i, K’j)
zusammenfassen ind. Vergleich
? d(I’i, I’j)
gleich I’1, I’2, I’3, …
gleich
3.Stufe K’’1, K’’2, K’’3, ... d(K’’i, K’’j)
zusammenfassen
ind. Vergleich
?
usw. usw.
gleich
gleich
usw. usw.
3 Sehen
Ich möchte am Beispiel des Sehens das Modell konkret anwenden und seine Erklärungskraft
demonstrieren. Unter geringfügig vereinfachten Bedingungen lässt sich mit dem Modell
erklären, wie aus den Informationen des Sehnervs die zweidimensionale Charakteristik des
10
visuellen Sinns gewonnen werden kann. Außerdem werde ich das Prinzip des indirekten
Vergleichs anhand eines Beispiels verdeutlichen.
6
Die physiologischen Fakten finden sich z.B. in [5].
7
Beim menschlichen Auge stimmt dieses Bild der punktweisen Informationsübertragung weitgehend, vgl. aber
Untersuchungen zur Funktionsweise eines Froschauges, das die Bildinformation vor der Weiterleitung an das
Gehirn vorverarbeitet, so dass nicht jede Faser einem Bildpunkt entspricht: [6].
8
Der Fehler durch die Vereinfachung zu kastenförmigen Objekten ist kleiner als es zunächst schein, da sich
jedes Bild in guter Näherung als eine Summe solcher Kastenfunktionen darstellen lässt. Da eine Summation mit
der Mittelung kommutiert, kann auch zunächst gemittelt und anschließend summiert werden bzw. ein Bild in
mehrere Kasten-Bilder zerlegt werden ohne dass dadurch ein Fehler entsteht. Die Annahme einer
Gleichverteilung der Breite erzeugt im Gegensatz dazu sicherlich einen größeren Fehler.
11
0 x y a
Der Abstand der beiden Koordinaten zum Zeitpunkt t hängt nun vom Abstand ihrer
Rezeptoren auf der Netzhaut, D =| x − y | , und dem Bild, das durch die Breite b und Position
a des Kastens beschrieben wird, ab. Über a und b wird in der Rechnung gemittelt, da dies die
Parameter sind, die die Menge aller Bilder charakterisiert. Ich schreibe für den Abstand
d a ,b ( x, y ) . Die Werte, über die später integriert werden muss, lassen sich durch eine
Fallunterscheidung erfassen:
Mittelt man nun noch über die verschiedenen Kastenbreiten bis zu einer maximalen Breite
bmax ( b max ≥ D ) erhält man
AXY = d a ,b ( X , Y ) a ,b
1
b max
1 B +b 1 2b
D b max
2D
=
b max ∫ B + b ∫ d a ,b ( X , Y ) ⋅ da ⋅ db = b max ∫ B + b ⋅ db + ∫ B + b ⋅ db
0 0 0 D
12
2 B B + b max
= D + B ⋅ ln + D ⋅ ln
b max B + D B + D
AXY
0.6
0.5
0.4
0.3
0.2
0.1
D
0.5 1 1.5 2
B =1;
bmax = 1 (blau); bmax = 1.5 (grün); bmax = 2 (gelb); bmax = 2.5 (rot)
Da die Breite des Bildes und des Kastens B und b immer größer Null sind und die maximale
Kastenbreite bmax größer als der größte Rezeptorenabstand (der maximal B sein kann) ist, ist
die Ableitung immer positiv und AXY also eine steigende Funktion des Abstandes der
entsprechenden Rezeptoren auf der Netzhaut. Wie auch die Grafik zeigt, ist für große Werte
von bmax (d.h. wenn es Objekte gibt die das Blickfeld bei weitem überschreiten, was in der
Realität der Fall ist) der Zusammenhang zwischen AXY und D annähernd linear. Die durch A
induzierte Metrik und Topologie (siehe oben) ist dann äquivalent zu einer Ebene. Dieses
Ergebnis ist empirischer Natur und nicht selbstverständlich. Die Topologie des Hörnervs ist
beispielsweise eine ganz andere:9 Die entscheidende physikalische Größe, die
Luftschwingungen, lässt sich durch eine eindimensionale Größe, die Frequenz,
9
Für eine genauere Beschreibung der Funktionsweise des menschlichen Gehörs siehe ebenfalls [5].
13
charakterisieren, auch das Hörorgan (die Kochlea, die das Corti-Organ enthält) ist linear
aufgebaut und auch der Hörnerv leitet die Information im Prinzip frequenzaufgelöst weiter. Es
gibt aber zwei Phänomene, die eine lineare Topologie verhindern. Zum einen gibt es
Resonanzphänomene im Innenohr (Wanderwellentheorie), die eine frequenzaufgelöste
Wahrnehmung ermöglichen, aber auch dazu führen dass selbst bei einer sinusförmigen
Anregung nicht nur Sinneszellen in einem kleinen Bereich, sondern auch Obertöne stimuliert
werden. Zum anderen treten auch in der Natur Resonanzphänomene auf, so dass es praktisch
keine reinen Sinusschwingungen gibt. Die durch benachbarte Frequenzen bzw. Nachbarschaft
der Rezeptoren erzeugte Nähe überlagert sich also mit der durch Resonanzeffekte erzeugten
Nähe, was eine komplexere Topologie bedeutet.
Die entscheidende Erkenntnis dieser Überlegungen ist, dass die durch die Abstandsmatrix
erzeugte Topologie des Sehnervs äquivalent zur Topologie der Netzhaut bzw. der
Bildinformation ist und dasselbe auch im Fall anderer Sinnesorgane zu erwarten ist. Auch die
Zuordnung eines Schmerzes zu einer bestimmten Ursache ist keinesfalls selbstverständlich,
sondern setzt die differenzierte Erlernung aller Einzelheiten voraus (die Zuordnung einzelner
Körperteile zum eigenen Körper, die Koordination dieser Körperteile, die Zuordnung der
sensitiven Informationen zu einem Körperteil).
Diese Art von Lernprozess wird durch das Modell beschrieben und wenn man das Verhalten
von Säuglingen beobachtet, hat man das Gefühl, dass all ihre Handlungen nur einem Zweck
dienen – ihre Matrizen möglichst schnell zu füllen.
im indirekten Vergleich zum Tragen, da beide Quadrate den gleichen Raumbereich füllen, die
angeregten Rezeptoren also auf der Netzhaut benachbart liegen und die Inputs nach der
Transformation deshalb viel größere Ähnlichkeit haben als zuvor. Die im direkten Vergleich
nicht sehr ähnlichen Wahrnehmungen sind im indirekten Vergleich deutlich ähnlicher, für
zwei Objekte, die sich nur in ihrer Farbe unterscheiden, ist genau das charakteristisch. Erst der
indirekte Vergleich über die Ähnlichkeitsmatrix der Nervenfasern macht es möglich von
räumlicher Kongruenz oder Form zu sprechen.
4.1 Hypothese
Die Hypothese ist zweiteilig und lautet:
1) Auf der Menge aller Wahrnehmungen, die ein einzelner Mensch macht, existiert eine
erfahrungsabhängige Topologie.
Sucht man nach Entsprechungen von 1) und 2) im mathematischen Modell, wären das am
ehesten die (durch die Abstandsmatrix induzierte) Topologie und der indirekten (durch die
Ähnlichkeitsmatrix realisierte) Vergleich. Je zwei Wahrnehmungen haben einen mehr oder
weniger großen Abstand und sind mehr oder weniger stark assoziiert (im mathematischen
Modell durch Werte aus [0,1] quantifiziert). Ich gehe aber davon aus, dass Abstand und
15
4.2 Kommunikation
Kommunikation ist ein sehr weiter Begriff, unter dem je nach Kontext Verschiedenes
verstanden wird.10 Ich meine damit in dieser Arbeit vor allem bewusste zwischenmenschliche
Kommunikation. Diese setzt aber etwas voraus, das man selbst auch schon als Vorform der
Kommunikation bezeichnen könnte, nämlich die oben genannten Assoziationen. Anhand
folgender Grafik lassen sich einige Begriffe besser erläutern:
Zeichen Zeichen
(extensional) (intensional) Begriff / Assoziation
Kommunikation
Objekt Bedeutung
10
vgl. dazu z.B. die verschiedenen Definitionen von Kommunikation in der Soziologie, Biologie,
Informationstheorie, Kybernetik, Nachrichtentechnik, Psychologie, Systemtheorie usw.
11
Dieses weiter gefasste Verständnis eines Zeichens ähnelt dem von z.B. Charles Sanders Peirce (siehe z.B. [7]).
16
Mit der Bedeutung eines Zeichens meine ich das, was das Zeichen durch Assoziation auslöst.
Die Bedeutung ist eine intensionale Größe.
Eine Assoziation ist im Spezialfall der Kommunikation die Verbindung zwischen einem
Zeichen (intensional) und seiner Bedeutung. Sie ist hier also eine Abbildung vom Raum der
Zeichen in den Raum der Bedeutungen, was beides Unterräume der Menge aller
Wahrnehmungen sind.
Das bezeichnete Objekt ist die zur Bedeutung gehörende Extension (d.h. das
Wahrgenommene der Wahrnehmung, die mit der Wahrnehmung des Zeichens (extensional),
also dem Zeichen (intensional), assoziiert wird).
Ein Begriff ist mit einer Assoziation verwandt, eine präzisere Formulierung folgt im nächsten
Abschnitt.
von Zeichen, Bedeutung und Begriff, wie es das semiotische Dreieck darstellt. Ein Zeichen
(extensional) verweist auf ein Objekt, wobei die Bedeutung des Zeichens, also die subjektive,
intensionale Verbindung zwischen Zeichen und Objekt, durch den Begriff gegeben ist. Es
wäre vorteilhaft, wenn der Zusammenhang von Zeichen, Bedeutung und Objekt eindeutig
wäre. Das ist jedoch in dem hier verwendeten Modell nicht der Fall, da sich die Begriffe auf
der Basis individueller Erfahrung bilden, und auch in der Praxis stellt sich diese Annahme oft
als falsch heraus. „So entstehen leicht die fundamentalsten Verwechslungen (deren die ganze
Philosophie voll ist).“ (Wittgenstein: Tractatus logico-philosophicus [8], 3.324)
kann aber aus oben genannten Gründen nicht stetig sein. Es gibt also den Fall, dass ähnliche
Zeichen unterschiedliche Bedeutungen haben sowie den, dass unterschiedliche Zeichen
ähnliche Bedeutungen haben. Letzterer ist unproblematisch, da er keine Missverständnisse
hervorruft. Ersterer aber führt zu Missverständnissen, sobald die Kommunikation geringfügig
gestört wird oder das Verständnis der Zeichen bei den Kommunikationspartnern nicht exakt
übereinstimmt. Für eine funktionierende Kommunikation muss die Bedeutung zuverlässig in
einen relativ engen Bereich eingeordnet werden können. Soll sie robust gegen Störungen sein,
müssen dafür Spielräume vorhanden sein. Insbesondere müssen zwischen ähnlichen Zeichen
mit verschiedener Bedeutung Bereiche liegen, die keinem der beiden Zeichen zugeordnet
sind. In der Praxis werden sich also durch Misserfolge in der Kommunikation zwischen
ähnlichen Zeichen mit verschiedener Bedeutung Bereiche ausbilden, die bedeutungsleer sind.
12
In dem Fall, dass die Bedeutungen ebenfalls ähnlich sind, ist solch eine Abgrenzung nicht
nötig. So ist z.B. die Lautstärke oft ein Maß für die Dringlichkeit der Aussagen: Dasselbe
Wort stellt in verschiedenen Lautstärken gesprochen eine dichte Menge verschiedener
Zeichen mit verschiedenen Bedeutungen dar, wobei die Lautstärke kein diskretes, sondern ein
kontinuierliches Maß für die Dringlichkeit ist. Diese Unterscheidung findet sich auch in
Watzlawicks Kommunikationstheorie wieder ([9], S. 61 ff.).
12
Auf die Kritik, dass kein „Zeichen“ völlig bedeutungsleer ist, möchte ich erwidern, dass dieses Problem in
einer komplexeren Darstellung mit kontinuierlichen statt diskreten Assoziationswerten nicht aufträte. Das
Phänomen des bedeutungsleeren Bereiches zeigt sich im Fall einer konkret vorliegenden Sprache auch im
Begriff des Minimalpaares. Ein Minimalpaar beschreibt zwei Worte, die phonetisch zwar verschieden sind,
zwischen denen jedoch auch kein weiteres Wort in der Sprache existiert (z.B. (Hand, Hund), (Hand, Band), nicht
aber (Hund, Band) ).
13
siehe z.B. [7], S. 64.
19
verändert. Die genaue Definition von α ( w, B ) und α krit bestimmt wie sich die Begriffe
genau entwickeln. Hierüber lässt sich die Charakteristik der resultierenden begrifflichen
Struktur beeinflussen und auch an bestehende Theorien angleichen. Ich werde hier nicht
versuchen diesen Theorien samt ihrer Unzulänglichkeiten gerecht zu werden, sondern nur
beispielhaft zwei Varianten kurz anreißen. 15 Im Anhang befinden sich Grafiken, die die
folgenden Überlegungen in einer zweidimensionalen Darstellung veranschaulichen. Jeder
Punkt der Ebene stellt dabei eine mögliche Wahrnehmung dar, wobei die Wahrnehmungen,
14
Das ist wichtig, um das Modell in sich schlüssig zu halten.
15
Eine kurze Darstellung verschiedener Konzepte findet sich z.B. in [10], S. 91 ff.
20
die bereits in die Menge der Bedeutungen des Begriffs aufgenommen sind, mit schwarzen
Punkten markiert sind. Die Konzepte funktionieren nicht nur in 2D, sondern in beliebigen
Räumen, in denen eine Abstandsfunktion definiert ist.
„Und die Stärke des Fadens liegt nicht darin, dass irgend eine Faser durch seine ganze
Länge läuft, sondern darin, dass viele Fasern einander übergreifen“
(Wittgenstein: Philosophische Untersuchungen [8], § 67)
Eine insbesondere von Ludwig Wittgenstein vertretene Konzeption von Begriffen, die so
genannte Familien-Ähnlichkeits-Konzeption, besagt, dass verschiedene Objekte, die unter
einen Begriff fallen, nicht notwendigerweise nach genau einem Satz von Kriterien eindeutig
bestimmt sind. Vielmehr spielt ihre Verwandtschaft untereinander eine große Rolle, so dass es
passieren kann, dass zwei unter denselben Begriff fallende Objekte (je nach Version bzw.
Auslegung) nichts oder nur wenig gemeinsam haben.
Wählt man für α krit die lokale Toleranz der Bedeutung B des Begriffs, α krit = τ (B ) , und für
α ( w, B ) die Isolation der Wahrnehmung innerhalb der Bedeutung, α ( w, B ) = I ( w, B ) , so
entspricht die Entwicklung eines Begriffs der iterativen Konstruktion eines Elements einer ε -
Ordnung mit ε = τ (B ) . Die lokale Toleranz und damit ε kann im verlauf der Entstehung
zwar kleiner, nicht aber größer werden. Der Begriff verändert sich nicht mehr, wenn alle
Wahrnehmungen, die nicht Element seiner Bedeutung sind, seine lokale Toleranz verletzen
würden. Alle Elemente seiner Bedeutung sind durch „Schritte“ kleiner oder gleich τ (B )
miteinander verbunden. In den Grafiken ist zu erkennen, dass sich der Bereich möglicher
Bedeutungen an die vorhandenen Bedeutungen „anschmiegt“ und einzelne Elemente relativ
stark berücksichtigt.
Wählt man als α krit den mittleren Abstand der Elemente der Bedeutung B des Begriffs
1
α krit =
| B |2
∑ ∑ d ( x, y )
x∈B y∈B
und als α ( w, B ) den mittleren Abstand der Wahrnehmung zur
1
Bedeutung des Begriffs α ( w, B ) = ∑ d ( w, x ) , entwickelt sich der Begriff „kugelförmig“.
| B | x∈B
Die (virtuelle) Wahrnehmung, deren mittlerer Abstand zu den übrigen Bedeutungen am
geringsten ist, kann als der (virtuelle) Prototyp bezeichnet werden.
Beide Theorien, können ohne Probleme sowohl in diskreter als auch gradueller Weise
verwendet werden, wie auch in den Grafiken dargestellt. Im graduellen Fall wird keine
α ( w, B ) n
Exp ( −( ) ) mit n=2 (bzw. n=8) gewählt, da diese Funktion die α ( w, B ) -Werte
α krit
zwischen Null und Unendlich auf das Intervall [0,1] abbildet, wobei die breite der Verteilung
durch α krit bestimmt ist. Da jeder Punkt eine mögliche Wahrnehmung darstellt, können die
Werte somit interpretiert werden als Wahrscheinlichkeit, dass zur Beschreibung der
entsprechenden Wahrnehmung der Begriff verwendet wird. Der Exponent n ermöglicht einen
fließenden Übergang von diskreter zu gradueller Variante.
besonders hoher Wahrscheinlichkeit macht und welche davon wiederum für die
Kommunikation relevant sind. Auf diese Weise erhielte man Aussagen darüber, welche
Begriffe sich mit besonders großer Wahrscheinlichkeit bilden. Dieser Ansatz liefert auch die
Erklärung dafür, weshalb es eine relativ große Übereinstimmung der Begriffe verschiedener
Kulturen gibt – die zu beschreibende Welt ist dieselbe. Innerhalb einer Kultur entsteht eine
besonders große Übereinstimmung dadurch, dass einerseits neue Begriffe von anderen
Menschen erlernt werden und andererseits die Wechselwirkung durch Kommunikation, wie
oben beschrieben, zu einer Konvergenz der Begriffe und Zeichen führt.
Noch ein weiterer wichtiger Punkt ist bis hierher unerwähnt geblieben: Kommunikation ist
selbst wieder ein wahrnehmbares Phänomen. Das bedeutet, dass sich ganz von selbst eine
Metakommunikation, also eine Kommunikation über Kommunikation, einstellt. Die
Grammatik einer Sprache ist nichts anderes als eine begriffliche Erfassung sprachlicher
Phänomene. Und zur Bedeutung eines Wortes gehört nicht nur das Objekt oder der
Sachverhalt auf den es verweist, sondern ebenso der sprachliche Zusammenhang in dem es
normalerweise verwendet wird. Jedes Wort hat also immer schon grammatische
Implikationen aufgrund der Tatsache, dass seine Verwendung in der Sprache selbst wieder
eine Wahrnehmung ist.
In derselben Weise existieren natürlich auch Begriffe über Begriffe. Diese mehrschichtige
Struktur der Begriffe, wobei die Bedeutung mancher Begriffe nur in einer Aussage über
andere Begriffe liegt, ist etwas anderes als die teilweise geschachtelte und überlappende
Struktur von Begriffen. Diese Schachtelung (also dass die Bedeutung mancher Begriffe
vollständig innerhalb der Bedeutung eines anderen Begriffs liegt) und die Überlappung (also
dass nicht-identische Begriffe trotzdem gemeinsame Bedeutungen haben) verführt zu der
Vermutung der klassischen Begriffskonzeption, dass ein komplexer Begriff in basale Begriffe
zerlegt werden kann. Legt man meine Überlegungen zugrunde, ist die Ursache für
Schachtelung und Überlappung, dass in manchen Situationen ein präziserer Begriff benötigt
wird. Dieser liegt notwendigerweise zunächst innerhalb eines allgemeineren, er entwickelt
sich jedoch unabhängig von diesem und überschreitet u.U. auch die Grenzen des
übergeordneten Begriffs.
5 Schluss
Diese Arbeit schneidet eine Problematik an, die schon seit Jahrhunderten in unterschiedlichen
Ausprägungen in den verschiedensten Disziplinen auftaucht. Ich nenne sie (mit einem etwas
technischen Begriff) die Analog-Digital-Problematik. In anderen Kontexten drückt sich diese
23
16
Heinz von Foerster hat betont, dass die Kommunikabilien (Zeichen, Symbole, Wörter usw.) nicht
vorausgesetzt werden dürfen, sondern erklärt werden muss, wie sie als Eigenwerte einer rekursiven Funktion
entstehen (nach [3], S. 29).
24
17
vgl. [10], S. 97 ff.
25
Anhang
In den Folgenden Abbildungen stellen die schwarzen Punkte die zur Bedeutung eines Begriffs
gehörenden Elemente eines zweidimensionalen Bedeutungsraumes dar.
In den folgenden drei Abbildungen markieren die Linien den Rand des Bereichs innerhalb
dessen α ( w, B ) ≤ α krit für die oben angegebenen Definitionen der Familienähnlichkeits- (blau
) und Prototypen-Theorie (rot).
150
100
50
-50
-100
-150
26
150
100
50
-50
-100
-150
150
100
50
-50
-100
-150
27
α ( w, B ) n
In den folgenden Abbildungen ist die Funktion Exp ( −( ) ) für n=2 (rechts) und n=8
α krit
(links) über der Bedeutungsebene aufgetragen. Bei der gemischten Theorie wurde im
Exponenten der Mittelwert aus Prototypen- und Familienähnlichkeits-Theorie verwenden:
1 α Pr ot ( w, B ) n α Fam ( w, B ) n
Exp ( − (( ) +( ) )) . Der aufgetragene Wert kann als
2 α Pr ot krit α Fam krit
Wahrscheinlichkeit dafür interpretiert werden, dass eine Wahrnehmung an der
entsprechenden Stelle versucht wird mithilfe des Begriffs, also einem Zeichen seiner
Zeichenmenge, zu kommunizieren. Je größer der Parameter n dabei ist, desto ähnlicher ist die
Beschreibung der diskreten Variante.
n=8 n=2
Prototypen-Theorie___________________________________________________
Familienähnlichkeits-Theorie__________________________________________
Gemischte Theorie____________________________________________________
29
Literatur
[1] Weizsäcker, Carl Friedrich von: Die Einheit der Natur. München: dtv, 1974 (8. Aufl.
2002).
[2] Weizsäcker, Carl Friedrich von: Aufbau der Physik. München: dtv, 1988 (4. Aufl.
2002).
[3] Baecker, Dirk: Form und Formen der Kommunikation. Frankfurt am Main:
Suhrkamp, 2005.
[4] Pias, Klaus [Hrsg.]: Cybernetics: The Macy-Conferences 1946-1953 (Band I,
Transactions / Protokolle). Zürich; Berlin: diaphanes, 2003.
[5] Hick, Christian [u.a.] [Hrsg.]: Kurzlehrbuch Physiologie. München [u.a.]: Urban &
Fischer, 2002.
[6] McCulloch, Warren S.: What the Frog’s Eye tells the Frog’s Brain. In: Corning,
William C. [Hrsg.]: The Mind: Biological Approaches to its Functions, S. 233-258,
New York [u.a.]: Wiley, 1968.
[7] Peirce, Charles S.; Pape, Helmut [Hrsg.]: Phänomen und Logik der Zeichen. Frankfurt
am Main: Suhrkamp, 1983.
[8] Wittgenstein, Ludwig: Tractatus logico-philosphicus [u.a]. Werkausgabe Band 1,
Frankfurt am Main: Suhrkamp, 1984.
[9] Watzlawick, Paul [u.a.]: Menschliche Kommunikation. Formen, Störungen,
Paradoxien. Bern: Hans Huber, 2000.
[10] Baumann, Peter: Erkenntnistheorie. Stuttgart; Weimar: Metzler, 2006.
[11] Kant, Imanuel; Raymund Schmidt [Hrsg.]: Kritik der reinen Vernunft. Nach der 1.
und 2. Originalausgabe. Hamburg, Leipzig: Meiner, 1990.
[12] Pias, Claus: Analog, Digital, and the Cybernetic Illusion. In: Kybernetes, special
issue: Heinz von Foerster in memoriam, 33/2 (2004), S. 543-550.