Druckansicht
Darstellungsstil als bild-rhetorische Kategorie. Einige Vorüberlegungen


Autoren: Klaus Sachs-Hombach, Jörg R. J. Schirra
[erschienen in: Bild-Stil: Strukturierung der Bildinformation (Themenheft zu IMAGE 3)]

Schlagwörter: Bildstil, Bildrhetorik, Illokution, perzeptueller Realismus

Disziplinen: Philosophie, Rhetorik


If we consider pictures (or at least sets of pictures) as symbol systems, it seems reasonable to describe them (analogue to the speech act theory) as imbedded in the broader context of sign acts. They would consequently have an illocutionary role and could serve, for example, to warn against something, to inform about something, or to ask someone to do something. But since pictures are characterized by several particularities, an easy transfer of linguistic categories is problematic. Even if we are justified to describe many applications of pictures as forms of communicative actions, it should be examined in detail to what extent we have to modify the categories of the speech act theory while applying them to pictures. This will be pursued in the following article concerning the relation between pictorial style and functions of pictures.

Abstract in Deutsch:


1. Einleitung

Mit Bildern können wir jemanden vor etwas warnen (z. B. den Postboten vor dem Hund), über etwas informieren („Dies ist die Tür zur Herrentoilette“) oder zu etwas auffordern (etwa im Rahmen einer Bedienungsanleitung). Derart in den Kontext von Zeichenhandlungen eingebettet, können wir ihrer Präsentation folglich eine illokutionäre Funktion zuschreiben. Einen bildpragmatischen Ansatz, der auf diese Weise die performativen Komponenten der Bildverwendung betont, halten wir für theoretisch ergiebig; da Bilder aber vor allem im Vergleich mit sprachlichen Äußerungen zahlreiche Besonderheiten besitzen, sollte im Einzelnen geprüft werden, inwieweit die zur Anwendung kommenden Kategorien der Sprechakttheorie im Kontext der Bildkommunikation nicht doch modifiziert werden müssen.

Bildkommunikation darf dabei im Übrigen nicht zu eng verstanden werden. So ist damit durchaus auch an den Fall gedacht, dass sich jemand selbst ein Bild zeigt – wenn er etwa alleine eine Galerie besichtigt. Auch dieser Fall kann (und sollte) als Zeichenverwendung verstanden werden, also als eine Handlung, bei der jemand (der „Sender“) jemandem (dem „Empfänger“) etwas mithilfe eines Zeichens zu verstehen gibt. Nur dass in diesem Fall – ähnlich einem Monolog – Sender und Empfänger verschiedene Rollen sind, die dieselbe Person, ganz im Sinne G. H. Meads, simultan einnimmt. Die illokutionäre Funktion, die sich prinzipiell zwischen zwei Beteiligten aufspannt, wird hier also wirksam zwischen dem Betrachter und einem internalisierten alter ego.

Eine relativ direkte Übertragung von Searles Sprechakttheorie auf bildliche Zeichenakte wurde bereits 1978 von Kjørup (vgl. Kjørup 1978) vorgeschlagen. Allerdings besteht in der Wahrnehmungsnähe von Bildern eine wesentliche Auszeichnung, die deutliche Modifikationen der Sprechakttheorie nahe legt. Mit dem Ausdruck „Wahrnehmungsnähe“ möchten wir hierbei den Sachverhalt zum Ausdruck bringen, dass wir zur Interpretation von Bildern unwillkürlich auf (kulturell durchaus modifizierte) Kompetenzen der (visuellen) Wahrnehmung zurückgreifen: Sie prägen auch unser Bildverständnis zumindest teilweise. So erkennen wir etwa deshalb mit großer Leichtigkeit in einer bildlichen Darstellung bestimmte Gegenstände – so möchten wir behaupten –, weil wir mit der Wahrnehmung dieser Gegenstände bereits in unserer Alltagswelt Erfahrung haben. Bei der elementaren Identifizierung der Bildgegenstände können wir daher auf schon bestehende Klassifikationsmechanismen zurückgreifen.

Ist diese Ansicht, die eher ähnlichkeitstheoretisch und nicht verwendungstheoretisch inspiriert ist, zutreffend, dann wäre die Hypothese nicht unplausibel, dass es auch für den bildhaften Ausdruck einer illokutionären Funktion neben den konventionellen Mitteln (etwa roter Balken als Verbot) bildspezifische, perzeptuell verankerte Mittel gibt. Das schließt nicht aus, dass wir konventionelle Mittel der „Bildsteuerung“ oft verwenden. Wir möchten die Mittel, die gewissermaßen illokutionäre Marker zu setzen erlauben, allgemein als bild-rhetorische Mittel bezeichnen. Rhetorisch sind es primär die unterschiedlichen Darstellungsweisen, die die Rezeption des Bildes unterstützen und lenken. Ein skizzenhafter Linienstil kann etwa dazu dienen, die Vorläufigkeit einer Gebäudezeichnung zu betonen. Alternativ hierzu ließe sich auch mit der Farbintensität ein entsprechender Effekt erreichen. Hier sind deshalb vor allem Konventionen zu vermuten. Dagegen scheint das Verständnis z. B. von einer extremen Untersicht unmittelbar auf unsere Wahrnehmungskompetenz bezogen zu sein.

Die These, die wir genauer untersuchen möchten, lautet also, dass die zur Steuerung des Bildverstehens wichtigen stilistischen Elemente zumindest teilweise nicht rein konventionell sind, sondern in enger Relation zu den jeweiligen Wahrnehmungsvermögen des Bildbetrachters stehen. Bevor wir diese These eingehender plausibel machen (3.) und an dem konkreten Beispiel einer sozialkritischen Fotografie mit naturalistischem Darstellungsstil veranschaulichen (4.), möchten wir zunächst einige Erläuterung zum Begriff der Bildrhetorik (2.) vorbringen.

2. Was ist Bildrhetorik?

Unter „Rhetorik“ wird gegenwärtig die Theorie und Praxis der menschlichen Beredsamkeit verstanden (vgl. Knape 2000). Soll es der Rhetorik in diesem Sinne ganz allgemein um die Möglichkeiten der Erzeugung oder Änderung von Überzeugungen (bzw. um die entsprechenden Theorien hierzu) gehen, dann wird auch der Präsentation eines Bildes niemand rhetorische Aspekte absprechen wollen. Denn bekannter- und erwiesenermaßen wird mit Bildern etwas in uns bewirkt. Entsprechend prägen Bilder (oft in unmittelbarer und affektiver Weise) unsere Meinungen. Die Bemühungen um eine Bildrhetorik haben dennoch erst in jüngster Zeit eingesetzt (vgl. Knape 2005). Hierbei lässt sich, anknüpfend an die genannte Definition von Rhetorik, unter dem Ausdruck „Bildrhetorik“ die Theorie und Praxis des Einsatzes bildhafter Mittel zur Verstärkung der menschlichen Überzeugungsfähigkeit verstehen. Primär wird es der Bildrhetorik um eine Reflexion des Einsatzes und der gezielten Gestaltung von Bildern in persuasiven Kontexten gehen.

Hierbei ist es hilfreich, einige Grundunterscheidungen einzuführen. Bei der Bestimmung der rhetorischen Mittel sollte zunächst unterschieden werden, ob es sich primär um Bildkommunikation oder primär um sprachliche Kommunikation handelt (vgl. hierzu Harms 1990 oder Heitmann & Schiedermair 2000). Der zweite Fall, bei dem das Bild etwa zur Illustration sprachlich vorgegebener Sachverhalte verwendet wird, ist sicherlich gebräuchlicher. Unter Umständen wird man hierbei bereits die Tatsache, dass überhaupt ein Bild (als Beleg oder zur Illustration) gezeigt wird, selbst als rhetorisches Mittel werten. Hierbei handelt es sich aber nicht um genuin bild-rhetorische Verfahren. Innerhalb eines kommunikativen Kontextes können natürlich beliebige Gegenstände rhetorisch wirksam werden. So kann beispielsweise auch der Zeitpunkt, der Ort oder selbst ein zeitgleiches Ereignis an einem anderen Ort den Erfolg einer Rede beeinflussen. Von einem bildhaften rhetorischen Mittel im eigentlichen Sinn wollen wir nur dann reden, wenn ein Bild auf Grund seiner bildinternen Eigenschaften kommunikativ wirksam wird. Hier sind wir bereits im Grenzbereich zum ersten Fall angelangt: der Bildkommunikation nämlich, die bild-rhetorisch den interessanteren Fall liefert, weil das Bild nun eine (vom sprachlichen Kontext tendenziell unabhängige) eigenständige Funktion wahrnimmt und seine rhetorische Kraft mittels der bildeigenen Eigenschaften bzw. der jeweiligen Bildgestaltung entfalten muss.

Bildkommunikation ganz ohne jeden sprachlichen Bezug ist eher selten. Sie liegt am ehesten noch in den Werken der modernen Bildkunst vor. Die Übergänge sind allerdings fließend. Selbst wenn Bilder ohne Text erscheinen, stehen sie oft – wie etwa das Beispiel der sakralen Bildkunst zeigt – im Kontext eines sprachlichen Diskurses, so dass ihr Verständnis eine genauere Kenntnis der entsprechenden Texte voraussetzt. Liegt eine Text-Bild-Kombination vor, dann handelt es sich nur dann primär um Bildkommunikation, wenn nicht das Bild die sprachlichen Zeichen, sondern umgekehrt die sprachlichen Zeichen das Bild erläutern. Der Text dient in diesem Fall also lediglich zur Verdeutlichung der Bildmitteilung und könnte eventuell auch fehlen. Bei den klassischen Printmedien – wie dem Buch oder der Zeitung – dominiert sprachliche Kommunikation. Dagegen dominiert in den modernen „visuellen“ Medien – wie Fernsehen oder Video – Bildkommunikation.

Eine weitere wichtige Unterscheidung, die sich aus dem Gesagten bereits ergibt, besteht darin, ob die rhetorische Wirkung von dem Bild insgesamt oder von einzelnen Gestaltungselementen ausgeht. Einem Gestaltungselement messen wir dabei eine rhetorische Funktion bei, insofern es über die Darstellung eines Inhaltes hinaus zugleich zur Verdeutlichung der kommunikativen Intention und damit zur Verdeutlichung des Verwendungszwecks beiträgt. Diese Verdeutlichung ergibt sich also nicht aus dem Inhalt allein, sondern aus der Art und Weise, wie ein Inhalt präsentiert wird. Rhetorisch sind demnach primär die unterschiedlichen Darstellungsweisen, die (durch stilistische Marker verstärkt) das Verständnis eines visuellen Artefaktes unterstützen und lenken. Bei unseren weiteren Überlegungen wird es insbesondere um diese Mittel gehen, also um die dem visuellen Artefakt inhärenten Steuerungscodes.

Wenn der Rhetorikbegriff entsprechend weit gefasst wird, besagt die Rede von einer Bildrhetorik also, dass Bilder innerhalb kommunikativer Zusammenhänge kraft ihrer visuellen Eigenschaften bzw. ihrer visuellen Gestaltung persuasive Funktionen übernehmen können. Die konkrete Aufgabe einer Bildrhetorik liegt dann in der Erfassung der jeweiligen Gestaltungsmittel, die geeignet sind, in systematischer Weise Überzeugungen zu generieren oder zu modifizieren. Offensichtlich kann dies in überaus vielfältiger Form geschehen. Ein sehr einfaches Mittel ist beispielsweise die Hervorhebung bestimmter Inhalte durch Vergrößerung. Die Hervorhebung ist nur eines unter zahlreichen Mittel, das zudem sehr unterschiedlich realisiert werden kann, beispielsweise ebenfalls durch farbliche Kontraste oder durch eine spezielle Beleuchtungssituation. So wird etwa durch eine zusätzliche Ausleuchtung in Abb. 1 rechts der Eindruck der Räumlichkeit und Materialität des abgebildeten Objektes deutlich gegenüber der linken Fassung hervorgehoben (vgl. Hoppe & Lüdicke 1998).


Abb.1: Hervorhebung von Materialität und Tiefe durch Ausleuchtung (rechts)

Wichtig ist hierbei vor allem, dass sich bild-rhetorische Elemente aus der Art und Weise ergeben, wie ein Inhalt dargestellt wird, also aus dem Darstellungsstil. Wir verwenden den Ausdruck „Stil“ im Folgenden sehr allgemein und nicht im kunsthistorischen Sinne. Ist die Annahme richtig, dass der Darstellungsstil eines Bildes als Mittel zur Steuerung der Bildinterpretation dient, dann ergibt sich hieraus unmittelbar die Empfehlung, Bildstil und Bildfunktion aufeinander abzustimmen, da nicht jede Bildfunktion in derselben Weise angezeigt werden kann. Um beispielsweise die Funktionsweise des menschlichen Blutkreislaufes in einem medizinischen Lehrbuch zu veranschaulichen, ist eine fotografische Darstellung – und generell eine zu realistische Darstellung – eher ungeeignet. Wie etwas bildhaft dargestellt werden sollte hängt also entscheidend von dem Verwendungszweck oder von der Bildfunktion ab.

Schließlich erweist sich eine Gliederung der rhetorischen Wirkung eines Bildes in ihre kognitiven (strukturalen) Komponenten einerseits und ihre affektiven (motivationalen) Aspekten andererseits im Folgenden als hilfreich. Dass man „im Bild“ etwas sieht und diesen Bildinhalt mit bereits Gewußtem zu neuen Überzeugungen verknüpfen kann ist zunächst lediglich eine strukturale Möglichkeit, und zwar in der Regel eine unter mehreren. Tatsächlich müssen wir von einer prinzipiellen semantischen Unbestimmtheit des Bildinhalts ausgehen, die sich nicht nur daraus herleitet, dass sich vermutlich immer alternative Szenarien konstruieren lassen, die ein vergleichbares Wahrnehmungsmuster erzeugen würden (vgl. Sachs-Hombach 2003: 174 ff.). Bereits die der Inhaltsbestimmung vorausgehende Einteilung in Figur und Grund ist nicht eindeutig festgelegt und kann, abhängig von den aktuellen Verwendungsbedingungen, vielfältig variieren (vgl. Schirra 2005: 50 & 67).

Dass ein bestimmter Bildinhalt gesehen wird und darauf basierend ein kognitiv möglicher Schluss tatsächlich gezogen, eine bestimmte Meinung gebildet wird, hängt auch davon ab, dass eine entsprechende Motivation vorhanden ist. Es sind speziell die affektiven Wirkungen von Bildern, die wir in diesem Zusammenhang betrachten wollen, denn sie vor allem können die notwendige „Energie“ liefern, um eine struktural nur mögliche rhetorische Wirkung zu realisieren und damit einen bestimmten Bildinhalt und eine darauf aufbauende illokutionäre Rolle als aktuell relevant festzulegen. Unter Affekten versteht man eine Komponente der Verhaltenssteuerung, die im Wesentlichen spontan funktioniert, wenigstens in Grundzügen angeboren ist (vgl. Dornes 1995: 21) und recht unterschiedliche Aspekte aus der Verhaltenstheorie, der Physiologie und der Psychologie integriert. So gehören bestimmte Ausdrucksbewegungen (insbesondere Mimik) ebenso dazu, wie einige Bereiche des hormonellen und des vegetativen Systems, und schließlich gewisse Einfärbungen von Kognitionen (vgl. Krause 1995: 57). Uns interessieren hier insbesondere letztere: Bestimmte Wahrnehmungen sind angstbesetzt, andere füllen uns mit Lust; gewisse Vorstellungen lösen Wut aus, andere Scham. Dabei beeinflusst die affektive Einfärbung gesehener Gegenstände – und das ist unabhängig davon, ob diese Gegenstände realiter oder im Bild gesehen werden – deutlich die Wahrscheinlichkeit, dass auf diese Gegenstände auch reagiert wird (ebenso: dass man sich an sie erinnert). Auf Bildpräsentationen bezogen heißt dies, dass deren illokutionäre Funktion von der Stärke der affektiven Einfärbungen abhängen sollte.

3. Illokutionäre Rolle und Darstellungsstil

Betrachten wir in Abbildung 2 zunächst ein relativ einfaches Beispiel aus der Computervisualistik (vgl. Strothotte & Strothotte 1997: 273 f.). Die drei dort dargestellten Gebäudeansichten basieren auf einem einzigen geometrischen Modell (d. h. dem abstrakten, rechner-internen Stellvertreter eines abzubildenden Gegenstands in der Informatik). Aus ihm wurden mit unterschiedlichen Algorithmen die verschiedenen bildlichen Darstellungen gerendert. Unter „Rendering“ wird in der Computergrafik der algorithmische Prozess verstanden, mit dem aus dem geometrischen Modell eine konkrete Ansicht relativ zum Betrachterstandpunkt und zur Beleuchtungssituation erzeugt wird. Allgemein bekannt sind sicher die sogenannten „photorealistischen“ Rendering-Algorithmen, deren Resultate etwa Version b entsprechen.

Inzwischen ist es allerdings durch das so genannte non-photorealistic rendering möglich geworden, auch eine Fülle anderer Darstellungsstile recht einfach mit dem Computer generieren zu lassen. So können beispielsweise unterschiedliche Linienstile als Parameter in das Rendering eingehen (Abb. 2 a und c).


Abb. 2: Computergenerierte Gebäudeansichten mit unterschiedlichem Abstraktionsgrad und Linienstil, Schumann et al. 1996

Bei Abbildung 2 liefert die Variante c eine Gebäudeansicht, die wir spontan als Skizze interpretieren, einer Darstellungsart also, die wir gemeinhin mit einer eher flüchtigen Produktions- und Rezeptionssituation in Verbindung bringen; die Darstellung in a erinnert hingegen eher an eine technische Zeichnung. Wichtig ist hierbei zunächst einmal, dass wir den speziellen Linienstil nicht dem dargestellten Gebäude zuschreiben, sondern ihn als stilistische Besonderheit der Darstellung verstehen. Zum Verständnis des kommunikativen Bildgehalts ist diese Besonderheit des Darstellungsstils wesentlich. Die Verwendung des skizzenartigen Darstellungsstils intendiert nämlich eine Vermittlung von speziellen affektiven und damit motivationalen Aspekten: Während nämlich die Darstellungsspielarten a und b bei der Präsentation den Klienten eines Architekturbüros gegenüber als abgeschlossen und unabänderlich wirken, signalisiert die flüchtige Skizze die Vorläufigkeit des Entwurfs. Ein Architekt kann also durch geschickte Wahl des Darstellungsstils entweder seine Autorität über die Entwurfsentscheidungen herausstreichen. Oder aber er kann den designerischen Entwicklungsprozess als wesentlich offener erscheinen lassen und so versuchen, seine Klienten stärker darin einzubeziehen. Weil zur Vermittlung des Bildinhaltes in der Regel recht abstrakte Darstellungsformen hinreichend sind, kann der Darstellungsstil also genutzt werden, um die jeweiligen kommunikativen Absichten manifest zu machen. Folglich dient der Stil, terminologisch gesprochen, als illokutionärer Indikator (vgl. auch Sachs-Hombach & Schirra 2002).

Wird Bildkommunikation mit Hilfe einer Bestimmung der illokutionären Rollen handlungstheoretisch beschrieben, dann lassen sich drei grundsätzliche Komplexitätsgrade unterscheiden. Auf der elementarsten Ebene veranschaulicht ein Bild lediglich als wesentlich erachtete Begriffsmerkmale bzw. den mit der Verwendung des Begriffs notwendig verbundenen Verhaltenskontext. Eine solche Veranschaulichung ist etwa für Bildwörterbücher typisch oder – etwas komplexer – in den grafischen Darstellungen geometrischer Theoreme wichtig, wie sie sich in mathematischen Lehrbüchern finden. Bei diesen Darstellungen handelt es sich durchweg nicht um die Darstellung individueller, konkreter Gegenstände, sondern um die Darstellung von Gegenstandsklassen oder von abstrakten Gegenständen. Daher könnte die Grundfunktion der Veranschaulichung auch analog zur charakterisierenden Funktion von Prädikaten aufgefasst werden.

Auf einer komplexeren Ebene kann mit einem Bild auch zu verstehen gegeben werden, dass es sich bei der Veranschaulichung um einen ganz bestimmten Gegenstand handelt, auf den Bezug genommen und dem bestimmte Eigenschaften zugeschrieben werden sollen: dass bestimmte Bildelemente also topische Funktion haben. Obwohl ihre kausale Entstehungsgeschichte jeweils eine bestimmte Referenz nahe legen mag, ist dies keine spezifische Eigenschaft von Fotografien. Soll die Referenz eines Zeichens bildhaft sichergestellt werden, dann muss sie über den jeweiligen Bildinhalt – über das, was wir in ihnen sehen – zustande kommen. Es gibt unseres Erachtens daher im Bildbereich kein Äquivalent für Eigennamen im engeren Sinne. Die Veranschaulichung konkreter Gegenstände erfolgt immer im Sinne von Kennzeichnungen, indem begriffliche Charakterisierungen derart kombiniert werden, dass sie sich in einem bestimmten Kontext zur Charakterisierung individueller Dinge eignen.

Ein weiterer Komplexitätsgrad liegt schließlich vor, wenn wir mit bildhaften Darstellungen die verschiedenen illokutionären Funktionen ausüben. Mit dem Präsentieren eines Bildes lässt sich beispielsweise eine Behauptung oder eine Aufforderung verbinden oder auch eine Einstellung einem Sachverhalt gegenüber vermitteln. Mit Bildern können wir also unter anderem etwas behaupten oder vor etwas warnen. Ob etwa die Präsentation eines Bildes normativ aufzufassen ist ergibt sich dabei nicht aus dem Bild selbst, sondern immer erst aus dem kommunikativen Kontext. Ein und dasselbe Bild erhält daher in der Regel relativ zu dem jeweiligen Handlungszusammenhang eine unterschiedliche kommunikative Bedeutung. Diese verschiedenen Formen der Bildkommunikation zu erfassen ist eine der wesentlichen Aufgaben einer sprechakttheoretisch inspirierten Bildpragmatik, die es bisher erst in Ansätzen gibt.

Kommen wir aber zu unserer Abbildung 2 zurück, in der die Vorläufigkeit der Darstellung durch einen skizzenhaften Linienstil zum Ausdruck gebracht wird. Die nahe liegende theoretisch interessante, aber nur sehr schwierig zu beantwortende Frage lautet nun: Inwieweit ist die jeweilige Wahl der Darstellungsmittel eine rein konventionelle Festlegung? Oder gibt es doch syntaktische Eigenschaften eines Bildes, die bestimmte Lesarten auf Grund spezieller perzeptueller Kompetenzen zumindest begünstigen? Gibt es, anders gefragt, eine in der Bildlichkeit selbst begründete Basis, auf deren Grundlage wir die jeweilige illokutionäre Rolle eines Bildes bestimmen können bzw. der gemäß wir sie gestalten müssen, um angemessen verstanden zu werden? Eine Beantwortung dieser Frage ist natürlich besonders für diejenigen Bilder wichtig, die ohne sprachlichen Kommentar möglichst unmittelbar wirken sollen.

In Sachs-Hombach & Schirra 2002 hatten wir untersucht, inwieweit ein Unterschied im Darstellungsstil innerhalb eines Bildes die Zuordnung von prädikativen (rhematischen) und topischen (thematischen) Funktionen zu entsprechenden Bildelementen beeinflussen kann. Im Folgenden möchten wir nun behaupten und an einem Beispiel verdeutlichen, dass auch bildhafte illokutionäre Indikatoren durchaus perzeptuell verankert sein können. Zu betonen ist hierbei aber, dass die perzeptuelle Verankerung nicht zu einer „natürlichen“ Bedeutung führt, ebenso wenig, wie die Zuordnung zu referentiellem Grund und prädikativer Figur durch eine entsprechende Unterscheidung im Darstellungsstil innerhalb eines Bildes völlig determiniert sein kann. Bilder sind nicht nur, wie oben erwähnt, semantisch unbestimmt. Zudem ist der Wahrnehmungsprozess selbst teilweise kulturell geformt. Beispielsweise haben sich unsere Kompetenzen, Filme anzusehen, über die letzen hundert Jahre enorm verändert. Schließlich bilden auch die Wahrnehmungsinhalte in der Regel soziale Artefakte, die wir natürlich nur darum angemessen erkennen und beurteilen können, weil wir mit ihnen in den entsprechenden lebensweltlichen Verwendungskontexten bereits umgehen.

4. Naturalismus als illokutionärer Indikator

Als Beispiel haben wir die bekannte Kriegsfotografie Napalm Bomb Attack von Nick Ut gewählt (vgl. Abb. 3). Wir möchten nun weniger auf die ikonografischen und ikonologischen Aspekte eingehen (vgl. dazu Blum 2005), sondern diese Fotografie als ein offensichtliches Beispiel für die bildhafte Appellfunktion nutzen. Warum, lautet dann die Frage, wirkt diese Fotografie in so unmittelbarer Weise appellativ? 1972 veröffentlicht hatte sie nicht unerheblich zur Kritik am Vietnamkrieg und vielleicht sogar zur Beendigung dieses Krieges beigetragen. Es steht also außer Zweifel, dass diesem Bild eine appellative illokutionäre Funktion zugeschrieben wurde. Mit welchen Mitteln wurde dies erreicht? Unsere These lautet, dass der hierbei zum Ausdruck kommende Naturalismus ein wichtiges Stilmittel dafür abgibt. Das schließt weder aus, dass dieser Eindruck sehr bewusst hergestellt wurde, noch schließt es aus, dass seine Wirkung sich im historisch-kulturellen Wandel auch verlieren kann.


Abb. 3: Nick Ut: Napalm Bomb Attack, Vietnam 1972.

Naturalismus verstehen wir als einen Darstellungsstil, bei dem ein möglichst hohes Maß an visuellem Realismus angestrebt wird. Damit ist nicht gemeint, dass die Darstellung in einem erkenntnistheoretischen Sinne realistisch ist, denn auch ein fiktiver Gegenstand kann perzeptuell realistisch dargestellt werden. Naturalismus und erkenntnistheoretischer Realismus dürfen also nicht verwechselt werden. Das erste ist als Darstellungsstil eine graduell variable Eigenschaft: So ist ein Farbfoto hinsichtlich der Farbwerte naturalistischer als ein Schwarzweißfoto. Der zweite betrifft hingegen das Verhältnis von Darstellung und Wirklichkeit: eine Darstellung kann entsprechend als wirklichkeitsgetreu oder nicht wirklichkeitsgetreu bewertet werden.

Uns geht es im Folgenden lediglich um den Einfluß, den die Formen der medialen Vermittlung haben. Paradoxerweise können diese durch entsprechende Verdichtungsprozesse sogar einen intensiveren Realitätseindruck entstehen lassen, als dies die unmittelbare Wahrnehmung realer Gegenstände erlauben würde („Hypernaturalismus“): insofern nämlich der Unterschied von bildlicher Darstellung zur kognitiven Vorstellung infolge der medialen Aufbereitung geringer sein kann als bei dem realen Ereignis. Der Eindruck größerer Wirklichkeitsnähe etwa einer Karikatur entsteht dann dadurch, dass bei der Gestaltung der bildhaften Darstellung Prinzipien der kognitiven Repräsentation genutzt werden, so dass die Darstellung für den Rezipienten in einem höheren Maße kognitiv kompatibel ist.

4.1 Die kognitive Komponente des Appells

Um den strukturalen Aspekt bei unserem Beispiel verständlich zu machen, ist es hilfreich, den mit der Fotografie verbundenen Appell als praktischen Syllogismus zu formulieren. Der Gedanke ist hierbei, dass ein Appell wesentlich eine Handlungsaufforderung beinhaltet. Formal lässt sich das als Du solltest X tun! bzw. Ich fordere Dich auf, X zu tun zum Ausdruck bringen. Wir sehen im Folgenden davon ab, wie dieser Appell konkret aussieht, was also im Einzelnen getan werden soll. Er könnte verstanden werden als Aufforderung, sich kritisch über den Vietnamkrieg zu äußern, oder als Aufforderung, gegen den Vietnamkrieg zu demonstrieren, oder auch als Aufforderung, eine bestimmte Partei zu wählen. Wichtiger als der Inhalt des Appells ist uns die interne Begründung, mit der ein solcher Appell unterstützt wird, und die als die kognitive Kraft des Appells gelten kann. Diese Begründungsleistung sehen wir als den Gehalt des praktischen Syllogismus an.

Der Begriff des praktischen Syllogismus geht auf Aristoteles zurück. In der neueren Philosophie wird er in der Regel als Ausdruck einer Zweckrationalität gefasst. Als Prämissen dienen daher zum einen eine Handlungsabsicht und zum anderen die Überzeugung, dass das mit der Absicht verbundene Ziel über ein bestimmtes Mittel erreicht werden kann. Die Konklusion besteht dann darin, dieses Mittel auszuführen. Ist eine der Prämissen jedoch ein Gebot, dann beschreibt der praktische Syllogismus eine moralische Verpflichtung, wie sie uns unter anderem im Appell begegnet.

Bei unserem Beispiel kann als grundlegende Prämisse die dem kategorischen Imperativ angelehnte Formulierung „Sei gerecht!“ dienen, die wir auch so verstehen können: „Nimm Stellung gegen Unrecht!“. Dies wäre eine implizite Forderung, auf die bei der Verwendung des Bildes nicht ausdrücklich Bezug genommen werden muss, weil sie bei den intendierten Bildnutzern als allgemein anerkannt vorausgesetzt werden kann. Zudem benötigen wir eine auf den Krieg bezogene Prämisse. Diese müsste bestimmte Kriege als Unrecht ausweisen. Etwa in der folgenden Formulierung: „Ein Krieg, der Unbeteiligte, insbesondere Kinder nicht verschont, ist Unrecht.“ Schließlich muss es eine auf das Bild bezogene Prämisse geben, mit der eine konkrete Einschätzung gegeben wird, etwa: „Im Vietnamkrieg werden Kinder nicht verschont.“ Aus diesen drei Prämissen lässt sich nun der Appellcharakter des Bildes erfassen:

(P1) Sei gerecht: Nimm Stellung gegen Unrecht!
(P2) Ein Krieg, der Unbeteiligte, insbesondere Kinder nicht verschont, ist Unrecht.
(P3) Im Vietnamkrieg werden Kinder nicht verschont.
_____________________________________
(K) Nimm Stellung gegen den Vietnam-Krieg!

Bei den ersten beiden Prämissen handelt es sich um moralische Gebote. Wir gehen davon aus, dass der Fotograf diese Gebote kennt. Zudem kann er sich darauf verlassen, dass sie allgemein anerkannt sind. Hinsichtlich (P2) ließen sich zwar komplizierte Diskussionen darüber anschließen, ob es nicht einen gerechten Krieg geben kann. Und dies wird ja, wie wir aus der jüngsten Zeitgeschichte in mehr als einem Fall wissen, auch ausgiebig zur Legitimation eines Kriege führenden Landes gemacht. Wir können hier auf diese Diskussion aber verzichten, weil wir davon ausgehen, dass die Fotografie ihre Appellfunktion in dem Maße ausübt, in dem (P2) von den Bildnutzern anerkannt wird. Wir konzentrieren uns also auf den Fall des gelungenen Appells. Immerhin zeigt der Einwand, dass eine Appellfunktion vom Kontext und insbesondere von den bereits vorher bestehenden Überzeugungen abhängt.

Für unseren Zusammenhang ist nun insbesondere (P3) wichtig. Während die ersten beiden Prämissen vom Bildverwender vorausgesetzt werden können, muss die dritte Prämisse „Im Vietnamkrieg werden Kinder nicht verschont“ vor allem durch das Bild vermittelt und plausibel gemacht werden. Das Bild ist eine unter üblichen Sichtbedingungen – Augenhöhe, passable Lichtverhältnisse, gute Schärfentiefe – geschossene Schwarzweißfotografie mit einer Horizontlinie im oberen Drittel der Bildfläche. Es handelt sich zudem um eine hoch-naturalistische Darstellung; lediglich das Fehlen von Farbe schränkt den Grad an Naturalismus etwas ein. In der Fotografie zeigt sich uns – zwischen anderen Kindern mit ähnlicher Mimik und Bewegung – insbesondere ein mageres, nacktes, vor Entsetzen oder Schmerz schreiendes Mädchen in der Bildmitte, das „nicht verschont“ wurde, da es mit allen Kräften einer tödlichen Gefahr zu entkommen versucht: Der Himmel im Hintergrund wird durch dunkle Rauchwolken verdeckt, deren Quelle im Fluchtpunkt der Straße zu liegen scheint, auf der die Kinder davonrennen. Entsprechend der These von der Wahrnehmungsnähe als Charakteristikum der Bilder lassen sich diese Bedeutungskomponenten unter Nutzung von in Wesentlichen denselben Wahrnehmungskompetenzen gewinnen, die wir auch für das Sehen der Szene selbst einsetzen würden, wären wir denn dort gewesen.

Für die weiteren strukturalen Aspekte benötigt das Bild Unterstützung durch den Kontext. Beispielsweise ist es sehr schwierig, nur mittels der Fotografie den Bezug auf Vietnam herzustellen. Klar ist, dass es sich um kriegerische Aktivitäten (bewaffnete Uniformierte im Hintergrund, Explosionswolke) in einem vermutlich asiatischen Land handelt. Aber könnte nicht auch ein Terroranschlag in Indonesien oder eine Brandkatastrophe in den Philippinen dargestellt sein? Um dies auszuschließen werden Fotografien im medialen Kontext in der Regel mit Bildunterschriften versehen, die als indexikalische Verankerung dienen. Dass die Gefahr, vor der die Kinder fliehen, in brennendem Napalm besteht, ist eine Information, die wir dem Bildtitel und wohl auch den damaligen Nachrichtensendungen entnehmen konnten. Außerdem kann der Fotograf den zeitgenössischen Informationskontext voraussetzen. Als die Fotografie veröffentlicht worden ist, war der Vietnamkrieg ein in den Medien ausführlich diskutiertes Ereignis. Allein diese Voraussetzung zeigt, dass die appellative Bildfunktion mit der geschichtlichen Entfernung unsicherer wird. Trotzdem wird jemand, der die Fotografie von Ut ohne die historischen Kenntnisse betrachtet, vermutlich noch emotional angesprochen werden, ohne aber doch den konkreten Anlass sowie den konkreten Appell zu verstehen.

Ein weiterer kognitiver Aspekt, der Kontextinformationen erfordert, liegt im Glauben an den indexikalischen Charakter von Pressefotos. Auch dies ist keineswegs selbstverständlich und wird im Zeitalter der digitalen Fotografie sogar zunehmend fragwürdig. Damit der dargestellte Syllogismus funktioniert, muss der Bildnutzer glauben, dass das Dargestellte tatsächlich stattgefunden hat, dass also der Bildzeichenakt authentisch ist. Die Fotografie an sich kann das in der Tat nicht sicherstellen. Nur unter der zusätzlichen Annahme, dass der kausale Herstellungsprozess der Fotografie unter bestimmten Bedingungen des Gelingens Realismus verbürgt und zudem die Institution der seriösen Presse richtig funktioniert, d. h. die Authentizität der durch sie vermittelten Zeichenakte garantiert, kann daher der Bildnutzer Prämisse (P3) in den Syllogismus einbeziehen (vgl. auch Schirra 2005: 76ff &179ff). Allerdings kann gerade der relativ hohe Grad an Naturalismus zumindest auch als ein bild-rhetorischer Hinweis darauf verstanden werden, dass diese Darstellung als eine authentische Darstellung zu interpretieren sei.

Prinzipiell lassen sich trotz aller Einschränkungen neben der Schlußfolgerung (P1, P2, P3) zu (K) aus kontextueller und bildkommunizierter Meinung gerade wegen der Wahrnehmungsnähe des Bildes noch sehr viele weitere struktural ableiten.Denn bei der Verwendung von Bildern muss man prinzipiell mit einer gewissen Offenheit ihrer Interpretation rechnen. Dass der hier vorgestellte Syllogismus als strukturale Basis der illokutionären Rolle unseres Beispielbildes tatsächlich verwendet wird, dass man sich ihm sozusagen kaum verweigern kann, das erfordert daher noch einen zusätzlichen Schritt, der allerdings die motivationale Komponente betreffen muss.

4.2 Die affektive Komponente des Appells

Der Fotograf zeigt uns, wie gesagt, im Bildmittelpunkt ein mageres, nacktes, vor Entsetzen oder Schmerz schreiendes kleines Kind, das mit all seinen Kräften einer im Hintergrund drohenden Gefahr zu entkommen versucht (Abb. 4). Es ist dieses vor Grauen verzerrte Gesicht des schutzlosen Mädchens im Zentrum des Bildes, dem wir uns kaum entziehen können. Hört man nicht fast ihre Schreie, ebenso wie das Schluchzen des gleichfalls verzweifelt weinenden, etwas älteren Jungen am linken Bildrand? Wie genau hängen diese Reaktionen mit der illokutionären Funktion des Bildes zusammen?

Die spontane Wirkung des Bildes ist eng damit verbunden, dass Mimik eine ausgesprochen wichtige Komponente des Affektausdrucks bei Menschen ist. Wenn wir unsere Mimik nicht – mit verhältnismäßig großer Anstrengung – bewusst kontrollieren, spiegeln sich unsere Affekte spontan im Gesicht. Dabei kommt den affektiven Ausdrucksbewegungen bereits bei Tieren auch eine kommunikative Funktion zu: Eine starke affektive Belegung eines gesehenen Fressfeindes mit Angst sorgt sicherlich zunächst für eine effektive Verhaltenssteuerung für das Individuum selbst. Wird darüber hinaus eine mit dem Affekt verbundene Ausdruckbewegung von Artgenossen entsprechend gedeutet und der Affekt auf sie übertragen, so kann das Wahrnehmen des Fressfeindes durch das eine Individuum direkt auch den anwesenden Artgenossen zugute kommen.


Abb. 4: Ausschnitt von Abb. 3 .....................................Abb. 5: E. Munch: Der Schrei. Lithographie, 1895

N. Bischof weist auf die Wirksamkeit dieser Form der Affektübertragung für den Menschen am Beispiel einer Lithographie von E. Munch hin (Bischof 1998: 133 f.; vgl. Abb. 5): „[Munch] konfrontiert den Betrachter mit der hilflosen Angst der kauernden Person, aber er tut dies auf eine Weise, die es dem, der sich auf das Bild einläßt, nicht erlaubt, Distanz zu wahren. Das Grauen bleibt nicht innerhalb der Grenzen des Gegenübers, ist über diese hinausgequollen, … . Die Angst wird hier zum Medium, sie wird allgegenwärtig, saugt den Betrachter ein und löst die Membran auf, hinter der sich seine eigene Seele schützen will. Man bezeichnet diesen Ansteckungseffekt als Stimmungsübertragung.“ In der Tat fallen mehrere formal-ästhetische Ähnlichkeiten als auch inhaltliche Unterschiede zwischen Munchs Lithographie und dem Zentralteil der Fotografie von Ut in der direkten Gegenüberstellung in Abb. 4 und 5 ins Auge, sollen hier aber nicht weiter thematisiert sein.

Interessant ist hier für uns allerdings, dass auch von den in der Fotografie abgebildeten Gesichtern eine starke Stimmungsübertragung ausgeht. Dass die Gefahr in brennendem Napalm besteht ist zwar eine Information, die wir dem Bildtitel entnehmen müssen. Aber auch ohne diese Kenntnis empfinden wir unmittelbar den Schrecken und die Bedrohung, die von den dunklen Rauchwirbeln im Hintergrund ausgehen. Wir verstehen sie als Gefahr vor allem deshalb unmittelbar, weil wir eine hohe Sensibilität bei der Interpretation von Gesichtsausdrücken besitzen und in der Lage sind, Gesichtszüge als direkten Ausdruck von psychischen Befindlichkeiten zu verstehen. Auch wenn wir diesen konkreten Gesichtsausdruck in unserem Alltag noch nicht erlebt haben sollten, so versetzt das Sehen dieser Gesichter – das Betrachten dieses Bildes – uns spontan in ihn hinein. Der Affekt bleibt zwar in der Regel rational kontrolliert – einem Bild gegenüber verhalten wir uns normalerweise mit mehr rationaler Distanz, als wir uns der dargestellten Szene direkt gegenüber verhalten würden. Aber als entsprechende Emotionen bleibt der übertragene Affekt durchaus nachempfindbar und wirksam.

Diese Stimmungsübertragung ist die wesentliche affektive Triebkraft, die wir – unter der kognitiven Prämisse, dass den ungeschützten Kindern in der Abbildung großes Leid angetan wird – dann als motivationale Komponente des Appells erleben, durch den der hier vorliegenden strukturalen Basis der entscheidende Impuls zur Folgerung gegeben wird. Es ist gerade die Wahrnehmungsnähe, die es auch bei Bildern möglich macht, dass sowohl das spontane Auslösen affektiver Reaktionen auf abgebildete Gegenstände oder Situationen erfolgt, wie auch die ebenfalls spontane Affektübertragung von bloß abgebildeten Personen auf den Betrachter.

Es ist darüber hinaus der recht hohe Grad an Naturalismus, der in Verbindung mit der unterstellten Objektivität der Fotografie eine starke affektive Aufladung im Beispiel auslöst, und der so zur Realisierung der oben angegebenen, struktural nur möglichen Schlußfolgerung (unter wahrscheinlich sehr vielen weiteren Möglichen) führt und damit letztlich dem Bild die illokutionäre Funktion des entsprechenden Appells liefert. Naturalismus ist wohl keine notwendige Bedingung des Appellcharakters. Er stellt zunächst nur eine Möglichkeit dar, den Appellcharakter zu markieren. Er wirkt, weil dieser Darstellungsstil die kognitive und affektive Komponente besonders gut miteinander integriert. Auf der strukturalen Ebene deutet er (trotz der oben erwogenen Einschränkungen) in hervorgehobener Weise auch darauf hin, dass das Gezeigte wirklich passiert ist. Die affektive Komponente für sich lässt sich durchaus auch anders realisieren. Die in der Abstraktion verdichtete Darstellungsweise kann dabei sogar den Effekt verstärken (siehe das Beispiel von Munch, dessen expressionistischer Darstellungsstil sicher nicht als naturalistisch gelten kann). Allerdings geht die Steigerung der spontan-affektiven Reaktion bei einer solchen „hypernaturalistischen“ Darstellung in der Regel auf Kosten der kognitiven Komponente: Der authentische Bezug auf die konkreten Ursachen des Leids wird deutlich abgeschwächt. Im Beispiel „Der Schrei“ bleibt der Grund für dieses ausufernde Leid entsprechend auch ganz unbestimmt, die Affektübertragung wird zur dominierenden Wirkung. Eine Appellfunktion darüber hinaus wird nicht gestützt. In der weitgehend naturalistischen Darstellung der Schwarzweißfotografie ergänzen sich hingegen der Authentizitätsanspruch des strukturalen Aspekts und die unmittelbare Wirkung der Stimmungsübertragung gerade wechselseitig und führen auf diese Weise gemeinsam zur untersuchten illokutionären Funktion.

5. Fazit

Die kommunikative Bedeutung eines Bildes in einer Präsentationshandlung wird nicht nur durch den Bildinhalt sondern auch durch seine illokutionäre Rolle bestimmt. Diese Rolle sollte dem Betrachter angezeigt werden. Im rhetorischen Kontext können hierbei stilistische Eigenheiten als Indikatoren dienen. Der Erfolg und die Effizienz bild-rhetorischer Verfahren verdanken sich dabei der zumindest partiellen perzeptuellen Verankerung der als illokutionäre Indikatoren dienenden stilistischen Marker sowie der spontanen affektiven Reaktionen, die die Wahrnehmungsnähe des Bildes auslöst. Die spezifische Wirkung des verwendeten Darstellungsstils besteht vor allem darin, die strukturale und die motivationale Wirkkomponente auf besondere Weise miteinander in Verbindung zu setzen.

Die hier wiedergegebenen Überlegungen sind tatsächlich nur als eine erste Annäherung an das Thema Darstellungsstil und bild-rhetorische Funktionen zu verstehen. So bleiben hier etwa komplexere Formen der emotionalen Wirkung von Bildern neben den verhältnismäßig einfachen affektiven Reaktionen unberücksichtigt. Auch die Rolle, die kunsthistorische Befunde, etwa die dem Ut-Bild eingeschriebene auf europäische Darstellungstraditionen verweisende Komposition (Mädchen und Jesus/Pietà), in bild-rhetorischer Hinsicht zu spielen vermögen, und deren Wechselwirkungen mit dem Darstellungsstil wurden nicht betrachtet.

Schließlich muss eine ausführlichere Untersuchung der Rolle, die die möglichen graduellen Abstufungen von Naturalismus – zwischen hypernaturalistischen Verdichtungen auf der einen, und den Naturalismus zunehmend abschwächenden Abstraktionen auf der anderen Seite – auf die illokutionäre Funktion einer Bildpräsentation haben, weiteren Untersuchungen vorbehalten bleiben.

Literatur

Bischof, Norbert (1998): Das Kraftfeld der Mythen. Piper: München.

Blum, Gerd (2005): Die Komposition des Schreckens. Hynh Cong „Nick“ Uts Fotografie „Terror of War“ und der interkulturelle Dialog. In: Freundschaftsspiel. Zeitgenössische Kunst im interkulturellen Dialog, hg von der Kunstakademie Münster, Münster 2005, 184-203.

Dornes, Martin (1995): Wahrnehmen, Fühlen, Phantasieren. In: Koch, Gertrud (1995) (Hg.): Auge und Affekt. Wahrnehmung und Interaktion. Fischer: Frankfurt/M., S. 15-38.

Harms, Wolfgang (1990) (Hg.): Text und Bild, Bild und Text (DFG-Symposium 1988). Stuttgart: Metzler.

Heitmann, Annegret & Schiedermair, Joachim (2000) (Hg.): Zwischen Text und Bild. Zur Funktionsbestimmung von Bildern in Texten und Kontexten. Freiburg im Breisgau: Rombach.

Hoppe Axel & Lüdicke K. (1998): Measuring and Highlighting in Graphics. In: Strothotte et al. (1998), Computer Visualization – Graphics, Abstraction, and Interactivity. Springer, Heidelberg, Chapter 7, 121-136.

Kjørup, Søren (1978): Pictorial Speech Acts. In: Erkenntnis 12, 55-71.

Knape, Joachim (2000): Was ist Rhetorik? Stuttgart: Reclam.

Knape, Joachim (2005): Rhetorik. In: Sachs-Hombach, Klaus (Hg.): Bildwissenschaft. Disziplinen, Themen und Methoden. Frankfurt am Main: Suhrkamp, 134, 148.

Krause, Rainer (1995): Gesicht – Affekte – Wahrnehmung und Interaktion. In: Koch, Gertrud (1995) (Hg.): Auge und Affekt. Wahrnehmung und Interaktion. Fischer: Frankfurt/M., S. 57-72.

Sachs-Hombach, Klaus (2003): Das Bild als kommunikatives Medium. Elemente einer allgemeinen Bildwissenschaft. Köln: Herbert von Halem Verlag.

Sachs-Hombach, Klaus & Schirra, Jörg R. J. (2002): Selecting Styles for Tele-Rendering. Toward a Rhetoric in Computational Visualistics. In: 2nd International Symposium on Smart Graphics, Hawthorne (NY), USA, June 11-13, 2002, 102-106.

Schirra, Jörg R.J. (2005): The Foundation of Computational Visualistics. (Reihe Bildwissenschaft Band 14). Wiesbaden: DUV.

Schumann, J., Strothotte, T., Raab, A., Laser, S. (1996): Assessing the Effect of Non-Photorealistic Images in Computer-Aided Design“. In: Proc. SIGCHI '96: Human Factors in Computing Systems, Vancouver, 35-41.

Strothotte, Christine & Strothotte, Thomas (1997): Seeing Between the Pixels: Pictures in Interactive Systems. Berlin / Heidelberg / New York: Springer.

Tinbergen, Nikolaas (1951). The Study of Instinct. Oxford: Clarendon Press (1989 von Oxford University Press neu herausgegeben).