Relazioni tra musica e immagine nella cultura audiovisiva

 

Parliamo di quel tipo di rapporti, fra musica e immagine, che specialmente le società ricche hanno sviluppato in questo ultimo secolo: le culture filmiche e televisive, oppure, per dirlo con un solo termine, le culture audiovisive.


La presentazione dei seguenti criteri di valutazione ha per noi uno scopo didattico primario: vogliamo offrire agli allievi della nostra scuola di musica un bagaglio utile per capire le possibili relazioni fra musica e immagine e, soprattutto, per giocare, creare, produrre eventi audiovisivi sulla base di scelte motivate e non casuali fra il linguaggio musicale e quello visivo.


È con questo scopo che ora cercheremo di presentare quei parametri che, sulla base di una nostra attenta osservazione, abbiamo potuto evidenziare all'interno delle tante relazioni fra musica e immagine:

  • Globalità affettivo-emotiva: tanto la musica quanto l'immagine sono "portatrici" di stati emotivi come amore, paura, odio, tenerezza, serenità, ecc. Questi si presentano alla nostra primaria percezione globale come vere e proprie "scene" musicali (musica della passione, della serenità, della comicità, ecc.) o visive (scena d'amore, di odio, di terrore, ecc.). In un'ottica di convergenza fra i linguaggi, è logica molto conseguente far corrispondere una musica di felicità ad una scena visiva dal clima emotivamente identico o quantomeno simile; e gli spettatori di un film, durante una tale visione rimangono sicuri e comodamente seduti sulla poltrona proprio perché ciò che stanno vedendo e ascoltando è ciò che si aspettano di vedere e di ascoltare. Invece, in un'ottica di divergenza, è altrettanto logico combinare una musica di terrore con una scena carica di allegria; e sarà proprio questa combinazione che metterà in crisi il sistema di attese degli spettatori al punto da far vivere loro quella condizione psicoaffettiva di instabilità che si ritroveranno a vivere tanto nei film suspense di Alfred Hitchcock quanto in quelli thriller di Dario Argento.
  • Strutture narrativo-formali: sia un brano di musica che una scena tratta da un film, mostrano alla nostra percezione una forma, una struttura narrativa, una evoluzione all'interno di uno spazio temporale auditivo o visivo. Questo spazio di suoni o di immagini può essere organizzato nelle forme più diverse (es. contiguità o discontinuità degli eventi, sviluppo degli elementi in crescendo o in diminuendo, amplificazioni o diminuzioni degli spazi o ambiti visivo-sonori, ecc.) e di conseguenza, ognuna di queste forme non solo veicolerà contenuti diversi ma coinvolgerà in modo altrettanto diverso lo spettatore. La classica scena del bacio che alle soglie degli anni 1950 iniziò a diffondersi nei film americani, è un campione molto rappresentativo di ciò che andiamo dicendo: graduale avvicinamento dei corpi sino al contatto, graduale crescita del senso emotivo delle parole, graduale aumento dello stato emozionale dei personaggi, ecc. il tutto corrispondente ad una graduale crescita dell'intensità musicale, delle strutture ritmiche e melodiche che si coloreranno in modo altrettanto passionale grazie all'uso di quel tipico sound languido e mieloso ottenuto dal suono degli strumenti ad arco. Per chi avesse voluto rendere divergente la scena del bacio, sarebbe bastato "rompere" questa similarità strutturale sovrapponendo alle stesse immagini una musica subito certa, costante e decisa, eroica e senza alcuna evoluzione in crescendo, come ad esempio la marcia Trionfale tratta dall'Aida di Verdi; e quasi sicuramente molti spettatori sarebbero scoppiati dalle risate poiché in questa palese divergenza di percorsi fra immagine e musica può nascondersi molta comicità.
  • Sincronizzazione ritmico-motoria: l'immagine e la musica hanno in comune il movimento, l'andamento ritmico. Nell'immagine, i personaggi, gli animali e le cose, si spostano a determinate velocità e altrettanto determinate scansioni temporali; nella musica gli impulsi sonori fanno la stessa cosa. Mettendo in relazione questo comune parametro, la cultura videomusicale acquisisce quel livello espressivo che possiamo appunto chiamare sincronizzazione ritmico-motoria. Esempi significativi di questo si possono trovare nelle Comiche del primo Novecento (Sennet, Ridolini, Chaplin, Keaton e altri), nei Cartoni animati e nel Film sperimentale d'animazione (McLaren, Bozzetto, Luzzati, Zac e altri).
    Questo rapporto può indurre le persone verso due principali interpretazioni: una di tipo caricaturale, l'altra verso il senso della evidenziatura valorizzante. La prima si attua quando il movimento visivo, nel sovrapporsi al suono, diventa iperenergetico, innaturale, irreale, assumendo i valori del comico, del ridicolo, del fantastico così attraenti per i bambini e forse anche per i grandi (Walt Disney ha insegnato e insegna ancora); la seconda si realizza quando un gesto viene evidenziato da un suono, caricandosi di grande significato (es. in 2001 Odissea nello Spazio il regista Kubrick riesce ha far capire, sincronizzando un possente accordo musicale tratto da Così parlò Zarathustra con un gesto del braccio di una scimmia che batte in terra un osso-mandibola, che quello è il momento in cui il primate inizia ad avvicinarsi alla conoscenza: quel colpo di mandibola non sposta solo oggetti ma può diventare un'arma utilizzabile contro gli altri animali). Quest'ultima tipologia di sincronizzazione fra musica e immagine, non è poi così diversa da ciò che gli esseri umani fanno quando parlano in modo molto "accalorato" con gli altri.
    In termini mentali e fisici, le esperienze di sincronizzazione che l'uomo realizza fra i vari linguaggi (sonoro, visivo, motorio, verbale) sembrano manifestare l'antico bisogno di omologia ritmica, che tutte le culture del mondo hanno sempre cercato di realizzare anche in sintonia e sincronia con gli eventi naturali. Vivere fatti diversi sulla base di uno stesso andamento ritmico è una delle tante tattiche di condivisione che porta gli uomini verso l'acquisizione di una maggiore sicurezza nello stare con altri esseri umani e con le cose di questo mondo.
  • Rumoristico-ambientale: nel guardare un panorama, ci capita molto spesso di non notare che abbiamo cose anche da ascoltare: rumori, voci, fruscii, versi d'animali, ecc. Ogni immagine ha quindi una sua "rumorosità" che nel gioco dei rapporti con la musica può essere presa in considerazione. Basterebbe allora "sonorizzare" ciò che vediamo con ciò che sentiamo per realizzare questo "naturale" legame. Oppure, come si faceva tanto tempo fa, utilizzare la figura professionale dell'artigiano rumorista che con mezzi del tutto improvvisati ricreava i suoni e i rumori dell'ambiente. E, anche se con tecnologie molto più sofisticate, questo è quello che oggi si può fare con un tecnico del suono al computer.
    Il significato di questo rapporto è semplice: offrire alla visione e all'ascolto umano quello che percepirebbe l'uomo se si trovasse in un ambiente simile. In breve si tratta solo di ricreare ciò che si vede e si sente nel modo più veritiero possibile. E tutto questo è molto convergente, molto lineare sul piano logico e percettivo. Ma ci sono almeno due casi che rendono molto più interessante questo rapporto ai quali spesso non facciamo tanto caso perché presi dalla visione della scena o dalle parole dei personaggi o per la nostra scarsa attenzione. Il primo è quello che ci permette di attribuire ai rumori un significato che va oltre alla loro normale entità auditiva: è il caso del rumore dei passi che nei thriller fa presagire incombenza di morte. Il secondo è ancora più innaturale, perché crea una scena irreale vissuta ormai dagli spettatori come normale: è il caso di una coppia di amanti che si bacia al centro di una metropoli in pieno traffico dove la colonna sonora, invece di riprodurre il più che contestualizzato rumore delle auto, ci fa ascoltare una appassionata melodia orchestrale che ci riporta verso gli stati emotivi dei personaggi in maniera del tutto artificiosa. Ormai, tanto nei prodotti filmici quanto in quelli televisivi, sembra essere cosa più che normale mettere la musica al posto del rumore circostante, anche perché questa tattica è molto più potente di una "normale" sonorizzazione ambientale: può più velocemente e con più decisione provocare e dirigere il coinvolgimento e lo stato emotivo degli spettatori. Al contrario, quando una immagine filmica si ritrova sonorizzata con gli elementi sonori ambientali o naturali, ci si sente invitati a rientrare nella realtà, con tutto il coinvolgimento dei nostri sensi sia in modo positivo (immersioni sonore naturali) che negativo (aggressioni dis-ecologiche).
  • Vettorialità: l'immagine può mettere in evidenza livelli spaziali in grado di descriverci veri e propri movimenti o direzioni: salite, discese, linee, curve, piroette, salti, ecc. che la musica può benissimo descrivere nei suoi movimenti ritmico-melodici.
    I tanti cartoni animati fanno molto uso di questa dimensione videosonora vettoriale ad esempio nelle cadute o scivolate a terra molti personaggi si ritrovano accompagnati dal suono dell'ottavino o da quello del trombone a coulisse poiché questi, meglio di altri strumenti, possono creare un effetto di caduta sonora caricaturale. E così allo stesso modo ragionano i movimenti rotatori delle astronavi e dei pianeti accompagnati dal rotatorio valzer Sul bel Danubio blu nella scena del viaggio verso Giove tratta dal citatissimo film di S. Kubrick 2001 Odissea nello spazio. In questo senso sembra aver ragionato anche il noto brano di Rimskij-Korsakov Il volo del calabrone che ci propone, con il suo gioco melodico, un vero e proprio filmato sugli andamenti di velocità e di direzione di questo animale: ecco perché è molto facile trovare questo motivo o motivi simili in cartoni animati che vogliono descrivere il volo di questo o di altri insetti simili.
  • Energia: il campo visivo può offrire momenti, immagini, situazioni che richiamano tanto il senso della forza, quanto quello della massa o consistenza energetica: tante persone che marciano con forza e decisione, una piuma che cade leggermente a terra, ecc. Allo stesso modo la musica può essere in grado di mostrare la sua pesantezza o leggerezza, la sua forza o debolezza, ecc. nel ricco gioco dei crescendo o dei diminuendo, dei pianissimo o dei fortissimo. La relazione tra scene forti o deboli (per energia ed emotività) e musiche possenti o esili, è comune in tutti i generi di film. Ma forse l'esempio più palese e piacevole fu quando nella televisione italiana, ai tempi di Carosello, si riuscì a rendere famoso un olio da cucina che si chiamava Sasso grazie alla leggerezza delle immagini a rallenty e all'altrettanto leggero Mattino tratto dal Peer Gynt di E. Grieg. Questo senso energetico che, come abbiamo visto, si tramuta anche in senso fisico corporeo del peso, lo ritroviamo, unito ad altri parametri, sempre nella stessa scena del viaggio verso Giove nel film 2001 Odissea nello spazio: il valzer, che accompagna questo volo astronautico, ha la capacità di dare al corpo dello spettatore la stessa sensazione fisica di leggerezza che può provare quando balla, poiché questa danza, tende a sollevare il corpo facendo sfogare tutto il suo peso in forza centrifuga (chi balla il valzer non sente cadere il peso del corpo sulle gambe ma lo sente sfuggire verso l'esterno dalle braccia, dal busto, dal capo, grazie al veloce e costante moto rotatorio). Questa sensazione fisica di leggerezza ben si addice ai movimenti di un corpo che nello spazio si muove in assenza di gravità, senza cioè vivere la percezione del proprio peso, come appunto mostrano le immagini in questa scena del film. Questo aspetto energetico, nelle culture audiovisive, sta acquisendo sempre più valore, anche perché è un altro grande mezzo per scuotere attenzione e provocare movimenti emotivi nello spettatore. Oggi, specialmente nei nuovi film animati della Disney ( Re Leone, Bianca e Bernie, Tarzan, ecc.), la musica e l'immagine si giocano questo spazio energetico in modo molto discontinuo, cioè senza preparazione, come se appunto il peso audiovisivo (fortissimo o pianissimo) cadesse di colpo addosso sulla fisicità dei piccoli spettatori. Questo moto disatteso delle energie audiovisive, sembra funzionare nello spettatore, adulto o bambino che sia, come una corda elastica in grado di tirarlo o di allontanarlo in modo molto repentino dagli eventi. E' anche con questo ricco e veloce gioco di attacchi e di distacchi energetici auditivi e visivi che si arricchisce sempre più la tattica del coinvolgimento e del trattamento emotivo nei confronti dello spettatore.
  • Storicità: tanto la musica quanto l'immagine possono avere una collocazione storica. Tutti gli spettatori che nel 1968 videro per la prima volta 2001 Odissea nello spazio percepirono un certo contrasto storico nel sentire un "vecchio" valzer di Strauss su delle immagini "futuristiche" per quel tempo. Ma se in questo film la scena poteva risultare impegnata e autoriflessiva, in altri casi il contrasto storico fra questi due linguaggi è in grado di creare veri e propri momenti di ilarità, come ben sanno i registi comici come Mel Brooks. Questa divergenza storica soddisfatta, come abbiamo già visto, da altri parametri, non fu affatto percepita quando nel 1975 gli spettatori andarono a vedere, sempre del regista Kubrick, Barry Lindon, un film che proponeva musiche molto in sintonia con il clima storico dei primi anni del 1800. Un altro grande esempio di musica e immagine abbinate sul piano storico ci viene dal noto film Il grande Gatsby che ci propone musiche tipiche del proibizionismo americano del primo 1900. Quindi, mettere in accordo la storicità delle immagini con quella della musica è un comportamento di convergenza molto diffuso nei film, nei telefilm o negli sceneggiati a forte caratterizzazione storica. Tutto ciò non si riferisce solo a quei prodotti audiovisivi che ci propongono avvenimenti del passato, ma anche a quelli che hanno una forte contestualizzazione nel futuro, come ad esempio i tanti nuovi film di avventure fantascientifiche che sfruttano molto spesso basi musicali con sonorità elettronico-spaziali che la nostra mente colloca giustamente verso il futuro. Unire ciò che si vede e ciò che si sente sulla base del parametro storico è come vestirsi alla moda: ci si sente in sintonia con il tempo storico che viviamo.
  • Geograficità: la musica e l'immagine non solo possono avere in comune un tempo storico, ma anche un luogo geografico. Questo accordare immagini e suoni sulla base del parametro geografico è molto comune nei documentari televisivi, in certi film western o d'avventura. Per esempio, nella fortunata e famosa serie dei film sull'agente segreto James Bond, interpretato dall'attore Sean Connery, capitava spesso di comprendere immediatamente di essere stati "trasportati" da una nazione ad un'altra, grazie a un semplice accenno musicale e visivo tipico dei luoghi lasciati o raggiunti. E con lo stesso principio la multinazionale della bevanda scura e non alcolica più famosa del mondo, propose anni fa una pubblicità televisiva dove l'ascolto del tema musicale pubblicitario arrangiato in tanti stili geografici, unito alla visione di immagini e personaggi corrispondenti a tali luoghi, riuscì a trasmettere il messaggio: "la nostra bibita è bevuta in tutto il mondo".
  • Contenuto: un prodotto per immagini può avere l'intenzione di trasmettere contenuti piuttosto che storie e racconti. Prendiamo ad esempio il programma televisivo Quark che mostra subito la sua finalità di divulgazione scientifica. Ora, per riuscire a diffondere verso il vasto pubblico un tale sapere, quale musica si poteva mai scegliere come sigla per rendere il senso della divulgazione da un parte e del carattere scientifico dall'altra? Si trattava di trovare un brano che potesse comprendere sia le caratteristiche di popolarità (quindi comprensibile, appropriabile, orecchiabile), sia quelle di impegno culturale (quindi ragionato, non istintivo). Queste due direzioni di contenuto, se vogliamo, sono in opposizione tra loro poiché il concetto di divulgazione non va linearmente d'accordo con quello di scienza, dal momento che questo ultimo ci rimanda ad un sapere che è tipicamente rivolto agli addetti, quindi a poche persone. La scelta dell'Aria sulla quarta corda di J.S.Bach come sigla musicale, non poteva essere più idonea: questo brano presenta infatti da una parte un tema musicale abbastanza orecchiabile, cantabile, appropriabile (quindi divulgabile) e, dall'altra, un modo di condurre le varie parti musicali abbastanza impegnato, colto, logico e studiato (quindi scientifico).
    Moltissimi film o programmi televisivi, seri o comici che siano, nella scelta di un tema conduttore o di una sigla musicale, possono quindi fare riferimento a musiche che manifestano contenuti simili a quelli espressi dalle loro immagini.
  • Dissolvenza: fuori dal tempo e dallo spazio: la musica e l'immagine come linguaggi sociali sono il risultato di forme strutturate secondo modelli più o meno costituiti. Ora, quando questi linguaggi si propongono in veste informale, non ben definita, i soggetti percettori iniziano a vivere stati di non determinazione, non nitidi, non molto riconoscibili. Ed è sulla base di questo principio che la percezione umana inizia a perdere la sensazione del tempo e dello spazio, come capita appunto durante la visione di quelle scene ormai "classiche" in cui, con il contributo di interventi musicali e di immagini in dissolvenza, si ha la sensazione di star vivendo un momento fuori dal tempo e dallo spazio. Un caso tipico di quanto andiamo dicendo si trova in quelle scene in cui assistiamo al passaggio dallo stato di veglia a quello del sonno-sogno (o del ricordo) di un determinato personaggio che ritroviamo in molti film o sceneggiati televisivi.
  • L'orecchio e l'occhio verso altri sensi: la percezione audiovisiva è quasi sempre da intendersi come percezione sinestesica, un "sentire" con tutti i sensi. In certi casi può capitare però che si voglia esaltare un senso, o più di uno, su tutti gli altri. La musica con i suoi ricchi e diversissimi sound può essere già da sola una grande esperienza sinestesica; se poi trova anche il contributo dell'immagine che descrive visivamente ciò che quei determinati sensi dovrebbero percepire, ecco allora che lo spettatore potrà vivere con l'olfatto e con il tatto una determinata scena come "puzzolente", "sporca" e "viscida", come ad esempio capita nel film Blade Runner quando i fotogrammi descrivono ambienti scuri, umidi e fumosi sostenuti da una musica che tratta le sue sonorità in modo altrettanto "sporco", "viscido" e "puzzolente", quasi come se al posto delle nostre orecchie e dei nostri occhi, a "vivere" questa scena, ci fossero (e di fatto ci sono!) il nostro naso e la nostra pelle.
  • La musica in scena: nella videomusic, assistiamo molto spesso a scene in cui la musica diventa protagonista principale: un canto, un assolo strumentale, una esecuzione orchestrale o di gruppo. Questo è anche quello che capita molto spesso nei film musicali, basti pensare all'opera rock Jesus Christ Superstar, dove i cantanti e la loro musica diventano gli attori protagonisti. Lo spettatore, in questo caso, non sempre riesce sul momento a scindere fra ciò che l'attore significa nella sua veste di personaggio e ciò che significa nella sua veste di cantante o musicista. La musica può essere quindi in scena tanto come oggetto quanto come soggetto, è ascoltata e vista nello stesso istante, a volte quasi come in un concerto. E ciò che viviamo in un concerto non è certo simile a quello che possiamo vivere durante la videoaudizione di un film. Il gioco interpretativo fra vero e falso, credibile e non credibile, continuo e discontinuo, realtà e fantasia, ascoltato e visto si fa sempre più complesso. Ma questa ambiguità può anche rendere il prodotto autoriflessivo, cioè può indurre lo spettatore a porsi domande in merito ai non rettilinei percorsi di senso che certi audiovisivi propongono volontariamente o casualmente. Ma non dobbiamo dimenticare di pensare a tutte quelle volte che in un film, pur vedendo musicisti in scena, non sentiamo le loro esecuzioni perché la regia vuole che la nostra attenzione sia rivolta sui "reali" personaggi, su ciò che stanno dicendo o facendo, o addirittura solamente sulla sola visione globale dell'immagine.
  • Conclusioni: oltre a questi rapporti, il gioco di combinazione fra musica e immagine può trovare anche altre tattiche più o meno profonde o interessanti, come ad esempio la scelta del silenzio sonoro per concentrare tutte le attenzioni sull'immagine, oppure il contrario, cioè fermare l'immagine e far "scorrere" la musica per dare l'idea che i personaggi si siano "bloccati" per pensare; o ancora combinare musica e immagine sulla base di un colore dominante dato sia dal timbro-sound musicale e sia dal colore tipico della scena visiva. A volte, come capita spesso in produzioni televisive realizzate in poco tempo, al titolo del programma viene abbinata una sigla musicale con lo stesso titolo o che, nel testo cantato, abbia anche una sola parola di questo (es. un programma televisivo dedicato al valore del danaro, anni fa aveva come sigla la canzone Mille lire al mese). Tutta questa analisi ci dimostra che i linguaggi audiovisivi, tramite il rapporto di divergenza e convergenza fra i parametri sino ad ora indicati, possono essere molto vari e ricchi, non solo per raggiungere diversi livelli di qualità estetica, ma anche per stimolare nelle forme più diverse il comportamento fisico, emotivo e intellettivo degli spettatori.