Bild und Ton beanspruchen den Zuseher im unterschiedlichen Ausmaß. 
Warum Schreck?
Weil textliche Information vom Bild fast verschluckt wird.
Bild beansprucht 80 % der Aufmerksamkeit.
Ton beansprucht 20 % der Aufmerksamkeit.
[ ... Nebenbei aus der Schule geplaudert: gute Gestalter machen vor einem Interview ein sogenanntes "Antextbild" der Person, die danach im Interview sprechen wird. Der Zuseher kann sich in Ruhe diese Person "ansehen". Dies ist eine notwendige Orientierungsphase. Danach erst hört der Zuseher auch auf das gesprochene Wort. Macht man das nicht, sind die ersten 5 Sekunden des Interviews einfach "für die Katz' ". Das Bild verschluckt den Inhalt des Wortes.  ...]
Das bewegte Bild kann sogar stören. 
Immer wenn es gilt abstrakte und textlastig Inhalte zu vermitteln, sollten die Bilder sowieso ganz ruhig werden. Das Bild bindet die Aufmerksamkeit. Starke, bewegte, explosive, rasante, oder auch lyrische Bilder sind gut für subtile Emotionalität im Spielfilm, schlecht für eine Info-Video. Ein Informationsvideo, welches abstrakte Inhalte vermitteln muss braucht entsprechend dezente Bilder. Deshalb ist ein Fotovideo gut, wenn Textdominanz erforderlich ist.