Wie KI das Medientraining ergänzt

Interview-Vorbereitung

Vor einigen Wochen kontaktierte mich die Kommunikationsberatung Team Lewis. Man würde mir gerne „Training for Trust“ (TFT) vorstellen, schrieb mir ein Berater. Dem Begleittext zufolge handelt es sich um das „weltweit erste biometrische Trainings- und Analyseprogramm für Sprecher:innen auf dem Markt“.

Das System messe unter anderem Blickkontakt, Sprechgeschwindigkeit und Sprechweise und erstelle anhand von Faktoren wie Gelassenheit und Vorsicht mit Hilfe von künstlicher Intelligenz ein emotionales Profil, heißt es in der PM. Die KI liefert dann Werte für Vertrauenswürdigkeit, Selbstsicherheit, Glaubwürdigkeit, Engagement und Authentizität. Am Ende gibt es einen „Trust Score“, der aussagt, inwieweit man in dem Test von einer vorher definierten Zielgruppe als vertrauenswürdig wahrgenommen wird. Wie kommt man an?


Lesen Sie auch:


Es macht in meinen Augen einen Unterschied, ob man sich ein Tool aus der Entfernung beschreiben lässt oder es selbst getestet hat. Ich bin also nach London gereist. Dort hat Team Lewis sein internationales Headquarter. Weltweit arbeiten mehr als 600 Mitarbeiter für die Agentur. In London befindet sich auch das vollständig eingerichtete Studio, in dem die komplette KI-Analyse stattfinden kann. An Standorten wie München und Berlin kommt eine reduzierte Version zum Einsatz.

Die Medientrainings werden wie bisher von einem Trainer durchgeführt. In meinem Fall war das Chief Client Officer Andres Wittermann, der pro Jahr etwa 50 Medientrainings mit CEOs, Vorständen, Sales-Professionals und Sprechern durchführt. Mir ging es dabei weniger um meine eigene Performance – natürlich interessierte die mich auch –, sondern darum zu sehen, welche Erkenntnisse das KI-System liefern kann und wie sich die Ergebnisse ändern, wenn ich aufgrund der Tipps aus der KI-Analyse und des Trainers meinen Auftritt korrigiere.

Das Set-up

Es sollte zwei Mock-up-Interviews geben zu Themen, die mit meinem beruflichen Alltag zu tun haben. Das erste drehte sich um Herausforderungen von Media Relations. Im zweiten sollte es um die PR-Ausbildung gehen. Ich schickte vorab Kernbotschaften und Vorschläge für mögliche Soundbites an Wittermann. Mein Input sollte in die KI eingespeist werden, um nachher evaluieren zu können, inwieweit es mir gelungen war, Botschaften zu vermitteln. Als Zielgruppen definierten wir professionelle Kommunikatoren, Journalisten und die allgemeine Öffentlichkeit.

Das Studio

Die Interviews fanden in einem Studio statt, das vor allem für TV- und Audio-Aufnahmen genutzt wird. Es ähnelte denen von „CNN“ oder „Sky News“. Am Ende wurden es drei Interviews – zwei auf Englisch und eines auf Deutsch. Es zeigte sich, dass die KI-Analyse für die deutsche Sprache nicht gut funktioniert.

Das Studio hat als Hintergrund einen acht mal drei Meter großen LED-Bildschirm, auf dem die Opening-Sequenz einer fiktiven Fernsehsendung eingespielt wurde. Außerdem ist es möglich, auf dem Screen während der Interviews Videos oder Social-Media-Postings einzublenden. Der Sound ist in Dolby Atmos.

Es gibt drei Kameras. Eine Kamera ist ausschließlich auf das Gesicht gerichtet, um Mimik und Blickwinkel aufzuzeichnen. Neben dem Trainer begleiten diese Form des Medientrainings noch ein Motion Graphic Designer und AI Developer, der die KI-gestützte Auswertung macht, sowie ein Video Producer für die filmische Umsetzung. Preislich liegt ein Training im Londoner Studio bei etwa 15.000 britischen Pfund (circa 17.000 Euro).

Die Interviews

Die englischsprachigen Interviews waren 8:38 Minuten und 5:26 Minuten lang. Sie ähnelten Gesprächen, wie man sie aus Sendungen wie „Berlin direkt“ oder mit einem persönlichen Gast im Studio der „Tagesthemen“ kennt. Der Interviewer und die interviewte Person – ich – saßen sich gegenüber.

Professionelles TV-Studio mit Kameras, Scheinwerfern und einer beleuchteten LED-Wand.

Die Trainingsinterviews fanden vor drei Kameras statt. Eine Kamera war dabei ausschließlich auf das Gesicht gerichtet, um unter anderem den Blickkontakt zu messen. © Team Lewis

Wittermann war der Interviewer. Seine Fragen kannte ich nicht. Bei beiden Interviews wurden auf dem Screen Ausschnitte aus Medienberichten eingeblendet, wozu ich dann etwas sagen sollte.

Die Analyse

Die KI-Analyse des Interviews dauerte etwa so lange wie das eigentliche Gespräch. Nach knapp zehn Minuten hatten wir das Ergebnis, das wir uns auf dem großen Screen im Studio anschauten. Wie war ich denn so?

An oberster Stelle der Auswertung steht der „Trust Score“. Der liegt zwischen 0 und 100. Je höher der Wert ist, desto vertrauenswürdiger hat die Person auf die Zuschauer gewirkt.

Team Lewis hat das Tool selbst programmiert und die KI trainiert. Probeläufe hätten gezeigt, dass ein aufgezeichnetes Interview mit einem Schwerverbrecher einen Wert von etwa 60 erreicht habe. Über 90 ist außergewöhnlich hoch. Andres Wittermann zufolge ist die weltbekannte Rede von Charlie Chaplin in dem Film „Der große Diktator“ von dem Tool mit mehr als 90 bewertet worden. Ich landete im ersten Interview bei 82/100. Im zweiten bei 88/100, was als „professionell, besonnen, kenntnisreich, aufschlussreich und selbstbewusst“ eingestuft wurde.

Bei den hohen Werten gilt es zu berücksichtigen, dass ich über ein Thema sprach, das mir sehr vertraut ist. Außerdem befand ich mich nicht in der Stresssituation eines realen Interviews, wenngleich das Studio eine TV-Atmosphäre simuliert und man vor drei Kameras sitzt. Ich musste in meinen Antworten auch keine Botschaften unterbringen, sondern konnte das sagen, wovon ich wirklich überzeugt bin. Es wäre traurig gewesen, nicht überzeugend gewirkt zu haben.

Gemessene Parameter

Die Auswertung lieferte unter anderem einen prozentuellen Wert für den Augenkontakt mit dem Interviewer, berücksichtigt aber auch situationsbezogene Aspekte und die Intensität. Manche Leute schauen in TV-Interviews nach unten. Andere auf ihre Hände oder versuchen, direkt die potenziellen Zuschauer zu adressieren. Meine Werte für den Augenkontakt beziehungsweise die passende Blickrichtung waren zwar gut. Allerdings riet mir die KI, meine Blickrichtung öfter mal zu variieren.

Zwei Personen, links Volker Thoms, rechts Andres Wittermann, stehen vor einem großen Bildschirm mit Datenanalysen und Grafiken.

Ein Wert, den das Tool misst: der Augenkontakt. Wie war die Blickrichtung? © Team Lewis

Anhand einer Zeitskala ließ sich ablesen, wie ich an bestimmten Punkten des Interviews reagierte. So war es mir überzeugend gelungen darzulegen, wer die Zielgruppen von KOM sind und welchen Herausforderungen sich CEOs ausgesetzt sehen. Durchschnittlich waren meine Antworten auf die Frage, welchen Einfluss die globale Unsicherheit auf Kommunikationsstrategien hat. Hier hatte ich etwas rumgestottert.

Das System misst die Sprechgeschwindigkeit. Als schnell gelten mehr als 160 Wörter pro Minute. Langsam ist unter 90. Die „Trusted Pace“ liegt bei 120 Wörtern/Minute. Mein Durchschnitt lag im ersten Interview bei 135 Wörtern/Minute, was mir ein „Excellent Pacing“ einbrachte. Beim zweiten Gespräch waren es 116 Wörter/Minute. Recht typisch für Interviews: Anfangs war mein Sprechtempo höher, was auf Anspannung schließen lässt, die sich mit der Zeit oft legt. In Runde zwei wusste ich, worauf ich zu achten habe.

Grafik zeigt ein Liniendiagramm mit Sprechtempo, gemessen in Wörtern pro Minute über einen Zeitraum von 2 Minuten.

Die blaue Linie zeigt die Sprechgeschwindigkeit im ersten Gespräch. In Interviews und bei Vorträgen wird anfangs oft schneller gesprochen, bevor sich die Nervosität legt. © Screenshot

Wie hätten mich die Zielgruppen wahrgenommen? Bei den Punkten Glaubwürdigkeit, Selbstvertrauen und Authentizität erreichte ich hohe Werte. Der „Engagement“-Score war mittelmäßig.

Das System attestierte mir, dass ich eher formal kommuniziert und wenig Emotionen gezeigt hätte. Von einem CEO, der über ein neues Produkt spricht, würde man an einer solchen Stelle im Interview erwarten, dass er für dieses brennt und das auch zeigt. Im zweiten Interview, als ich bewusst auf mehr Variabilität und Emotionen geachtet habe, lag der Wert höher.

Grafik mit einem Radar-Diagramm, das Werte für die Parameter „Trustworthiness“ (90 Prozent), „Confidence“ (88 Prozent), „Engagement“ (75 Prozent), „Authenticity“ (85 Prozent) und „Clarity“ (80 Prozent) darstellt.

Die Analyse attestierte Volker Thoms eine hohe Vertrauenswürdigkeit. Der niedrigere Score bei „Engagement“ bedeutet, dass es seinen Antworten etwas an Emotionen fehlte. © Screenshot

Darüber hinaus zeigte die Auswertung, ob ich Füllwörter benutzt habe. Eine zu häufige Verwendung kommt schlecht an. Ich nutzte moderat Wörter wie „basically“, „I mean“ oder „let’s say“, was für Nichtmuttersprachler symptomatisch ist. Hinzu kamen einige „ah“ und „uh“. Im zweiten Interview war es von allem weniger. Das einfach zu vermeidende „basically“ kam kaum noch vor. „Let’s say“ blieb.

Die KI liefert einen Vorschlag für einen Trainingsplan. Ich sollte darauf achten, häufiger die Blickrichtung zu variieren, den Sprachduktus zu ändern und mit persönlichen Beispielen Emotionen zu erzeugen.

Was leistet die KI?

Der Ablauf eines Medientrainings hat sich bei Team Lewis durch „Training for Trust“ nur unwesentlich verändert. Weiterhin gibt der Trainer Feedback. Egal wie groß dessen Erfahrung ist: Seine Einschätzung bleibt subjektiv und ist tagesformabhängig.

Mit einer KI-Analyse lassen sich zusätzliche Daten erheben. Die meisten Kommunikationsverantwortlichen haben sicher selbst ein Gefühl dafür, ob sie schnell sprechen oder Füllwörter verwenden. Die Intensität einschätzen und bewerten, ob das negativ auffällt, können wohl die wenigsten. Die KI liefert eine Einordnung unter Berücksichtigung des mitgelieferten Kontextes. Ähnlich ist es mit dem Augenkontakt. Ein hoher Wert muss nicht ideal sein. Ein starrer Blick kann sogar aggressiv wirken. Hier ist eine Einordnung eines Trainers sinnvoll.

„Die KI hat Schwierigkeiten, Ironie und Humor zu erkennen“, sagt Andres Wittermann. Das System kann nicht feststellen, ob Aussagen zutreffen oder gelogen sind. Es liefert aber Parameter, anhand deren man erkennen kann, was sich beispielsweise bei einzelnen Antworten verändert hat. Die ausgesendeten Emotionen zum Beispiel. Es bedarf dann der Interpretation.

Die Auswertung ermöglicht es zudem, sich Daten zu einzelnen Interviewsequenzen anzuschauen. Bei welchen Fragen kamen Füllwörter zum Einsatz? Wo wurden die Botschaften inkonsistent? Das System liefert auch Indikatoren über den emotionalen Status. An welchen Stellen wirkte der Interviewte angespannt? Worüber sprach die Person voller Begeisterung?

„Medienerfahrene CEOs und Vorstände gehen in der Regel mit einer klaren Vorstellung in ein Training rein“, sagt Wittermann. „Wir können ihnen so direkt sagen, was sie gut machen und wo es eventuell noch Schwachstellen gibt.“ Die Zahlen liefern einen Ansatz zur Selbstreflexion über Interviewsituationen hinaus und helfen auch bei Vorträgen, Town Halls oder sonstigen Gesprächen.

CEOs und Vorstände werden selten von ihren Mitarbeitern ehrlich und hart kritisiert. Ein externer Trainer ist unabhängiger, muss sein Feedback aber trotzdem an Person und Umstände anpassen. Jeder kennt das aus eigenen Weiterbildungen: Coaches neigen dazu, sich auf das Positive zu fokussieren. Feedback einer Maschine ist unerbittlicher, wenngleich das „Training for Trust“-Tool offenbar so gepolt ist, dass es konstruktive Urteile abgibt und respektvoll bleibt.

Kommen KI und Trainer manchmal zu völlig unterschiedlichen Bewertungen? „Nein, zu großen Abweichungen kommt es nicht. Das hat damit zu tun, dass wir die Maschine selbst trainiert haben und sie sich an dem orientiert, was wir für effektiv halten“, sagt Andres Wittermann. „Wir trainieren die KI außerdem immer weiter und nutzen dafür auch die Erfahrungen unserer Kunden.“

Das Ziel sei, die KI kontinuierlich weiterzuentwickeln. Die Zeit, bis das Ergebnis vorliegt, wurde bereits deutlich reduziert. CEOs und Vorstände, die häufig eng getaktet sind, wollen natürlich nicht stundenlang auf die Auswertung warten. Es muss schnell gehen.

Team Lewis hat inhouse rund sechs Monate an der Entwicklung des Systems gearbeitet. Könnten andere das auch? „Wir haben jetzt einen Vorsprung, aber natürlich ist es für andere auch möglich, etwas Ähnliches zu entwickeln“, erklärt Agenturmanager Wittermann.

Dieser Beitrag erschien zuerst in der gedruckten Ausgabe #Zukunft. Das Heft können Sie hier bestellen.