Das Testen des testens – Wie vorgehen?

Bei mir ist gerade eine Test-Kampagne zu Ende gegangen und sie hat erstaunlich viele Fragen aufgeworfen. Dabei ging es zwar auch um Spielinhalte, wichtiger waren aber die dahinterstehenden Prozesse, die zu diesen Inhalten geführt haben. Das lässt die Frage aufkommen, wie am sinnvollsten getestet werden sollte. Denn das Testen ist essenziell. Selbst die beste Spielidee kann nicht zünden, wenn das Spiel, in das sie eingebaut ist, unbalanciert, unbequem oder widersprüchlich ist. Allerdings, so haben die verschiedenen Herangehensweisen an das Testen gezeigt, können zahlreiche Fehler dabei gemacht werden. Denn das Testergebnis wird dabei maßgeblich durch die Art und Weise beeinflusst, wie getestet wird. Deswegen will ich in diesem Beitrag dazu einmal meine Erfahrungen äußern.

Worum geht es?

Ich habe mir für das Warhammer 40k Tabletop ein von Total War inspirierten Kampagnenansatz ausgedacht. Im Warhammer 40k Grundspiel kauft man sich verschiedene Einheiten zusammen, achtet auf bestimmte Waffen- und Fähigkeitenzusammenstellungen und versucht dann durch das gezielte Zerstören und Positionieren auf dem Schlachtfeld mehr Siegpunkte als der Gegner zu erhalten. Dieser Kern gilt unverändert in dem selbsterdachten Kampagnenmodul, aber über ihn wurde ein System mit Armeebewegungen, Forschung, Gebäudebau und Quests errichtet. Treffen zwei Armeen in diesem Kampagnenmodus zusammen, kommt es zu einer gewöhnlichen Warhammer 40k Schlacht. Aber alle Bedingungen, die zu dieser Schlacht führen, werden durch das Kampagnenmodul beeinflusst. Das heißt, das eigentlich Spiel bleibt unangetastet, aber alle Schlachten, die vorher austauschbar und beliebig waren, werden nun in einen konkreten Kontext gesetzt. Es ist relevant, welche Verluste entstehen (das ist im Grundspiel größtenteils unwichtig) und es ermöglicht Armeenkombinationen, die vorher aus Effizienzsgründen nie gespielt wurden.

Die Schlachten erhalten damit eine ganz neue Bedeutung, weil der Sieg weniger wichtig wird, als die Art und Weise, wie gewonnen wird. Im Grundspiel ist der Sieg absolut und das Einzige, was eine Bedeutung hat. Durch die Kampagne wird es dagegen viel wichtiger, wann sich Einheiten vom Schlachtfeld zurückziehen, um die Verluste zu minimieren und damit folgende Schlachten (weil die Armee sich nur auf bestimmten Punkten der Karte versorgen kann) noch gewinnen kann.

Der mathematische Ansatz

In meiner Tabletop-Kampagne gab es einen Spieler, der davon ausging, dass sich alles berechnen lässt. Dieser Meinung bin ich schon einige Male im kompetitiven Bereich begegnet. Die Behauptung von den selbsternannten Experten ist dann, dass bereits zu Beginn einer Partie, bevor noch der erste Zug gemacht wurden ist, das Ergebnis mathematisch feststeht. Diese Behauptung habe ich nicht nur im Tabletopbereich, sondern auch im Kartenspielbereich (etwa bei Magic the Gathering) gehört. Das ging sogar soweit, dass wenn ich anders gespielt habe, als mir der „Experte“ meine Züge vorhergesagt hat, mir vorgeworfen wurde, ich würde schlecht spielen. Interessanterweise konnte ich dennoch den einen oder anderen Sieg erringen. Ich glaube daher nicht an einen mathematischen Determinismus. Das liegt zum einen daran, dass Wahrscheinlichkeiten keine Garantien darstellen und zum anderen, dass Spieler, die das Spiel nur auf diese mess- und berechenbaren Zahlen reduzieren, alles andere außer Acht lassen. Ich kann mir vorstellen, dass eine intensive Beschäftigung mit den optimalen Siegstrategien zu einer Art Technokratie im Kopf führt, in der wirklich nur noch Zahlen relevant werden. Aber zumindest Tabletop besteht aus deutlich mehr als nur Zahlen. Die Positionierung und Psychologie spielen ebenfalls große Rollen. Ersteres lässt sich, aufgrund von Sichtfeldern und Deckung, nicht vollständig mit einen Bewegungswert erfassen, Letzteres besitzt nicht eimal Werte (Stichwort: Carnifex Distraction – das bezeichnet ein großes, sehr gefährlich wirkendendes Modell, dessen tatsächliche Kampfkraft aber eher gering ist, aber dennoch das Feuer auf sich lenkt und vor dem feindliche Truppen einen ehrfürchtigen Abstand halten). In einem Kampagnensystem, dass noch Gelände- und Armeetypen, Artillerie, Luftangriffe und Persistenz einführt, lässt sich der mathematische Ansatz nicht mehr halten, zumindest nicht als deterministische Theorie.

Balance lässt sich nicht einfach berechnen, aber Berechnungen sind ein wichtiger Teil der Balancierung. Der Spieler von oben hat den Fehler gemacht und alles auf die Ökonomie (Punkte) runtergerechnet. Wenn eine Armee durch eine bestimmte Komposition aus Einheiten besser oder schneller Gebiete einnehmen konnte, sah er nur die Punkte, die der eine Spieler dadurch gewann und der andere verlor. Er sah dadurch nicht, was die Armeebewegung auf der strategischen Ebene bedeutete. Selbst verlustreiche Schlachten gegen Festungen konnten sinnvoll sein, wenn danach die Ökonomie des Gegners in Reichweite war. Das heißt, der mathematische Ansatz darf nicht als goldener, alles umfassender Maßstab begriffen werden. Wenn die Vergleichsebene gleich ist (etwa zwei Wirtschaftsgebäude) kann er sehr helfen. Wenn die Vergleichsebenen sich aber ändern (ein Wirtschaftsgebäude, dass zudem Armeebewegung verbessert gegen ein sehr teures Wirtschaftsgebäude, dass aber alle Produktionskosten von Einheiten senkt), wird die Berechnung zu komplex, um nutzbare Aussagen daraus zu gewinnen. Dann braucht es einen Spieltest.

Der Spieltest

Ich persönlich bin ein großer Freund des Spieltests, weil die konkrete Spielsituation schließlich der wichtigste Maßstab ist, in dem sich die Eigenkreation beweisen muss. Dabei reicht es nicht, Ideen bloß zu denken und sie dann gleich vorzustellen. Sie müssen zuvor durch eine konkrete, konstruierte Situation dem Tester vor Augen geführt werden. Ansonsten ist die Gefahr, etwas zu übersehen und den Überblick zu verlieren, sehr groß. Dieser Vorbereitungsaufwand ist deswegen nötig, weil die Testgruppe in den meisten Fällen gleichzeitig die Spielgruppe ist. Das heißt, sie spielen nicht, weil sie primär die Regeln testen, sondern Spaß haben wollen. Der durch die Regeln erzeugte Spaß wird damit die Messlatte. Das erzeugt einen großen Nachteil und Vorteil. Der Nachteil ist die Subjektivität, die dem Ganzen anhaftet. Auf das Gelände Berg können etwa nur Infanterie-, Schweber- und Luftwaffenarmeen. Ein Spieler einer Fraktion mit schwacher Infanterie findet Berge daher viel zu schwer einzunehmen, während Spieler mit Fraktionen mit starker Infanterie die Regel genau richtig finden. Dazu kommen Spieler, die tendenziell Dinge, die sie benachteiligen, als zu stark und Dinge, die sie bevorteilen, als zu schwach bewerten. Es ist schwierig, aus den subjektiven Eindrücken eine funktionierende Balancierung abzuleiten. Der große Vorteil hingegen liegt darin, dass das Spiel von verschiedenen Leuten gespielt wird. Dadurch werden Anwendungsmöglichkeiten und Regellücken entdeckt, die dem Einzelnen leicht verborgen bleiben. Im Rahmen eines kleineren, für die eigene Spielgruppe zugeschnittenen Projektes, lassen sich außerdem auch noch Anpassungen an die Spielbedürfnisse der eigenen Gruppe durchführen. 

Professionelle Tester

Ich will diese Art der Testmöglichkeit ebenfalls noch kurz erwähnen, allerdings habe ich das bisher nur zweimal probiert und beide Male waren meine Erfahrungen damit durchwachsen. Das liegt vor allem daran, dass es keine Plattform gibt, bei der sich professionelle Tester für das eigene Regelwerk kaufen lassen. Damit besteht zu Beginn bereits ein beträchtlicher Rechercheaufwand, entsprechende Personen zu finden. Ich hatte mich diesbezüglich an erfahrene Rollenspielautoren gewandt (für ein anderes Projekt). Diese mussten dann auch noch für das Testen überzeugt werden. Das kann natürlich mit ausreichendem Geldeinsatz geschehen. Da es aber keinen Markt dafür gibt, ist der Preis reine Verhandlungssache. Ist er zu niedrig angesetzt, hängt es enorm von der Motivation des Testers ab, das eigene Werk zu lesen. Einer hatte sogar zu mir gemeint, dass er es überhaupt nur in Betracht zieht, seine Zeit zu investieren, wenn er das Werk für vielversprechend hält. Damit sind die Hürden sehr hoch. Durch Glück konnte ich hier jedoch einen Tester gewinnen. Das Review war detailliert, durchdacht und hilfreich, allerdings auch durch die eigene Muse gefärbt. Es wurde weniger in der Idee des Systems gedacht, die ich mit dem Regelwerk vorgegeben hatte, als viel mehr in eigenen Präferenzen. Vielleicht lassen sich in einem kreativen Hobby auch nur schwer objektive Gütekriterien einrichten, allerdings hat das die Qualität des Feedbacks geschmälert. Ich brauchte schließlich Lösungen innerhalb meines Systems und keine Ideen, die neue Teilsysteme eröffneten. Der zweite Nachteil dieses intensiven Testens war der Zeitansatz. Bei kleineren Regelwerken mag das noch vernachlässigbar sein, aber bei Regelwerken mit hunderten von Seiten ist es das nicht mehr.

Am Ende der Betrachtung würde ich daher einen kombinierten Ansatz empfehlen. Bevor eine neue Regel getestet werden soll, muss sich durchdacht, durchgerechnet und für den Spieltest vorbereitet werden. Im Tabletop hat es sich eingebürgert, dass ich Regeln, bevor sie zu Anwendung kommen, mit meiner Gruppe bespreche und dadurch schon in der Vorbereitungsphase ihr Feedback einflechten kann. Erst dann beginnt der Spieltest, der dann im Laufe der Kampagne zeigt, ob sich die Regel bewährt. Dabei habe ich festgestellt, dass es einige laute Spieler geben kann, die ihren Unmut kundtun. Hier ist es wichtig stark zu bleiben, auf den Gruppenkonsens zu pochen und auf die Prüfung durch den Spieltest zu verweisen. Unsicherheiten führen hier eher dazu, dass sich vorteilsbedachte Spieler durchsetzen können. Außerdem ist es wichtig, eine Regel/ Balanceänderung nach der anderen zu implementieren, weil dadurch in den meisten Fällen das damit zusammenhängende System verändert wird.

Soweit zu der Art, wie ich derzeit teste. Aber wie immer bin ich auf eure Kommentare und eure Erfahrungen zum Testen gespannt.

2 Gedanken zu „Das Testen des testens – Wie vorgehen?

  1. Andreas (RPGnosis)

    Sehe ich auch so, Feldtests sind essentiell. Die meisten klassischen Balancing-Probleme kann man im Vorfeld (durch das ausführliche Gedankenexperiment) zwar selbst finden, wenn man sich im System auskennt, entscheidend ist aber das Verständnis und die „Usability“ durch die Spielenden.
    Gleichzeitig darf man Spieltests aber nicht überbewerten, vor allem nicht im Rollenspielkontext, wo die Spielmöglichkeiten endlos sind. Von „bei uns war das +10-Schwert gar nicht broken, das wurde dem Barbaren ohnehin vor dem Endkampf gestohlen“ bis „da darf man doch nicht einfach eine magische Waffe finden, die Gruppe ist noch nicht mal Level 4!“ sollte jedes Feedback im Kontext der Spielgruppe, die es geäußert hat, betrachtet werden.
    Schlimm finde ich Leute, die behaupten, man könne ein Regelsystem nicht durch Lesen verstehen, sondern muss es (am besten bei ihnen selbst) gespielt haben, damit man mitreden kann, oder andersrum diejenigen, die jedes Spiel gleich gut finden, weil sie eh alles nur handwedeln statt die vorgegebenen Regeln zu verwenden.
    Und meiner Erfahrung nach ist Testen und Optimieren ein iterativer Prozess – man sollte nicht glauben, nach einer Runde damit durch zu sein. Das Schwierige ist, den richtigen Ausstiegszeitpunkt zu finden…

    Antworten
    1. Ariatros Artikelautor

      Vielen Dank für deinen Kommentar! Weise Worte. Ich habe mich auch davon verabschiedet, alles genau durchrechnen zu wollen. Das Gedankenexperiment ist wichtig, weil es die Testarbeit verkürzt. Ich habe aber da das Problem, dass ich eine Selbstblindheit besitze. Was ich noch total intuitiv und selbsterklärend empfinde, verstehen andere gar nicht. Oder was ich als spannende Mechanik erdacht habe, ist für andere mühselig und lästig. Also ja, man muss in die Praxis gehen. Ich habe jetzt vor allem 2-3 Testgruppen und, obgleich das schon mal mehr als eine ist, werde ich das Gefühl nicht los, dass ich das Regelsystem immer weiter für die Bedürfnisse dieser Gruppen anpasse. Deine Frage: „Wann aufhören?“, finde ich daher sehr wichtig. Aber was wäre denn der beste Zeitpunkt dazu? Spontan fallen mir bei jeder Sitzung Punkte auf, die ich gerne noch schleifen, erweitern oder wegnehmen würde. Das ist vielleicht gar nicht mal so sinnvoll, weil in bestimmten Fällen eine Regelanpassung einen größeren Teil des gesamten Regelframeworks verändern kann. Das will ich am Beispiel des Balancings deutlich machen:
      Grundsätzlich finde ich mehr Ausrüstungsoptionen sinnvoll. Das kann aber schnell dazu führen, dass sie bestimmte Ausrüstungsoptionen obsolet machen. Also stärke ich die wieder? Lasse sie so stehen und verändere aber die Verfügbarkeit? Im schlimmsten Fall baut man dann nur noch um oder fügt ständig was hinzu. Gerade das Hinzufügen empfinde ich als kritisch, weil ab einen bestimmten Punkt die Übersicht und auch die Leselust verloren geht. Ich kann mich da etwa an DSA 4 und einen Meister erinnern, der es mit allen Regeln (auch die Ausdauerregeln) spielen wollte. Das war ein sehr großes Regelkonvolut, was aber dem Spiel selbst kaum was hinzugefügt hat.
      Auch aus der Erfahrung mit der 40k-Tabletop-Kamapgne kann ich sagen, dass Spielbarkeit das Ziel sein sollte. Auch wenn es ärgert und manchmal unlogisch ist, aber es gibt Regeln, gerade welche, die den Simulationsaspekt erhöhen sollen, die erfordern eine hohe Konzentration beim Spiel oder erhöhen dessen Zeitaufwand unverhältnismäßig. Also haben wir uns auf reine spielmechanische Limitierungen geeinigt, damit das eigentliche Spielgefühl nicht verloren geht. Viel ist das ein guter Punkt, um dem Testen aufzuhören, wenn eine Art Flow geschaffen ist, der vielleicht nicht alles umfassen kann, aber den Spielern ein Gefühl der Rahmung und sicheren Erwartbarkeit gibt.

      Antworten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.