Die kombinierte Token-Anzahl von System-Prompt, Gesprächsverlauf und neuer Nachricht überschreitet das maximale Kontextfenster des Modells. Mistrals Dokumentation zu bekannten Einschränkungen bestätigt, dass Anfragen, die das Kontextfenster überschreiten, einen 400 Bad Request zurückgeben. Da lange Gespräche wachsen, kann der angesammelte Nachrichtenverlauf das Limit überschreiten — was dazu führt, dass alle nachfolgenden Anfragen fehlschlagen, bis der Verlauf gekürzt wird.