A API da Anthropic impõe limites de RPM (solicitações por minuto) e TPM (tokens por minuto) que escalam com o nível de uso da API. O tipo rate_limit_error é distinto do overloaded_error — rate_limit_error é por usuário e por chave, ou seja, a conta excedeu seus próprios limites alocados. Os limites de taxa da Anthropic variam significativamente por nível: o Nível 1 tem limites muito baixos, enquanto o Nível 4 e superiores suportam throughput em escala enterprise.