Tag: benchmarks
All the articles with the tag "benchmarks".
-
Das Rennen läuft um Autonomie
Fünf Frontier-Modelle in einer Woche. Eines davon arbeitet zwei Wochen autonom. Und wir tun so, als könnten wir das noch bewerten.
-
Lokale LLMs im Praxistest: Was Open-Weight-Modelle heute wirklich leisten
Ein praxisnaher Vergleich zwischen lokalen Open-Weight-Modellen und Cloud-Frontier-Modellen.