Super HN - Super Hacker News

OTelBench: AI struggles with simple SRE tasks (Opus 4.5 scores only 29%) (quesma.com) 12 points by stared 43 minutes ago