Даже некоторые из лучших ИИ не могут превзойти этот новый эталон


Некоммерческая организация Center for AI Safety (CAIS) и компания Scale AI, предоставляющая ряд услуг по маркировке данных и разработке ИИ, выпустили новый сложный эталон для передовых систем ИИ. Эталон, получивший название «Последний экзамен человечества», включает в себя тысячи вопросов, собранных на основе краудсорсинга и затрагивающих такие темы, как математика, гуманитарные и естественные науки. Чтобы сделать оценку более жесткой, вопросы... Читать далее