🤖 Загадки против ИИ! Исследователи взяли загадки из NPR Sunday Puzzle, чтобы проверить, насколько искусственный интеллект умеет решать головоломки, созданные для обычных людей. 💡 Основные моменты: • Модели, вроде OpenAI o1, иногда «сдаются» и дают ответы, которые сами понимают как неверные. • Загадки сформулированы так, чтобы не требовать специальных знаний – только базовый кругозор и умение логически мыслить. • Для проверки модели тщательно факт-чекают информацию, но это иногда занимает на несколько секунд-длиннее! • Некоторые алгоритмы даже «выражают разочарование», подобно человеку, когда застревают на сложной задаче. 🔍 Планируют расширять тестирование, чтобы понять, как развивается способность ИИ к рассуждению и где можно внести улучшения.

NeuroVesti
🤖 Загадки против ИИ!
Исследователи взяли загадки из NPR Sunday Puzzle, чтобы проверить, насколько искусственный интеллект умеет решать головоломки, созданные для обычных людей.
💡 Основные моменты:
• Модели, вроде OpenAI o1, иногда «сдаются» и дают ответы, которые сами понимают как неверные.
• Загадки сформулированы так, чтобы не требовать специальных знаний – только базовый кругозор и умение логически мыслить.
• Для проверки модели тщательно факт-чекают информацию, но это иногда занимает на несколько секунд-длиннее!
• Некоторые алгоритмы даже «выражают разочарование», подобно человеку, когда застревают на сложной задаче.
🔍 Планируют расширять тестирование, чтобы понять, как развивается способность ИИ к рассуждению и где можно внести улучшения.
🤖 Загадки против ИИ!
Исследователи взяли загадки из NPR Sunday Puzzle, чтобы проверить, насколько искусственный интеллект умеет решать головоломки, созданные для обычных людей.
💡 Основные моменты:
• Модели, вроде OpenAI o1, иногда «сдаются» и дают ответы, которые сами понимают как неверные.
• Загадки сформулированы так, чтобы не требовать специальных знаний – только базовый кругозор и умение логически мыслить.
• Для проверки модели тщательно факт-чекают информацию, но это иногда занимает на несколько секунд-длиннее!
• Некоторые алгоритмы даже «выражают разочарование», подобно человеку, когда застревают на сложной задаче.
🔍 Планируют расширять тестирование, чтобы понять, как развивается способность ИИ к рассуждению и где можно внести улучшения.
Дата публикации: 16.02.2025 23:21