Об этом сообщает «Politexpert» со ссылкой на Science Alert
Компания DeepSeek из Китая стремительно набирает популярность благодаря выпуску мощных моделей искусственного интеллекта, способных составить конкуренцию продуктам OpenAI и Anthropic. Основной прорыв связан с моделью DeepSeek V3, представленной в декабре 2024 года. При значительно меньших затратах на обучение она показывает производительность на уровне GPT-4o. Разработчики смогли достичь этого благодаря уникальному подходу к оптимизации вычислительных мощностей и применению передовых алгоритмов.
Спустя месяц, 20 января 2025 года, DeepSeek представила новую версию под названием R1, которая использует метод пошагового рассуждения. Это значительно улучшает её способности в сложных задачах, требующих многослойного анализа. Технология основана на методе обучения с подкреплением, который также был применён к компактным моделям, способным работать на обычных компьютерах. Это вызвало бурную реакцию в индустрии, повлияв даже на фондовые рынки, где акции ведущих технологических компаний резко просели.
Главный секрет успеха DeepSeek – максимальная эффективность. Разработка моделей обходится дешевле, а их обучение требует в разы меньше графических процессоров, чем у конкурентов. Ключевые инновации связаны с применением технологии разрежённости параметров и усовершенствованной системой хранения данных. Это позволяет модели работать быстрее и точнее, снижая потребность в мощных вычислительных ресурсах.
Важным моментом стало то, что DeepSeek выложила свои разработки в открытый доступ, что даёт возможность другим исследователям бесплатно использовать передовые технологии. Это ставит под удар бизнес-модель крупных западных корпораций, но открывает новые перспективы для науки и стартапов. Уже сейчас ожидается, что такие технологии позволят запускать мощные ИИ-приложения прямо на пользовательских устройствах без необходимости в облачных сервисах.
Напомним, ранее мы писали о том, что будет, если в Солнечной системе появится суперземля.
Комментировать