Технологии

«Яндекс» открыл доступ к библиотеке для обучения нейросетей

«» открыл разработчикам и исследователям по всему миру доступ к своей библиотеке для обучения больших языковых моделей YaFSDP, которая может ускорить процесс обучения на четверть, говорится в пресс-релизе компании. «Яндекс открыл для всех библиотеку YaFSDP. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека дает ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения», — сказано в релизе. Библиотека в первую очередь рассчитана на текстовые модели, но подходит и для нейросетей, которые генерируют изображения.

Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру. Как уточнили в компании, это позволит сократить расходы на оборудование для обучения моделей, что особенно важно для стартапов и научных проектов. Также библиотека позволит решить одну из проблем в обучении больших языковых моделей, связанную с недостаточной загрузкой каналов коммуникации между графическими процессорами.

«Библиотека оптимизирует использование ресурсов GPU (графический процессор — ред.) на всех этапах обучения… Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет», — отметили в «Яндексе».

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»