“Яндекс” открыл доступ к библиотеке для обучения нейросетей
“Яндекс” открыл разработчикам и исследователям по всему миру доступ к своей библиотеке для обучения больших языковых моделей YaFSDP, которая может ускорить процесс обучения на четверть, говорится в пресс-релизе компании. “Яндекс открыл для всех библиотеку YaFSDP. Она значительно ускоряет обучение больших языковых моделей – как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека дает ускорение до 25% – результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения”, – сказано в релизе. Библиотека в первую очередь рассчитана на текстовые модели, но подходит и для нейросетей, которые генерируют изображения.
Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру. Как уточнили в компании, это позволит сократить расходы на оборудование для обучения моделей, что особенно важно для стартапов и научных проектов. Также библиотека позволит решить одну из проблем в обучении больших языковых моделей, связанную с недостаточной загрузкой каналов коммуникации между графическими процессорами.
“Библиотека оптимизирует использование ресурсов GPU (графический процессор – ред.) на всех этапах обучения… Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет”, – отметили в “Яндексе”.