МОСКВА, 11 июн - ПРАЙМ. "Яндекс" открыл разработчикам и исследователям по всему миру доступ к своей библиотеке для обучения больших языковых моделей YaFSDP, которая может ускорить процесс обучения на четверть, говорится в пресс-релизе компании.
"Яндекс открыл для всех библиотеку YaFSDP. Она значительно ускоряет обучение больших языковых моделей - как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека дает ускорение до 25% - результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения", - сказано в релизе.
Библиотека в первую очередь рассчитана на текстовые модели, но подходит и для нейросетей, которые генерируют изображения.
Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру. Как уточнили в компании, это позволит сократить расходы на оборудование для обучения моделей, что особенно важно для стартапов и научных проектов. Также библиотека позволит решить одну из проблем в обучении больших языковых моделей, связанную с недостаточной загрузкой каналов коммуникации между графическими процессорами.
"Библиотека оптимизирует использование ресурсов GPU (графический процессор - ред.) на всех этапах обучения… Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет", - отметили в "Яндексе".