Yandex выложил в опенсорс библиотеку для убыстрения обучения нейросетей

Yandex выложил в открытый доступ свою библиотеку YaFSDP. Она до 25% ускоряет обучение (педагогический процесс, в результате которого учащиеся под руководством учителя овладевают знаниями, умениями и навыками) огромных языковых моделей с открытым начальным кодом. Библиотеку YaFSDP могут употреблять создатели, компании и исследователи по всему миру.

YaFSDP рассчитана на огромные языковые модели, но подступает и для остальных нейросетей. К примеру, ее можно употреблять, чтоб убыстрить обучение (педагогический процесс, в результате которого учащиеся под руководством учителя овладевают знаниями, умениями и навыками) нейросетей, созданных для генерации изображений. Библиотека поможет уменьшить расходы на оборудование для обучения моделей, уменьшить расходы ресурсов графических микропроцессоров.

Одна из сложностей в обучении огромных языковых моделей – это недостающая загрузка каналов коммуникации меж графическими микропроцессорами. YaFSDP это решает. Библиотека улучшает внедрение ресурсов GPU на всех шагах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (сглаживание модели). Благодаря этому YaFSDP использует ровно столько графической памяти, сколько необходимо для обучения, при всем этом коммуникацию меж GPU ничто не замедляет, – говорится в сообщении Yandex’а.

Yandex протестировал библиотеку на посторониих нейросетях с открытым начальным кодом. YaFSDP дает убыстрение до 25% зависимо от архитектуры и характеристик нейросети.

Начальный код YaFSDP уже есть на GitHub.

Напомним, ранее Yandex представил новейшую версию машинного перевода, обученную при помощи YandexGPT.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *