Yandex открыл начальный код платформы для работы с большенными данными

Yandex опубликовал начальный код YTsaurus. Это платформа для хранения и обработки огромных данных, с которой работает большая часть сервисов Yandex’а.

Платформа подступает для широкого круга задач, от аналитики до обучения сложных моделей с млрд характеристик. К примеру, Поиск строит при помощи YTsaurus поисковый индекс, а беспилотные авто употребляют платформу, чтоб обрабатывать данные о поездках и облагораживать свои методы. YTsaurus управляет суперкомпьютерами Yandex’а, распределяя нагрузку так, чтоб их вычислительные мощности использовались более отлично.

Максим Бабенко, управляющий отдела технологий распределенных вычислений:

Yandex ведет разработку YTsaurus – либо YT, как мы называем ее снутри – с 2010 года. Мы начали строить свою экосистему для огромных данных, поэтому что ни одно из имевшихся на рынке решений не удовлетворяло всем нашим требованиям. На данный момент YTsaurus – один из главных частей внутренней инфраструктуры Yandex’а. Над платформой работают 10-ки разрабов, и ее способности повсевременно расширяются.

YTsaurus – отказоустойчивая и просто масштабируемая платформа. В Yandex’е она развернута на 10-ках тыщ серверов и обрабатывает экзабайты данных; с ней работает любой 2-ой работник компании. YTsaurus можно употреблять как традиционную MapReduce-систему, но при всем этом она поддерживает и остальные пользующиеся популярностью подходы к обработке данных. К примеру, у нее есть интеграции с ClickHouse и Apache Spark. Подробнее о способностях YTsaurus рассказывается в блоге Yandex’а на «Хабре».

Алексей Башкеев, управляющий Yandex Cloud:

Самую большую пользу YTsaurus может принести большим компаниям, которые обрабатывают огромные объемы данных на тыщах серверов в критериях повсевременно растущей перегрузки.

Начальный код и документация YTsaurus доступны на GitHub. Код распространяется под лицензией Apache 2.0. Применять платформу либо доработать ее под себя может хоть какой желающий.

Yandex открыл начальный код платформы для работы с большенными данными

Добавить комментарий Отменить ответ

Средства дороже свободы: Telegram ограничивает доступ к неким каналам по просьбе Apple

ФАС возбудила дело против Сбербанка за нарушение маркетингового законодательства

Как заполнить выдачу позитивом и получать больше клиентов из поиска

Как заработать на запуске веб-сайтов с партнерской программкой Аспро

Контент-стратегии в SMM: как и когда использовать, плюсы и недочеты, примеры от больших компаний

Yandex представил YandexART 1.3.

VK Cloud запустила пасмурный сервис Cloud Kafka

SEO для веб-сайта на Tilda: пошаговая {инструкция} + чек-лист

VK Реклама и YCLIENTS запустили инструмент для вербования клиентов

Контент-стратегии в SMM: как и когда использовать, плюсы и недочеты, примеры от больших компаний

Yandex представил YandexART 1.3.

VK Cloud запустила пасмурный сервис Cloud Kafka

SEO для веб-сайта на Tilda: пошаговая {инструкция} + чек-лист

Средства дороже свободы: Telegram ограничивает доступ к неким каналам по просьбе Apple

ФАС возбудила дело против Сбербанка за нарушение маркетингового законодательства

Как заполнить выдачу позитивом и получать больше клиентов из поиска

Как заработать на запуске веб-сайтов с партнерской программкой Аспро

Куда пойти учиться: как конкурировать с маркетплейсами в выдаче поисковых систем

Как уменьшить стоимость установки приложения на 51%: опыт сервиса «Максим»

30 ошибок при настройке рекламы в Яндекс.Директе

Гипотезы в digital: методы разработки, тестирование и оценка

7 трендов интернет-маркетинга на 2022 год