#стартапдня Snowflake предлагает своим клиентам Data Warehouse (как по-русски то?

#стартапдня Snowflake предлагает своим клиентам Data Warehouse (как по-русски то?) в облаке. Через красивый веб-интерфейс в систему можно загружать любые свои данные от Excel-файлов до многогигабайтных таблиц, ну а если счет идет на терабайты и гонять их через браузер – идея странная, то можно использовать готовые утилиты командной строки.

Следующий шаг после загрузки – собственно анализ. Предполагается, что большинство клиентов будут использовать встроенный SQL через всё тот же красивый веб-интерфейс, но и командная строка опять же никуда не делась. Для тех, кто не очень понимает, а зачем это вообще может быть надо, пара примеров, остальные могут три абзаца пропустить.

Пример 1. Выгружаем из своего магазина данные по всем заказам, загружаем их в Snowflake, и начинаем делать всякие запросы, пытаясь найти какие-нибудь закономерности или что-то интересное. Это можно было бы сделать в Excel, но Excel может и не переварить наш объём, это мог бы сделать программист, но программисты всегда чем-то заняты, это можно было бы сделать в своем аналогичном интерфейсе, но его делать надо, а программисты всегда чем-то заняты.

Пример 2. Выгружаем из своего сайта все логи, загружаем их в Snowflake и вечно там храним, а при каких-то авариях-расследованиях смотрим, что же этот пользователь или эта группа пользователей делали на сайте месяц назад. Или, например, статистику по уникам за определенный период в определенном разделе считаем. Это всё мог бы делать сисадмин с помощью grep/awk/sort, но хранить достаточно большие логи на Snowflake, пожалуй, что и дешевле, чем у себя, SQL работает быстрее grep, да и искусство утрачено, не все уже руками считать умеют.

Пример 3. С двух разных сайтов выгружаем их базы и смотрим на пересечения по пользователям, пытаясь увидеть, чем такие люди и их поведение отличается от остальных. Опять же, если аналитик знает SQL, то ему можно программиста не отвлекать, это всегда эффективнее выходит.

По сравнению с традиционными решениями облако дает свое главное классическое преимущество – оплата только за потребленное ресурсы, что во многих задачах может означать практически ноль. Хранение данных стоит 40$ в месяц за террабайт, это, конечно, дороже себестоимости (Амазон S3 – 23$), но для разумных объёмов полностью компенсируется отсутствием беспокойства. Цена вычислений зависит от тарифного плана, масштаб – несколько долларов в час. Для случая аналитика, работающего в интерактивном режиме, оплата за решение без следа растворится в зарплате специалиста.

От конкурентов клонов Snowflake защищен технической сложностью – попробуйте сделать SQL, который хоть как-то будет переваривать терабайты без лицензионных отчислений и профессионального DBA, думающего отдельно о каждой таблице.

Тема модная, красивые графики все рисовать любят, аналитики в любой американской компании есть, сервис им нравится, выручка растет, инвестиции растут. В последней сделке стартап получил 100 миллионов долларов по оценке около полумиллиарда.