1. Скачать [ДМК] Apache Arrow. Обработка больших данных в оперативной памяти (Мэтью Топол)

    Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения в оперативной памяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его...
  2. Робот

    Скачать Apache Kafka. Потоковая обработка и анализ данных. 2-е издание (Гвен Шапира, Тодд Палино)

    При работе любого корпоративного приложения образуются данные: файлы журналов, показатели, информация об активности пользователей, исходящие сообщения и другие. Правильное управление этими данными не менее важно, чем сами данные. Если вы архитектор, разработчик или инженер-технолог, но вы пока...
  3. Робот

    Скачать Apache Airflow и конвейеры обработки данных (Бас Харенслак, Джулиан де Руйтер)

    онвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания...
  4. Скачать [ДМК] Как на самом деле работают компьютеры (Джастис Мэтью)

    Оригинальное название: "How Computers Really Work: A Hands-On Guide to the Inner Workings of the Machine" Эта книга по экосистеме персонального компьютера: от оперативной памяти, тактовых сигналов и машинного кода до языков программирования, операционных систем и интернета. Но вы не просто...
  5. Робот

    Скачать [ДМК] Apache Pulsar в действии (Давид Хьеррумгор)

    Надежный обмен сообщениями между серверами является сердцем распределенного приложения. Apache Pulsar — это гибкая платформа обмена сообщениями в реальном времени, созданная для работы в Kubernetes и обеспечивающая масштабируемость и отказоустойчивость, необходимые для облачных систем. Pulsar...
  6. Скачать [ДМК] Инженерия данных в Python (Cuantum Technologies)

    Перед вами полноценный путеводитель в увлекательный мир обработки данных при помощи Pandas, NumPy и Scikit-learn. Она содержит множество примеров, которые помогут вам научиться преобразовывать сырые крупицы данных в настоящий шедевр из ценной информации и аналитических выводов. Книга написана...
  7. Робот

    Скачать Обработка больших данных (Джейд Картер)

    Книга является пособием для изучения технологий больших данных, охватывая основные и продвинутые аспекты работы с данными в распределенных системах. Начав с основ, она объясняет значение БД, их эволюцию и экосистему Hadoop, включая компоненты и инструменты: HDFS, MapReduce, Hive, Pig, HBase...
  8. Робот

    Скачать [Школа Больших Данных] Аналитика больших данных для руководителей (Николай Комиссаренко)

    Аналитика больших данных для руководителей Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса. О продукте: Сегодня...
  9. Робот

    Скачать [Школа больших данных] BDAM: Аналитика больших данных для руководителей (Николай Комиссаренко)

    BDAM: Аналитика больших данных для руководителей Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса. О продукте: Сегодня...
  10. Скачать Полный бред! Скептицизм в мире больших данных (Карл Бергстром)

    Книга о том, как распознавать ложь, дезинформацию, фейковые новости и не попасться на удочку красивых графиков, убедительной статистики и наукообразных терминов. В отличие от прямой лжи чушь звучит весьма правдоподобно. Это информация, про которую нельзя однозначно сказать, что она ложна, но...
  11. Скачать [Stepik] Apache Airflow для аналитиков данных (Дмитрий Новиков)

    Apache Airflow для аналитиков данных Какие темы затронем Разберем что такое пайплайн и зачем нам DAG Изучим основы Airflow и напишем первый скрипт Разберемся с архитектурой и интерфейсом Установим свой Airflow в Docker Погрузимся в best practices по разработке Что после? После курса полученных...
  12. Робот

    Скачать [ДМК] Анализ и визуализация данных в Yandex DataLens (Александр Гинько)

    Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных. Среди рассматриваемых тем: • подключение к данным из...
  13. Робот

    Скачать [ДМК] Анализ и визуализация данных в Yandex DataLens (Александр Гинько)

    Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных. Среди рассматриваемых тем: • подключение к данным из...
  14. Робот

    Скачать [ДМК] Анализ и визуализация данных в Yandex DataLens (Александр Гинько)

    Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных. Среди рассматриваемых тем: • подключение к данным из...
  15. Робот

    Скачать [ДМК] Анализ и визуализация данных в Yandex DataLens (Александр Гинько)

    Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных. Среди рассматриваемых тем: • подключение к данным из...
  16. Робот

    Скачать [Школа Больших Данных] GreenPlum для инженеров данных

    Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД Введение в GreenPlum Архитектура GreenPlum Партиционирование таблиц, индексы Транзакции и блокировки Оптимизация и планы запросов Лабораторная работа Часть 2. Внешние данные и код: GreenPlum как агрегатор данных и исполнитель кода...
  17. Скачать [ДМК] Визуализация данных при помощи дашбордов и отчетов в Excel (Дик Куслейка)

    Эта книга научит вас мыслить новыми категориями, а не просто представлять данные в виде строк и столбцов. Вы сможете перекинуть мостик от элементарной работы с данными к их систематизации и выстраиванию на их основе полноценных историй. Узнаете, как обращаться с выбросами и представлять...
  18. Робот

    Скачать [teachmeskills] Инженер данных 2024 (Дмитрий)

    О профессии: Онлайн-образование в IT-школе TeachMeSkills предлагает курсы по профессии Data Engineer, которые станут отличным стартом для тех, кто хочет стать инженером данных. Инженер данных, играет ключевую роль в обработке и анализе больших объемов данных. Твой результат в конце курса: 1...
  19. Робот

    Скачать [Школа больших данных] PRAR: Практическая архитектура данных (Михаил Королев)

    PRAR: Практическая архитектура данных Классические методы, современные подходы и лучшие практики архитектуры и интеграции данных для проектных команд. На примерах платформенных решений, корпоративных фабрик данных, микросервисов и веб-приложений. Архитектура данных (Data Architecture): Это...
  20. Робот

    Скачать [МФТИ] Инженер Данных. Data Engineer 2023. Часть 7 из 10 (Гайк Инанц, Илья Склонин, Олег Ивченко)

    Программа "Профессия Data Engineer": 1 курс "Старт в Data Engineering" - Автоматизируете процессы сбора, очистки и анализа реальных данных без разработчиков (ETL) - Освоите инструменты: Git, SQL, базовый Python - Научитесь работать с хранилищами данных (DWH) 2 курс "Python: основы языка" -...
Сверху