Вы используете устаревший браузер. Этот и другие сайты могут отображаться в нём некорректно. Вам необходимо обновить браузер или попробовать использовать другой.
Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения воперативнойпамяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его...
При работе любого корпоративного приложения образуются данные: файлы журналов, показатели, информация об активности пользователей, исходящие сообщения и другие. Правильное управление этими данными не менее важно, чем сами данные. Если вы архитектор, разработчик или инженер-технолог, но вы пока...
Робот
Тема
apache kafka
анализ данных
гвен шапира
обработкаданных
потоковая обработка и анализ данных
тодд палино
онвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания...
Робот
Тема
apache airflow
apache airflow и конвейеры обработки данных
data pipelines with apache airflow
бас харенслак
джулиан де руйтер
дмк пресс
Оригинальное название: "How Computers Really Work: A Hands-On Guide to the Inner Workings of the Machine"
Эта книга по экосистеме персонального компьютера: от оперативнойпамяти, тактовых сигналов и машинного кода до языков программирования, операционных систем и интернета. Но вы не просто...
Aноним
Тема
джастис мэтью
дмк
интернет
компьютер
программирование
роботы
Надежный обмен сообщениями между серверами является сердцем распределенного приложения. Apache Pulsar — это гибкая платформа обмена сообщениями в реальном времени, созданная для работы в Kubernetes и обеспечивающая масштабируемость и отказоустойчивость, необходимые для облачных систем. Pulsar...
Робот
Тема
apache pulsar в действии
kubernetes
pulsar
давид хьеррумгор
обмен сообщениями между серверами
Перед вами полноценный путеводитель в увлекательный мир обработки данных при помощи Pandas, NumPy и Scikit-learn. Она содержит множество примеров, которые помогут вам научиться преобразовывать сырые крупицы данныхв настоящий шедевр из ценной информации и аналитических выводов. Книга написана...
Книга является пособием для изучения технологий большихданных, охватывая основные и продвинутые аспекты работы с данными в распределенных системах. Начав с основ, она объясняет значение БД, их эволюцию и экосистему Hadoop, включая компоненты и инструменты: HDFS, MapReduce, Hive, Pig, HBase...
Робот
Тема
анализ информации
джейд картер
обучение программированию
самоучитель
Аналитика большихданных для руководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.
О продукте:
Сегодня...
Робот
Тема
02-06-2024
аналитика большихданных для руководителей
николай комиссаренко
школа большихданных
BDAM: Аналитика большихданных для руководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.
О продукте:
Сегодня...
Робот
Тема
bdam
bigdataschool
аналитика большихданных для руководителей
николай комиссаренко
школа большихданных
Книга о том, как распознавать ложь, дезинформацию, фейковые новости и не попасться на удочку красивых графиков, убедительной статистики и наукообразных терминов.
В отличие от прямой лжи чушь звучит весьма правдоподобно. Это информация, про которую нельзя однозначно сказать, что она ложна, но...
Aноним
Тема
больших
бред
данных
джевин уэст
карл бергстром
миф
полный
полный бред
скептицизм
скептицизм в мире большихданных
Apache Airflow для аналитиков данных
Какие темы затронем
Разберем что такое пайплайн и зачем нам DAG
Изучим основы Airflow и напишем первый скрипт
Разберемся с архитектурой и интерфейсом
Установим свой Airflow в Docker
Погрузимся в best practices по разработке
Что после?
После курса полученных...
Aноним
Тема
airflow
apache airflow для аналитиков данных
dmitriy novikov
etl
etl-процессы
stepik
аналитика
аналитики данных
дмитрий новиков
Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных.
Среди рассматриваемых тем:
• подключение к данным из...
Робот
Тема
yandex datalens
александр гинько
анализ и визуализация данныхв yandex datalens
дмк
Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных.
Среди рассматриваемых тем:
• подключение к данным из...
Робот
Тема
yandex datalens
александр гинько
анализ и визуализация данныхв yandex datalens
дмк
Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных.
Среди рассматриваемых тем:
• подключение к данным из...
Робот
Тема
yandex datalens
александр гинько
анализ и визуализация данныхв yandex datalens
дмк
Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных.
Среди рассматриваемых тем:
• подключение к данным из...
Робот
Тема
yandex datalens
александр гинько
анализ и визуализация данныхв yandex datalens
дмк
Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД
Введение в GreenPlum
Архитектура GreenPlum
Партиционирование таблиц, индексы
Транзакции и блокировки
Оптимизация и планы запросов
Лабораторная работа
Часть 2. Внешние данные и код: GreenPlum как агрегатор данных и исполнитель кода...
Робот
Тема
17-10-2022
greenplum
greenplum для инженеров данных
инженер данных
школа большихданных
Эта книга научит вас мыслить новыми категориями, а не просто представлять данные ввиде строк и столбцов. Вы сможете перекинуть мостик от элементарной работы с данными к их систематизации и выстраиванию на их основе полноценных историй. Узнаете, как обращаться с выбросами и представлять...
Aноним
Тема
excel
визуализация данных
дашборд
дик куслейка
дмк
отчеты в excel
О профессии:
Онлайн-образование в IT-школе TeachMeSkills предлагает курсы по профессии Data Engineer, которые станут отличным стартом для тех, кто хочет стать инженером данных. Инженер данных, играет ключевую роль в обработке и анализе больших объемов данных.
Твой результат в конце курса:
1...
Робот
Тема
apache airflow
python
teachmeskills
дмитрий
инжинер данных
PRAR: Практическая архитектура данных
Классические методы, современные подходы и лучшие практики архитектуры и интеграции данных для проектных команд.
На примерах платформенных решений, корпоративных фабрик данных, микросервисов и веб-приложений.
Архитектура данных (Data Architecture):
Это...
Робот
Тема
bigdataschool
data architecture
prar
михаил королев
практическая архитектура данных
школа большихданных
Программа "Профессия Data Engineer":
1 курс "Старт в Data Engineering"
- Автоматизируете процессы сбора, очистки и анализа реальных данных без разработчиков (ETL)
- Освоите инструменты: Git, SQL, базовый Python
- Научитесь работать с хранилищами данных (DWH)
2 курс "Python: основы языка"
-...
Робот
Тема
apache hive
apache kafka
data engineer 2023
hdfs
mapreduce
nosql
yarn
инженер данных
мфти
часть 7