Все курсы
Администрирование Arenadata Streaming Kafka
Код курса | Даты начала курса | Стоимость обучения | Длительность обучения | Формат обучения |
---|---|---|---|---|
ADS-KAFKA | по запросу |
72 000 руб. | 24 ак.часов | Дистанционный |
Регистрация |
3 дня практического обучения администрированию и эксплуатации Arenadata Streaming — отечественной корпоративной платформы потоковой обработки данных в режиме реального времени на базе Apache Kafka и Apache Nifi – проектов с открытым исходным кодом.
Что такое Arenadata Streaming
Arenadata Streaming (ADS) – эффективное масштабируемое отказоустойчивое решение для потоковой обработки данных в режиме реального времени, зарегистрированное в государственном реестре программ для ЭВМ, адаптированное для корпоративного использования и построенное на базе проектов с открытым исходным кодом – Apache Kafka и Apache Nifi.
Платформа передачи потоковой информации Arenadata Streaming обеспечит надежное хранение и оперативную обработку потоков записей по мере их возникновения в системах реального времени. На практике эта система используется для реализации оперативных и безопасных процессов сбора, агрегации, обработки и передачи информации от:
- устройств интернета вещей (Internet Of Things);
- внешних баз данных;
- Big Data сервисов и распределенных приложений.
Arenadata Streaming зарегистрирована в Едином реестре российских программ, соответствует политике импортозамещения и может использоваться в проектах цифровизации государственных организаций и частных компаний России.
О курсе Arenadata Streaming Kafka
3 дня практического обучения для специалистов, желающих получить и систематизировать знания по использованию платформы Arenadata Streaming Kafka для организации распределенной потоковой обработки событий (Event Streaming Processing) в реальном времени. Курс администрирования Arenadata Streaming построен на реальных примерах и содержит расширенные сведения по установке распределенного кластера Arenadata Streaming Kafka, настройке безопасности Kerberos и интеграции с другими продуктами мониторинга и оптимизации Kafka в соответствии с лучшими практиками (best practices). Для операций развертывания и управления кластером Arenadata Streaming используется консоль ADCM.
Соотношение теории к практике 40/60
По завершении курса вы получите следующие документы:
- сертификат нашего учебного центра «Школа Больших Данных».
Кому нужен курс администрирования Arenadata Streaming
Практический курс администрирования Arenadata Streaming предназначен для системных администраторов, инженеров данных и разработчиков Big Data, которые хотят:
- изучить методы администрирования и настройки кластера Arenadata Streaming Kafka;
- узнать примеры интеграции Аренадата Кафка со сторонними системами;
- получить навыки мониторинга и оптимизации кластера Kafka с использованием лучших практик:
- освоить методы настройки безопасности Kafka с SSL и Kerberos.
Необходимая предварительная подготовка
- Знание базовых команд Linux (опыт работы с командной строкой, файловой системой , POSIX, текстовыми редакторами vi, nano)
- Основы Hadoop
Программа курса Arenadata Streaming KAFKA
1. Введение в Arenadata Streaming
- Архитектурные особенности Arenadata Streaming
- Что такое Kafka?
- Сценарии использования Kafka
- Компоненты Kafka и Kafka экосистемы дистрибутива ADS (Arenadata Streaming)
- Кластер Zookeeper
- Потоковая Обработка Событий (Event Stream Processing): терминология и основные концепции
2. Основные концепции Kafka
- Как работает Kafka: Топики (Topics) и партиций (Partitions). Репликация данных
- Брокеры (Brokers): Развертывание. Конфигурация Multibroker
- Поставщики данных (Producers): Типы партиций. Синхронные и асинхронные Producers Параметры конфигурации. Java API
- Потребители данных (Consumers): Очереди Consumers. Широковещание (Broadcasting)
3. Установка кластера Arenadata Streaming
- Требования по установке кластера
- Автоматизация развертывания с использованием ADCM – Arenadata Cluster Manager
- Установка и настройка кластера Zookeeper: Настройка кворума. Конфигурация сервисов и файловой системы. Оптимизация и отказоустойчивость Zookeeper
- Установка и настройка кластера Kafka: Планирование установки и sizing кластера Типовые проблемы при установке. Запуск и первоначальное конфигурирование Kafka. Конфигурация Listeners
- Установка кластера Kafka на Yandex Cloud
4. Базовые операции в Kafka
- Семантика операций в Arenadata Streaming.
- Гарантия очередности. Гарантия доставки.
- Операции с Топиками (Topic)
- Публикация данных с консольного Producer
- Получение данных с консольного Consumer
- Разбор примера кода producer
- Разбор примера кода consumer
5. Оптимизация кластера Kafka
- Выполнение операций обслуживания кластера Arenadata Streaming с ADCM
- Оптимизация производительности компонент кластера
- Масштабирование кластера
- Балансировка разделов(partition) и использование Partition Reassignment Tools в Kafka Topics
- Мониторинг кластера Kafka с использованием Grafana и JMX
- Best Practices
6. Интеграция Arenadata Streaming с Arenadata Hadoop
- Использование Arenadata NiFi для потоковой обработки данных
- Интеграция Apache Hadoop с Kafka для файловых операций с HDFS
7. Расширенная конфигурация кластера Kafka
- Геораспределенная конфигурация с использованием ADS Mirror Maker
- Расширенная конфигурация топиков (Topic): Изменение конфигурации топиков. Sizing (количество партиций и фактор репликации). Сегменты и индексы. Политика очистки логов (Log Cleanup Policy). Сжатие и консолидация данных в логах.
- Настройка Schema Registry
8. Безопасность в Kafka
- Шифрование SSL: Установка центра сертификатов (CA), настройка SSL для Kafka кластера и клиентов.
- Аутентификация SSL/SASL
- Аутентификация Kerberos: Настройка Keytabs и principals. Настройка кластера Kafka и клиентов для поддержки Kerberos.
- Авторизация в Управление списками управления доступом (ACL)
Примечание: Обучение проводится на Community версии ADS Arenadata Streaming ( Для корпоративных курсов возможно проведение курса на Enterprise Edition при наличии лицензии Заказчика)
Кто проводит курс
Комиссаренко Николай
Томский Политехнический Институт (Томск, 1994)
Профессиональные компетенции:
- Сертифицированный тренер Arenadata (2019)
- Построение Data Lake и аналитика больших данных на решениях Arenadata, Cloudera, HortonWorks, EMC (Hadoop, Isilon), Pivotal, облачные решения, cистемы хранения данных уровня enterprise, информационная безопасность
- EMC Certified Instructor (2007)
- Dell EMC Specialist – Cloud Architect (2006)
- Dell EMC XtremeIO, Isilon – Storage Aministrator, Data Science Specialist (2006)
- IT Service Manager (2006)
- Certified Information System Security Professional (CISSP) (2006 -2010)
- Certified Information Security Manager (CISM)
География наших клиентов
- Москва
- Санкт-Петербург
- Нижний Новгород
- Екатеринбург
- Казань
- Краснодар
- Красноярск
- Перьм
- Челябинск
- Новосибирск
- Томск
- Тверь
- Саратов
- Самара
- Ростов-на-Дону
- Хабаровск
- Волгоград
- Калуга
- Якутск
- Севастополь
- Тольяти
- Владивоссток
- Тюмень
- Южно-Сахалинск
- Уфа
- Ставрополь
- Минск
- Алматы
- Астана
- Ташкент
- Душанбе
- Бешкек