AWS на русском

Viktor Vedmich

Подкаст ”AWS на русском”. Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Лучшие практики и свежие новости из мира AWS в формате интервью на русском языке. Смотрите и слушайте #awsнарусском

  1. May 12

    068. Redis → Valkey в inDrive: история миграции 500 кластеров

    8 миллионов поездок в день, 500 кластеров Redis в 8 регионах AWS, и всё это смигрировали на Valkey силами двух инженеров за два месяца. История inDrive. В новом выпуске подкаста «AWS на русском» говорим с Vadym Voitiuk (Principal SA, AWS) и командой inDrive (Alexander Lisachenko, Solution Architect + Artem Gab, Engineering Manager) про Redis, Valkey и ElastiCache в масштабе ride-hailing: 🔹 inDrive в цифрах: 48 стран, 1000+ городов, 8M поездок в день и миллионы водителей в real-time телеметрии 🔹 Каир-проблема: одна city_id = один hot slot. Почему m6g.24xlarge (96 ядер) не спасла, и как однопоточный Redis завалил прод 🔹 H3 гексагоны от Uber как новый ключ шардирования: разблокировали горизонтальное масштабирование по shard 🔹 Микросервисная архитектура: от коммунального Redis к Redis per microservice per region, blast radius сократили с мира до страны 🔹 Миграция 500 кластеров OSS Redis -> Valkey: 2 инженера × 2 месяца × zero-downtime через AWS online engine migration, ~20% экономии подтверждено CUDOS Будет полезно SRE, DevOps и архитекторам, у кого Redis/Valkey под серьёзной geo-нагрузкой, и всем, кто думает про переезд с self-managed Redis на ElastiCache или с Redis OSS на Valkey. 💡 Обычный CPUUtilization врёт на Redis/Valkey: при outage может показывать «всё ок». Смотреть надо на EngineCPUUtilization. Redis однопоточный, и именно оно показывает загрузку того самого «золотого» ядра, которое работает с данными. 🎧 Доступно на любимой платформе: • YouTube, Podbean, Apple Podcasts, Яндекс Музыка, Spotify, RSS (ссылки ниже) 💬 А у вас Redis прячет свой «золотой» core? Какие метрики мониторите в ElastiCache на проде? #Redis #Valkey #ElastiCache #H3 #inDrive #AWS #Подкаст #AWSнаРусском Навигация (Podbean) (0:00) Introduction (0:57) Гость AWS - Вадим Войтюк (1:05) inDrive: Саша (SA) + Артём (Engineering Manager) (1:51) Что такое inDrive: ride-hailing с аукционом цены, 48 стран (4:28) Масштаб: 8M поездок в день и real-time телеметрия водителей (7:07) Почему Redis: геоиндексы для dispatch и Ленты (9:31) GEOADD, проекция Меркатора и геоподводные камни (10:27) Старый подход: city_id и hot slot на мегаполис (12:32) «Каир-проблема»: всё упирается в одно ядро (13:21) Redis на железе в виде «ёлочки» (16:27) Миграция в ElastiCache: один shard на 90% CPU (18:00) m6g.24xlarge не спас: Redis однопоточный (19:01) Нет контроля над распределением cluster slots (20:53) Первый rollback с production (22:14) Решение: H3 гексагоны от Uber (26:20) Временный Redis operator в EKS (28:50) Сейчас: ~500 кластеров × 8 регионов (29:52) Redis как hard dependency микросервиса (32:14) Engine CPU: ключевая метрика (34:33) Scale by shards vs by nodes (35:35) T-family baseline, кредиты, переход на M-family (38:37) Переезд на Valkey (39:06) 20% экономии по CUDOS (42:46) 500 кластеров × 2 инженера × 2 месяца (45:18) Online engine migration: zero-downtime (48:08) Graviton как дефолт для managed-сервисов (49:57) Топ метрик: engine CPU, memory, network (52:06) Секретная метрика Geospatial CMDS latency (53:00) Connection storming как предиктор cascade failure (55:46) TLS offloading + IO multiplexing на Valkey large+ (58:55) Wish-list: network autoscaling + гибридный (1:00:23) Итоги   YouTube: https://youtu.be/LZLvJJvePSo Podbean: https://awsinrussian.podbean.com/ Apple Podcast: https://podcasts.apple.com/by/podcast/aws-на-русском/id1600771698 Яндекс.Музыка: https://music.yandex.ru/album/20088544 Spotify: https://open.spotify.com/show/4kOoih4FvHqyK5mLF3E42J RSS: https://feed.podbean.com/awsinrussian/feed.xml

    1h 2m
  2. Apr 2

    067. Agentic AI паттерны: от чат-бота до мультиагентных систем

    Думаете, промпт-инжиниринг — это про текст? В агентских системах промпт стал целеполаганием, а контекст агент собирает сам. В новом выпуске подкаста «AWS на русском» говорим с Фёдором Павловым (SA, AWS, обладатель всех 12 сертификатов) о паттернах Agentic AI: 🔹 Чем агентская система отличается от обычного LLM — 3 принципа: автономность, агентность, асинхронность 🔹 Строительные блоки агента — prompting, retrieval (RAG), tool use (MCP), memory 🔹 Memory: short-term vs long-term vs RAG — как устроена память агента и почему LLM «глупеет» от перегруженного контекста 🔹 Cognition augmented vs event-driven — почему агентские архитектуры гибче, но требуют guardrails и мониторинга 🔹 8 паттернов — от tool-based и coding agents до multi-agent collaboration и simulation Будет полезно разработчикам, архитекторам и DevOps-инженерам, которые хотят разобраться в Agentic AI от базовых концептов до мультиагентных систем. 💡 LLM «глупеет» от перегруженного контекста — поэтому long-term memory сжимает старые данные через саму LLM, сохраняя только то, что модели действительно важно. 🎧 Доступно на любимой платформе: • YouTube, Podbean, Apple Podcasts, Яндекс Музыка, Spotify, RSS (ссылки ниже) 💬 Вы уже строите агентские системы? Какие паттерны используете? Делитесь в комментариях! #AgenticAI #LLM #MCP #AWS #Подкаст #AWSнаРусском #AIAgents Навигация (Podbean) (0:00) Introduction (0:46) Представление гостя — Фёдор Павлов (3:06) Чем Agentic AI отличается от обычного LLM (5:27) 3 принципа: автономность, агентность, асинхронность (8:10) Измерения работы агента: reasoning, действия, восприятие (11:03) RAG и retrieval (11:45) Memory: short-term (15:36) Long-term memory — компрессия через LLM (23:53) Long-term memory vs RAG (27:11) Event-driven vs cognition augmented (31:34) Трейд-оффы: стоимость, вероятность, мониторинг (35:12) Обзор Agentic AI паттернов (40:21) Speech/voice agents (43:45) Workflow orchestration agents (48:52) Multi-agent collaboration (50:26) Итоги Навигация (YouTube) 00:00:00 – Начало 00:00:46 – Представление гостя — Фёдор Павлов 00:03:06 – Чем Agentic AI отличается от обычного LLM 00:05:27 – 3 принципа: автономность, агентность, асинхронность 00:08:10 – Измерения работы агента: reasoning, действия, восприятие 00:11:03 – RAG и retrieval 00:11:45 – Memory: short-term 00:15:36 – Long-term memory — компрессия через LLM 00:23:53 – Long-term memory vs RAG 00:27:11 – Event-driven vs cognition augmented 00:31:34 – Трейд-оффы: стоимость, вероятность, мониторинг 00:35:12 – Обзор Agentic AI паттернов 00:40:21 – Speech/voice agents 00:43:45 – Workflow orchestration agents 00:48:52 – Multi-agent collaboration 00:50:26 – Итоги YouTube: https://www.youtube.com/watch?v=VIDEO_ID&list=PLxtckYH8Cdy_WT5tcCITt_f61Zr2qQJbL Podbean: https://awsinrussian.podbean.com/ Apple Podcast: https://podcasts.apple.com/by/podcast/aws-на-русском/id1600771698 Яндекс.Музыка: https://music.yandex.ru/album/20088544 Spotify: https://open.spotify.com/show/4kOoih4FvHqyK5mLF3E42J RSS: https://feed.podbean.com/awsinrussian/feed.xml

    53 min
  3. Feb 27

    066. Как AI меняет роль архитектора

    Раньше демка занимала 2 недели. Сейчас — 6 часов. И 70% времени уходит не на код, а на то, что действительно важно. Как AI меняет роль архитектора? В новом выпуске подкаста «AWS на русском» говорим с Евгением, руководителем группы архитекторов в AWS, о том, как AI трансформирует работу и ценность технических ролей: 🔹 Технические вопросы: AI отвечает на 90% из них за секунды — эксперимент на реальных кейсах 🔹 Архитектура: почему «что делать» становится важнее «как делать» и роль контекста 🔹 Билдинг: от 2 недель к 6 часам — революция в прототипировании с AI-инструментами 🔹 Обучение: почему пробовать руками важнее, чем проходить курсы, и как AI меняет процесс 🔹 Будущее ролей: от T-shape к «многоножка-shape» — модель эксперта-дженералиста Будет полезно архитекторам, senior-инженерам и техлидам, которые задумываются о развитии карьеры в эпоху AI. 💡 AI справляется с 90% технических вопросов, но собрать правильный контекст, понять бизнес и координировать людей — это то, что определяет ценность архитектора сегодня. 🎧 Доступно на любимой платформе: • YouTube, Podbean, Apple Podcasts, Яндекс Музыка, Spotify, RSS (ссылки ниже) 💬 Как AI изменил вашу работу? Что стало проще, а что — сложнее? Делитесь в комментариях! #AI #SolutionArchitect #AWS #Архитектура #CareerGrowth #Подкаст #AWSнаРусском Навигация (Podbean) (0:00) Introduction (0:32) Представление гостя — Евгений (3:10) Чем занимается архитектор: список активностей (5:11) Технические вопросы и AI: 90% замена (9:19) Архитектура: контекст важнее технических знаний (16:43) Билдинг: от 2 недель до 6 часов (25:20) Обучение: как AI меняет процесс (32:58) Изменение ролей (39:00) Эксперт-дженералист: как оставаться на коне (49:28) Заключение Навигация (YouTube) 00:00:00 – Начало 00:00:32 – Представление гостя — Евгений 00:03:10 – Чем занимается архитектор: список активностей 00:05:11 – Технические вопросы и AI: 90% замена 00:09:19 – Архитектура: контекст важнее технических знаний 00:16:43 – Билдинг: от 2 недель до 6 часов 00:25:20 – Обучение: как AI меняет процесс 00:32:58 – Изменение ролей 00:39:00 – Эксперт-дженералист: как оставаться на коне 00:49:28 – Заключение YouTube: https://www.youtube.com/watch?v=VIDEO_ID&list=PLxtckYH8Cdy_WT5tcCITt_f61Zr2qQJbL Podbean: https://awsinrussian.podbean.com/ Apple Podcast: https://podcasts.apple.com/by/podcast/aws-на-русском/id1600771698 Яндекс.Музыка: https://music.yandex.ru/album/20088544 Spotify: https://open.spotify.com/show/4kOoih4FvHqyK5mLF3E42J RSS: https://feed.podbean.com/awsinrussian/feed.xml

    52 min
  4. 08/29/2025

    065. ClickHouse на AWS: скорость данных для AI и аналитики

    Думаете, колоночная БД — это «узкая ниша» для дата-гуру? Знаете ли вы, что ClickHouse ставит рекорды по вставке данных и теперь разворачивается в AWS… одним кликом? В новом выпуске подкаста «AWS на русском» говорим с Дмитрием Павловым (ClickHouse) о том, как построить молниеносную аналитику и подготовить данные для LLM: 🔹 Что такое ClickHouse и зачем он бизнесу 🔹 Marketplace в AWS: биллинг одной кнопкой 🔹 Real-time дашборды — для Tesla, OpenAI и Anthropic 🔹 ClickHouse + MCP: интеграция, которую клиенты сразу начали юзать 🔹 Уроки внедрения: метаданные, контекст и cost optimization   💡 Инсайт: подробное описание таблиц и бизнес-процессов снижает порог входа так сильно, что даже нетехнари начинают писать SQL-запросы сами.     🎧 Доступно на любимой платформе: • YouTube, Podbean, Apple Podcasts, Яндекс Музыка, Spotify, RSS (ссылки ниже) 💬 Какие метрики вашей системы сегодня тормозят больше всего — и попробовали бы вы мигрировать их в ClickHouse? #ClickHouse #AWS #DataAnalytics #AI #Database #Подкаст #AWSнаРусском   Навигация (Podbean) (0:00) Introduction (0:59) Что такое ClickHouse (6:02) ClickHouse в AWS Marketplace (14:59) Real-time дашборды клиентов (23:45) ClickHouse + AI/LLM (36:06) Lessons learned и cost optimization (48:09) Итоги и планы   Навигация (YouTube) 00:00:00 – Начало 00:00:59 – Что такое ClickHouse 00:06:02 – ClickHouse в AWS Marketplace 00:14:59 – Real-time дашборды клиентов 00:23:45 – ClickHouse + AI/LLM 00:36:06 – Lessons learned и cost optimization 00:48:09 – Итоги и планы   YouTube: https://www.youtube.com/watch?v=IhDf_c1icRE&list=PLxtckYH8Cdy_WT5tcCITt_f61Zr2qQJbL Podbean: https://awsinrussian.podbean.com/ Apple Podcast: https://podcasts.apple.com/by/podcast/aws-%D0%BD%D0%B0-%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%BE%D0%BC/id1600771698 Яндекс.Музыка: https://music.yandex.ru/album/20088544 Spotify: https://open.spotify.com/show/4kOoih4FvHqyK5mLF3E42J RSS: https://feed.podbean.com/awsinrussian/feed.xml

    49 min
  5. 08/07/2025

    064. MCP: Как подключить любой инструмент к AI за 5 минут?

    Думаете, интеграция искусственного интеллекта с вашими внутренними системами — это всегда сложно и долго? А что, если существует стандарт, который упрощает этот процесс до уровня подключения USB? В новом выпуске подкаста "AWS на русском" вместе с Фёдором Павловым и Михаилом Голубевым разбираемся, что такое Model Context Protocol (MCP) и как он меняет правила игры для AI-приложений. 🔹 Что такое MCP? Объясняем на простом примере — это как Telegram-боты, только для больших языковых моделей (LLM). 🔹 Клиент или сервер? Разбираемся, с какой стороны начать разработку и почему вы, скорее всего, будете писать сервер. 🔹 Безопасность прежде всего: Кто отвечает за защиту от prompt injection и как обезопасить свои инструменты? 🔹 Практическое применение: Обсуждаем, как компании вроде PayPal уже используют MCP для расширения своих возможностей.   💡 Инсайт: MCP превращает "M×N проблему" интеграции (M приложений × N инструментов) в гораздо более простую "M+N проблему", создавая единый стандарт для взаимодействия. 🎧 Слушайте на любимой платформе: YouTube Podbean Apple Podcast Яндекс.Музыка Spotify RSS 💬 Какие инструменты вы бы хотели подключить к AI в первую очередь? Делитесь идеями в комментариях!     Навигация для Podbean: (0:00) Introduction: почему мы снова говорим про MCP? (2:45) Что такое MCP: клиент-серверный протокол для LLM (6:47) Как начать разработку: клиентская или серверная часть? (7:47) Аналогия с USB-C и решение "M x N проблемы" интеграции (12:53) Как на практике подключить MCP-сервер? (17:58) Практические примеры: Agentic Coding и доступ к файлам (19:45) Кто уже использует MCP: пример с PayPal (23:36) Вопросы безопасности и Prompt Injection (24:33) MCP — это замена агентов? (29:53) Анонс тем для следующего выпуска: Prompt Caching, CLine и другие Навигация для YouTube: 00:00:00 - Вступление: почему мы снова говорим про MCP? 00:02:45 - Что такое MCP: клиент-серверный протокол для LLM 00:06:47 - Как начать разработку: клиентская или серверная часть? 00:07:47 - Аналогия с USB-C и решение "M x N проблемы" интеграции 00:12:53 - Как на практике подключить MCP-сервер? 00:17:58 - Практические примеры: Agentic Coding и доступ к файлам 00:19:45 - Кто уже использует MCP: пример с PayPal 00:23:36 - Вопросы безопасности и Prompt Injection 00:24:33 - MCP — это замена агентов? 00:29:53 - Анонс тем для следующего выпуска: Prompt Caching, CLine и другие

    32 min
  6. 07/08/2025

    063. Расширяем контекст LLM: от RAG до агентов — как победить ограничения AI?

    Думаете, увеличение контекстного окна до миллионов токенов решает все проблемы? На самом деле модели всё равно теряют фокус, упускают важные детали в середине и страдают от информационной перегрузки! В этом выпуске обсуждаем: 🔹 Retrieval-Augmented Generation (RAG): как эта технология борется с "галлюцинациями" и устаревшими данными, обогащая ответы AI. 💡 GraphRAG: почему семантические графы — это следующий шаг в понимании сложных связей в данных, и как это меняет игру. 🎧 Tools и Function Calling: как научить модель взаимодействовать с внешним миром, получать актуальную информацию и выполнять действия через API. 💬 AI-агенты: как мы переходим от простых диалоговых сценариев к автономным системам, способным самостоятельно планировать и выполнять задачи. Этот выпуск будет особенно полезен разработчикам и архитекторам, которые хотят создавать более умные и автономные AI-решения, используя такие инструменты, как Amazon Bedrock. 💡 Узнаете, почему Nova Micro в 27 раз дешевле популярных моделей и как правильно декомпозировать документы для векторного поиска с учётом прав доступа. Навигация для Podbean: (0:00) Introduction (3:15) Проблема ограниченного контекста в LLM (8:40) Что такое RAG и как он обогащает запросы? (15:20) GraphRAG: новый уровень работы с данными через графы (22:10) Tools и Function Calling: как научить LLM действовать? (28:55) От диалоговых флоу к автономным AI-агентам (35:30) Анонс следующего эпизода: что такое MCP? Навигация для YouTube: 00:00:00 - Начало 00:03:15 - Проблема ограниченного контекста в LLM 00:08:40 - Что такое RAG и как он обогащает запросы? 00:15:20 - GraphRAG: новый уровень работы с данными через графы 00:22:10 - Tools и Function Calling: как научить LLM действовать? 00:28:55 - От диалоговых флоу к автономным AI-агентам 00:35:30 - Анонс следующего эпизода: что такое MCP?   🎧 Слушайте на любимой платформе: • YouTube • Podbean • Apple Podcast • Яндекс.Музыка • Spotify • 💬 Какие подходы к расширению контекста используете вы? Пробовали Graph RAG в продакшене? #AWS #AI #RAG #GraphRAG #LLM

    41 min
  7. 062. Масштабирование ML в AWS: От Исследований до Миллионов Предсказаний

    04/10/2025

    062. Масштабирование ML в AWS: От Исследований до Миллионов Предсказаний

    Как построить ML-систему, которая обрабатывает десятки миллионов предсказаний в месяц? Особенно когда речь идет о критически важном производственном процессе! В новом выпуске подкаста "AWS на русском" мы говорим с AWS ML Hero Рустемом (Rustem Feyzkhanov) о том, как масштабировать ML-системы в облаке от этапа исследований до промышленного внедрения: 🔹 Как построить эффективный ML-пайплайн для автоматического обучения моделей 🔹 Почему SageMaker Training Jobs и AWS Lambda — идеальная комбинация для масштабирования 🔹 Как оптимизировать расходы на ML-инфраструктуру с помощью spot-инстансов 🔹 Секреты мониторинга и отладки ML-систем в продакшене Этот выпуск будет особенно полезен ML-инженерам, DevOps-специалистам и техническим лидам, которые работают над масштабированием ML-решений в облаке. 💡 Узнаете, как сократить время итерации ML-экспериментов с дней до часов и автоматизировать процесс вывода моделей в продакшен. Навигация для Podbean: • (0:00) Введение и представление гостя • (5:30) Особенности AutoML платформы • (15:45) ML-пайплайны и инфраструктура • (25:20) Масштабирование и оптимизация • (35:10) Мониторинг и поддержка • (45:30) Рекомендации и выводы Навигация для YouTube: 00:00:00 - Начало 00:05:30 - Особенности AutoML платформы 00:15:45 - ML-пайплайны и инфраструктура 00:25:20 - Масштабирование и оптимизация 00:35:10 - Мониторинг и поддержка 00:45:30 - Рекомендации и выводы 🎧 Слушайте на любимой платформе: • YouTube • Podbean • Apple Podcast • Яндекс.Музыка • Spotify • RSS 💬 А как вы решаете задачи масштабирования ML-систем? Делитесь опытом в комментариях! #AWS #MachineLearning #SageMaker #MLOps

    34 min
  8. 03/20/2025

    061. Prompt Engineering: Как заставить AI работать на максимум?

    Думаете, достаточно просто задать вопрос искусственному интеллекту и получить идеальный ответ? На самом деле всё гораздо интереснее! В новом выпуске подкаста "AWS на русском" мы с Федором Павловым погружаемся в мир prompt engineering и раскрываем секреты эффективного взаимодействия с LLM: 🔹 Почему простой вопрос — это часто ошибочная стратегия 🔹 Как правильно задавать контекст и роли для AI 🔹 Few-shot learning: магия примеров в действии 🔹 Продвинутые техники для улучшения качества ответов Особенно интересно будет разработчикам, которые хотят повысить свою продуктивность с помощью AI-инструментов, таких как Amazon Q Developer. 💡 Узнаете, почему фраза "думай пошагово" творит чудеса с AI и как избежать типичных ошибок при составлении промптов. 🎧 Слушайте на любимой платформе: • YouTube • Podbean • Apple Podcast • Яндекс.Музыка • Spotify • RSS 💬 А как вы используете AI в своей работе? Делитесь опытом в комментариях! #AWS #AI #PromptEngineering #LLM #разработка #подкаст Навигация для Podbean: • (0:00) Введение • (0:25) Приглашенный гость Федор Павлов • (0:29) Обсуждение General TFI и промпт-инжиниринг • (2:08) Почему простой вопрос — это часто ошибочная стратегия • (2:29) Сравнение промпт-инжиниринга с SQL • (4:05) Как правильно задавать контекст и роли для AI • (6:51) Зачем нужен prompt engineering • (12:25) Few-shot learning: магия примеров в действии • (18:36) Продвинутые техники для улучшения качества ответов • (38:48) Борьба с галлюцинациями в моделях Навигация для YouTube: • 00:00:00 - Начало • 00:00:25 - Приглашенный гость Федор Павлов • 00:00:29 - Обсуждение General TFI и промпт-инжиниринг • 00:02:08 - Почему простой вопрос — это часто ошибочная стратегия • 00:02:29 - Сравнение промпт-инжиниринга с SQL • 00:04:05 - Как правильно задавать контекст и роли для AI • 00:06:51 - Зачем нужен prompt engineering • 00:12:25 - Few-shot learning: магия примеров в действии • 00:18:36 - Продвинутые техники для улучшения качества ответов • 00:38:48 - Борьба с галлюцинациями в моделях

    43 min

About

Подкаст ”AWS на русском”. Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Лучшие практики и свежие новости из мира AWS в формате интервью на русском языке. Смотрите и слушайте #awsнарусском

You Might Also Like