Telco Bytes بالعربي

Mohamed Eldeeb & Bassem Aly

بودكاست تقني عربي هدفه جمع وعرض وتحليل اهم و اخر اخبار التيلكو و تقديمها بصورة سهلة و مبسطة ...علي امل ان ده يكون مشاركه بسيطه مننا لاثراء المحتوي التقني العربي اللي بيتطور يوم عن يوم ويخلي المستمعين في الصوره من التطورات اللي بتحصل باستمرار...هتلاقوا اخبار مختلفة عن5G , Telco Cloud, SDN , NFV , SASE , Segment Routing, DataCenter, DevOps,Public Cloud, Private Cloud, Edge Computing, WAN-SDN, Mobile Core, SD-WAN, Cloud Securityhttps://telcobytes.buzzsprout.com/

  1. The Datacenter in the GenAI Era: What Changed?

    11/27/2025

    The Datacenter in the GenAI Era: What Changed?

    Send us something, Share your comments directly :) The Datacenter in the GenAI Era: What Changed? In this episode of TelcoBytes Arabic, we tackle the fundamental question: Why do we need AI-Ready Data Centers, and what has fundamentally changed in the GenAI era? We explore this question through three distinct perspectives: ━━━━━━━━━━━━━━━━━━━━ PERSPECTIVE 1: Traditional vs AI Workloads We compare E-commerce architectures (like Amazon) with AI Training Clusters to understand the fundamental shift: - Traditional Datacenters: Loosely coupled microservices that scale independently - AI Clusters: Tightly coupled systems where 100,000 to 1,000,000 GPUs must work as a single unit - Scale difference: From thousands of servers to millions of GPUs - Performance metrics: Transactions per Second vs PetaFLOPS ━━━━━━━━━━━━━━━━━━━━ PERSPECTIVE 2: Network Challenges in the AI Era The Surprising Reality: Approximately 2/3 of Job Completion Time in AI Training is wasted on the Network! Key Challenges Discussed: TAIL LATENCY PROBLEM - How the slowest single frame can stall millions of GPUs - The Butterfly Effect: 1-2 millisecond delay can cause hours of training delay - Synchronization barriers where all GPUs wait for the slowest one GO-BACK-N PROTOCOL - Why AI uses RDMA over Converged Ethernet (RoCE) - Packet loss catastrophe: Much worse than latency - How Go-Back-N retransmits entire windows when one frame is lost ELEPHANT FLOWS - Few massive flows (Terabytes) vs many small flows - Low entropy in traffic headers - Traffic polarization: All traffic on one link while others remain idle INCAST PROBLEM - Many-to-one communication patterns - Congestion hotspots in the fabric - Buffer overflow even with deep buffers ━━━━━━━━━━━━━━━━━━━━ PERSPECTIVE 3: Power & Cooling Implications How AI infrastructure requirements transform datacenter design: - Significantly higher power density - New cooling requirements - Time-to-market vs cost trade-offs ━━━━━━━━━━━━━━━━━━━━ KEY TAKEAWAY The Network isn't just a connection between servers—it's the true Backbone and Nervous System of AI Data Centers. That's why NVIDIA calls it the "AI Backbone": without optimized networking, even the most powerful GPUs cannot operate efficiently. All these challenges have solutions, which we'll explore in detail in upcoming episodes! ━━━━━━━━━━━━━━━━━━━━ TOPICS COVERED AI-Ready Datacenter | GenAI Infrastructure | Network Architecture | GPU Training | Traditional vs AI Workloads | Tail Latency | Job Completion Time | Go-Back-N Protocol | RDMA | RoCE | Elephant Flows | Traffic Polarization | Incast Problem | ECMP Hashing | All-to-All Communication | NCCL | Collective Operations | Deep Learning Infrastructure | Spine-Leaf Architecture | Data Center Networking ━━━━━━━━━━━━━━━━━━━━ FOLLOW US TelcoBytes: https://www.linkedin.com/in/telco-bytes Mohamed Ledeeb: https://www.linkedin.com/in/ledeeb Bassem Aly: https://www.linkedin.com/in/bassem-aly #AIDataCenter #GenAI #NetworkArchitecture #DeepLearning #GPUTraining #DataCenterNetworking #InfrastructureEngineering Follow us on Apple Podcast Google Podcast YouTube Channel Spotify

    41 min
  2. من الـPixels للـ Parameters: اساسيات الـ GPU  و الـ Model Training

    10/28/2025

    من الـPixels للـ Parameters: اساسيات الـ GPU و الـ Model Training

    Send us something, Share your comments directly :) اهلا في أولى حلقات سلسه عالم  مراكز البيانات الجاهزة للذكاء الاصطناعي – AI Ready Data Centers قبل ما نتكلم عن تصميم الشبكات، الـ fabrics، والـ interconnects، لازم نفهم الأساس: ليه الـ GPU أهم من الـ CPU في عالم ال AI؟ وإزاي بيحصل الـ Training جوا الـ Deep Neural Networks؟ وليه الشركات كلها بتجري تبني Data Centers مخصوصة للذكاء الاصطناعي AI؟ في الحلقة دي هنشرح المفاهيم دي بطريقة بسيطة وسلسة، من قصة Colossus لإيلون ماسك وال500 ألف GPU واللي بتبرز السباق المحموم لبناء ال AI-DCs، إلى مفاهيم زي الـ FLOPS والـ Precision، وشرح عملي لشبكات ال Neural Networks خطوة بخطوة واللي بتعتبر اساس ثوره ال AI الحديثه. في الحلقة دي هتتعلم: ليه الـ GPUs قلب ثورة الذكاء الاصطناعي الفرق بين AI / ML / DL بطريقة بسيطة إزاي بيتم تدريب النماذج خطوة بخطوة كاساسيات لأي مهندس شبكات أو مهتم ببنية الـ AI 🎧 اسمع الحلقة وادعمنا بالاشتراك 🔔 💬 قول لنا في الكومنتس: عايزنا نتكلم أكتر في أي جزء المرة الجاية؟ 📢 تابعنا على لينكدإن لمزيد من الحلقات والنقاشات التقنية: https://www.linkedin.com/in/telco-bytes https://www.linkedin.com/in/ledeeb https://www.linkedin.com/in/bassem-aly #TelcoBytes_بالعربي | #AIReadyDataCenter Follow us on Apple Podcast Google Podcast YouTube Channel Spotify

    58 min

About

بودكاست تقني عربي هدفه جمع وعرض وتحليل اهم و اخر اخبار التيلكو و تقديمها بصورة سهلة و مبسطة ...علي امل ان ده يكون مشاركه بسيطه مننا لاثراء المحتوي التقني العربي اللي بيتطور يوم عن يوم ويخلي المستمعين في الصوره من التطورات اللي بتحصل باستمرار...هتلاقوا اخبار مختلفة عن5G , Telco Cloud, SDN , NFV , SASE , Segment Routing, DataCenter, DevOps,Public Cloud, Private Cloud, Edge Computing, WAN-SDN, Mobile Core, SD-WAN, Cloud Securityhttps://telcobytes.buzzsprout.com/