今日深度AI

『AI技术小黑板』EP02:人工智能、深度学习与大语言模型底层机制

本期播客作为课程《智能体AI全栈课程》第二讲,它首先通过同心圆模型清晰界定了 AI、机器学习(ML)和深度学习(DL)之间的子集关系,并阐述了传统机器学习无法应对高维数据和特征工程挑战的“维度诅咒”。接着,详细解释了深度学习如何通过模拟人脑神经元结构(权重、偏差和激活函数)实现自动特征提取,并介绍了深度神经网络的核心训练机制:前向传播、损失函数计算和反向传播(梯度下降)。最后,将重点转向现代 AI,阐述了 LLM 主要依赖的 Transformer 架构如何通过注意力机制解决传统循环神经网络(RNN)的梯度消失问题,并对比了生成式 AI 与更具决策、推理和自主性能力的智能体 AI 之间的区别