Stephen Casper, a computer science PhD student at MIT, joined the podcast to discuss AI interpretability, red-teaming and robustness, evaluations and audits, reinforcement learning from human feedback, Goodhart’s law, and more.
Our music is by Micah Rubin (Producer) and John Lisi (Composer).
For a transcript and relevant links, visit the Center for AI Policy Podcast Substack.
Thông Tin
- Chương trình
- Tần suấtHằng tháng
- Đã xuất bảnlúc 17:02 UTC 2 tháng 8, 2024
- Thời lượng1 giờ
- Tập10
- Xếp hạngSạch