10 episodes

德塔‪赛‬ 德塔赛

- Technology
- 5.0 • 6 Ratings

德塔赛 DataSci 是专注数据科学的播客，每期节目会访谈一位数据科学领域的研究者和工程师。欢迎访问我们的官方网站 detasai.com。

- JAN 31, 2021
这是一个看脸的世界

这是一个看脸的世界

我们在第一眼看到一个人的时候，就会下意识的对这个人产生所谓的第一印象，有些人“看起来”值得信任，有些人“看起来”非常聪明，甚至有些人“看起来”不善交际。为什么我们会仅凭一个人的外表产生这些第一印象？
宋蔓是毕业于加州大学圣地亚哥分校的博士，她的研究方向是认知科学和机器学习。
这一期节目，她将和我们聊聊她如何用机器学习模型理解第一印象的产生。

了解更多，请访问宋蔓的 Google Scholar 页面。

Find out more at http://detasai.com
- 37 min
- JAN 18, 2021
用数据科学抗击新冠疫情

用数据科学抗击新冠疫情

用数据科学抗击新冠疫情
这期节目邀请到了在MIT读运筹学博士的李凌志同学，来和我们聊一下他在新冠疫情时做的传染病数学建模的工作。他们的模型后来被美国疾病控制与预防中心（CDC）和所用，也被刊登到了纽约时报的头条。我们讨论了用数学建模预测疾病传播的方法和挑战 —— 如何用有限的数据做出有意义的模型？怎么量化模型的好坏？在疫情实时发展的情况下，模型是怎么被优化和改进的？李凌志也和我们分享了一些和医生、医院、决策者合作的故事。

想要了解更多，请移步李凌志的公众号文章：

在麻省理工抗击新冠疫情实记 (1): https://mp.weixin.qq.com/s/brJPYDhl78kaZtKpppQ8qA
在麻省理工抗击新冠疫情实记 (2): https://mp.weixin.qq.com/s/feLTugkq_g69ygnm-1jf9w

Find out more at http://detasai.com
- 59 min
- MAY 30, 2018
DTS 15 - 语言的表示

DTS 15 - 语言的表示

用适当的方式表示词语是自然语言处理中一个不可或缺的任务。今天的节目中，我们在 UCSD 的同学唐帅和我们讨论了研究词的向量表示的动机和近几年比较流行的词向量表示算法。我们还提到了学习词的表示常用的数据来源，和学习过程中可能需要考虑到一些困难因素。

本期嘉宾：唐帅（UCSD 博士在读）
话题：自然语言处理
内容提要：

电子商务系统中的寻找近义词任务
词语的表示（representation）和词向量
近几年比较成功的词向量的表示算法
学习词的表示时常用的数据来源
怎么衡量一个词向量表示算法的优劣

相关链接

唐帅同学的个人主页
斯坦福深度学习与自然语言处理讲义中文翻译，其中第二讲介绍了词向量。
- 36 min
- APR 3, 2018
DTS 14 - 计算神经科学：大脑怎么工作？

DTS 14 - 计算神经科学：大脑怎么工作？

本期节目中我们跳出了“人工”神经网络的范围，探讨了计算神经科学的话题。计算神经科学研究生物的神经系统，
试图理解人类和其他生物的大脑到底是怎样工作的。

我们在节目提到了：

什么是计算神经科学
计算神经科学中用到的工具
深度学习模型对生物神经之间的信号传递的简化
人工神经网络的研究具体受到了生物学的哪些启发
为什么人类大脑能耗很低，但深度学习却要面对高能耗的难题
- 48 min
- DEC 17, 2017
工程先于理论：深度学习不是炼金术

工程先于理论：深度学习不是炼金术

前不久刚刚结束的 NIPS 学术会议中，Ali Rahimi 凭借他 2006 年的工作获得时间考验奖（Test of Time Award），并发表了一段非常有趣的获奖演说。这次演说成为了一段时间的热点话题。Ali 的演讲主要表达了对深度学习理论研究工作的忧虑。他提到很多实际效果非常好的深度学习算法并不存在足够严密的理论解释。Ali 将这种现象类比为“炼金术”。虽然演讲表达的观点得到了很多研究者的认同，但也引发很多反对的声音。这一期节目中，我们回顾了这一次演说。

相关链接

Ali Rahimi 在 NIPS 2017 的获奖演说可以在 YouTube 搜索到。如果不能访问 YouTube，
也可以点击这里在腾讯视频观看。
- 27 min
- DEC 1, 2017
没有数据制造数据也要学习

没有数据制造数据也要学习

很多机器学习任务的数据标签甚至数据本身很难获得。我们这一期节目聊到了具有这个特点的几个计算机视觉方面的学习任务。李正钦和我们介绍怎么使用人工制作的图像数据来训练学习算法。可以想像，再逼真的人工制造的图像数据与从现实世界中收集的相比，还是会有很大区别的。因此，简单地在人工数据上训练出来的模型，很难在现实世界中获得好的表现。怎么解决这个问题呢？我们在节目中也提到了几个方法。

在这一期节目的制作过程中，我第一次了解到开源动画。我们特别说到了《辛特尔 Sintel》这部动画短片。值得一提的是，这部短片的评分也相当不错呢，豆瓣和 IMDB 评分都在 7.5 分以上。

相关链接

李正钦的个人主页
节目中提到 Blender 为了宣传自己的软件制作了《辛特尔 Sintel》这个开源动画短片，豆瓣链接请点击这里。
- 24 min