305 集

随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。不是随机样本,而是全体数据:在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。不是精确性,而是混杂性:研究数据如此之多,以至于我们不再热衷于追求精确度;之前需要分析的数据很少,所以我们必须尽可能精确地量化我们的记录,随着规模的扩大,对精确度的痴迷将减弱;拥有了大数据,我们不再需要对一个现象刨根问底,只要掌握了大体的发展方向即可,适当忽略微观层面上的精确度,会让我们在宏观层面拥有更好的洞察力;不是因果关系,而是相关关系:我们不再热衷于找因果关系,寻找因果关系是人类长久以来的习惯,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系;相关关系也许不能准确地告诉我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。

如因作品内容,版权和其它问题请与本播主联系的,请在30日内进行。

免责声明:本书院为非营利性机构。以方便网友为主,仅供学习研究。
内容由热心网友提供和网上收集,不保留版权。若侵犯了您的权益,来信即刪。srn2188@sina.com

宇量数‪据‬ 南京土白更堪夸

    • 科技

随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。不是随机样本,而是全体数据:在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。不是精确性,而是混杂性:研究数据如此之多,以至于我们不再热衷于追求精确度;之前需要分析的数据很少,所以我们必须尽可能精确地量化我们的记录,随着规模的扩大,对精确度的痴迷将减弱;拥有了大数据,我们不再需要对一个现象刨根问底,只要掌握了大体的发展方向即可,适当忽略微观层面上的精确度,会让我们在宏观层面拥有更好的洞察力;不是因果关系,而是相关关系:我们不再热衷于找因果关系,寻找因果关系是人类长久以来的习惯,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系;相关关系也许不能准确地告诉我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。

如因作品内容,版权和其它问题请与本播主联系的,请在30日内进行。

免责声明:本书院为非营利性机构。以方便网友为主,仅供学习研究。
内容由热心网友提供和网上收集,不保留版权。若侵犯了您的权益,来信即刪。srn2188@sina.com

    知识最多、含金量最高的42本书二

    知识最多、含金量最高的42本书二

    • 10 分钟
    知识最多、含金量最高的42本书一

    知识最多、含金量最高的42本书一

    • 23 分钟
    “富裕”背后的成功定律

    “富裕”背后的成功定律

    • 25 分钟
    IT部门如何帮助业务构建高可用分析体系

    IT部门如何帮助业务构建高可用分析体系

    • 28 分钟
    刘慈欣谈 ChatGP

    刘慈欣谈 ChatGP

    • 24 分钟
    ChatGPT的工作原理三

    ChatGPT的工作原理三

    • 53 分钟

你可能还喜欢

声动早咖啡
声动活泼
搞钱女孩|女性成长访谈播客
搞钱女孩创始人小辉
潘吉Jenny告诉你|学英语聊美国|开言英语 · Podcast
OpenLanguage 英语
增长黑客
平凡的咖啡音乐
牛油果烤面包
牛油果烤面包
《中国古诗词》——原文译文皆是诗
橙子的幸福说