2024 年你需要查看的 40 个很棒的数据科学博客

加入 200 多万名通过 365 数据科学提升职业生涯的学生。向曾在 Meta、Spotify、Google、宜家、Netflix 和可口可乐工作过的讲师学习,掌握 Python、SQL、Excel、机器学习、数据分析、AI 基础知识等。

免费开始

365 团队2024 年 4 月 15 日阅读时间:15 分钟
博客无处不在。关于旅行的博客、关于宠物的博客、关于博客 2024 年你需要查看的 的博客。数据科学也不例外。数据科学博客比比皆是,而且数量如此之多,当您需要找到最有价值的信息时,从哪里开始呢?这就是我们来这里要提供的帮助。数据科学是一个快速发展的领域,许多人对此 亚马逊数据库 都有所了解,这并不奇怪。因此,本文将简要回顾我们认为非常棒的 40 个数据科学博客,并向您介绍它们的全部内容。注意:这些博客没有排名顺序,重点不在于“哪个是最好的博客?”,而在于“所有这些博客都很棒,但是哪个博客能提供我需要的内容?”。

我们将给予:

  • 每个博客的简要描述(从我的角度来看)。
  • 博客更新的频率。
  • 正在审查的网站上有一篇有趣的文章。

希望这有帮助!亚马逊数据库

博客名称:  DataKind

描述: 使用数据拯救世界。这就是 DataKind 的宗旨。使用公司 费者面临压力 用来盈利的相同算法和技术,并利用它们创造一个可持续发展的世界,满足所有人类需求 – 这是创始人 Jake Porway 的愿景,看来他们做得很好。查看他们的博客,了解他们在做什么以及他们如何帮助从寄养到灾害预防等一切事情。一家出色且有道德的公司和博客

发帖频率: 每周 1-2 次

文章内容: 关注保护濒危带叶猴免于灭绝的惊人努力。阅读本文,了解 RBLWG 如何使用机器视觉比较猴子的照片,以便更准确地判断种群数量和地理位置以评估栖息地。

保护新加坡濒危的带叶猴

博客名称:Probably Overthinking It

 

描述: Allen Downey 是 Olin 学院的一位作家 亚洲电子邮件列表 和教授。他主要撰写有关数据科学和贝叶斯统计的文章。他建立了一个简洁明了的博客(虽然这是他的新博客,但他链接到了旧博客,旧博客有大量的存档)。Allen 在 Twitter 上很活跃,经常与他的关注者一起解决问题。如果您想尝试解决一些问题,或者只是在寻找一些通用的数据科学和统计阅读材料,这是一个不错的去处。

发帖频率:每月 2-4 次

值得一看的文章:如果你喜欢龙与地下城(显然是游戏)和/或贝叶斯统计问题,那么看看这个问题。解决方案发布在 Jupyter 中,你可以比较一下。龙与地下城问题

博客名称:  365 数据科学

描述: 如果您今天要查看一个博客,那真的应该是这个。这个博客涵盖了复杂的教程、职业建议、访谈和一般的数据科学文章,每个人都能从中有所收获。我们知道,因为这是我们写的。我知道这是无耻的宣传,但我答应过给你一份 40 个顶级博客的清单,我真的认为我们的博客值得列入其中。

发帖频率: 每周 1-2 次

值得一看的文章:我们最受欢迎的文章之一。我们研究了数十本关于数据职业的书籍、数百篇文章和数千页报告,以便为您提供 最全面的数据科学职业指南。查看结果,我想您会对我们从中获得的见解感到惊讶。如果您想知道自己是否可以成为一名数据科学家,这尤其有用。开始数据科学职业生涯:终极指南所以,这就是我们的清单。40 个我们最喜欢的数据科学博客。如您所见,它们形状各异,但我们相信每个都有其可取之处。我们非常高兴地浏览来自数据科学领域的各种专业人士和爱好者的这些热爱的项目,我们希望您也一样。

博客名称:  Springboard

描述:  Springboard 涵盖了一些主题,但并不影响其数据科学文章。这里有一些非常好的帖子,并且有吸引人的介绍。它包含职业提示、列表和数据科学作为一般主题。对于几乎任何人来说,这都是一个引人入胜的博客,无论您是刚进入 AI 领域还是已经是深度学习老手。

发布频率: 每天

值得一看的文章: 每个人都喜欢精彩的 TED 演讲,如果你正在阅读这篇文章,那么你也喜欢数据科学。有时这些事情会结合在一起,有时有人会好心地汇编出 11 个最好的数据科学 TED 演讲。TJ DeGroat 做得真好 – 他甚至对每个演讲都做了简要概述。内容丰富,足以吸引你的注意力。

11 个必看的 TED 数据科学演讲

博客名称:BAIR

描述:伯克利人工智能研究中心 (BAIR) 的博客供研究人员交流人工智能领域的研究成果和观点。该博客由学生和教职员工撰写,旨在吸引专家和普通读者,他们通过大量人工智能研究领域最伟大的人物撰写的文章来实现这一目标。对人工智能感兴趣的每个人都能找到自己喜欢的东西。

发帖频率:每周 1-2 次

值得一看的文章:模仿是人类智能的重要组成部分。本文展示了研究人员如何开发人工智能以各种方式模仿行为。绝对令人着迷,它提出了许多关于人工智能的未来和这里所做的惊人工作的问题。必读。通过观看视频进行一次性模仿

博客名称:KDnuggets

描述:您可能还没有听说过KDnuggets。这是最好的博客之一。他们有很多高质量的客座帖子(包括我们写的一些帖子),虽然看起来有点让人不知所措,但您一定会找到一些好东西来阅读。去看看吧。

发布频率:每天

值得一看的文章:我们写的这篇文章确实是显而易见的选择。KDnuggets授予我们白金徽章,这是一项巨大的荣誉。数据科学 vs 机器学习 vs 数据分析 vs 商业分析

博客名称:O’Reilly

描述:专业而深入地研究数据和数据科学,绝不会让人望而生畏。这里的贡献者清楚地知道他们在做什么。帖子包括视频、播客和写得极好的文章。在这个网站上很容易一口气读完。

发布频率:每天

值得一看的文章:数据增长速度超出我们的理解能力,没有人能够完全确定未来会发生什么。本文对这一想法进行了全新的解读。数据的清算日

博客名称:Andrew Gelman

描述:这个博客上有 11 位作者,这意味着它充满了统计内容。每位贡献者都通过一些真正有趣的帖子(和评论)为其写作增添了个人色彩。您会发现一般意见、科学评论、教程和大量的讽刺。此外,他们还有一个“僵尸”类别… 脑子!

发布频率:每天

值得一看的文章:如果你曾经读过或写过科学论文,那么你会对这篇文章感同身受。重温“科学论文是骗局吗?”

博客名称:Hyndsight

描述: “预测”是Rob Hyndman最常用的标签。所以,如果你对此感兴趣,那你很幸运。他还涵盖统计、计算、会议等。该博客面向他的研究团队,但希望其他统计数学科学领域的研究人员能从中找到一些用处。如果你是,那就去看看吧 – Rob 的大门敞开着。

发布频率:每月

值得一看的文章:预测是这里的主要内容,因此,关于预测的最新帖子之一将让您了解 Rob 的风格。预测集成基准

博客名称:Oracle 和数据科学

描述:最近被 Oracle 收购,这可能是顶级数据科学博客之一。时尚、快速且易于使用;这是数据科学信息中心,对任何对数据世界感兴趣的人而言都是必读之物。

发帖频率:每周 2-3 次

值得一看的文章:使用搜索引擎工具进行数据分析的一些重要原因。写得很好,对任何想要分析数据的人来说都非常有用。使用搜索引擎工具进行数据分析的 7 大好处

博客 名称:Airbnb 数据博客

描述:Airbnb 的数据博客是其数据科学家撰写有关公司如何使用数据提供服务的文章的地方。这是对近代历史上最成功的企业之一的一次公开审视。它不仅对使用该服务的人有深刻见解,而且对任何对数据的实际用途感兴趣的人都有深刻见解。由于贡献者众多,您一定会找到一篇有趣的帖子。

发布 频率:每隔几个月一次

值得一看的 文章 :虽然是一篇较旧文章,但它很好地概述了 Airbnb 的运作方式。Airbnb如何使用机器学习来检测房东偏好

博客名称: Data Science Central

描述:Data Science Central 是一个真正全面的资源中心,您可以在其中找到有关分析和数据科学的所有经过深入研究的文章。从人工智能和机器学习,到代码和企业数据,再到用户体验、虚拟现实和游戏 – 您几乎不可能找到找不到的主题。除了行业专家的见解外,您还可以从社区论坛中受益,您可以在那里加入讨论或提出问题。

发帖频率:每天 1-2 次

值得一看的文章:由于有成千上万篇文章值得您关注,即使对于像我们这样的狂热读者来说,也很难只挑选一篇。我们将选择权留给您 – 只需在Data Science Central创建免费会员档案,您就可以探索他们丰富的博客文章库。

博客名称:Dataiku

描述: Dataiku 是分析和机器学习的中心枢纽,他们的博客通过定期更新分析世界来展示这一点。新闻、网络研讨会和大量博客文章 – 对于任何对分析感兴趣的人来说,这都是一个好地方

发帖频率:每周 1-3 篇值得一看的文章:如今深度学习无处不在,这篇文章将带你了解深度学习的真正含义,同时避免使用专业术语。一本很棒的指南,深入(但不涉及专业术语和数学)探索深度学习

博客名称:Cloudera

描述: Cloudera 有几个博客。第一个是工程博客,涵盖了最佳实践、操作方法、用例和 Cloudera 工程及其社区的内部信息。第二个是 VISION 博客,涵盖了一系列主题,但核心是 Cloudera 所代表的 – 安全。这家公司由来自 Google、Facebook、Hadoop、Yahoo! 和 Oracle 的一些大牌公司组成,他们的博客有很多内容,特别是如果你对这家公司感兴趣的话。

发布频率:每月

值得一看的文章:本文深入探讨了 Cloudera 和 Accenture 如何联手对抗内部威胁。非法内部行为可能使公司损失数百万美元,因此这是一个值得了解的问题,尤其是如果您的公司有一些狡猾的员工。

消除内部威胁

博客名称:  Aylien

描述: 这里有适合所有人的内容,任何对文本分析、NLP 和深度学习感兴趣的人都可以在这里找到。博客的组织方式非常方便用户使用,显然是为读者着想。文章的主题非常具体,但写得很好,如果你正在寻找某些特定内容,很容易找到。如果没有,那么你一定会找到值得一读的内容。

发布频率:每月

值得一看的文章: 聊天机器人是人工智能中令人着迷的一部分,本文回顾了聊天机器人的历史。对于任何对聊天机器人及其演变感兴趣的人来说,这都是一篇真正值得一读的文章。聊天机器人的互动历史

博客名称: 潜意识的沉思

描述:  Radhika Kulkarni 和她在 SAS 的团队(SAS 是分析领域的大公司之一,值得了解)着手讨论与高级分析相关的所有事情,这些分析解决了企业和组织面临的许多挑战。这个博客上有很多有趣的主题,许多基于 SAS,其他只是一般性地讨论分析,但都是相关的,而且写得很好。如果分析、人工智能和深度学习对你来说很重要,那么这是一个很棒的博客。

发帖频率:每月 1-3 次

值得一看的文章: 机器学习很棒!我们知道这一点,但它真正特别之处在于它如何应用于现实世界的问题。这篇简短但精彩的文章以易于理解的方式带您了解 4 种策略。

解决实际问题的四种机器学习策略

博客名称:今天学习数据科学

描述: Learn Data Science Today 隶属于Data Science PR Network,它是新闻稿发布和数据科学数字营销服务的全球领导者。该博客为您提供有关机器学习和人工智能、大数据、数据可视化、区块链和技术领域的最新信息。虽然相对较新,但这个博客已经有很多内容可以引起大多数人的兴趣。

发帖频率:每月 40-50 条

值得一看的文章: 您是否想过如何成功交付数据科学项目?我们也有!这是一篇关于该主题的文章,我们确信您会感兴趣的众多内容之一:如何成功交付数据科学项目

博客名称:  Data Aspirant

描述:  Data Aspirant 由自学成才的数据科学家和教育家 Saimadhu Polamuri 运营。Data Aspirant 是面向数据科学初学者的门户网站,因此您可以在这里找到有关数据科学各个领域的教程。这是一个开始或提高技能的好地方。

发帖频率:每月 1-2 次

值得一看的文章: 一份详尽的 R 技巧清单。如果你想提高你的 R 技能,它值得一读。写得很好,很容易理解,是了解博客上其他内容的一个很好的途径。

10 个智能 R 编程技巧助您成为更优秀的 R 程序员

博客名称:  Facebook Research

描述:  Facebook 在人工智能、机器学习和数据科学领域取得了长足进步。本博客让您了解 Facebook 研究团队的最新动态。此外,还提供大量关于经济学、自然语言处理、连接性、安全性等方面的见解。

发布频率:

值得一看的文章:  Facebook 研究人员利用 AI 将口哨声变成管弦乐,并为其他音乐“翻译”提供支持 – 另一篇你不会想到的文章,但这就是我们生活的世界。阅读本文,了解研究人员正在采取哪些措施利用 AI 技术改变音乐行业。Facebook研究人员利用 AI 将口哨声变成管弦乐,并为其他音乐“翻译”提供支持

博客名称:  R-bloggers

描述: 如果您还没猜到的话,750 名贡献者撰写了有关 R 的文章。R-Bloggers 旨在鼓励博主为 R 用户赋能。这里有一个强大的社区,如果您想参与 R 或您已经是“R”用户,那么这里一定有适合您的内容。

发布频率:每天

值得一看的文章: 对于任何想要编写循环的人来说,这都是一篇简单易懂的教程。虽然还有更高级的主题,但这篇文章对于了解这个网站来说还是不错的。如何在 R 中编写第一个 for 循环

博客名称:  Edwin Chen

 

描述:  Edwin Chen 凭借自己在 AI 和数据方面的经验撰写了一些非常有趣的文章,其中有精彩的见解。从 Twitter 到亚马逊,Edwin 就众多主题发表了精彩的见解,并配有易于理解的图片和非常易读的写作风格。

发布频率: 

值得一看的文章: 科学地看待流行网上书店的推荐算法。这些网站应该纳入人工评估吗?阅读后即可找到答案。

超越点击率:通过人工评估提供更好的推荐

博客名称:  Timo Grossenbacher

描述:  Timo 将地理信息、科学和数据新闻结合起来,创造出令人惊叹的可视化效果。他甚至写了一本包含 80 多张地图的书,名为“Grüezi, Moin, Servus!”。这本书是德语的,但幸运的是,他在博客上向您展示了他是如何进行研究的。他更喜欢 R,所以如果你喜欢这种语言,并且对地理学感兴趣,那就看看 Timo 的博客吧。

发布频率:

值得一看的文章:  Timo 关于空间插值的最新文章是一篇很棒的教程。他的研究涉及德国各地的方言,所以如果你对语言学感兴趣,你会从中获得额外的乐趣。

使用 R 进行分类空间插值

博客名称:  Simo Ahava

描述: 分析是这里的重中之重。Simo Ahava 是 Google 分析的开发专家,愿意帮助任何对分析或 Google Tag Manager 有疑问的人。他还涉足数字营销,他的博客很受欢迎,维护得很好。他尽最大努力简化复杂的主题,同时编写详尽的教程。

发布频率: 每月

值得一看的文章: 这篇关于如何跟踪浏览行为的深入教程是受 Simo 的一位 Twitter 粉丝的提问启发而写的。这体现了博客上的社区意识。这篇文章与 Jethro Nederhof 合作撰写,对于任何 Google Analytics 爱好者来说都是必读之作。在 Google Analytics 中跟踪浏览行为

博客名称:  DataGenetics

描述:  Nick Berry 在 Facebook 担任数据科学家,对数据隐私充满热情。他的博客涵盖了数据和统计方面的一系列主题。它易于阅读,您很可能会学到新东西。如果你想知道赢得网球比赛的几率或如何将水变成酒,那么你最好看看这个。

发布频率: 

值得一看的文章: 从统计学角度看网球比赛获胜的概率。对比赛的有趣观察,非常详细。概率和网球

博客 名称:Algobeans | 面向外行的数据分析教程和实验

描述:顾名思义,本博客的重点是为新手提供简化的数据科学教程。本博客不适合数据科学专业人士,但如果您仍在尝试掌握一些数据科学和统计学概念,那么本博客适合您。解释得很清楚,呈现得相当好。

发布 频率:不适用

值得一看的 文章 : A/B 测试很多情况下都很有用。这些人很好地解释了这个概念。

普通人的 A/B 测试指南

博客名称:  DataQuest

描述:  Dataquest 有一个漂亮、简洁的博客,里面有很多有趣的博客文章。他们主要面向有抱负的数据科学家,因为这是他们的目标人群。他们的目标是培训人们成为数据科学家,所以你会发现很多教程和求职建议——你可以好好利用的实用的东西。他们有很多客座作家,但似乎不是随便什么人,因为所有的博客都写得很好,很吸引人。对于任何刚进入数据科学领域或希望提高技能的人来说,这都是一个很棒的博客。

发帖频率: 每周 2-3 次

值得一看的文章:  Python 与 R – 当然,每个人都有自己的看法,哪个更好,但谁是对的呢?好吧,找出答案的最佳方法是像数据科学家一样解决问题 – 研究数据。这就是这篇文章所做的,它以不带偏见的眼光看待一系列函数并得出深刻的结论,这些结论肯定有助于任何人决定他们想要使用哪个程序。一篇写得很好且有用的文章。

Python 与 R:数据分析的正面对决

博客名称:  Julia Evans

描述:  Julia Evans 是来自蒙特利尔的程序员。她在这个博客上分享自己最近学到的东西。她收集了大量有趣的帖子,真正展现了她对编程的热情。她的写作风格谦逊,让人有一种一起探索的感觉。她与读者保持着开放的交流,这很好,她还出版了付费和免费的信息性编程杂志,制作非常精良。对于初学者和任何对编程感兴趣的人来说,这都是一个很棒的博客。

发帖频率: 每月 3-4 次

值得一看的文章: 虽然她的主题范围很广,但她的教程才是展示她技能的。这篇关于 Envoy 基础知识的文章展示了她如何将自己的个性融入到写作中,以一种吸引你继续阅读的方式,我相信这会吸引你阅读更多她的博客并关注她的旅程。

一些 Envoy 基础知识

博客名称:来自人类工程师的博客

描述:虽然它不会赢得任何演示奖项,但对于任何想要扩展机器学习和深度学习知识的人来说,它无疑是一个好地方。虽然有点难找,但当你找到时,它们都是关于大量主题的精心编写的指南。如果你对机器学习有扎实的了解,我认为你可以在这里进一步了解。

发布频率:每 3 个月 1 条

值得一看的文章:这篇机器学习历史文章显然是一篇基石文章。这是一篇写得很好的有趣文章,为博客的其余部分奠定了基础。

机器学习简史

博客名称: 机器学习精通

描述:  Jason Brownlee 对机器学习非常着迷,他想与他人分享他的热爱。他有一个内容丰富的博客,为机器学习爱好者提供大量教程。他的解释清晰而详尽。虽然不适合初学者,但教程非常多,大多数人都会发现一些有价值的东西。此外,他从一开始就告诉你阅读教程后你会知道什么——这很方便。如果你想学习新东西,看看这个。

发帖频率: 每周 1-2 次

值得一看的文章: 他的教程大多采用相同的风格,所以看完这篇文章后,你就会知道他的其他教程会是什么样子。这篇文章是关于如何编写学生的 t 检验。考虑到它在统计学中的广泛应用,这是一个不错的起点,看看你是否喜欢 Jason 的风格。

如何使用 Python 从 Scratch 编写学生 t 检验代码

博客名称:  PYImageSearch

描述:  Adrian Rosebrock 专攻图像搜索引擎,涵盖一系列技能 – 对象跟踪、人脸识别、运动检测等。他的教程内容丰富、清晰,并具有很好的个性化风格。如果您对图像感兴趣,这是一个特别好的博客。

发帖频率: 每周 1-2 次

值得一看的文章: 在本教程中,Adrian 将教您如何使用 OpenCV 创建动画 GIF。这是一篇有趣且具有教育意义的文章。如果您不喜欢 GIF……那就接受它吧!(如果您阅读这篇文章,您就会明白这个笑话的意思)

使用 OpenCV 创建 GIF

博客名称:  Smart Data Collective

描述: 一个精心设计的博客,拥有众多撰稿人,涵盖各种主题。人工智能、分析、区块链、大数据等等。文章适合经验丰富的爱好者和初学者。这里有适合每个人的内容。

发布频率: 

值得一看的文章: 人工智能的光明面。轻松读一读人工智能如何为人类带来积极变化。

人工智能如何帮助儿童和老人

博客名称: Amazon AWS AI Blog

描述:此处的链接将带您进入亚马逊的 AI 博客,但还有超过 25 个类别可供选择(尽管并非全部与数据科学相关)。您无疑会找到一些感兴趣的东西。大多数帖子都围绕一些亚马逊项目展开,但有大量专家客座博主,您肯定会学到一些东西。

发布频率:每天

要查看的文章:有关如何使用 Alexa 制作 QnA 机器人的这个教程看起来很有趣。

使用 Amazon Lex 和 Amazon Alexa 创建问答机器人

博客名称:Freakonometrics

描述:经济学家和数学家 Arthur Charpentier 教授的学术博客。仅针对一个人,提供了大量帖子,其中包含一些有趣的数学观点,涉及从平均寿命到朋友数量等一系列主题。他还介绍了他举办和参加的讲座。此外,如果您是法语人士,您可以查看一些法语帖子。

发帖频率:每周 3-4 次

值得一看的文章:关于为什么一般来说人们的朋友比他们的朋友少的帖子。用数学证明。

友谊悖论游戏

博客名称:  Datafloq

描述: 这里有一些有趣且富有洞察力的文章,涵盖了区块链、VR、AI、物联网、大数据等。关于当前趋势的观点文章似乎是这里文章的主要内容,所以如果你感兴趣的话,那就去吧。

发布频率: 每天

值得一看的文章: 区块链无疑正在呈指数级增长,影响着各行各业。本文探讨了它可能对电影业产生的潜在影响。

区块链会改变电影行业吗?

博客名称: 数据双重确认

描述:  Hui Xiang Chua 的个人博客,详细介绍了她的学习过程。Hui 拥有统计学学士学位(荣誉学位)、商业分析硕士学位,并且是一名研究分析师,她使用过多种工具,例如 R、Python、Tableau、SAS 和 SPSS。这意味着,如果您有兴趣在这些领域中的任何一个领域发展自己的技能,那么关注她的博客是个好主意。

发帖频率: 每月 4-5 次

值得一看的文章: 每个人都喜欢美味的馅饼,但对饼图的喜爱程度可能不尽相同。在本文中,Hui 开启了对饼图的讨论,并引出了有关该主题的一些更详细的文章(如果您感兴趣的话)。

是否使用饼图

博客 名称:Alex Perrier

 

描述: Alex Perrier 是一名数据科学顾问,他撰写了一些关于 Gsutil 和亚马逊机器学习的优秀文章。在这里绝对可以学到一些东西,而且你可以了解他的个性。看起来是个好人。

发布频率:每 3 个月 1-2 次

值得一看的 文章 :这是一个与数据科学无关但关于手机成瘾的有趣博客,可以让您很好地了解 Alex 的写作。

iPhone 上瘾?快来控制自己!

博客名称:  Simply Stats

 

描述:  Simply Stats 是三位充满热情的生物统计学教授的博客,他们发布自己感兴趣的想法。他们对最近大量的数据以及统计学家如何成为科学家感到兴奋。如果您对统计学感兴趣,并且想阅读 3 个人关于他们热情的文章,同时分享一些有关统计学的新想法,那么这里就是您要找的地方。

发帖频率: 每月 3-2 次

值得一看的文章: 学术界在数据科学中的作用是当前的热门话题。本文是 Rafael 对两者之间如何联系的看法。对于任何感兴趣的人而言,这都是一篇值得一读的文章,Rafael 开启了对话,因此请随意发表评论以进行一些尊重的辩论。学术界在数据科学教育中的作用

滚动至顶部