为什么Python比R更像是数据科学的宠儿?我看到R中可用的方法比Python多得多。
0 354
0
该提问暂无详细描述
收藏
2021-01-13 13:14 更新 karry •  4552
共 1 个回答
高赞 时间
1

因为Python确实使我很愉快。

当我学习计算机科学时,Python尚未真正流行,因此实际上我在统计练习中首先遇到了R。我没有不喜欢它,但它也没有赢得我的心。我使用它半年了,不久之后便完全忘记了语法。有趣的是,比起R我更能记得Perl。但R肯定比SAS更好。

因此,我以后大部分的数据工作都是在Matlab上进行的,我发现这个环境也很不错(评估单元格,增量值和重新评估等),但语言也缺乏。

在我攻读博士学位期间,我遇到了Python,因为每个人都在使用它,并且花了几天/几周的时间才可以高效地使用它。我总是感到惊讶的是,当我不确定某些语法细节时,我只是凭直觉尝试一下,在大多数情况下,它确实会那样工作。也和Numpy在一起。

我觉得pandas,甚至还有Matplotlib(因为它模仿Matlab)没有那么直观。每次都要查一下东西。

当然,应对我的需求,python的普通功能也非常重要。我进行了很多字符串处理,四处移动,使用scrapy进行Web抓取,访问数据库或与Web界面进行通信以及其他许多任务。

最后,如果你想使用最新的深度学习框架,Python是一流的(尤其是在Tensorflow激增的情况下)。

虽然我喜欢Python进行脚本编写,探索,设置实验等工作,但我不喜欢Python用于“实际”应用程序。由于大多数/很多库都没有,所以我仍然花费大量时间通过解释器运行某些东西,只是为了找出其中的内容。

为了快速展示我的实验脚本并传递数据,将随机的东西放到随机的容器中,并一直对其进行修改直到合适为止,这很方便。对于经久耐用的C ++来说,我很高兴拥有此类系统。虽然它不是Haskell,但我仍然发现我通常工作一个小时就能解决所有编译器问题,然后在第一次或第二次运行时按预期工作。

使用Python时,REPL会处理很多琐碎的错误类型,特别是使用Pandas时。

但是总体而言,正如我在第一句话中所述-我发现使用Python是一种乐趣。

本回答来自马库斯·托曼(Markus Toman),自由顾问,计算机科学博士

收藏
2021-01-13 13:24 更新 anna •  5050