数据科学家如何选择 Python 的 IDE》是一篇2018年的文章,提到 Spyder 是 python 做科学计算的最佳 IDE,visual studio 已经变成了 R 语言在 windows 平台上最完美的 IDE,可作参考。

generated__Spyder.jpg_huec006358a5426648b486bc1cb031fb29_413500_980x0_resize_q75_box.jpg

以下节选主要内容:

对于一个做数据分析计算的人来说,他的 IDE 最好能提供以下核心功能(按重要性排序):

  • 强大的交互性
  • 查看 dataframe
  • qtconsole

目前数据科学领域的编程语言主要是以下几种(按使用人数大致排序):

  • R
  • Python
  • matlab/octave
  • Julia

在这些语言中,Python 通用性最强,所以在 Python 社区里码农们的声音比较大,利用 Python 做计算的新手很容易被程序员们带偏,所以本文主要讨论 Python 的 IDE。

考察的IDE

  • pycharm
  • Rodeo
  • Spyder
  • jupyter notebook

pycharm

pycharm 并不适合所有人,至少在推出 scientific mode(科学模式)之前,pycharm 在科学计算领域根本没有 spyder 方便。但尽管有了新版,由于其是庞大的商业软件,且冷启动慢和占用内存比较大,并不适合新手及小项目。

Rodeo

Rodeo 是一个轻量级的简陋 IDE,唯一亮点在于它可以查看 dataframe。

Spyder

spyder 在所有针对科学计算的 IDE 里第一个使用 qtconsole,它也是第一个可以以表格形式查看 numpy 和 pandas 对象的 python IDE。方便和强大的交互特性,使其成为 python 做科学计算的最佳 IDE。

jupyter notebook

不建议把 jupyter notebook 作为主力开发工具,因为这容易让人养成两个坏习惯:一是每写一行代码就要运行一下然后跳到下一个 cell,导致驾驭长代码的能力越来越差;二是把所有代码放在一个文件里,不利于养成模块化和工程化的编程习惯。

jupyter notebook 作为展示工具和交互工具都是很好用的,适合用来做展示或撰写报告。

例外:visual studio

R 语言只有一个专用 IDE——Rstudio,但是最近发现 visual studio 里面加入了针对 R 语言的数据科学模式(由 RTVS 提供),有单独的绘图 pane 与变量查看功能,默认的 layout 类似于 Rstudio,但是可以更加自由地定制。

和 Rstudio 相比,visual studio 里的数据科学模式最令人眼前一亮的特点是它和 excel 的完美互动。在 Rstudio 中,要查看一个 datafarme,通常的做法是在变量列表里双击变量的名字,在 Rstudio 里以表格的形式将它打开;现在在 visual studio 中你不仅可以做到这件事,还可以在变量列表中的某个变量名右边直接点击"在excel中打开"这个选项,直接在 excel 中打开这个变量。

除此之外,visual studio 作为宇宙第一 IDE,在项目资源管理、版本管理等方面都是非常方便的,这些功能在 Rtudio 里面基本没有。可以说,自从提供了数据科学模式,visual studio 已经变成了 R 语言在 windows 平台上最完美的 IDE。

最后给 R IDE 一个排名

  • Visual Studio
  • Emacs
  • Rstudio
  • VSCode

其他IDE相关文章

既是推荐


  • WinPython 是一个免费的、开源的、可移植的Python编程语言的发行版,适用于科学和教育用途。
  • Anaconda 是一个适用于科学计算的 Python 集成开发环境。
  • JupyterLab 是广受欢迎的 Jupyter Notebook新界面,允许在基于单元格的组织中逐步可视化数据。
👍

本文由 cds 整理发布,参考 CC-BY-SA 3.0 协议共享,欢迎转载、引用或改编。
感谢您的支持,以共同推动STEM公益教育!

楼主残忍的关闭了评论