《数据科学家如何选择 Python 的 IDE》是一篇2018年的文章,提到 Spyder 是 python 做科学计算的最佳 IDE,visual studio 已经变成了 R 语言在 windows 平台上最完美的 IDE,可作参考。
以下节选主要内容:
对于一个做数据分析计算的人来说,他的 IDE 最好能提供以下核心功能(按重要性排序):
- 强大的交互性
- 查看 dataframe
- qtconsole
目前数据科学领域的编程语言主要是以下几种(按使用人数大致排序):
- R
- Python
- matlab/octave
- Julia
在这些语言中,Python 通用性最强,所以在 Python 社区里码农们的声音比较大,利用 Python 做计算的新手很容易被程序员们带偏,所以本文主要讨论 Python 的 IDE。
考察的IDE
- pycharm
- Rodeo
- Spyder
- jupyter notebook
pycharm
pycharm 并不适合所有人,至少在推出 scientific mode(科学模式)之前,pycharm 在科学计算领域根本没有 spyder 方便。但尽管有了新版,由于其是庞大的商业软件,且冷启动慢和占用内存比较大,并不适合新手及小项目。
Rodeo
Rodeo 是一个轻量级的简陋 IDE,唯一亮点在于它可以查看 dataframe。
Spyder
spyder 在所有针对科学计算的 IDE 里第一个使用 qtconsole,它也是第一个可以以表格形式查看 numpy 和 pandas 对象的 python IDE。方便和强大的交互特性,使其成为 python 做科学计算的最佳 IDE。
jupyter notebook
不建议把 jupyter notebook 作为主力开发工具,因为这容易让人养成两个坏习惯:一是每写一行代码就要运行一下然后跳到下一个 cell,导致驾驭长代码的能力越来越差;二是把所有代码放在一个文件里,不利于养成模块化和工程化的编程习惯。
jupyter notebook 作为展示工具和交互工具都是很好用的,适合用来做展示或撰写报告。
例外:visual studio
R 语言只有一个专用 IDE——Rstudio,但是最近发现 visual studio 里面加入了针对 R 语言的数据科学模式(由 RTVS 提供),有单独的绘图 pane 与变量查看功能,默认的 layout 类似于 Rstudio,但是可以更加自由地定制。
和 Rstudio 相比,visual studio 里的数据科学模式最令人眼前一亮的特点是它和 excel 的完美互动。在 Rstudio 中,要查看一个 datafarme,通常的做法是在变量列表里双击变量的名字,在 Rstudio 里以表格的形式将它打开;现在在 visual studio 中你不仅可以做到这件事,还可以在变量列表中的某个变量名右边直接点击"在excel中打开"这个选项,直接在 excel 中打开这个变量。
除此之外,visual studio 作为宇宙第一 IDE,在项目资源管理、版本管理等方面都是非常方便的,这些功能在 Rtudio 里面基本没有。可以说,自从提供了数据科学模式,visual studio 已经变成了 R 语言在 windows 平台上最完美的 IDE。
最后给 R IDE 一个排名
- Visual Studio
- Emacs
- Rstudio
- VSCode
其他IDE相关文章
- 2019年PYPL榜单发布,编程语言、IDE与数据库市场如何?
延伸阅读
这篇关于数据科学开发环境设置的文章(The Definitive Data Scientist Environment Setup)详细介绍如何在自己的计算机上,安装各种软件,设置一个数据科学环境。主要观点是:
- A NVIDIA GPU of at least 4GB of RAM.
- Avoid Apple MacBooks.
- Ubuntu LTS.
- Python.
- Miniconda.
- Jupyter.
- PyCharm.
既是推荐
- WinPython 是一个免费的、开源的、可移植的Python编程语言的发行版,适用于科学和教育用途。
- Anaconda 是一个适用于科学计算的 Python 集成开发环境。
- JupyterLab 是广受欢迎的 Jupyter Notebook新界面,允许在基于单元格的组织中逐步可视化数据。
楼主残忍的关闭了评论