作者:Saurabh Hooda

来源:TalkingData 数据学堂

在开始学习 Python 之前,要选择最适合您的 IDE。在本文中,我们试验了许多可用的工具,记录了它们的优缺点,并给出如何选择对您来说最好的 Python IDE 的建议。

Python 于 1991 年首次发布,他的作者是 Guido vanRossum,是为通用变成开发的解释型高级编程语言。Python 解释器可在多种操作系统上使用,包括 Linux,MacOS 和 Windows。

伴随着近 30 年的运转,Python 在编程社区中获得了极大的欢迎。对较小的项目来说,使用 IDLE 或 Python Shell 来编写 Python 代码是有效的,但要完成成熟的机器学习或数据科学项目时这两种却不实用。

在这种情况下,您需要使用 IDE(集成开发环境)或专用代码编辑器。由于 Python 是领先的编程语言之一,因此有众多 IDE 可供选择。那么问题来了,「谁才是 Python 最好的 IDE?」

显然,Python 没有某一个 IDE 或代码编辑器可以冠名「最佳」。这是因为他们都有各自的优劣势。此外,在众多 IDE 中进行选择可能会非常耗时。

不过不要担心!因为我们已经做好了。为了帮助您选择适合的 IDE,我们整理了一些比较有名的,专门用于处理数据科学项目的 Python IDE。

平台:Linux / macOS / Windows官方网站: 类型:通用文本编辑器

Atom 是一个免费的开源文本和源代码编辑器,可用于许多编程语言,包括 Java,PHP 和 Python,并且文本编辑器中支持用 Node.js 编写的插件。尽管 Atom 可用于多种编程语言,但它通过其有趣的数据科学功能展示了对 Python 的非凡热爱。

Atom 为 table 带来最大功能之一是支持 SQL 查询。但首先您需要安装 Data Atom 插件才能使用。它支持 MicrosoftSQL Server,MySQL 和 PostgreSQL。此外,在 Atom 中无需打开任何其他窗口就可以显示结果。

另一个有利于数据科学家的 Atom 插件是 Markdown Preview Plus。这为编辑和可视化 Markdown 文件提供了支持,允许您预览,渲染 LaTeX 方程等。

活跃的社区支持

与Git的完美整合

为管理多个项目提供支持

可能会遇到旧CPU的性能问题

存在迁移问题

平台:Linux / macOS / Windows官方网站: 类型:基于 Web 的 IDE

JupyterNotebook 于 2014 年诞生自 IPython,它是一个基于服务器 - 客户端结构的 Web 应用程序。它允许您创建和操作称为 notebooks 的笔记本文档。对于用 Python 的数据科学家来说,JupyterNotebook 是必不可少的,因为它提供了直观和交互式的数据科学环境之一。

除了作为 IDE 运行之外,Jupyter Notebook 还可用作教育或演示工具。对于刚刚开始使用数据科学的人来说,它是一个完美的工具。使用 JupyterNotebook 可以轻松查看和编辑代码,从而创建令人印象深刻的演示文稿。

通过使用 Matplotlib 和 Seaborn 等可视化库,在同一文档中支持同时显示图形和代码。此外,也可以将整个工作导出为 PDF,HTML 或 .py 文件。与 IPython 一样,Project Jupyter 是一系列项目的总称,包括 Notebook 本身,一个控制台和一个 Qt 控制台。

允许从 notebooks 创建博客和演示文稿

保证了可重复的研究

在运行之前可以编辑片段

复杂的安装过程

平台:Linux / macOS / Windows官方网站: 类型:Python 专用的 IDE

PyCharm 是 Python 的专用 IDE。PyCharm 对 Python 来说就像 Eclipse 之于 Java。它具备功能齐全的集成开发环境,分别提供免费版和付费版(称为社区版和专业版)。PyCharm 是安装与设置的最快的 IDE 之一,并且是数据科学家的首选。

对于那些喜欢 IPython 或 Anaconda 发行版的人来说,要知道 PyCharm 可以轻松集成 Matplotlib 和 NumPy 等工具。这意味着处理数据科学项目时可以使用数组查看器和交互式图。除此之外,PyCharm 扩展了对 JavaScript,Angular JS 等的支持。这使得它也同样适合 Web 开发。

完成安装后,PyCharm 可以很容易地用于编辑,运行,编写和调试 Python 代码。要从一个新的 Python 项目开始,只需打开一个新文件就可以开始写代码。除了提供直接调试和运行功能外,PyCharm 还提供对源代码控制和全尺寸项目的支持。

活跃的社区支持

Python 开发,包括数据科学和非数据科学项目

新手和成手都很容易使用

更快的重建索引

无需任何外部要求即可运行,编辑和调试 Python 代码

加载速度可能会很慢

在使用现有项目之前,可能需要调整默认设置

平台:Linux / macOS / Windows官方网站: 类型:特定于 Python 的 IDE

带有橙色的 logo 暗示了这个 Python IDE 是专门为进行数据分析而开发的。如果您对 RStudio 有一些了解,您会发现 Rodeo 与 RStudio 共享许多功能。这里为不了解 RStudio 的人解释一下,它是 R 语言最流行的集成开发环境。

与 RStudio 一样,Rodeo 的窗口分为四个部分,即文本编辑器,控制台,变量可视化环境以及绘图/库/文件。令人惊讶的是,Rodeo 和 RStudio 都与 MATLAB 有很大的相似之处。

Rodeo 的最佳之处在于它为初学者和成手提供了同样的便利。由于 Rodeo 允许您在创建的同时进行查看和探索,因此它无疑是使用 Python 开始数据科学的最佳 IDE 之一。IDE 还提供内置教程,并附带帮助材料。

大量的定制化

查看并探索您实时创建的内容

使用自动完成和语法突出显示功能更快地编写代码,并支持 IPython

不太积极的支持

受到内存问题的困扰

平台:Linux / macOS / Windows官方网站:-ide/spyder 类型:特定于 Python 的 IDE

Spyder 是一个开源的 Python 专用 IDE。它的独特之处在于它针对数据科学工作流程进行了优化。它与 Anaconda 包管理器捆绑在一起,后者是 Python 编程语言的标准发行版。Spyder 具备所有必需的 IDE 功能,包括代码补全和集成的文档浏览器。

Spyder 特别针对数据科学项目而构建了一个平滑的学习曲线,让您可以快速学习它。在线帮助可以支持开发项目的同时查找有关库的特定信息。此外,它与 RStudio 有相似之处。因此,非常适合从 R 切换到 Python。

Spyder 对 Python 库(如 Matplotlib 和 SciPy)的集成支持,进一步证明了它特别适用于数据科学家。除了可观的 IPython /Jupyter 集成之外,Spyder 还拥有独特的「可变浏览器」功能。它允许使用基于表格的布局显示数据。

代码补全和变量探索

使用方便

非常适合用于数据科学项目

整洁的界面

积极主动的社区支持

缺乏支持非数据科学项目的能力

对于高级 Python 开发人员来说太基础了

这完全取决于您希望 IDE 能满足的需求。尽管如此,这里有一些通用的建议:

在刚开始接触 Python 时,请使用具有较少自定义项和附加功能的 IDE。在刚开始时对这类功能的注意力越少越好

将 IDE 功能与您的期望进行比较

尝试使用多个 IDE 可以帮助您更好地了解哪个 IDE 最适合特定要求

———— / END / ————

上海交通大学教你“玩”转AI