EXCEL+Python搞定数据处理(第一部分:Python入门-第2章:开发环境)
一、Anaconda Python发行版
1.安装
在清华大学镜像网站下下载软件
Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirrorhttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=Dhttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=Dhttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=Dhttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D 选择红框内的版本下载:
随后安装,如下图,根据网络上众多博客的经验,如下图修改安装设置,其余默认即可
(第一个设置一定要选个人(第一个选项),否则以后每次打开prompt都要以管理员身份运行!麻烦得很):
安装即可,结束后,点击next,取消勾选两个选项后点击finish。随后进行基本配置。
环境配置参考博客
【2025年最新】Anaconda3的安装配置及使用教程(超详细),从零基础入门到精通,看完这一篇就够了(附安装包)-CSDN博客https://blog.csdn.net/logic1001/article/details/144931692https://blog.csdn.net/logic1001/article/details/144931692 电脑设置搜索栏搜索高级系统设置,点击环境变量、在上面的框中双击path、新建变量。
随后在windows菜单栏搜索Anaconda,打开anaconda prompt ,查看是否显示版本号(显示即安装成功)
随后更改环境保存路径和更改下载。在prompt中输入conda info
没有修改的conda的pkgs和envs均保存在C盘(如上图所示),为了不占用系统盘的空间,我们需要修改保存的位置
在C盘-用户-用户名,找到.condarc。用记事本打开。
删除其中原本的内容,修改路径并保存,如下图所示。
conda镜像源的配置,因为conda很多下载的东西在国外,默认的下载速度往往会很慢,这里建议修改为清华的镜像源,打开anaconda prompt,输入以下指令。
# 添加清华源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
# 添加阿里云镜像源
conda config --add channels https://mirrors.aliyun.com/anaconda/pkgs/free/
conda config --add channels https://mirrors.aliyun.com/anaconda/pkgs/main/
# 添加中科大源
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/menpo/
# (可选)设置搜索时显示通道地址
conda config --set show_channel_urls yes
随后输入conda info,发现成功修改路径以及镜像源
2.Anaconda Prompt
我们后续的学习会一直使用Anaconda Prompt,因此可以把它固定在 Windows 任务栏上Anaconda Prompt 的输入行会以 (base) 开头。
如果你学习过Linux那么一切好说,这里面的命令与Linux完全一致,比如cd等,这里我假设大家都会,如果不会也不要紧,用到哪个命令现搜就行,不用完全记住。
比如输入dir就会列出所有文件
随后也可以尝试一下切换盘符和目录
3.Python REPL:交互式Python会话
通过执行 python 命令启动一个交互式 Python 会话。
在 Python 中,REPL 代表 读取(Read) - 求值(Eval) - 输出(Print) - 循环(Loop),它是 Python 交互式会话的工作模式。当你在 Python 中打开命令行(或一个交互式开发环境),你可以直接输入代码,Python 会立即执行这些代码并显示结果。
比如说我们可以进行一个一年级小学生的高难度计算:
输入import this就可以查看《Python 之禅》—— Python 编程语言的设计原则集合,提出了 Python 开发中应遵循的哲学和指导思想。
- "Beautiful is better than ugly."(美观胜于丑陋):代码应该易读且整洁。
- "Explicit is better than implicit."(明确胜于隐含):写代码时,尽量使意图清晰明了,不要让代码依赖模糊的行为。
- "Simple is better than complex."(简单胜于复杂):尽量使代码简洁,不要过度设计。
- "Readability counts."(可读性很重要):代码的可读性很关键,应当为其他开发者(或未来的自己)写代码时考虑清晰明了。
要退出Python会话,需要输入quit()并按回车键。也可以在Windows中按下快捷键Ctrl+Z,然后按回车键。
4.包管理器:Conda和pip
(1)pip 包管理器
- pip 是 Python 官方推荐的包管理工具,它专门用于安装和管理 Python 包。
- 通过 pip,你可以安装来自 Python 包索引(PyPI)的包。这些包通常是 Python 代码和其他文件,用来扩展 Python 的功能。
- 例如,你可以通过
pip install pandas
来安装 Pandas 库,这样就能在你的 Python 程序中使用 Pandas 进行数据分析。
(2)Conda 包管理器
- Conda 是 Anaconda 发行版中的内置包管理器。它不仅可以安装 Python 包,还可以安装其他软件包(如 R、Ruby 等)和不同版本的 Python 解释器。
- Conda 的一个主要优势是:它不仅管理 Python 库,还能管理 Python 环境的创建和切换,甚至安装多个版本的 Python 解释器。
- 例如,你可以用 Conda 来安装不同版本的 Python(如 Python 3.7、3.8 等),这在开发中可能会很有用,因为某些库可能仅与特定版本的 Python 兼容。
- Conda 还能安装许多非 Python 的库,比如用于机器学习的 TensorFlow,这使得它比 pip 更加通用和强大。
(3)Anaconda 和包管理器
- Anaconda 是一个包含了 Python 以及大量常用数据科学库(如 pandas, numpy, matplotlib 等)的大型发行版。
- Anaconda 中已经预装了 pip 和 Conda,所以你不需要手动安装这些工具。
- 使用 Anaconda,你可以通过 Conda 创建不同的 Python 环境,方便地在不同项目中使用不同版本的库和 Python 解释器。
warning:Conda 和 pip
在使用 Anaconda 的情况下,应该尽可能地用 Conda 安装各种软件包。而 pip只是用来安装那些在 Conda 中找不到的软件包。不然的话 Conda 可能会覆盖你用 pip 安装的包。
如果想查看你安装的 Anaconda 发行版中已经安装了哪些包,可以输入conda list 。
先来安装 Plotly 和 xlutils,这两个包都可以在 Conda 中找到:
conda install plotly xlutils
如遇问题,可以参考以下博文(最好的办法就是重新下一个老版本的anaconda):
下面的博文大概率不会彻底解决问题...
conda 解决An HTTP error occurred when trying to retrieve this URL-CSDN博客https://blog.csdn.net/Alihao_/article/details/134726131https://blog.csdn.net/Alihao_/article/details/134726131https://blog.csdn.net/Alihao_/article/details/134726131https://blog.csdn.net/Alihao_/article/details/134726131【真正解决】Conda安装卡在solving environment这一步!_conda 卡在solving environment-CSDN博客https://blog.csdn.net/qq_52012471/article/details/130960331https://blog.csdn.net/qq_52012471/article/details/130960331https://blog.csdn.net/qq_52012471/article/details/130960331https://blog.csdn.net/qq_52012471/article/details/130960331
成功结束安装!!
随后,可以通过 pip 来安装 pyxlsb 和 pytrends,这两个包 Conda 中没有:pip install pyxlsb pytrends
5.Conda环境
Conda 环境 是一种隔离的环境,确保你在每个项目中使用不同的 Python 版本和依赖包版本,从而避免不同项目间的冲突。这个概念类似于 Python 的虚拟环境,但 Conda 环境更强大,因为它不仅能管理 Python 包,还可以管理其他非 Python 包,比如 R
包、Java
等。我们每行开头的(base)就是一个默认的基本conda环境。
(1)Conda环境的特征
-
隔离性:每个 Conda 环境都是独立的,包含一个特定版本的 Python 以及一组特定版本的库。这样,项目间不会因依赖不同版本的库而冲突。
-
版本管理:比如,你有一个项目需要 Python 3.8 和特定版本的 pandas,另一个项目需要 Python 3.9 和不同版本的 pandas。Conda 环境可以让你在不同的环境中管理不同版本的 Python 和包,而不必担心版本冲突。
-
简便的依赖管理:在 Conda 环境中,你可以通过
conda install
命令安装和管理不同版本的 Python 包。Conda 自动解决包之间的依赖问题,避免了手动处理依赖冲突的麻烦。 -
虚拟环境与 Conda 环境:虽然虚拟环境是 Python 中的标准工具,但 Conda 环境在多平台、多语言支持方面更为强大。它不仅支持 Python,还能管理其他编程语言和系统工具。
在本次学习的过程中,不用切换 Conda 环境,我们会一直使用默认的 base 环境。不过当创建新项目时,为每个项目使用单独的 Conda 环境或者虚拟环境是很好的实践方式。这可以让你规避不同项目之间的依赖冲突。(引用原文)
(2)创建 Conda 环境的示例
-
创建一个新的 Conda 环境:
这条命令将创建一个名为conda create -n myenv python=3.10
myenv
的环境,使用 Python 3.10。 -
激活环境:
conda activate myenv
激活该环境后,你会看到
(myenv)
出现在命令提示符前面,表示当前环境已经被激活。 -
安装包: 在激活的环境中,你可以安装所需的包:
conda install pandas=1.1.0
-
查看已安装的环境:
conda env list
通过使用 Conda 环境,你能够避免不同项目间的依赖冲突,确保项目在开发和部署过程中能够平稳运行。
二、Jupyter笔记本
Jupyter 笔记本是一种广泛应用于数据科学、机器学习和研究领域的工具。它允许用户以交互式的方式运行 Python 代码,生成图表和可视化,并将这些代码、结果、图形和文本以结构化的方式融合在同一个文档中。Jupyter 笔记本通过浏览器运行,提供了一个直观且易于使用的界面,非常适合用来进行数据分析、教学和实验记录。
与传统的 Python 解释器相比,Jupyter 笔记本为用户提供了更为灵活的工作环境。它不仅可以运行 Python 代码,还能以图形化的方式展示数据,支持插入文本说明,甚至可以嵌入公式和链接。这使得 Jupyter 笔记本特别适合进行数据探索、分析和可视化,而不仅仅局限于代码的执行。
Jupyter 笔记本是一款功能强大的工具,能够快速准备、分析和可视化数据,其用例与传统的 Excel 工作簿非常相似,因此被视为 Excel 的有力竞争者。然而,Jupyter 笔记本与 Excel 的最大不同在于,它是通过 Python 代码 来完成这些任务的,而不是像 Excel 那样通过鼠标操作和点击单元格来进行数据处理。这使得 Jupyter 笔记本对于那些需要进行复杂分析和自动化处理的用户来说,具有更高的灵活性和效率。
另一个 Jupyter 笔记本的优势是它 将数据与业务逻辑分离。在 Jupyter 笔记本中,你的代码和图表是独立的,通常使用外部的 CSV 文件或数据库中的数据,而不会像在 Excel 中那样将数据和计算逻辑混合在一起。这种结构化的方式,使得你的代码更加清晰、易于管理。
此外,Jupyter 笔记本可以通过 Python 的可视化功能,帮助用户清晰地理解数据的动态过程。与 Excel 中的公式不同,Jupyter 笔记本的代码执行结果能够直接显示出来,不会像 Excel 中的单元格公式那样隐藏在计算过程背后,这使得数据处理和分析更加透明,用户能更容易把握正在发生的事情。
Jupyter 笔记本不仅可以在 本地环境 中运行,还可以在 远程服务器 上运行。在许多情况下,服务器的性能通常要比本地机器更强大,能够处理更多的数据和更复杂的计算任务。而且,服务器可以在无人值守的情况下持续运行代码,进行定时任务或长期的数据处理,Excel 则难以做到这一点。
1.运行Jupyter笔记本
进入示例代码所存放的目录并运行笔记本
(base)> cd C:\Users\username\python-for-excel
(base)> jupyter notebook
随后会跳转到网页:
点击”New“-选择Python3
浏览器会为第一个空白笔记本打开新的标签页,我们可以在Jupyter右边设置名称”first_notebook“
2.笔记本单元格
正文区域一个光标正在空白单元格中闪烁。如果光标没有闪烁,可以用鼠标点击单元格,尤其是 In [ ] 右侧的区域,这样就能激活该单元格。接下来,重新进行上一节的练习,输入表达式 1 + 5,然后点击菜单栏中的 运行 按钮,或者使用更快捷的键盘组合:Shift + 回车(Shift + Enter)。执行后,代码将会在当前单元格中运行,并且结果会显示在单元格下方。
由于当前笔记本中只有一个单元格,执行完毕后,笔记本会自动在下方插入一个新的空白单元格。此时,请注意,当单元格正在执行时,它会显示 In [*],表示代码正在计算。当计算完成后,星号(*)将被替换为数字,例如 In [1],其中数字代表该单元格的执行顺序。
在该输入单元格下方,你将看到对应的输出单元格,它的编号与输入单元格相同。例如,若输入单元格为 In [1],则输出单元格会显示为 Out [1]。每次运行一个单元格时,编号会自动加 1,帮助你识别代码执行的顺序。
注意:单元格的输出
在 Jupyter 笔记本中,如果单元格的最后一行代码返回了一个值,那么这个值会自动显示在 Out [ ] 单元格中,表示该单元格的输出。例如,如果你输入 3 + 4,它的结果 7 将会显示在 Out [1] 下方。
然而,如果在单元格中使用了 print 函数,或者代码发生了异常,则相应的输出不会出现在 Out [ ] 单元格中,而是直接显示在 In [ ] 单元格下方。print 函数输出的内容是直接打印出来的,而不是返回值,因此它没有 Out [ ] 标签。同样,异常信息也会直接显示在 In [ ] 单元格下方,而不在 Out [ ] 中显示。
在 Jupyter 笔记本中,单元格有不同的类型,其中我们需要关注以下两种:
(1)代码单元格(Code)
- 这是 Jupyter 笔记本的默认单元格类型。当你需要执行 Python 代码时,使用代码单元格。
(2)Markdown 单元格(Markdown)
- Markdown 是一种轻量级的标记语言,使用标准文本字符来格式化文本。在 Jupyter 笔记本中,你可以用它来添加格式化的文本说明、注释或文档内容。
切换单元格类型为 Markdown
要将一个单元格的类型切换为 Markdown,首先选中该单元格,然后在单元格模式下拉菜单中选择 Markdown(在中文版 Jupyter 笔记本中显示为“标记”),在中文环境下可能会带有一定的误导性。
例如,切换为 Markdown 单元格后,可以输入以下 Markdown 语法文本,介绍 Markdown 格式规则:
# 这是一级标题
## 这是二级标题
你可以让你的文本变成*斜体*、**粗体**或`等宽字体`
* 这是项目符号
* 又一个项目符号
输入完毕后,按下 Shift + 回车,这段文本会被渲染为格式化的 HTML,展示为标题、斜体、粗体、等宽字体和项目符号等格式。
快捷键操作
在命令模式下切换单元格类型和其他常用快捷键:
快捷键 | 操作 |
---|---|
Shift + 回车 | 执行单元格(在编辑模式下也可用) |
↑(上箭头) | 将单元格选择器上移 |
↓(下箭头) | 将单元格选择器下移 |
b | 在当前单元格下方插入新单元格 |
a | 在当前单元格上方插入新单元格 |
dd | 删除当前单元格(按两次字母 d) |
m | 将单元格类型切换至 Markdown |
y | 将单元格类型切换至代码 |
这些快捷键能大大提高在 Jupyter 笔记本中的工作效率。
3.编辑模式与命令模式
在 Jupyter 笔记本中,单元格有两种交互模式:编辑模式和命令模式。了解这两种模式以及如何在它们之间切换,有助于更高效地使用 Jupyter 笔记本。
(1)编辑模式(Editing Mode)
- 当点击一个单元格时,或者在选中单元格时按下回车键,单元格会进入 编辑模式。
- 在编辑模式下,单元格的边缘会变成 绿色,并且单元格中的 光标 会开始闪烁,表示可以开始输入或编辑内容。
- 编辑模式允许你编辑代码或文本,修改单元格中的内容。
(2)命令模式(Command Mode)
- 要切换到 命令模式,只需要按下 Esc 键。
- 进入命令模式后,选中的单元格边缘会变成 蓝色,并且不会显示光标。这表示不能直接编辑单元格内容,但可以执行其他操作。
- 在命令模式下,可以通过快捷键对单元格进行管理,如插入新单元格、删除单元格、改变单元格类型等。
4.执行顺序很重要
Jupyter 笔记本非常易于使用,但如果没有按正确的顺序运行单元格,可能会让你对结果感到困惑。下面是一个典型的示例,说明了为什么按顺序运行单元格是很重要的:
示例:
假设有以下几个单元格,按顺序执行如下:
In [3]: a = 3
In [4]: a
Out[4]: 3
In [5]: a = 5
- In [3]:将变量
a
设置为 3。 - In [4]:输出
a
的值,结果是 3。 - In [5]:将变量
a
设置为 5。
此时,Out[4] 的输出是 3,符合预期。
错误执行:
然而,如果回到 In[3] 单元格并再次执行它,你会得到不同的结果:
In [3]: a = 3
In [6]: a
Out[6]: 5
In [5]: a = 5
- In [6] 的输出是 5,而不是预期的 3。这是因为当你执行 In [5] 时,已经将
a
的值改为 5。因此,即使你重新执行了 In [4],它仍然引用的是已经被修改过的a
值。
为什么会这样?
Jupyter 笔记本的执行顺序与单元格的顺序无关,而是根据你 实际执行 单元格的顺序来决定的。每个单元格可以独立地执行,而不必严格按照它们在笔记本中的位置从上到下依次执行。因此,执行顺序是由你手动操作来控制的,而不仅仅是从前到后的线性顺序。
解决方案:
为了避免这种问题,建议在重新执行某个单元格时,不要单独执行某一个单元格,而是从头到尾依次运行所有单元格。这样可以确保每个单元格中的代码和变量的执行顺序是连贯的。
Jupyter 笔记本的 “单元格 > 运行” 菜单提供了一种便捷的方法来顺序执行所有单元格。这可以帮助你确保每个单元格的执行结果都是基于正确的前提条件。
5.关闭Jupyter笔记本
Jupyter 内核的管理
- Jupyter 内核:每个 Jupyter 笔记本都运行在一个独立的内核中,内核是执行 Python 代码的“引擎”。每个内核占用一定的计算资源,包括 CPU 和内存。
- 关闭笔记本时关闭内核:为了释放资源并避免系统变慢,关闭 Jupyter 笔记本时应该同时关闭内核。如果只是关闭浏览器标签页,内核仍然在后台运行,继续消耗系统资源。
- 在菜单中选择 “文件 > 关闭” 可以关闭笔记本并释放资源。
- 在 Jupyter 仪表板的“运行”标签页中,也可以关闭正在运行的笔记本。
- 如果要关闭整个 Jupyter 服务器,可以点击仪表板右上角的 “退出” 按钮,或者在 Anaconda Prompt 中按两次 Ctrl+C,停止 Jupyter 服务。
如果您更喜欢使用命令行,关闭Jupyter Notebook的过程也很简单。在终端中输入jupyter notebook list
可以查看当前运行的Notebook及其对应的URL。记下需要关闭的Notebook的URL,然后在终端中输入jupyter notebook stop <端口号>
(通常是8888),即可关闭所有通过该端口启动的Jupyter Notebook实例。
上面一段参考博客:
如何关闭python的jupyter – PingCodehttps://docs.pingcode.com/ask/1000655.html
云上的 Jupyter 笔记本
云平台为用户提供了无需本地安装的 Jupyter 笔记本环境(后续的excel部分不可以)。以下是几个常见的免费的云服务平台:
-
Binder:
Binder 是由 Project Jupyter 提供的服务,可以直接运行公共 Git 仓库中的 Jupyter 笔记本。不需要注册或登录,可以快速启动笔记本并进行操作。 -
Kaggle Notebook:
Kaggle 是一个数据科学平台,提供大量的数据集和数据科学竞赛。Kaggle 从 2017 年起成为 Google 的一部分,提供免费的云端笔记本服务,专注于数据科学和机器学习任务。 -
Google Colab:
Google Colab 是 Google 提供的 Jupyter 笔记本平台,支持直接访问 Google Drive 上的文件,包括 Google Sheets 等。虽然 Colab 不完全支持 Jupyter 中的所有快捷键,但它提供了免费的云端 GPU 和 TPU 支持,非常适合机器学习和深度学习任务。
三、VSCode
本节将介绍如何安装并配置 Visual Studio Code(VS Code),这是由微软开发的一款免费且开源的文本编辑器。在深入介绍它的关键组件之前,我们将先编写一个 Python 脚本,并通过几种不同方式来运行它。但首先,我们需要讨论在什么情况下不适合使用 Jupyter 笔记本运行 Python 脚本,以及为什么在本书中推荐使用 VS Code。
虽然 Jupyter 笔记本非常适合用于研究、教学和实验性的工作流程,尤其在处理交互式代码和可视化内容时表现出色,但它并不适合编写针对生产环境的 Python 脚本。这类脚本通常不需要 Jupyter 笔记本的可视化功能。而且,在涉及到多个文件和多个开发者协作的复杂项目时,Jupyter 笔记本也显得不太方便。因此,当你需要编写并运行传统的 Python 文件时,使用一个功能更强大的文本编辑器会更加合适。虽然理论上任何文本编辑器都可以用来写 Python 代码,甚至是记事本,但实际需求却更高。一个好的 Python 编辑器应当具备以下几个特性:
- 语法高亮:编辑器能够为不同的代码元素(如函数、字符串、数字等)使用不同的颜色,帮助开发者快速理解代码的结构。
- 自动补全:自动补全功能(也称为智能感知或 IntelliSense)可以根据上下文提供代码建议,减少打字量并降低打错字的概率。
随着开发的深入,你可能会遇到更多的需求。你会希望从编辑器中直接访问以下功能:
- 执行代码:能够直接在编辑器中运行代码,而不需要在文本编辑器和外部命令行(如 Anaconda Prompt)之间来回切换。
- 调试器:调试器可以让你逐行执行代码,查看变量的值,并帮助诊断代码中的问题。
- 版本控制:如果你使用 Git 管理代码,能够直接在编辑器中进行版本控制操作,而无需频繁切换到其他工具。
市面上有许多工具可以满足这些需求,选择合适的工具通常取决于开发者的个人喜好和项目需求。有些开发者可能更喜欢一个简单的文本编辑器配合外部命令行工具,而另一些开发者则倾向于使用集成开发环境(IDE)。IDE通常将代码编写、调试、版本控制等功能集成在一个工具中,但有时也可能显得臃肿。
VS Code 自2015年发布以来,已经成为开发者中最受欢迎的编辑器之一。2019年 Stack Overflow 的开发者调查显示,VS Code 成为最受欢迎的开发环境。VS Code 为什么如此受欢迎呢?简而言之,它融合了文本编辑器和全功能 IDE 的优点:它是一个“迷你 IDE”,涵盖了编程所需的所有基本工具,并且还具备以下特点:
- 跨平台:VS Code 可以在 Windows、macOS 和 Linux 系统上运行,并且还支持云托管版本,如 GitHub Codespaces。
- 集成工具:VS Code 内置调试器,支持 Git 版本控制,并且可以用作 Anaconda Prompt 的集成终端。
- 扩展功能:包括 Python 支持在内的各种功能都可以通过扩展一键安装。
- 轻量级:VS Code 安装包的大小仅为 50MB 到 100MB,适合快速安装并运行。
Warning:VS Code 和 Visual Studio 是两个不同的工具。尽管 Visual Studio 也可以用于 Python 开发(通过安装 Python Tools for Visual Studio,简称 PTVS),但它通常需要更多的配置,并且主要用于 .NET 语言(如 C#)的开发。
为了验证 VS Code 是否真如宣传那样出色,最好的方法就是亲自尝试安装并使用它。
1.安装和配置
直接在微软商城中就可以直接自动安装。
按ctrl+shift+p后输入default profile后选择Terminal:Select Default Profile(选择默认配置文件)
然后按回车键。在下拉菜单中,选择command prompt(命令提示符)并按回车键确认。
这样以便 VSCode 正常激活 Conda 环境。
2.执行Python脚本
如果大家接触过Linux的话就知道,我们可以通过code .来打开VScode。这样文件中的代码就会在目录中显示。
随后新建一个py文件并命名为hellopython.py,并打上如下代码(右下角的python解释器中有对应的版本等信息)
在 Jupyter 笔记本中,通常最后一行代码的返回值会自动显示出来,而在普通的 Python 脚本中,我们需要明确指定输出的内容,这就是为什么要使用 print
函数来输出信息。
在 VS Code 的状态栏中,你应该能够看到 Python 版本号,比如“Python 3.10.9 64-bit (conda)”。如果你点击它,会弹出命令面板,让你选择不同的 Python 解释器(如果你安装了多个版本的话),还可以选择不同的 Conda 环境。记得,在运行脚本之前,一定要先保存文件。在 Windows 上,你可以按快捷键 Ctrl+S
来保存文件。
在 VS Code 中,有几种方法可以运行你的 Python 脚本。一种是通过 Anaconda Prompt 运行,另一种是直接点击编辑器中的运行按钮。对于需要在服务器上运行脚本的情况,通常会使用 Anaconda Prompt 来执行脚本,所以了解如何使用它是非常重要的。
使用 Anaconda Prompt 运行脚本
-
打开 Anaconda Prompt。
-
使用
cd
命令切换到脚本所在的文件夹。例如:(base)> cd C:\Users\username\python-for-excel
-
运行脚本:
(base)> python hellopython.py 输出: hello world!
上述命令运行后,输出结果
hello world!
会显示在屏幕上。如果你没有在正确的文件目录中,你需要使用文件的完整路径: -
(base)> python C:\Users\username\python-for-excel\hellopython.py(看你自己新建在了哪里) hello world!
处理长文件路径
如果路径非常长,你可以直接将文件拖放到 Anaconda Prompt 窗口中,文件的完整路径会自动填入光标所在位置,省去了手动输入路径的麻烦。
在 VS Code 中使用 Anaconda Prompt
不需要离开 VS Code 来使用 Anaconda Prompt。VS Code 提供了一个集成终端,可以直接在其中运行命令。只需按快捷键 Ctrl+`(esc下面)
或通过 “查看 > 终端” 菜单项来打开集成终端。由于集成终端会在当前项目所在的文件夹中打开,所以无需切换目录,直接运行脚本即可:
(base)> python hellopython.py
hello world!
使用 VS Code 的运行按钮
VS Code 还提供了一种非常便捷的运行代码的方式。你在编辑 Python 文件时,会在右上角看到一个播放图标(运行按钮)。点击这个按钮,VS Code 会自动在底部打开终端并运行代码。这种方式不需要切换到 Anaconda Prompt,简化了操作流程。
在 VS Code 中打开文件的默认行为
当你在 VS Code 的资源管理器(位于活动栏)中单击一个文件时,默认会以预览模式打开它。也就是说,如果你没有对文件进行修改,下次单击其他文件时,这个文件会被替换掉当前打开的文件标签。如果你不希望这种行为发生,可以调整 VS Code 的设置。你可以通过 首选项 > 设置
进入设置界面,或者使用快捷键(Windows:Ctrl+,
,macOS:Command-,
),找到 “工作台 > List: Open Mode”,将其设置为 “doubleClick”。这样就可以通过双击文件来打开,而不是单击时自动预览。
补充:可选文本编辑器和 IDE
在选择文本编辑器或集成开发环境(IDE)时,工具的选择因人而异。本书使用了 Jupyter 笔记本和 VS Code,但这并不意味着你只能使用这些工具。以下是一些受欢迎的文本编辑器和 IDE,供你参考:
文本编辑器
-
Sublime Text
Sublime Text 是一个高效且功能强大的付费文本编辑器。它以极快的速度和简洁的界面而受到许多开发者的青睐。 -
Notepad++
Notepad++ 是一个历史悠久且免费的文本编辑器,适用于 Windows 操作系统。它支持多种编程语言,功能简单且易于上手。 -
Vim 和 Emacs
Vim 和 Emacs 是两个非常强大的文本编辑器,但它们有较陡的学习曲线。对于新手程序员来说,这可能不是最优选择,但它们在专业程序员中非常受欢迎。二者之间的竞争非常激烈,甚至被称为“编辑器大战”。
IDE(集成开发环境)
-
PyCharm(本人也使用过这个)
PyCharm 是一个非常强大的 Python IDE。它有免费版(社区版),功能齐全,适用于大多数开发需求。而付费版(专业版)则提供了更多功能,特别是在科学计算和 Web 开发方面。 -
Spyder
Spyder 是一个类似于 MATLAB 的 Python IDE,带有变量浏览器等工具,特别适合数据科学和科学计算。它默认包含在 Anaconda 发行版中,你可以通过 Anaconda Prompt 使用spyder
命令来启动。 -
JupyterLab
JupyterLab 是由 Jupyter 团队开发的基于 Web 的 IDE,它不仅支持 Jupyter 笔记本,还集成了数据科学工作所需的多种工具和功能,适合进行数据分析、机器学习等任务。 -
Wing Python IDE
Wing Python IDE 是一个有着悠久历史的 IDE,提供免费的简化版和付费版(Wing Pro)。它支持调试、代码完成等强大功能。 -
Komodo IDE
Komodo IDE 是由 ActiveState 开发的商业 IDE,除了 Python,还支持许多其他编程语言,如 Ruby、PHP 等。它是一个多语言的开发环境。 -
PyDev
PyDev 是基于 Eclipse IDE 的 Python 插件,提供了强大的调试、代码补全等功能,适合熟悉 Eclipse 的开发者使用。
不同的工具有不同的优点和特点,选择适合自己需求的工具可以提高编程效率和开发体验。