Python字符串易踩的10个“坑”-程序员充电站

大家好，欢迎来到 Crossin 的编程教室。

字符串是Python中最常用的数据类型之一，看起来简单，用着顺手，但里面也藏着一些“坑”，很多新手（甚至有些老手）都会在这里不小心踩中。

今天我们就来盘点一下Python字符串的10个经典易错点，帮助你避开这些常见错误。相信看完这篇文章，你对字符串的理解又能更进一步。

1. 字符串是不可变的

Python的字符串是不可变（immutable）的，这意味着一旦创建，就不能修改其中的字符。

很多人写出这样的代码，以为自己改了字符串：

s = "hello"s[0] = "H" # 试图修改第一个字符

结果直接报错：'str' object does not support item assignment

还有人用replace，以为它能原地替换：

s = "hello"s.replace("h", "H")print(s) # 还是 "hello"

但其实 replace 是返回一个新字符串，原字符串没变。正确写法：

s = s.replace("h", "H")print(s) # "Hello"

记住：任何“修改”字符串的操作，都会返回新字符串，原字符串不变。

2. is 和 == 在字符串里的区别

== 判断值是否相等，is 判断是否是同一个对象。

对于小字符串，Python会做字符串驻留（interning），所以有时is也返回True：

a = "hello"b = "hello"print(a == b) # Trueprint(a is b) # 通常True（因为驻留）

但不要依赖 is，尤其是长字符串或动态生成的：

a = "hello world!"b = "hello " + "world!"print(a is b) # 可能False

所以，永远用 == 比较值相等。

3. 空字符串、None、False 的混淆

空字符串 ""、None、False 在布尔上下文中都为 False：

if "": print("不会执行")if None: print("也不会执行")if False: print("还是不执行")

但它们是完全不同的东西：

""：有值，字符串类型，只是内容为空
None：没有值 / 未赋值
False：有值，bool类型

检查字符串是否为空串用 if s == ""，不要和 None 混用。

4. strip() 不是“删除字符”

有人以为：

s.strip("abc")

是删除字符串里的 "abc" 子串。

但其实它的含义是：

删除字符串两端所有属于字符集合 {a, b, c} 的字符。

print("abc123abc456bca".strip("abc"))# 结果是 "123abc456"

不是替换，不是删除子串，而是从两端往中间“剥字符”，直到不属于集合的字符为止。

5. split() 的默认行为

不传参数的split()很聪明：

s = "a b c d"print(s.split()) # ['a', 'b', 'c', 'd'] 自动把连续空白当一个分隔符print(s.split(" ")) # ['a', '', 'b', '', '', 'c', '', 'd']

它会自动丢弃首尾空白，并忽略空字段。

6. 字符串比较的“反直觉”顺序

字符串比较是按Unicode码点逐字符比较的：

print("10" < "2") # True 因为'1'的码点 < '2'print("Apple" < "apple") # True 因为大写A < 小写a

因此排序或比较版本号、数字字符串时可能会跟你想象的结果不一样。需要排序数字时，先转 int 或用 key 参数。

7. 字符长度 ≠ 显示长度

len() 计算的是字符数（Unicode码点数），不是视觉宽度：

s = "你好🏃🏻‍♀️" # emoji组合字符print(len(s)) # 7

8. 循环中用 + 拼接字符串的性能陷阱

在循环里这样拼接：

s = ""for i in range(100000): s += "a" # 每次都创建新字符串

大数据量时会超级慢（O(n²)）。

正确方式：

parts = []for i in range(100000): parts.append("a")s = "".join(parts)# 或直接 s = "".join("a" for i in range(10000))

大量字符串拼接时务必用 join。

9. “中文乱码”

中文乱码通常发生在编码/解码不匹配的时候：

text = "中文"bytes_data = text.encode("gbk") # 用gbk编码print(bytes_data.decode("gbk")) # 用gbk解码正确print(bytes_data.decode("utf-8", errors='replace')) # 用utf-8解码 → 乱码 ����

读文件、网络数据时，指定正确的编码，否则编码不匹配就会乱码。

10. 结尾不能是单个反斜杠

字符串末尾不能直接写单个 \，因为它会转义后面的引号，即使是前面加上 r 的原始字符串（raw string）也不行：

r"C:\new\test\" # 语法错误

如果你想表示 Windows 的路径，直接用 / 替代 \ 吧。

以上就是Python字符串的10个易错点。希望这些例子能帮你少走弯路。

你还踩过什么坑？可以在留言区说一说。

如果本文对你有帮助，欢迎点赞、评论、转发。你们的支持是我更新的动力~

Crossin的新书《码上行动：用ChatGPT学会Python编程》已经上市了。本书以ChatGPT为辅助，系统全面地讲解了如何掌握Python编程，适合Python零基础入门的读者学习。【点此查看详细介绍】

购买后可加入读者交流群，Crossin为你开启陪读模式，解答你在阅读本书时的一切疑问。

Crossin的其他书籍：

添加微信crossin123，加入编程教室共同学习~

感谢转发和点赞的各位~

针对Docker CentoS Stream9内核和文件描述符优化

文章目录一、文件描述符优化（解决 "too many open files"） 1. 系统级文件描述符限制（永久生效） 2. 用户级文件描述符限制（永久生效） 3. Docker 服务级限制（关键！Systemd 管理的服务需单独配置） 4. 验证文件描述符优化生效二、内核参数优化（适配 Docker 运…

李华

MCP量子认证通过率仅35%？，靠这4套精准模拟题我一次上岸

第一章：MCP量子认证模拟试题概述 MCP量子认证是面向现代云计算与量子计算融合领域的一项高级技术资格认证，旨在评估开发者在量子算法集成、云平台部署及安全协议实现等方面的综合能力。模拟试题作为备考的核心资源，全面覆盖理论知识与实操技能…

李华

YOLO的“开眼看世界”：让目标检测突破类别限制，听懂你的话

从“固定答案”到“开放世界” 想象一下，你训练了一个能识别猫狗的YOLO模型，但当它遇到一只兔子时，它要么强行把兔子归为猫或狗，要么直接忽略。这就是传统目标检测的局限——“封闭世界”假设。模型只能识别训练时见过的固定类别。但随着人工智能的发展，我们越来越需要…

李华

紧急！未正确备份图Agent将导致全域数据崩溃？速看官方认证方案

第一章：MCP DP-420 图 Agent 备份的紧迫性与风险解析在现代数据保护体系中，MCP DP-420 图 Agent 作为关键的数据代理组件，承担着从源系统采集、加密并传输备份数据的核心职责。一旦该代理出现故障或配置丢失，将直接导致备份链中断…

李华

听LLaMA Factory、vLLM、RAGFlow作者亲述顶级开源项目的增长法则｜GOBI 2025

于开发者而言，开源一个项目很简单，一个命令足矣，但维护一个项目，却意味着：一边扛着本职工作，一边独自修复 Bug、优化文档；深夜改着无人问津的 PR，独自面对着扎堆涌来的 Issue……看着…

李华

【限时领取】MCP量子认证全真模拟试卷5套（含评分标准）

第一章：MCP量子认证模拟试卷一考试环境配置说明为确保MCP量子认证模拟考试顺利进行，需在本地部署兼容的量子计算模拟环境。推荐使用Qiskit与Python 3.9组合构建开发与测试平台。安装Python 3.9或更高版本，验证命令：python --vers…

李华