字符串操作
replace()实现字符串替换
字符串是“不可改变”的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变字符串。我们尝试改变字符串中某个字符,发现报错了
字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。
a = "abcdefghijklmnopqrstuvwxyz"
a = a.replace("c", "高")
print(a)
str()实现数字转型字符串
str()
可以帮助我们将其他数据类型转换为字符串。例如:
a = str(5.20) #结果是:a = ‘5.20’
b = str(3.14e2) #结果是:b = ’314.0’
c = str(True) #结果是:c = ‘True’
使用[]提取字符
字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。
正向搜索:
最左侧第一个字符,偏移量是 0,第二个偏移量是 1,以此类推。直到 len(str)-1 为止。
反向搜索:
最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str)为止。
a = "abcdefghijklmnopqrstuvwxyz"
a[0] # 'a'
a[3] # 'd'
a[-1] # 'z'
a[-26] # 'a'
字符串切片 slice 操作
切片 slice 操作可以让我们快速的提取子字符串。标准格式为:[起始偏移量start:终止偏移量end:步长step]
操作和说明 | 示例 | 结果 |
---|---|---|
[:] 提取整个字符串 | “abcdef”[:] | “abcdef” |
[start:] 从 start 索引开始到结尾 | “abcdef”[2:] | “cdef” |
[:end] 从头开始知道 end-1 | “abcdef”[:2] | “ab” |
[start:end] 从 start 到 end-1 | “abcdef”[2:4] | “cd” |
[start:end:step] 从 start 提取到 end-1,步长是 step | “abcdef”[1:5:2] | “bd” |
其他操作(三个量为负数)的情况:
示例 | 说明 | 结果 |
---|---|---|
"abcdefghijklmnopqrstuvwxyz"[-3:] | 倒数三个 | “xyz” |
"abcdefghijklmnopqrstuvwxyz"[-8:-3] | 倒数第八个到倒数第三个(包头不包尾) | 'stuvw' |
"abcdefghijklmnopqrstuvwxyz"[::-1] | 步长为负,从右到左反向提取 | 'zyxwvutsrqponmlkjihgfedcba' |
切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于 0 则会当做 0,终止偏移量大于“长度-1”会被当成-1。例如:
"abcdefg"[3:50] # 'defg'
"abcdefghijklmnopqrstuvwxyz"[::-1] # 'zyxwvutsrqponmlkjihgfedcba'
split()分割和 join()合并
split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符):
a = "to be or not to be"
a.split() # ['to', 'be', 'or', 'not', 'to', 'be']
a.split('be') # ['to ', ' or not to ', '']
join()的作用和 split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:
a = ["jiamei", "jiamei100", "jiamei200"]
"*".join(a) # jiamei*jiamei100*jiamei200
字符串常用方法
常用查找方法
a='''我是嘉美,我在XXXXX上班。我的儿子叫XXX,他6岁了。我是一个编程教育的普及者,希望影响XXXX万学习编程的中国人。我儿子现在也开始学习编程,希望他18岁的时候可以超过我'''
方法和使用示例 | 说明 | 结果 |
---|---|---|
len(a) | 字符串长度 | 66 |
a.startswith('我是嘉美') | 以指定字符串开头 | True |
a.endswith('过我') | 以指定字符串结尾 | True |
a.find('嘉') | 第一次出现指定字符串的位置 | 2 |
a.rfind('嘉') | 最后一次出现指定字符串的位置 | 2 |
a.count("编程") | 指定字符串出现了几次 | 3 |
a.isalnum() | 所有字符全是字母或数字 | False |
a = """我是嘉美,我在XXXXX上班。我的儿子叫XXX,他6岁了。我是一个编程教育的普及者,希望影响XXXX万学习编程的中国人。我儿子现在也开始学习编程,希望他18岁的时候可以超过我"""
len(a) # 66
a.startswith("我是嘉美") # True
a.endswith("过我") # True
a.find("嘉") # 2
a.rfind("嘉") # 2
a.count("编程") # 3
a.isalnum() # False
去除首尾信息
我们可以通过 strip()去除字符串首尾指定信息。通过 lstrip()去除字符串左边指定信息,rstrip()去除字符串右边指定信息。
"*s*x*t*".strip("*") # 's*x*t'
"*s*x*t*".lstrip("*") # 's*x*t*'
"*s*x*t*".rstrip("*") # '*s*x*t'
" s xt ".strip() # 's xt'
大小写转换
编程中关于字符串大小写转换的情况,经常遇到。我们将相关方法汇总到这里。为了方便学习,先设定一个测试变量:
a = "gaoqi love programming, love SXT"
示例 | 说明 | 结果 |
---|---|---|
a.capitalize() | 产生新的字符串,首字母大写 | 'Gaoqi love programming, love sxt' |
a.title() | 产生新的字符串,每个单词都首字母大写 | 'Gaoqi Love Programming, Love Sxt' |
a.upper() | 产生新的字符串,所有字符全转成大写 | 'GAOQI LOVE PROGRAMMING, LOVE SXT' |
a.lower() | 产生新的字符串,所有字符全转成小写 | 'gaoqi love programming, love sxt' |
a.swapcase() | 产生新的,所有字母大小写转换 | 'GAOQI LOVE PROGRAMMING, LOVE sxt' |
格式排版
center()
、ljust()
、rjust()
这三个函数用于对字符串实现排版。示例如下
a="JIAMEI"
a.center(10,"*") # '**JIAMEI**'
a.center(10) # ' JIAMEI '
a.ljust(10,"*") # 'JIAMEI****'
特征判断方法
- salnum() 是否为字母或数字
- salpha() 检测字符串是否只由字母组成(含汉字)
- sdigit() 检测字符串是否只由数字组成
- sspace() 检测是否为空白符
- supper() 是否为大写字母
- islower() 是否为小写字母
"sxt100".isalnum() # True
"sxt尚学堂".isalpha() # True
"234.3".isdigit() # False
"23423".isdigit() # True
"aB".isupper() # False
"A".isupper() # True
"\t\n".isspace() # True
format 格式化
字符串格式化
基本语法是通过 {} 和:来代替以前的 % 。
format() 函数可以接受不限个数的参数,位置可以不按顺序。
a = "名字是:{0},年龄是:{1}"
print(a.format("张三", 18))
b = "名字是:{0},年龄是{1}。{0}是个好小伙"
print(b.format("李四", 20))
c = "名字是{name},年龄是{age}"
print(c.format(age=19, name="王五"))
数字格式化
浮点数通过f
,整数通过d
进行需要的格式化。
数字 | 格式 | 输出 | 描述 |
---|---|---|---|
3.1415926 | {:.2f} | 3.14 | 保留小数点后两位 |
3.1415926 | {:+.2f} | 3.14 | 带符号保留小数点后两位 |
2.71828 | {:.0f} | 3 | 不带小数 |
5 | {:0>2d} | 05 | 数字补零 (填充左边, 宽度为 2) |
5 | {:x<4d} | 5xxx | 数字补 x (填充右边, 宽度为 4) |
10 | {:x<4d} | 10xx | 数字补 x (填充右边, 宽度为 4) |
1000000 | {:,} | 1,000,000 | 以逗号分隔的数字格式 |
0.25 | {:.2%} | 25.00% | 百分比格式 |
1000000000 | {:.2e} | 1.00E+09 | 指数记法 |
13 | {:10d} | 13 | 右对齐 (默认, 宽度为 10) |
13 | {:<10d} | 13 | 左对齐 (宽度为 10) |
13 | {:^10d} | 13 | 中间对齐 (宽度为 10) |
a = "我是{0},我的存款有{1:.2f}"
print(a.format("张三", 888.888))