Python笔记07Python07

272 阅读 0 评论 180 点赞

我是靠谱客的博主无奈小土豆，这篇文章主要介绍Python笔记07Python07，现在分享给大家，希望可以做个参考。

Python07

Python07字符串什么是字符串字符串的驻留机制字符串的常用操作字符串的查询操作字符串的大小写转换操作的方法字符串内容的对齐操作字符串的劈分操作方法判断字符串的操作方法替换与合并字符串的比较操作字符串的切片操作格式化字符串格式化字符串的两种方式字符串的编码与解码

字符串

什么是字符串

在Python中字符串是基本数据类型，是一个不可变的字符序列

字符串的驻留机制

仅保存一份相同且不可变字符串的方法，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的字符串只保留一份拷贝，后续创建相同字符串时，不会开劈空间，而是把字符串的地址赋给新创建的变量

# 字符串的驻留机制
a = 'Python'
b = "Python"
c = '''Python'''
print(a, id(a))
print(b, id(b))
print(c, id(c))

驻留机制的几种情况（交互模式）
- 字符串的长度为0或1
- 符合标识符的字符串
- 字符串只在编译时驻留，而非运行时
- [-5,256]之间的整数数字
sys中的item方法强制2个字符串指向同一个对象
PyCharm对字符串进行了优化处理

s1 = ' abc%'
s2 = ' abc%'
print(s1 is s2)  # True

字符串驻留机制的优缺点
- 当需要值相同的字符串时，可以直接从字符串池里拿来使用，避免频繁的创建和销毁，提升效率和节约内存，因此拼接字符和修改字符串会比较影响性能的
- 在需要进行字符串拼接时建议使用str类型的join方法，而非+，因为join·（）方法是先计算出所有字符中的长度，然后再拷贝，只new一次对象，效率比“+”的效率高

字符串的常用操作

字符串的查询操作

方法名称	作用
index（）	查找子串substr第一次出现的位置，如果查找的子串不存在时，则抛出ValueError
rindex（）	查找子串substr最后一次出现的位置，如果查找的子串不存在时，则抛出ValueError
find（）	查找子串substr第一次出现的位置，如果查找的子串不存在时，则返回-1
rfind（）	查找子串substr最后一次出现的位置，如果查找的子串不存在时，则返回-1

# 字符串的查询操作
s = 'hello,hello'
print(s.index('lo'))  # 3
print(s.find('lo'))  # 3
print(s.rindex('lo'))  # 9
print(s.rfind('lo'))  # 9

# print(s.index('k'))  # ValueError
print(s.find('k'))  # -1
# print(s.rindex('k'))  # ValueError
print(s.rfind('k'))  # -1

字符串的大小写转换操作的方法

方法名称	作用
upper（）	把字符串中所有字符都转成大写字母
lower（）	把字符串中所有字符都转成小写字母
swapcase（）	把字符串中所有大写字母转成小写字母，把所有小写字母转成大写字母
capitalize（）	把第一个字符转换为大写，把其余字符转换为小写
title（）	把每个单词的第一个字符转换为大写，把每个单词的剩余字符转换为小写

# 字符串中大小写转换方法
s = 'hello,python'
a = s.upper()   # 转成大写后，会产生一个新的字符串对象
print(a, id(a))
print(s, id(s))
b = s.lower()  # 转换之后，会产生一个新的字符串对象
print(b, id(b))
print(s, id(s))
print(b == s)  # True
print(b is s)  # False

s2 = 'hello,Python'
c = s2.swapcase()
print(c, id(c))  # HELLO,pYTHON

print(s2.title())  # Hello,Python

字符串内容的对齐操作

方法名称	作用
center（）	居中对齐，第一个参数指定宽度，第二个参数指定填充符，第二个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符串
ljust（）	左对齐，第一个参数指定宽度，第二个参数指定填充符，第二个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符
rjust（）	右对齐，第一个参数指定宽度，第二个参数指定填充符，第二个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符串
zfill（）	右对齐，左边用0填充，该方法只接收一个参数，用于指定字符串的宽度，如果指定的宽度小于等于字符串的长度，返回字符串本身

s = 'hello,Python'
'''居中对齐'''
print(s.center(20, '*'))
'''左对齐'''
print(s.ljust(20, '*'))
print(s.ljust(10))
print(s.ljust(20))
'''右对齐'''
print(s.rjust(20, '*'))
print(s.rjust(20))
print(s.rjust(10))
'''右对齐,使用0进行填充'''
print(s.zfill(20))
print(s.zfill(1))
print('-8910'.zfill(8))  # -0008910

字符串的劈分操作

方法

split（）
- 从字符串的左边开始劈分，默认的劈分字符是空格字符串，返回的值都是一个列表
- 以通过参数sep指定劈分字符串是的劈分符
- 通过参数maxsplit指定劈分字符串的最大劈分次数，在经过最大次劈分之后，剩余的子串会单独作为一部分
rsplit（）
- 从字符串的右边开始劈分，默认的劈分字符是空格字符串，返回的值都是一个列表
- 以通过参数sep指定劈分字符串是的劈分符
- 通过参数maxsplit指定劈分字符串时的最大劈分次数，在经过最大劈分次数之后，剩余的子串会单独作为一部分

s = 'hello world Python'
lst = s.split()
print(lst)  # ['hello', 'world', 'Python']
s1 = 'hello|world|Python'
print(s1.split('|'))
print(s1.split('|', maxsplit=1))
print(s1.split('|', maxsplit=2))

'''rsplit()从右侧开始劈分'''
print(s.rsplit())
print(s1.rsplit('|'))
print(s1.rsplit('|', maxsplit=1))

判断字符串的操作方法

方法名称	作用
isidentifier（）	判断指定的字符串是不是合法的标识符
isspace（）	判断指定的字符串是否全部有空白字符组成（回车、换行、水平制表符）
isalpha（）	判断指定的字符串是否全部由字母组成
isdecimal（）	判断指定字符串是否全部由十进制的数字组成
isnumeric()	判断指定的字符串是否全部由数字组成
isalnum()	判断指定的字符串是否全部由字母和数字组成

'''字符串的判断操作'''
s = 'hello,python'
print('1.', s.isidentifier())  # False
print('2.', 'hello'.isidentifier())  # True
print('3.', '张三'.isidentifier())  # True
print('4.', '张三_123'.isidentifier())  # True

print('5.', 't'.isspace())  # True

print('6.', 'abc'.isalpha())  # True
print('7.', '张三'.isalpha())  # True
print('8.', '张三1'.isalpha())  # False

print('9.', '123'.isdecimal())  # True
print('10.', '123四'.isdecimal())  # False
print('11.', '罗马数字'.isdecimal())  # False

print('12.', '123'.isnumeric())  # True
print('13.', '123四'.isnumeric())  # True
print('14.', '罗马数字'.isnumeric())  # True

print('15.', 'abc1'.isalnum())  # True
print('16.', '张三123'.isalnum())  # True
print('17.', 'abc！'.isalnum())  # False

替换与合并

功能	方法名称	作用
字符串替换	replace（）	第一个参数指定被替换的子串，第二个参数指定替换子串的字符串，该方法返回替换后得到的字符串，替换前的字符串不发生变化，调用该方法时可以通过第三个参数指定最大替换次数
字符串的合并	join（）	将列表或元组中的字符串合并成一个字符串

s = 'hello,Python'
print(s.replace('Python', 'world'))
s1 = 'hello,Python,Python,Python'
print(s1.replace('Python', 'world', 2))

lst = ['hello', 'java', 'Python']
print('|'.join(lst))
print(' '.join(lst))

t = ('hello', 'java', 'Python')
print(' '.join(t))

print('*'.join('Python'))  # P*y*t*h*o*n

字符串的比较操作

运算符：<,<=,>,>=,==,!=
比较规则：首先比较两个字符串中的第一个字符串，如果相等则继续比较下一个字符，依次比较下去，直到两个字符串中的字符不相等时，其比较结果就是连个字符串的比较结果，两个字符串中的所有后续字符将不再被比较
比较原理：两个字符进行比较时，比较的是其ordinal value（原始值），调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr，调用内置函数chr时指定ordinal value可以得到其对应的字符

print('apple' > 'app')  # True
print('apple' > 'banana')  # False
print(ord('a'), ord('b'))  # 97 98
print(chr(97), chr(98))  # a b
'''==与is区别
==比较的是value是否相等
is比较的是id是否相等'''
a = b = 'Python'
c = 'Python'
print(a == b)  # True
print(b == c)  # True
print(a is b)  # True
print(a is c)  # True
print(id(a), id(b), id(c))  # 2278382845320字符串驻留

字符串的切片操作

字符串是不可变类型
不具备增删改等操作
切片操作将产生新的对象

s = 'hello,Python'
s1 = s[:5]  # 由于没有指定起始位置，所以从0kaishi
s2 = s[6:]  # 由于没有指定结束位置，所以访问到字符串的最后一个元素
s3 = '!'
newstr = s1 + s3 +s2
print(s1)
print(s2)
print(newstr)
print('-------------------')
print(id(s))
print(id(s1))
print(id(s2))
print(id(s3))
print(id(newstr))
print('-----------------切片[start:end:step]------------------------')
print(s[1:5:1])  # 从1开始数到5，不包含5，步长为1
print(s[::2])  # 默认是从0开始，没有写结束，默认到字符串的最后一个元素，步长为2，两个元素之间的索引间值为2
print(s[::-1])  # 默认从字符串的最后一个元素开始，到字符串的第一个元素结束，因为步长为负数
print(s[-6::1]) # 从索引为-6开始，到字符串的最后一个元素结束，步长为1

格式化字符串

格式化字符串的两种方式

%作为占位符：%s：字符串。%l或%d：整数。%f：浮点数。
{}作占位符

# 格式化字符串
# %占位
name = '张三'
age = 20
print('我叫%s，今年%d岁啦' % (name, age))
# {}占位符
print('我叫{0}，今年{1}岁啦'.format(name, age))
# f-string
print(f'我叫{name}，今年{age}岁啦')

print('%d' % 99)
print('%10d' % 99)  # 10表示的是宽度
print('%.3f' % 3.1415926)  # 保留三位小数
print('%10.3f' % 3.1415926)  # 同时表示宽度和精度；表示一共宽度为10，小数点后三位
print('hellohello')

print('{0:.3}'.format(3.1415926))  # .3表示的是一共是三位数
print('{0:.3f}'.format(3.1415926))  # .3f表示的是三位小数
print('{0:10.3f}'.format(3.1415926))  # 10.3f表示的是宽度是10位，三位小数

字符串的编码与解码

编码：将字符串转换为二进制数据
解码：将bytes类型的数据转换成字符串类型

s = '天涯共此时'
# 编码
print(s.encode(encoding='GBK'))  # 在GBK这种编码格式中，一个中文占两个字节
print(s.encode(encoding='UTF-8'))  # 在UTF-8这种编码格式中，一个中文占三个字节
# 解码  byte代表的是一个二进制数据（字节类型数据）
byte = s.encode(encoding='GBk')  # 编码
print(byte.decode(encoding='GBk'))  # 解码
byte = s.encode(encoding='UTF-8')  # 编码
print(byte.decode(encoding='UTF-8'))  # 解码