摘要:问题如何比较两个字面一样,但字节不一样的字符串例如人口膾炙人口膾这里的和字符串是一样的,但仔细观察可以发现,其中字符串是,字符串对应的是所以虽然和是字面上一模一样的字符串,但实际上和是不等的解决方案使用库的将两个字符串标准化后,再进行比较就
问题
如何比较两个字面一样,但字节不一样的字符串
例如:
>>> a = u"u4ebau53e3u3058u3093u3053u3046u306bu81beu7099u304bu3044u3057u3083u3059u308b" >>> b = u"u4ebau53e3u3058u3093u3053u3046u306bu81beuf9fbu304bu3044u3057u3083u3059u308b" >>> print(a, b, sep=" ") 人口じんこうに膾炙かいしゃする 人口じんこうに膾炙かいしゃする
这里的a和b字符串是一样的,但仔细观察可以发现,其中a字符串是u7099,b字符串对应的是uf9fb
所以虽然a和b是字面上一模一样的字符串,但a实际上和b是不等的
>>> a == b False解决方案
使用unicodedata库的normalize将两个字符串标准化后,再进行比较就可以了
>>> import unicodedata >>> normalize_a = unicodedata.normalize("NFC", a) >>> normalize_b = unicodedata.normalize("NFC", b) >>> print(normalize_a) 人口じんこうに膾炙かいしゃする >>> print(normalize_b) 人口じんこうに膾炙かいしゃする >>> print(normalize_a == normalize_b) True讨论
这个问题是最近在Stack Overflow上很热的一个问题,原问题见:https://stackoverflow.com/que...
关于Unicode对这个问题的介绍可以见:http://www.unicode.org/faq/no...
来源Stack Overflow
关注欢迎关注我的微信公众号:python每日一练
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/41503.html
摘要:问题在每日一练中介绍了如何一个可迭代对象,使用运算符即可但往往我们遇到的问题是可迭代对象中的数量是不确定的这个时候该如何拿到我们想要的元素,比如我们只需要可迭代对象的第一个或者最后一个元素而已解决方案使用中的运算符例如我们需要拿到一个元组的 问题 在每日一练0001中介绍了如何unpack一个可迭代对象,使用,运算符即可 但往往我们遇到的问题是可迭代对象中的数量是不确定的 这个时候该如...
摘要:问题如何序列化输出元素包含字符串元组的字符串元组好绕举个例子将输出为解决方案容易想到使用函数,但函数要求元素必须都是字符串类型,否则会抛出错误一个比较简单的方法是将给进中,然后再将给进函数,最后指定函数的参数来输出如果想要将结果存储起来,那 问题 如何序列化输出元素包含字符串元组的字符串元组(好绕) 举个例子 >>> zoo1 = (monkey, elephant) >>> zoo2...
摘要:问题如何执行外部命令,如解决方案使用库在之前,使用函数在及之后,使用函数讨论命令的执行默认不需要环境,所以当你使用作为参数时,需要将置位,否则会报错误通常来说对于执行系统命令,我们会想到,但在官方文档中已经建议了使 问题 如何执行外部命令,如ls -l 解决方案 使用subprocess库 在Python 3.5之前,使用subprocess.call()函数 >>> import s...
摘要:问题如何判断一个文件是否存在解决方案这个问题可以分成几类问题如果这里的文件指的是文件或目录,我们可以用方法如果这里的文件指的是普通的文件,我们可以用方法如果这里的文件指的是目录,我们可以用方法并且在之后,可以使用面向对象的方法使用库来判断, 问题 如何判断一个文件是否存在 解决方案 这个问题可以分成几类问题 如果这里的文件指的是文件或目录,我们可以用os.path.exists()方法...
摘要:问题你需要执行简单的日期操作,计算两个日期间隔多少天某个日期后的多少天是几月几日转换时间字符串的格式等解决方案使用库中的和类其中类代表一个日期时间,例如年月日点分秒类代表一个日期间隔对于实例,可以直接进行数学运算得到一个实例,也就是两个日 问题 你需要执行简单的日期操作,计算两个日期间隔多少天、某个日期后的多少天是几月几日、转换时间字符串的格式等 解决方案 使用datetime库中的d...
阅读 1439·2021-11-22 14:44
阅读 2806·2021-11-16 11:44
阅读 3189·2021-10-13 09:40
阅读 1944·2021-10-08 10:04
阅读 2329·2021-09-24 10:28
阅读 2891·2021-09-06 15:02
阅读 2918·2019-08-30 15:52
阅读 2376·2019-08-30 13:20