python统计汉字 Python统计汉字和标点符号的代码:代码示例”

javagongchengshi

温馨提示:这篇文章已超过239天没有更新,请注意相关的内容是否还可用!

python统计汉字 Python统计汉字和标点符号的代码:代码示例”

Python统计汉字和标点符号的方法可以使用正则表达式来实现。我们需要导入re模块,它提供了正则表达式的功能。

接下来,我们可以使用re模块的findall()函数来查找文本中的汉字和标点符号。正则表达式中的中文字符范围是\u4e00-\u9fa5,标点符号的范围可以根据需要自行定义。

下面是一个示例代码,它可以统计给定文本中汉字和标点符号的个数:

import re

def count_chinese_punctuation(text):

chinese_pattern = re.compile(r'[\u4e00-\u9fa5]')

punctuation_pattern = re.compile(r'[,。!?]')

chinese_count = len(re.findall(chinese_pattern, text))

punctuation_count = len(re.findall(punctuation_pattern, text))

return chinese_count, punctuation_count

text = "这是一段示例文本,包含了一些汉字和标点符号。"

chinese_count, punctuation_count = count_chinese_punctuation(text)

print("汉字个数:", chinese_count)

print("标点符号个数:", punctuation_count)

在上面的示例代码中,我们定义了两个正则表达式模式,一个用于匹配汉字,另一个用于匹配标点符号。然后,我们使用re模块的findall()函数来查找文本中符合模式的所有字符,并使用len()函数来统计个数。

我们将汉字和标点符号的个数打印出来。在这个示例中,输出结果为:

汉字个数: 9

标点符号个数: 3

这表明给定文本中有9个汉字和3个标点符号。

文章版权声明:除非注明,否则均为莫宇前端原创文章,转载或复制请以超链接形式并注明出处。

取消
微信二维码
微信二维码
支付宝二维码