python统计汉字 Python统计汉字和标点符号的代码：代码示例”

温馨提示：这篇文章已超过239天没有更新，请注意相关的内容是否还可用！

Python统计汉字和标点符号的方法可以使用正则表达式来实现。我们需要导入re模块，它提供了正则表达式的功能。

接下来，我们可以使用re模块的findall()函数来查找文本中的汉字和标点符号。正则表达式中的中文字符范围是\u4e00-\u9fa5，标点符号的范围可以根据需要自行定义。

下面是一个示例代码，它可以统计给定文本中汉字和标点符号的个数：


import re
def count_chinese_punctuation(text):
    chinese_pattern = re.compile(r'[\u4e00-\u9fa5]')
    punctuation_pattern = re.compile(r'[，。！？]')
    chinese_count = len(re.findall(chinese_pattern, text))
    punctuation_count = len(re.findall(punctuation_pattern, text))
    return chinese_count, punctuation_count
text = "这是一段示例文本，包含了一些汉字和标点符号。"
chinese_count, punctuation_count = count_chinese_punctuation(text)
print("汉字个数：", chinese_count)
print("标点符号个数：", punctuation_count)

在上面的示例代码中，我们定义了两个正则表达式模式，一个用于匹配汉字，另一个用于匹配标点符号。然后，我们使用re模块的findall()函数来查找文本中符合模式的所有字符，并使用len()函数来统计个数。

我们将汉字和标点符号的个数打印出来。在这个示例中，输出结果为：

汉字个数： 9

标点符号个数： 3

这表明给定文本中有9个汉字和3个标点符号。

python统计汉字 Python统计汉字和标点符号的代码：代码示例”

相关阅读