如何用Python统计单词频次并逐行输出

花韻仙語 2026-01-25 00:00:00 次阅读

本文教你编写python程序，读取一行文本并输出每个单词及其出现次数，按输入顺序逐词显示频次，无需额外数据结构即可实现基础需求。

要实现“对输入的每个单词，原序输出该单词及其在整个字符串中的出现频次”，最直接的方法是：对分割后的每个词，调用 str.count() 统计其在整个原始字符串中（而非当前列表）的出现次数。

你的原始代码存在两个关键问题：

each_word.count(x) 统计的是该词在已分割的列表 each
_word 中的重复次数，但 count() 在列表中是精确匹配（区分大小写且不忽略空格），而你期望的是在整个原始输入字符串中搜索子串——这会导致误判（例如 "hi" 和 "mark" 中的 "hi" 不会被单独匹配）；
更严重的是，print(*each_word, word_count) 将全部单词和最后一个 word_count 一次性输出，完全偏离了“每词一行、带频次”的格式要求。

✅ 正确做法是：在循环中对每个 word 即时打印，并使用 phase.count(word)（注意：必须用原始字符串 phase，而非列表）进行频次统计：

phase = input().strip()  # 去首尾空格，避免异常
words = phase.split()

for word in words:
    freq = phase.count(word)  # ✅ 在原始字符串中统计完整单词匹配（注意：这是子串匹配）
    print(f"{word} {freq}")

⚠️ 注意事项：

上述方法依赖 str.count() 的子串匹配行为。它能正确处理示例 hey hi Mark hi mark，因为各单词间由空格分隔，无嵌套（如 "hi" 不会误匹配 "high"）。但若输入含标点（如 "hi!"）或大小写混杂需统一处理，则需进阶方案（如正则清洗或 collections.Counter + 规范化）。

若后续需去重统计或忽略大小写，推荐改用字典累计：

from collections import Counter
words = [w.lower() for w in phase.split()]  # 统一小写
counter = Counter(words)
for word in phase.split():
    print(f"{word} {counter[word.lower()]}")