如何用Python统计单词频次并逐行输出

本文教你编写python程序,读取一行文本并输出每个单词及其出现次数,按输入顺序逐词显示频次,无需额外数据结构即可实现基础需求。

要实现“对输入的每个单词,原序输出该单词及其在整个字符串中的出现频次”,最直接的方法是:对分割后的每个词,调用 str.count() 统计其在整个原始字符串中(而非当前列表)的出现次数

你的原始代码存在两个关键问题:

  • each_word.count(x) 统计的是该词在已分割的列表 each

    _word 中的重复次数,但 count() 在列表中是精确匹配(区分大小写且不忽略空格),而你期望的是在整个原始输入字符串中搜索子串——这会导致误判(例如 "hi" 和 "mark" 中的 "hi" 不会被单独匹配);
  • 更严重的是,print(*each_word, word_count) 将全部单词和最后一个 word_count 一次性输出,完全偏离了“每词一行、带频次”的格式要求。

✅ 正确做法是:在循环中对每个 word 即时打印,并使用 phase.count(word)(注意:必须用原始字符串 phase,而非列表)进行频次统计:

phase = input().strip()  # 去首尾空格,避免异常
words = phase.split()

for word in words:
    freq = phase.count(word)  # ✅ 在原始字符串中统计完整单词匹配(注意:这是子串匹配)
    print(f"{word} {freq}")

⚠️ 注意事项:

  • 上述方法依赖 str.count() 的子串匹配行为。它能正确处理示例 hey hi Mark hi mark,因为各单词间由空格分隔,无嵌套(如 "hi" 不会误匹配 "high")。但若输入含标点(如 "hi!")或大小写混杂需统一处理,则需进阶方案(如正则清洗或 collections.Counter + 规范化)。
  • 若后续需去重统计或忽略大小写,推荐改用字典累计:
    from collections import Counter
    words = [w.lower() for w in phase.split()]  # 统一小写
    counter = Counter(words)
    for word in phase.split():
        print(f"{word} {counter[word.lower()]}")
  • 本题预期输出保留原始大小写和顺序(如 Mark 和 mark 视为不同词),因此无需转换,直接使用原始 word 打印即可。

总结:对于基础场景,用 input().split() 配合原始字符串的 .count() 是简洁有效的解法;理解“统计对象是原始字符串”而非分割后列表,是修正逻辑的关键。