永发信息网

linux 统计某个单词出现多少次

答案:3  悬赏:0  手机版
解决时间 2021-01-19 06:12
  • 提问者网友:焚苦与心
  • 2021-01-18 13:13
linux 统计某个单词出现多少次
最佳答案
  • 五星知识达人网友:枭雄戏美人
  • 2021-01-18 14:38
使用这个命令查出文本中的单词出现频率按照由高到底排序
cat words.txt |tr -cs "[a-z][A-Z]" "[12*]"|tr A-Z a-z|sort|uniq -c|sort -k1nr -k2|head -10
但是有时我们想查找出某一个单词的出现频率这时我们可以使用如下几个命令
文件名称:file  查找单词名称:word
操作命令:
(1)more file | grep -o word | wc -l
(2)cat file | grep -o word | wc -l
(3) grep -o test word | wc -l
如果这些还是不能满足需求,那只能写linux脚本进行实现了。可以使用awk哦
1.命令格式:
wc [选项]文件...
2.命令功能:
统计指定文件中的字节数、字数、行数,并将统计结果显示输出。该命令统计指定文件中的字节数、字数、行数。如果没有给出文件名,则从标准输入读取。wc同时也给出所指定文件的总统计数。
3.命令参数:
-c 统计字节数。
-l 统计行数。
-m 统计字符数。这个标志不能与 -c 标志一起使用。
-w 统计字数。一个字被定义为由空白、跳格或换行字符分隔的字符串。
-L 打印最长行的长度。
--help 显示帮助信息
--version 显示版本信息
4.值得注意的是,-c,c应该是count的缩写,统计的是文件的字节数,而不是通常我们想要的“字数”,字数的统计应该用-w,所以上面提到那个问题,可以怎么做呢?wc并没有提供给我们统计特定一个单词的选项,只能查找呗~所以结合grep就可以这样简单写:
grep cout hello.cpp | wc -l
5.上面命令通过管道串联起来,意思是,查找hello.cpp里所有出现过cout的行,统计行数。
但是,问题来了,如果不只想统计行数,而是想精确到个数(一行里可能会出现多次),应该怎么办呢?
这就是grep的作用了2,-o选项(only的意思)表示只选中那些匹配的地方,比如a cout yes, and b cout no.,匹配cout,结果是两行,每行一个cout。所以要想统计出现次数的话,简单加一个选项就好了:
全部回答
  • 1楼网友:十年萤火照君眠
  • 2021-01-18 17:06
用 wc 命令
  • 2楼网友:十鸦
  • 2021-01-18 15:51

假定你要统计 a.txt 里 world 这个单词的次数grep -o world a.txt | wc -l
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯