uniq -c -f1是显示的某一个重复的地方才会计数,也就是说aab才是2,1。如果是aba的话就是111了。
因此一般来说都是cut之后进行排序然后再使用uniq的命令对其进行统计来显示。
当时team leader让我统计每个国家的人数。因此我使用了如下的shell脚本来计算最终的结果。
1 | cut -d '"' -f 10 08-03-2015_09_36_28_AM_TRM_WW_NFS_Gamescom_Trailer_AUG15_20150803.txt|sort -k1,1|uniq -c |
uniq的使用参数的含义如下
– c 显示输出中,在每行行首加上本行在文件中出现的次数。它可取代- u和- d选项。
– d 只显示重复行。
– u 只显示文件中不重复的各行。
– n 前n个字段与每个字段前的空白一起被忽略。一个字段是一个非空格、非制表符的字符串,彼此由制表符和空格隔开(字段从0开始编号)。
+n 前n个字符被忽略,之前的字符被跳过(字符从0开始编号)。
– f n 与- n相同,这里n是字段数。
– s n 与+n相同,这里n是字符数。