论坛首页 招聘求职版 面试秘籍

Linux基本命令面试题

浏览 1852 次
精华帖 (0) :: 良好帖 (0) :: 隐藏帖 (6)
作者 正文
时间:2008-05-04
zgos 写道
tr -s "\t| " "\n" <1.txt|sort|uniq -c

正解
有点小瑕玼,单词与标点符号连在一起时,会被认作一个新单词。
   
0 请登录后投票
时间:2008-06-16
按照zgos的方法我又改进了一下,去掉了标点符号,并让脚本大小写不敏感:

cat 1.txt | tr -s "[:punct:]" " "| tr "[A-Z]" "[a-z]" | tr -s "\t+| +" "\n" | sort | uniq -c | sort -r

输出结果:
9 and
7 i
5 to
3 the
3 like
3 is
3 important
2 with
2 than
2 technologies
2 team
2 my
2 more
2 knowledge
2 in
2 have
2 development
2 d <----------这就是I‘d like造成的
1 very
1 thinking
1 thick
1 summarizing
1 success

不过还有个问题就是“’d”不能简单的把“’”变成空格,而是需要转换成相应单词,不过到底转化为“would“还是“had”很麻烦。
   
0 请登录后投票
时间:2008-06-16
renyangok 写道
按照zgos的方法我又改进了一下,去掉了标点符号,并让脚本大小写不敏感:

cat 1.txt | tr -s "[:punct:]" " "| tr "[A-Z]" "[a-z]" | tr -s "\t+| +" "\n" | sort | uniq -c | sort -r

输出结果:
9 and
7 i
5 to
3 the
3 like
3 is
3 important
2 with
2 than
2 technologies
2 team
2 my
2 more
2 knowledge
2 in
2 have
2 development
2 d <----------这就是I‘d like造成的
1 very
1 thinking
1 thick
1 summarizing
1 success

不过还有个问题就是“’d”不能简单的把“’”变成空格,而是需要转换成相应单词,不过到底转化为“would“还是“had”很麻烦。


建议不要用CAT,直接文件流就可以了
   
0 请登录后投票
时间:2008-06-27
frogfool 写道
[请教]统计文件a.txt中“每个单词”的重复出现次数?若该文件大到几个G又该如何处理?


cat file | tr ' ' '\n'|tr A-Z a-z| sed -e 's/[\,\:\.]//g'|sort | uniq -c|sort -nr
   
0 请登录后投票
论坛首页 招聘求职版 面试秘籍

跳转论坛:
JavaEye推荐