본문 바로가기

리눅스

[명령어] wc, sort, split ,uniq, cut 명령어

반응형

wc, sort, split ,uniq, cut 명령어

1. wc
- 지정한 파일의 행 수, 단어 수, 문자 수 를 화면에 출력한다. -l 옵션을 자주 사용한다.
- 다른 명령어와 함께 사용되는 응용에는 (파이프) 를 사용한다.
2. sort
– 텍스트로 입력된 내용을 지정한 방법에 따라 정렬하여 출력한다.
– 기본적으로 아스키 코드 값을 이용하며 숫자는 -n 옵션을 사용하여 인식이 가능하다
– 특정한 필드를 이용하여 정렬하려면 +n (2번 필드부터 1로 인식), -k n (필드번호 그대로 사용)을 이용하여 사용이 가능하다. 만일 두번째 필드의 정렬을 적용하지 않으려면 – 를 다시 이용한다.
– 예) sort +1 test : 이경우는 두번째 필드를 이용하여 정렬을 하고 만약 두번째 필드가 같다면 세 번째 필드를 이용하여 정렬한다.
– 예) sort +1 -2 test : 이 경우 두번째 필드가 같으면 세번째 필드를 이용하여 정렬하지 않고 원래 파일의 순서를 유지한 채로 정렬한다.
– 숫자를 이용하는 경우는 -n -k 4 와 같이 사용한다.
– 파일로 저장하려면 -o 옵션을 사용한다.
– 필드 구분자를 이용하여 (이때 -t: 와 같이 옵션에 필드 구분자를 붙여서 사용) 다른 파일도 처리가 가능
3. split
– 큰 파일을 여러 개의 작은 파일로 분할하는 명령이며 지정된 이름의 파일이 생성된다.(xaa, xab)
– 예제로 /etc/services 파일을 복사하여 사용한다. -30 과 같이 행을 기준으로 분할이 가능하고 -b 512 와 같이 용량을 기준으로 분할도 가능하다.
4. uniq
– 중복된 내용의 행이 연속으로 있으면 하나만 남기고 삭제한다.
– 전체적으로 분산된 중복은 찾아내지 못한다. 따라서 정렬하여 순차적으로 만든뒤에 적용한다.
– 파일로 저장이 가능하다. -o 옵션
– 중복없는 행만 찾으려면 -u 옵션
– 중복 행 보기 : -d, 중복 횟수 보기 : -c
5. cut
– 파일의 각 행(세로)에서 선택된 필드를 잘라내는 명령이다.
– 주의 사항은 필드의 구별은 탭으로만 인식한다는 점이다. 문서가 탭으로 필드 구별이 되어있지 않다면 필드 구분자 옵션 -d 을 이용하여 -d’ ‘ 와 같이 공백으로 구분하는 것도 가능하다.
– 특정한 문자를 추출하는 것 보다는 -f 를 이용하여 필드를 추출하는데 더 유용하다. 콤마를 이용해서 여러 필드 추출이 가능하다.


출처 : http://lkhstory.blogspot.com/2008/05/wc-sort-split-uniq-cut-linux.html

 

728x90
반응형