본문 바로가기

리눅스

wc, sort, split ,uniq, cut 명령어

반응형

wc, sort, split ,uniq, cut 명령어

큰 파일을 다루거나 데이터를 처리할 때 필요한 여러 가지 유용한 명령어들입니다.

1. wc (Word Count)

  • wc 명령어는 파일의 행 수, 단어 수, 문자 수를 세어주는 명령어입니다.
  • 일반적으로 -l 옵션을 자주 사용하여 행 수만을 출력합니다.
  • 다른 명령어와 함께 사용될 때는 (파이프)를 사용하여 출력을 다음 명령어로 전달할 수 있습니다.

2. sort

  • sort 명령어는 텍스트로 입력된 내용을 지정한 방법에 따라 정렬하여 출력합니다.
  • 기본적으로 아스키 코드 값을 이용하며, 숫자는 -n 옵션을 사용하여 인식할 수 있습니다.
  • 특정한 필드를 이용하여 정렬하려면 -k 옵션을 사용합니다. 예를 들어, sort -k 2는 두 번째 필드를 기준으로 정렬합니다.

3. split

  • split 명령어는 큰 파일을 여러 개의 작은 파일로 분할하는 명령어입니다.
  • 행 수나 용량을 기준으로 분할할 수 있습니다.
  • 분할된 파일들은 지정된 이름과 함께 생성됩니다.

4. uniq

  • uniq 명령어는 중복된 행을 제거합니다. 단, 중복된 행이 연속으로 있을 때만 하나만 남기고 삭제합니다.
  • 정렬된 데이터에 적용하는 것이 가장 일반적이며, -d 옵션을 사용하여 중복된 행만 보거나, -c 옵션을 사용하여 중복 횟수를 보는 등의 다양한 기능을 제공합니다.

5. cut

  • cut 명령어는 파일의 각 행에서 선택된 필드를 추출합니다.
  • 필드의 구분은 기본적으로 탭으로 인식하지만, -d 옵션을 사용하여 구분자를 지정할 수 있습니다.
  • -f 옵션을 사용하여 필드를 추출하는데, 콤마를 이용하여 여러 필드를 한 번에 추출할 수도 있습니다.

이러한 명령어들은 데이터 처리 및 분석에 있어서 매우 유용하며 복잡한 데이터를 다룰 때 특히 도움이 됩니다. 또한, 이러한 명령어들을 조합하여 원하는 형태의 데이터를 추출하거나 가공할 수 있습니다.

 

참고URL

- Jack Book : wc, sort, split ,uniq ,cut 명령어

 

728x90
반응형