Algorithm

[BaekJoon] 백준 알고리즘 1152번 / 단어의 개수

bkuk 2023. 2. 21. 17:05

문제

영어 대소문자와 공백으로 이루어진 문자열이 주어진다. 이 문자열에는 몇 개의 단어가 있을까? 이를 구하는 프로그램을 작성하시오. 단, 한 단어가 여러 번 등장하면 등장한 횟수만큼 모두 세어야 한다.

입력

첫 줄에 영어 대소문자와 공백으로 이루어진 문자열이 주어진다. 이 문자열의 길이는 1,000,000을 넘지 않는다. 단어는 공백 한 개로 구분되며, 공백이 연속해서 나오는 경우는 없다. 또한 문자열은 공백으로 시작하거나 끝날 수 있다.

출력

첫째 줄에 단어의 개수를 출력한다.


틀린 이유

  • 만약, String str = scan.nextLine(); 을 통해서 공백("") 을 입력했다고 가정하자.
  • 앞뒤 공백을 없애기 위해 trim()을 사용한다.
  • 변수 str은 빈 문자열로 변경된다.
  • 빈 문자열은 객체가 생성되지 않은 null과는 전혀 다른 상태이다.
  • 여기서 split(" ")을 사용하게 된다면, 어떻게 될까?
  • split() 메서드는 매칭되는 정규식이 없을 때, 자기 자신을 반환하게 되어있다.
  • trim으로 공백을 다 지웠으니, 매칭되는 정규식이 없으므로 return new String[]{this}가 실해되고, this는 자기 자신이 담고있던 빈 문자열("")일 것입니다.
  • 따라서, 반환된 String[] 배열은 index 0에 빈 문자열 하나가 반환 될 것 입니다.
  • 배열의 길이를 출력해보면 0이 아닌 1이 출력이 됩니다.
  • 따라서 빈 문자열을 토큰으로 인식하지 않는 StringTokenizer 클래스를 사용해야 합니다.

결론

  • StringTokenizer는 문자 또는 문자열로 문자열을 구분한다면, split는 정규표현식으로 구분합니다.
  • StringTokenizer는 빈 문자열을 토큰으로 인식하지 않지만 split는 빈 문자열을 토큰으로 인식하는 차이가 있습니다.

 

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.StringTokenizer;

public class Number1152 {
	
	public static void main(String[] args) throws IOException {
		
		BufferedReader br = new BufferedReader( new InputStreamReader( System.in ) );
		
		StringTokenizer st = new StringTokenizer(br.readLine(), " ");
		
		System.out.println( st.countTokens() );
		

	}
}