Algorithm
[BaekJoon] 백준 알고리즘 1152번 / 단어의 개수
bkuk
2023. 2. 21. 17:05
문제
영어 대소문자와 공백으로 이루어진 문자열이 주어진다. 이 문자열에는 몇 개의 단어가 있을까? 이를 구하는 프로그램을 작성하시오. 단, 한 단어가 여러 번 등장하면 등장한 횟수만큼 모두 세어야 한다.
입력
첫 줄에 영어 대소문자와 공백으로 이루어진 문자열이 주어진다. 이 문자열의 길이는 1,000,000을 넘지 않는다. 단어는 공백 한 개로 구분되며, 공백이 연속해서 나오는 경우는 없다. 또한 문자열은 공백으로 시작하거나 끝날 수 있다.
출력
첫째 줄에 단어의 개수를 출력한다.
틀린 이유
- 만약, String str = scan.nextLine(); 을 통해서 공백("") 을 입력했다고 가정하자.
- 앞뒤 공백을 없애기 위해 trim()을 사용한다.
- 변수 str은 빈 문자열로 변경된다.
- 빈 문자열은 객체가 생성되지 않은 null과는 전혀 다른 상태이다.
- 여기서 split(" ")을 사용하게 된다면, 어떻게 될까?
- split() 메서드는 매칭되는 정규식이 없을 때, 자기 자신을 반환하게 되어있다.
- trim으로 공백을 다 지웠으니, 매칭되는 정규식이 없으므로 return new String[]{this}가 실해되고, this는 자기 자신이 담고있던 빈 문자열("")일 것입니다.
- 따라서, 반환된 String[] 배열은 index 0에 빈 문자열 하나가 반환 될 것 입니다.
- 배열의 길이를 출력해보면 0이 아닌 1이 출력이 됩니다.
- 따라서 빈 문자열을 토큰으로 인식하지 않는 StringTokenizer 클래스를 사용해야 합니다.
결론
- StringTokenizer는 문자 또는 문자열로 문자열을 구분한다면, split는 정규표현식으로 구분합니다.
- StringTokenizer는 빈 문자열을 토큰으로 인식하지 않지만 split는 빈 문자열을 토큰으로 인식하는 차이가 있습니다.
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.StringTokenizer;
public class Number1152 {
public static void main(String[] args) throws IOException {
BufferedReader br = new BufferedReader( new InputStreamReader( System.in ) );
StringTokenizer st = new StringTokenizer(br.readLine(), " ");
System.out.println( st.countTokens() );
}
}