Algorithm/Implementation

(Java/자바) - 백준(BOJ) 12891번 : DNA 비밀번호

하눤석 2022. 8. 5. 13:41
728x90

https://www.acmicpc.net/problem/12891

 

12891번: DNA 비밀번호

평소에 문자열을 가지고 노는 것을 좋아하는 민호는 DNA 문자열을 알게 되었다. DNA 문자열은 모든 문자열에 등장하는 문자가 {‘A’, ‘C’, ‘G’, ‘T’} 인 문자열을 말한다. 예를 들어 “ACKA”

www.acmicpc.net


  • 문제 : 

평소에 문자열을 가지고 노는 것을 좋아하는 민호는 DNA 문자열을 알게 되었다. DNA 문자열은 모든 문자열에 등장하는 문자가 {‘A’, ‘C’, ‘G’, ‘T’} 인 문자열을 말한다. 예를 들어 “ACKA”는 DNA 문자열이 아니지만 “ACCA”는 DNA 문자열이다. 이런 신비한 문자열에 완전히 매료된 민호는 임의의 DNA 문자열을 만들고 만들어진 DNA 문자열의 부분문자열을 비밀번호로 사용하기로 마음먹었다.

 

하지만 민호는 이러한 방법에는 큰 문제가 있다는 것을 발견했다. 임의의 DNA 문자열의 부분문자열을 뽑았을 때 “AAAA”와 같이 보안에 취약한 비밀번호가 만들어 질 수 있기 때문이다. 그래서 민호는 부분문자열에서 등장하는 문자의 개수가 특정 개수 이상이여야 비밀번호로 사용할 수 있다는 규칙을 만들었다.

 

임의의 DNA문자열이 “AAACCTGCCAA” 이고 민호가 뽑을 부분문자열의 길이를 4라고 하자. 그리고 부분문자열에 ‘A’ 는 1개 이상, ‘C’는 1개 이상, ‘G’는 1개 이상, ‘T’는 0개 이상이 등장해야 비밀번호로 사용할 수 있다고 하자. 이때 “ACCT” 는 ‘G’ 가 1 개 이상 등장해야 한다는 조건을 만족하지 못해 비밀번호로 사용하지 못한다. 하지만 “GCCA” 은 모든 조건을 만족하기 때문에 비밀번호로 사용할 수 있다.

 

민호가 만든 임의의 DNA 문자열과 비밀번호로 사용할 부분분자열의 길이, 그리고 {‘A’, ‘C’, ‘G’, ‘T’} 가 각각 몇번 이상 등장해야 비밀번호로 사용할 수 있는지 순서대로 주어졌을 때 민호가 만들 수 있는 비밀번호의 종류의 수를 구하는 프로그램을 작성하자. 단 부분문자열이 등장하는 위치가 다르다면 부분문자열이 같다고 하더라도 다른 문자열로 취급한다.

 

 

 


  • 풀이 :

투포인터, 그 중에서도 left와 right 포인트의 간격이 항상 일정한 슬라이딩 윈도우 개념을 사용한 문제였습니다.

 

풀이입니다.

 

1. 우선, 주어진 문자열을 0번부터 부분집합의 길이 P 만큼 잘라 A, C, G, T의 개수를 카운트합니다.

 

2. 첫 번째로 만든 문자열이 주어진 DNA문자열의 최소 개수 조건을 만족한다면 정답을 카운트합니다.

 

3. (0, N-1)만큼 순회하며 가장 왼쪽 끝 문자를 카운트에서 지워줍니다. 또한 새로 연결할 문자를(가장 왼쪽 인덱스 + P) 카운트에서 세어줍니다.

 

4. 3의 작업이 끝난 후 A, C, G, T에 해당하는 카운트가 문제에서 주어진 최소 개수를 각각 만족한다면 정답을 카운트합니다. 

 

 

 


  • 소스코드 : 
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.HashMap;
import java.util.StringTokenizer;

public class Main{
	static int S;
	static int P;
	static int answer;
	static String DNA;
	static HashMap<Character,int[]> hm = new HashMap<Character, int[]>();
	static char[] dna = {'A','C','G','T'};
	public static void main(String[] args) throws IOException {
		BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
		StringTokenizer st = new StringTokenizer(br.readLine());
		S = Integer.parseInt(st.nextToken());
		P = Integer.parseInt(st.nextToken());
		DNA = br.readLine();
		st = new StringTokenizer(br.readLine());
        
        
        // HashMap의 구조 : (DNA문자, {현재 카운트, 최소 조건})
		for (char c : dna) {
			hm.put(c, new int[] {0, Integer.parseInt(st.nextToken())});
		}
        
        // 처음 P만큼 자른 문자열을 카운트하고 조건을 만족하는지 체크
		for (int i = 0; i < P; i++) {
			hm.get(DNA.charAt(i))[0]++;
		}
		if(isFull()) answer ++;		
        
        // 인덱스를 1씩 증가시켜가며 가장 왼쪽 문자 삭제, 가장 오른쪽 문자 추가
        // 카운트를 모두 새로 하는것이 아닌 왼쪽 끝은 -1 오른쪽 끝은 +1한다.
		for (int i = 0; i < S-P; i++) {
			hm.get(DNA.charAt(i))[0] -= 1;
			hm.get(DNA.charAt(i + P))[0] += 1;
			if(isFull()) answer ++;
		}
		System.out.println(answer);
		
	}
	public static boolean isFull() {
		for (char c : dna) {
			if (hm.get(c)[0] < hm.get(c)[1]) return false;
		}
		return true;

	}
}
320x100