관리 메뉴

공부 기록장 💻

[알고리즘] 캐시 (프로그래머스 2018 Kakao Blind Recruitment) 본문

# CS Study/Algorithms

[알고리즘] 캐시 (프로그래머스 2018 Kakao Blind Recruitment)

dream_for 2022. 9. 19. 11:26

캐시 (2018 K.B.R)

코딩테스트 연습 - [1차] 캐시

문제

지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.
어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.

입력 형식

  • 캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
  • cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
  • cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
  • 각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.

출력 형식

  • 입력된 도시이름 배열을 순서대로 처리할 때, "총 실행시간"을 출력한다.

조건

  • 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
  • cache hit일 경우 실행시간은 1이다.
  • cache miss일 경우 실행시간은 5이다.

입출력 예제

캐시크기(cacheSize) 도시이름(cities) 실행시간

3 ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "Jeju", "Pangyo", "Seoul", "NewYork", "LA"] 50
3 ["Jeju", "Pangyo", "Seoul", "Jeju", "Pangyo", "Seoul", "Jeju", "Pangyo", "Seoul"] 21
2 ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "SanFrancisco", "Seoul", "Rome", "Paris", "Jeju", "NewYork", "Rome"] 60
5 ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "SanFrancisco", "Seoul", "Rome", "Paris", "Jeju", "NewYork", "Rome"] 52
2 ["Jeju", "Pangyo", "NewYork", "newyork"] 16
0 ["Jeju", "Pangyo", "Seoul", "NewYork", "LA"] 25

💡나의 문제 풀이

문제 해결 아이디어

  • 먼저 LRU 알고리즘 기반 캐시에 대한 이해를 위해 다음 글을 먼저 참고 (https://dailylifeofdeveloper.tistory.com/355)
    • LRU(Least Recently Used) 페이지 교체 알고리즘은 캐시 내부에 찾고자 하는 페이지가 존재하는 경우 Cache Hit, 없는 경우 Cache Miss 이며, 캐시가 가득 차있으면서 Cache Miss의 경우 페이지 교체가 발생하는데 이때, 가장 오랫동안 참조되지 않은 페이지가 교체의 대상이 된다.
  • 먼저 빈 리스트 cache[] 를 생성하고, cities[0] 부터 차례대로 소문자로 변환하여 삽입한다.
  • 각 도시를 리스트에 삽입하면서 살펴볼 것들은 다음과 같다.
    • 먼저 cahce 리스트에 해당 도시 이름이 존재하는지 확인
      • 존재한다면, 원래 위치에서 pop 한 후, 맨 뒤로 이동시킨다.
      • 존재하지 않다면,
        • 캐시가 꽉 차있는 경우라면(cacheSize 보다 같거나 큰 경우), 맨 앞에 위치한 도시를 제거 (least recently used)
      • 이후 맨 뒤에 도시를 리스트에 삽입

고려사항

  • cacheSize==0 인 경우, 혹은 리스트에 도시를 삽입 할 때 현재 cache 리스트의 크기를 고려해야 함

작성 코드

  • 입출력 예제는 모두 통과했지만, 테스트 7, 17번을 통과하지 못했었다.
  • → 코드 초반부에 cacheSize==0 인 경우를 고려한 코드 추가했더니 해결 완료
def solution(cacheSize, cities):
		if cacheSize==0:
		    return 5*len(cities)
		cache = []
    answer = 0
    for c in cities:
        c = c.lower()
        # 캐시에 있는 경우 Cache Hit, 맨 뒤로 이동하기
        if c in cache:
            cache.pop(cache.index(c))
            cache.append(c)
            answer += 1 # cache hit
        # 캐시에 없는 경우 Cache Miss, 첫번째 요소에 집어넣기
        else:
            # 캐시가 꽉 차있는 경우 첫번째 요소에 집어넣기
            if len(cache) and len(cache)>=cacheSize:
                cache.pop(0) # least recently used 제거 후 새로 추가 (0번 인덱스)
            cache.append(c)
            answer += 5 # cahce Miss
    return answer

def test():
    print(solution(3, ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "Jeju", "Pangyo", "Seoul", "NewYork", "LA"])==50)
    print(solution(3, ["Jeju", "Pangyo", "Seoul", "Jeju", "Pangyo", "Seoul", "Jeju", "Pangyo", "Seoul"])==21)
    print(solution(2, ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "SanFrancisco", "Seoul", "Rome", "Paris", "Jeju", "NewYork", "Rome"])==60)
    print(solution(5,["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "SanFrancisco", "Seoul", "Rome", "Paris", "Jeju", "NewYork", "Rome"])==52)
    print(solution(2,["Jeju", "Pangyo", "NewYork", "newyork"])==16)
    print(solution(0,["Jeju", "Pangyo", "Seoul", "NewYork", "LA"])==25)

test()

답안 코드

  • 리스트가 아닌, 길이가 이미 결정된 큐 를 이용해 구현
  • cacheSize 의 크기의 deque 를 선언하였고, remove() 함수를 통해 큐에서 해당 도시 요소를 바로 찾아 삭제하도록 구현했다.
    • 캐시가 꽉 차있는 경우 → double-ended linked list 이기 때문에 맨 뒤에 추가하는 경우 맨 앞의 요소(least recently used)가 캐시에서 제거되는 것과 마찬가지이다.
def solution(cacheSize, cities):
    import collections
    cache = collections.deque(maxlen=cacheSize)
    time = 0
    for i in cities:
        s = i.lower()
        if s in cache:
            cache.remove(s)
            cache.append(s)
            time += 1
        else:
            cache.append(s)
            time += 5
    return time

리뷰

  • collections.deque
    • 파이썬의 **덱(deque)**의 경우, 양 끝에 요소 추가/삭제를 모두 지원하는 double-ended queue (내부적으로 double-linked list로 구현됨) 로, append(), appendleft() , pop(), popleft() 의 모든 연산의 평균 시간복잡도는 모두 O(1) 이고,
    • 리스트(list) 의 경우, fixed size memory blocks(array)로, 링크드 리스트가 아닌 고정된 사이즈의 메모리를 갖는 배열의 형태이다. 따라서 append() 는 O(1) 의 시간복잡도를 갖는 반면, insert(), pop(0) ,의 리스트의 어떠한 위치에 추가, 연산 수행 이후 모든 요소를 이동시키므로 평균 시간 복잡도가 O(n) 이다.
  • [파이썬] 덱 vs 리스트 속도 차이? (deque vs list speed 차이)
728x90
반응형
Comments