관리 메뉴

공부 기록장 💻

[알고리즘/해시] 순위 검색 (프로그래머스 2021 Kakao Blind Recruitment) 본문

# CS Study/Algorithms

[알고리즘/해시] 순위 검색 (프로그래머스 2021 Kakao Blind Recruitment)

dream_for 2022. 9. 13. 12:20

문제 설명

코딩테스트 연습 - 순위 검색

[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]

카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.

  • 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
  • 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
  • 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
  • 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.

인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?

물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.

  • 코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
  • 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?

즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.

  • [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?

[문제]

지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.

[제한사항]

  • info 배열의 크기는 1 이상 50,000 이하입니다.
  • info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
    • 개발언어는 cpp, java, python 중 하나입니다.
    • 직군은 backend, frontend 중 하나입니다.
    • 경력은 junior, senior 중 하나입니다.
    • 소울푸드는 chicken, pizza 중 하나입니다.
    • 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
  • query 배열의 크기는 1 이상 100,000 이하입니다.
  • query의 각 문자열은 "[조건] X" 형식입니다.
    • [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
    • 언어는 cpp, java, python, - 중 하나입니다.
    • 직군은 backend, frontend, - 중 하나입니다.
    • 경력은 junior, senior, - 중 하나입니다.
    • 소울푸드는 chicken, pizza, - 중 하나입니다.
    • '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
    • X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
    • 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.

 

입출력 예에 대한 설명

지원자 정보를 표로 나타내면 다음과 같습니다.

  • "java and backend and junior and pizza 100" : java로 코딩테스트를 봤으며, backend 직군을 선택했고 junior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 100점 이상 받은 지원자는 1명 입니다.

입출력 예에 대한 설명

지원자 정보를 표로 나타내면 다음과 같습니다.

  • "java and backend and junior and pizza 100" : java로 코딩테스트를 봤으며, backend 직군을 선택했고 junior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 100점 이상 받은 지원자는 1명 입니다.
  • "python and frontend and senior and chicken 200" : python으로 코딩테스트를 봤으며, frontend 직군을 선택했고, senior 경력이면서 소울 푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 200점 이상 받은 지원자는 1명 입니다.
  • "cpp and - and senior and pizza 250" : cpp로 코딩테스트를 봤으며, senior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 250점 이상 받은 지원자는 1명 입니다.
  • "- and backend and senior and - 150" : backend 직군을 선택했고, senior 경력인 지원자 중 코딩테스트 점수를 150점 이상 받은 지원자는 1명 입니다.
  • "- and - and - and chicken 100" : 소울푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 100점 이상을 받은 지원자는 2명 입니다.
  • "- and - and - and - 150" : 코딩테스트 점수를 150점 이상 받은 지원자는 4명 입니다.

💡나의 문제 풀이

풀이 조건

  • info 배열 (1~50,000)
    • language : cpp / java / python
    • part : backend / frontend
    • career : junior / senior
    • soul_food : chicken / pizza
    • score : 1~100,000
  • query 배열 (1~100,000)
    • language and part and careerand soul_food score
    • - 는 해당 field 고려 x

문제 해결 아이디어

  1. info 배열의 각 요소를 공백을 기준으로 값들을 꺼내 모두 리스트로 만들어 infoList에 저장
  2. query 의 각 요소들에 대해 공백을 기준으로 값들을 꺼내고, 0/2/4/6/7번째 값들만 리스트로 만듬
    1. infoList 의 각 요소들을 살피며 해당 조건들을 모두 만족하는지 확인하여 cnt 값 증가시키고, result 배열에 삽입
      1. flag 값을 0으로 초기화했다가
        1. 각 요소들에 대하여, score 조건을 먼저 확인하고
        2. career, part, language, soul_food의 값이 - 인 경우는 pass, 값이 같지 않다면 바로 flag 를 1로 변경하고 반복문 빠져나옴
      2. flag 값이 원래대로 0인 경우에만 cnt 값 증가시킴

작성 코드

def solution(info, query):
    infoList = [i.split(' ') for i in info]

    result = []
    for q in query:
        t = q.split(' ')
        qr = [t[0], t[2], t[4], t[6], int(t[7])]
        cnt = 0

        for i in infoList:
            if int(i[4])>=qr[4]: # 점수 먼저 확인
                flag = 0
                for j in range(0, 4):
                    if qr[j]=='-':
                        continue
                    if qr[j]!=i[j]:
                        flag = 1
                        break # 하나라도 조건을 만족하지 않는다면 반복문 빠져나옴
                if flag==0: # 모두 조건을 만족한 경우
                    cnt += 1 
        result.append(cnt)
    return result

def test():
  info = [
    "java backend junior pizza 150",
    "python frontend senior chicken 210",
    "python frontend senior chicken 150",
    "cpp backend senior pizza 260",
    "java backend junior chicken 80",
    "python backend senior chicken 50"
  ]

  query = [
    "java and backend and junior and pizza 100",
    "python and frontend and senior and chicken 200",
    "cpp and - and senior and pizza 250",
    "- and backend and senior and - 150",
    "- and - and - and chicken 100",
    "- and - and - and - 150"
  ]
  print(solution(info, query))

test()
  • 효율성 테스트를 전혀 통과하지 못했다. string 값들을 int형으로 mapping해보는 방식을 추가해보도록 하였다.

수정코드 1

  • Integer로 mapping → string 값들을 하나하나 비교하는 것보다 효율적이므로, 실행 시간이 반으로 줄어든 것을 확인할 수 있음. 그러나 효율성 테스트를 통과하기엔 역부족인 아이디어
table = [
    ["-", "cpp", "java", "python"],
    ["-", "backend", "frontend"],
    ["-", "junior", "senior"],
    ["-", "chicken", "pizza"],
  ]

def mapIntoInt(arr):
    tmp = []
    for i in range(0,4):
      # table[i] 중에서 동일한 값의 인덱스 집어넣기
      for j in range(0, len(table[i])):
        if table[i][j]==arr[i]:
            tmp.append(j)
    tmp.append(int(arr[4]))
    return tmp

def solution(info, query):
    infoList = [mapIntoInt(i.split(' ')) for i in info]

    result = []
    for q in query:
        t = q.split(' ')
        qr = mapIntoInt([t[0], t[2], t[4], t[6], int(t[7])])
        cnt = 0

        for i in infoList:
            if i[4]>=qr[4]: # 점수 먼저 확인
                flag = 0
                for j in range(0, 4):
                    if qr[j]==0: # '-'인 경우는 제외
                        continue
                    if qr[j]!=i[j]:
                        flag = 1
                        break
                if flag==0:
                    cnt += 1
        result.append(cnt)
    return result

공식 공채 사이트에 올라와있는 설명과 여러 답안 풀이 자료들을 참고한 후에 다시 코드를 재구성해하였다.

수정 코드 2

  • 미리 info 배열에 대해 조건과 ‘-' 조합으로 만들어질 수 있는 쿼리문(16가지의 경우)을 미리 구성하여 Dictionary 형태로 생성하는 방법이다.
    • 각 query문의 4가지 조건(점수 동일)을 만족하는 지원자의 종류는 16가지의 경우에 속할 수 있다. 해당 조건을 pass하는 경우(- 처리 되어 있는 조건)
      • - 가 4개인 경우 : 1
      • - 가 1개 또는 3개인 경우 : 4 * 2 = 8
      • - 가 2개인 경우 : 6
      • - 가 0개인 경우 : 1
      • 따라서 16가지 경우를 key(string)값으로, score을 value값으로 하는 Dictionary를 모든 지원자 info 에 대하여 만드는 방법을 사용하자. (query 문에 대해, 조건을 하나하나 따지면서 해당하는 지원자를 찾는 방법 대신, Dict 를 이용해 미리 저장해놓은 16가지의 경우로 바로 검색 가능하도록)
        • score 에 따라 오름차순 정렬 후, 이진 탐색(bisect)을 이용해 query 문에 해당하는 key값이 있는 경우, query문의 점수(score) 이상의 점수를 가진 지원자가 몇 명인지 세고 result 배열에 삽입하면 된다.
  • key-value는 query-[score list] 에 대응한다. ---- 라는 쿼리문에 대해 모든 지원자가 해당되기 때문이다.
  • itertools 를 이용해 4가지의 필드(language, career, part, soul_food)에서 - 가 0, 1, 2, 3, 4개씩 들어갈 수 있는 조합들을 itertools 모듈의 combinations 를 이용해 조합을 구한다.
  • query 문을 통해 dictionary 검색을 하고, value 리스트 내부에서 해당 query문의 score보다 같거나 큰 값을 탐색하기 위해서는 이분탐색 을 사용해야 한다. 따라서 value 리스트는 미리 오름차순 정렬이 필요하다.
from itertools import combinations
from bisect import bisect_left
import operator

def solution(info, query):
  result = []
  # info의 각 리스트가 나올 수 있는 16가지의 경우 Dict로 생성
  db ={"----":[0]}
  for i in info:
    # 공백 기준으로 split 하여 다시 리스트 생성
    i = i.split() # ['java', 'backend', 'junior',' pizza', '150']
    condition = i[:-1] # 조건들(4개)
    score = int(i[-1])
    # 16가지 경우의 조합 
    for number in range(5):
      # '-'가 0,1,2,3번이 0~4번 들어갈 조합 구하기
      case = list(combinations([0,1,2,3], number))
      for c in case:
        tmp = condition.copy()

        for index in c:
          tmp[index] = '-'
        # 문자열로 변환하여 Dictionary db에 추가
        key = ''.join(tmp)
        if key in db:
          db[key].append(score) # value 리스트에 추가
        else:
          db[key]=[score]

  # db를 value(score)를 기준으로 오름차순 정렬

  for value in db.values():
    value.sort()


  # 각 query문에 대해, db에 저장된 값 중 score
  for q in query:
    q = q.replace('and ', '') # 변경
    q = q.split()
    target = ''.join(q[:-1])
    score = int(q[-1])
    cnt = 0
    if target in db:
      # target 문자열을 가진 db의 값들(score)
      target_list = db[target]
      # target_list에서 score보다 크거나 같은 score을 가진 score의 index 중 처음 나타나는 인덱스
      firstIdx = bisect_left(target_list, score)
      cnt = len(target_list) - firstIdx
    result.append(cnt)

  return result


def test():
  info = [
    "java backend junior pizza 150",
    "python frontend senior chicken 210",
    "python frontend senior chicken 150",
    "cpp backend senior pizza 260",
    "java backend junior chicken 80",
    "python backend senior chicken 50"
  ]

  query = [
    "java and backend and junior and pizza 100",
    "python and frontend and senior and chicken 200",
    "cpp and - and senior and pizza 250",
    "- and backend and senior and - 150",
    "- and - and - and chicken 100",
    "- and - and - and - 150"
  ]
  print(solution(info, query))

test()

답안 코드 1

def solution(info, query):
    data = dict()
    for a in ['cpp', 'java', 'python', '-']:
        for b in ['backend', 'frontend', '-']:
            for c in ['junior', 'senior', '-']:
                for d in ['chicken', 'pizza', '-']:
                    data.setdefault((a, b, c, d), list())
    for i in info:
        i = i.split()
        for a in [i[0], '-']:
            for b in [i[1], '-']:
                for c in [i[2], '-']:
                    for d in [i[3], '-']:
                        data[(a, b, c, d)].append(int(i[4]))

    for k in data:
        data[k].sort()

    answer = list()
    for q in query:
        q = q.split()

        pool = data[(q[0], q[2], q[4], q[6])]
        find = int(q[7])
        l = 0
        r = len(pool)
        mid = 0
        while l < r:
            mid = (r+l)//2
            if pool[mid] >= find:
                r = mid
            else:
                l = mid+1
        answer.append(len(pool)-l)

    return answer

답안 코드 2

from itertools import combinations
from collections import defaultdict
from bisect import bisect_left

def solution(information, queries):
    answer = []
    dic = defaultdict(list)
    for info in information:
        info = info.split()
        condition = info[:-1]  
        score = int(info[-1])
        for i in range(5):
            case = list(combinations([0,1,2,3], i))
            for c in case:
                tmp = condition.copy()
                for idx in c:
                    tmp[idx] = "-"
                key = ''.join(tmp)
                dic[key].append(score) 

    for value in dic.values():
        value.sort()   

    for query in queries:
        query = query.replace("and ", "")
        query = query.split()
        target_key = ''.join(query[:-1])
        target_score = int(query[-1])
        count = 0
        if target_key in dic:
            target_list = dic[target_key]
            idx = bisect_left(target_list, target_score)
            count = len(target_list) - idx
        answer.append(count)      
    return answer

리뷰

  • 카카오 공식 신입공채 사이트에 올라와 있는 문서를 참고 (정답률 : 정확성 44.07%, 효율성 4.49% 라고 하니, 효율성 통과가 전반적으로 매우 어려운 문제임을 확인했다.)
    • query문 마다 info 리스트를 순회하며 조건의 부합 여부를 하나하나 따지는 아이디어는 매우 비효율적이다.
    • 문제의 관건은?
      • 한 지원자에 대한 query문이 다양한 조합의 경우가 있을 수 있기 때문에, key를 통해 value를 곧바로 얻을 수 있는, O(1) 시간복잡도를 가지는 Dictionary 로 미리 조합의 경우를 넣어 계산하는데 필요한 시간을 단축해야 한다.
      • 한 query문의 조건에 부합하는 지원자가 다수 존재할 경우를 고려해야 한다. 따라서 이진탐색 을 이용해 score 리스트에서 원하는 값보다 같거나 큰 값의 위치를 찾아, 효율적인 탐색을 구현해야 한다.
  • 2021 카카오 신입공채 1차 온라인 코딩 테스트 for Tech developers 문제해설

순열과 조합

[python] itertools를 이용해 순열과 조합 구하기

  • info에 대해 나올 수 있는 query문의 종류 16가지의 경우를 구하기 위해 itertools 모듈의 combinations 함수를 사용할 수 있다.
  • from itertools import combinations chars = ['A', 'B', 'C', 'D'] # 조합 c = combinations(chars, 2) # chars의 각 요소들을 2개 조합하여 만들 수 있는 튜플들을 리스트로 반환 print(list(c))

Dictinoary - Hash Table

점프 투 파이썬

[Python] 리스트와 딕셔너리의 주요 연산 시간 복잡도

Python Dictionary Append: How to Add Key/Value Pair

  • Hash Map의 역할을 하는 파이썬의 Dictionary 자료형
    • 시간 복잡도 측면에서 리스트보다 효율적: 리스트에서 요소가 존재하는지 확인하는데는 순차 탐색하므로 O(n) 이 걸리지만, Dictionary의 경우 내부적으로 Hash Table로 구현되기 때문에, 시간 복잡도는 O(1) 이다.
    • dict = {"apple":"사과", "app":["어플", "어플리케이션"]} # Key 리스트 만들기 print(dict.keys()) # dict_keys(["apple", "app"]} # Value 리스트 만들기 print(dict.values()) # dict_values("사과", ["어플", "어플리케이션"]) # Key, Value 쌍 얻기 print(dict.items()) # dict_items([("apple", "사과"), ("app", ["어플", "어플리케이션"])) # 해당 키가 딕셔너리 안에 있는지 조사하기 if "apple" in dict: print(dict["apple") print(dict.get("apple"))
    • 중복되는 key를 허락하지 않음 → 따라서 key에 대한 다수의 value값들은 리스트 형태로 매핑 가능하다. append() 함수를 이용해 해당 value 리스트에 추가 가능하다.
728x90
반응형
Comments