롯데에서 만나는 뜻밖의 럭키! ON세상 롯키데이가 오픈했어요 롯키데이의 오픈과 함께 10월의 롯.바.시(롯데e커머스를 바꾸는 시간)도 여섯 번째 이야기로 다시 찾아왔어요
롯데온에서 물건을 구매하기 전에 가장 먼저 해야 하는 일은 무엇일까요? 바로 여섯번째 롯.바.시의 주제인 검색이에요. 어떤 방식으로 검색이 되어지는지, 내가 원하는 물건을 어떻게 찾아주는지 검색의 원리와 용어, 트렌드에 대해 그동안 궁금하셨다면 검색 개발의 모든 것 함께 들여다봐요!
이번 강의는 21년 3월에 e커머스에 합류한 검색 전문가, PD1실 양지훈님이 진행해주셨어요 지훈님은 6개월 정도 가나에서 컴퓨터 스쿨 수업을 진행하는 봉사활동을 했던 경험이 있다고 해요! 책을 통해 검색 개발을 독학했고, 이런 우연한 계기를 통해 10년 동안 검색 전문가로 성장해오셨어요
DLP(Data loss protect) 시스템을 만드는 보안 회사부터 11번가까지 검색과 관련된 다양한 업무들을 진행해왔고, 이런 경험들을 바탕으로 어려울 수 있는 검색에 대한 강의를 재미있게 진행해 주셨답니다
많은 상품들 중 원하는 것을 하나하나 처음부터 끝까지 모두 찾는 것을 full scan이라고 하는데 이런 경우 비용도 많이 들고 오래도 걸리는 것이 단점이라고 해요 이 단점을 보완하기 위해 필요한 것이 바로 index이고, 이 방식은 찾고자 하는 단어와, 단어가 나오는 페이지 번호를 적어 둔 것으로 원하는 단어가 있는 페이지를 빠르게 찾을 수 있게 하는 것이라고 해요
검색엔진은 inverted index(역색인)을 사용하는데, 상품별로 키워드를 뽑고 각 키워드 별 상품번호를 기재하면 키워드에 해당하는 상품을 빠르게 찾아주는 것이 가장 기본적인 검색의 원리에요
검색의 원리 정말 간단하죠?^^ 그렇지만 이 과정에 또 다른 어려움이 숨겨져 있다고 하는데요 롯데온에 있는 수많은 상품중 상품별로 어떤 키워드를 추출해야 할까요?
먼저 키워드를 잘 뽑아서 검색의 정확도도 높이고, 사용자가 원하는 상품을 더 잘 찾아 줄 수 있도록 형태소 분석을 통해 ‘사전’ 작업을 한다고 해요. 우선적으로 추출 하고자 하는 단어를 사전으로 만들어 놓으면 그 기준으로 단어를 추출하고 키워드 관리를 통해 더 확장하거나 축소해가면서 키워드를 관리하고 있어요
그렇다면 많은 검색 상품 중 어떤 상품을 가장 먼저 노출해야 할까요? 이건 ‘랭킹’으로 이야기 해주셨는데요, 상품의 feature들을 감안하여 score를 생성하고 있어요. 키워드 기반 랭킹 알고리즘 점수를 참고하고, 키워드의 유형과 상품의 유형을 매칭하는 FMP 점수를 score로 사용한다고 해요. 또한, 키워드에 적합한 카테고리에 더 많은 점수를 부여하는 score weight를 조절하는 방식도 있다고 해요.
마지막으로 진화하고 있는 검색 기술에 대해 공유해주셨는데요, 1세대 검색(primary/secondary)과 2세대 검색(분산검색)을 지나 현재 3세대 Cloud 검색을 사용하고 있다고 해요 Cloud 검색은 어떤 서버에 색인, 검색을 해도 동일한 결과가 나오게 설계되어 있어서 장애 발생 시에도 시스템에 문제가 생기지 않는다고 해요. 또한, 색인과 검색이 진행될 때 서버의 상태를 점검하면서 가장 최적의 색인 검색 성능을 내도록 설계되어 있다고 해요.
검색의 원리와 발전까지 정말 검색의 모든 것을 알 수 있었던 즐거운 시간이었는데요 지훈님께서 준비해주신 알찬 강의와 다양한 퀴즈까지 230명의 구성원들이 적극적으로 참여할 수 있었어요✍🏻
회차가 진행될수록 더욱 흥미진진해지는 롯바시💖 다음 강의도 많은 기대 부탁드려요!