롯바시 여섯 번째 이야기

롯데에서 만나는 뜻밖의 럭키! ON세상 롯키데이가 오픈했어요🎁 롯키데이의 오픈과 함께 10월의 롯.바.시(롯데e커머스를 바꾸는 시간)도 여섯 번째 이야기로 다시 찾아왔어요🙌 

롯데온에서 물건을 구매하기 전에 가장 먼저 해야 하는 일은 무엇일까요?👀 바로 여섯번째 롯.바.시의 주제인 검색이에요. 어떤 방식으로 검색이 되어지는지, 내가 원하는 물건을 어떻게 찾아주는지 검색의 원리와 용어, 트렌드에 대해 그동안 궁금하셨다면 검색 개발의 모든 것 함께 들여다봐요!

🔎 검색? 어렵지 않습니다!

이번 강의는 21년 3월에 e커머스에 합류한 검색 전문가, PD1실 양지훈님이 진행해주셨어요👨🏻‍🏫 지훈님은 6개월 정도 가나에서 컴퓨터 스쿨 수업을 진행하는 봉사활동을 했던 경험이 있다고 해요! 책을 통해 검색 개발을 독학했고, 이런 우연한 계기를 통해 10년 동안 검색 전문가로 성장해오셨어요 😄

DLP(Data loss protect) 시스템을 만드는 보안 회사부터 11번가까지 검색과 관련된 다양한 업무들을 진행해왔고, 이런 경험들을 바탕으로 어려울 수 있는 검색에 대한 강의를 재미있게 진행해 주셨답니다👏

많은 상품들 중 원하는 것을 하나하나 처음부터 끝까지 모두 찾는 것을 full scan이라고 하는데 이런 경우 비용도 많이 들고 오래도 걸리는 것이 단점이라고 해요😥 이 단점을 보완하기 위해 필요한 것이 바로 index이고, 이 방식은 찾고자 하는 단어와, 단어가 나오는 페이지 번호를 적어 둔 것으로 원하는 단어가 있는 페이지를 빠르게 찾을 수 있게 하는 것이라고 해요📑

검색엔진은 inverted index(역색인)을 사용하는데, 상품별로 키워드를 뽑고 각 키워드 별 상품번호를 기재하면 키워드에 해당하는 상품을 빠르게 찾아주는 것이 가장 기본적인 검색의 원리에요💻

검색의 원리 정말 간단하죠?^^ 그렇지만 이 과정에 또 다른 어려움이 숨겨져 있다고 하는데요😭 롯데온에 있는 수많은 상품중 상품별로 어떤 키워드를 추출해야 할까요?

먼저 키워드를 잘 뽑아서 검색의 정확도도 높이고, 사용자가 원하는 상품을 더 잘 찾아 줄 수 있도록 형태소 분석을 통해 ‘사전’ 작업을 한다고 해요. 우선적으로 추출 하고자 하는 단어를 사전으로 만들어 놓으면 그 기준으로 단어를 추출하고 키워드 관리를 통해 더 확장하거나 축소해가면서 키워드를 관리하고 있어요📖 

그렇다면 많은 검색 상품 중 어떤 상품을 가장 먼저 노출해야 할까요?👀 이건 ‘랭킹’으로 이야기 해주셨는데요, 상품의 feature들을 감안하여 score를 생성하고 있어요. 키워드 기반 랭킹 알고리즘 점수를 참고하고, 키워드의 유형과 상품의 유형을 매칭하는 FMP 점수를 score로 사용한다고 해요. 또한, 키워드에 적합한 카테고리에 더 많은 점수를 부여하는 score weight를 조절하는 방식도 있다고 해요. 

마지막으로 진화하고 있는 검색 기술에 대해 공유해주셨는데요, 1세대 검색(primary/secondary)과 2세대 검색(분산검색)을 지나 현재 3세대 Cloud 검색을 사용하고 있다고 해요🔎 Cloud 검색은 어떤 서버에 색인, 검색을 해도 동일한 결과가 나오게 설계되어 있어서 장애 발생 시에도 시스템에 문제가 생기지 않는다고 해요. 또한, 색인과 검색이 진행될 때 서버의 상태를 점검하면서 가장 최적의 색인 검색 성능을 내도록 설계되어 있다고 해요.

검색의 원리와 발전까지 정말 검색의 모든 것을 알 수 있었던 즐거운 시간이었는데요👏 지훈님께서 준비해주신 알찬 강의와 다양한 퀴즈까지 230명의 구성원들이 적극적으로 참여할 수 있었어요✍🏻

회차가 진행될수록 더욱 흥미진진해지는 롯바시💖 다음 강의도 많은 기대 부탁드려요!