핵심재료만 라벨링하는게 어떤지?⇒ 재료가 얽히지 않는것을 제거한건 잘한 일
아이템투백 진행예정임. ⇒ 구매자 관점으로 묶는것도 일반적 추천시스템의 작동원리여서 사용자 기반 클러스터로 묶어서 진행하는거 좋은 방향인듯
텍스트로 검색했을때 tomato 검색시 tomato paste검색되는 부분때문에 더 세분화 시키려고 함. ⇒ 라벨링
⇒ 줄일 수 있으면 더 줄여도 될 것 같음. 서치 단계에서 오래걸릴수도 있어서 찾으면서 부하가 걸릴 수 있음. 만개 정도면 가능할듯.
어떠한 상품을 제거해야하는지에 대한 문의가 많이 이루어짐. 하위 20%(2개가 줄어듬) 상위 5%⇒ 그만큼 선호도가 높은 상품인데 비중을 높이는건 힘들것같다.
레드와인과 유사도를 보이는 중분류(99) 3개만 뽑음. 레드와인을 같이 샀던 상품들끼리 유사도 측정.
스테디한 상품을 제거했기때문에 6~7순위에 소금, 설탕 이 있을 수 있어서 우려됨. 상위5%제거했기 떄문에 그렇게 안나올수도 있음. (실무적 기준) 추천상품같은건 상위상품을 조금 더 줄여도 괜찮을거같음. 너무 무난한 상품이 포함되면 영양가 없는 추천으로 받아들일 수 있기 때문임.
⇒ 코사인 유사도로 진행중
(코사인 유사도) 산술적 편의를 위해 진행하는지? ⇒ 네
구매한 수가 적으면 결과값이 빨리나오는데, 구매한 수가 많으면 결과값이 오래걸림 ⇒ 속도 개선할 수 있는 부분이 있을까요? 3~4개 : 3초 155개: 1분~1분 30초 정도 걸림
⇒ (멘토님) 상품분류가 20,000개 정도였고 for문으로 서치하는 부분에서 단순하게 구현. 코드 최적화할 부분이 보이지 않음. 현재 가장 단순한 방법으로 구현되어있기에 빠른 방법이여서. 카테고리를 더 단순하게 줄이는 방법밖에 없을것 같음.