word2vec

(질문) 콘텐츠 베이스트 필터링 해봤는데 너무 많아서 그런지 성능이 MAP, NDCG?? 0% 가 나오더라

(질문) 자카드방식 진행중 ⇒ 원핫인코딩 같이 할 예정임.

⇒ 거의 손이 안가니까 금방할수 있을것인데

자카드 유사도를 쓰는 이유가 있을까?

  1. 상황 자체가 코사인같은 경우에 오히려 안맞는 이유가 각도 기반으로 구하는 유사도이기 때문에 카테고리컬 데이터를 가지고 유사도를 검증하는데는 적합하지 않음
  2. 자카드 펙터 요소요소를 가지고 유사도를 검증하는 방법 이기 때문에
  3. 결과 수치로 나왔을때 더 뚜렷하게 나오는걸 써도 상관은 없음.
  4. 여러가지 유사도 검증 기법 중 하나를 선택하는 기준이 있어야하는데 그걸 확실하게 설명해주는게 중요할듯 함.

레시피

없는애들 빼지말고 상품준비중으로 띄워놓자고 함

너무 오래걸리는 요리들도 많아서 한시간 내 해먹을 수 있는 레시피로 뽑자 ⇒16만개정도 나옴

임의로 샘플 만개 뽑아서 진행하자해서 거기까지 진행. 추천하는거는 상품이 들어가는 레시피를 다 보여주기로 함