1. 딥러닝을 왜 선택했는지?

⇒ 딥러닝은 설명력이 떨어지는 부분이 단점. 멘토님은 머신러닝을 추천하심. 하지만 충분한 이유가 있다면 괜찮음. 딥러닝 안에서도 여러가지 모델이 있는데, 2~3가지 모델 쓴다고 들었다. 다양한 알고리즘 중에서도 그 걸 사용하는 이유를 명확히 해주면 좋을 것 같다. 단순한 이유보다는 명확한 이유를 나타내주는게 좋다.

Ex) 유명한 모델이다 ⇒ 이런 이유는 좋지않음

  1. AWS 서버?

DB 구축 관련해서는 어떻게 할건지? DBMS - MySQL로 사용하려고 하는데 AWS같은걸 사용해야 하는지?(선민오빠질문) 자동적으로 반복적으로 추천해주기 위해서 DB를 사용해야 하는건지? (멘토 질문) AWS 서버 내려 받아서 쓸 수는 있는데, 이건 한번 찾아보겠다.(멘토 답변)

  1. ERD

종속관계가 더 정확하게 주어지는 경우가 좋을거 같다고 하심

케글에 있는 데이터를 우리 편의에 맞게 구성했고, Food central의 영양소 데이터를 끌어오려고 하다 보니까 nutrient 부분이 들어감 (우리 설명) 영양소 보여주는걸 설명함(선민오빠) 점섬으로 연결되어 있는거는 유관 관계에 있어서 표시 되어있는거죠?(멘토 질문) 예 (답변) 종속관계만 좀 더 명확하게 표현해주면 좋을 것 같다. 1대 다 관계인지, 그런 종속적인 관계만 명확하게 표현해줘도 좋을 것 같다. 테이블 구성은 100% 보진 않았지만 문제 있어보이진 않는다. 이걸 슬라이드로 쓰게 될 가능성이 있기 때문에 정리해주면 좋을 것 같다.

  1. 서버관련

서버 관리가 사실 필수적으로 보인다. 서버가 난이도가 높다. 나도 해본적이 있는데, 실시간 구현을 하기 위해서는 서버가 들어가야 하긴 한다. 처음 목표는 실시간으로 보여주는걸 목표로 했는데, 단기간으로 알기는 힘들어서 파이썬 장고 이용해서 간단하게 구현하는 식으로 진행했었다. aws는 까다로울 수 있어서 잘 안될 경우에는 프로젝트 결과가 통채로 틀어질 수 있어서 다른 plan을 생각해보는 것도 좋을 것 같다. 파이어베이스가 시간 부족할 때 사용하기 좋은 거니까 한번 이쪽도 사용해보는 것도 좋다. mysql보다는 파이어베이스 생각해보는걸 추천한다. (순탄한 옵션) 난이도가 쉽다는게 최신 dbms여서 그런거니까, 야매는 아니여서 괜찮다.

마켓컬리와 함께 나가는건강(멘토질문) -> 아녑(우리답변)

  1. 카테고리 컬럼 관련

컬럼을 키워서 모델의 성능을 떨어뜨리는건 좋은 선택이 아님 => 과감하게 포기하는게 좋지않나?라는 생각 =>모델성능을 고려하는게 1순위가 되도록 해야함. 고추장이나 김치같은 상품은 null값이 아닌값이 많이나오게됨. 한국인이 많이사는 타임 => null값으로 기록됨 => 다양성을 고려하게되어서 너무 많은 null값을 끌어안을 필요가 없음.

(선민) 구매횟수가 1개 정도 되는건 사라짐. 상품 5000개 정도 없어졌는데 => 성능에 영향 있을지? (보람) 25000개 정도 돌려봤을때도 안돌아갔음.. 돌아가려면 어떻게? 유사도 판단이 가능한지? => 답 : 유사도 판단 모델같은 경우에는 카테고리를 러프하게 잡고 시작하는게 좋음 => 네이버도 20개 남짓임 정말 핵심적으로 평가할 수 있는 칼럼들(유기농 성향) 유기농/밀키트/.. 으로 줄여주는 경우가 좋음 그래도 성능은 잘나오는 경우가 많음 (15~25개)