글쟁이, 코딩한다

0218 / k_digital 48일차 / 파이널프로젝트 본문

나는 코딩도 한다/TIL

0218 / k_digital 48일차 / 파이널프로젝트

Algori 2021. 2. 18. 22:36

0.

 이상형 월드컵 기반 영화 추천 사이트 만들기

 

1.

 오늘 한 일

 

 1) 추천 시스템 정리하기

 

이상형 월드컵 우승 영화 : A

콘텐츠 기반 필터링 (Content Based Filtering)

1. A와 장르가 비슷한 영화를 추천 : 콘텐츠 기반 필터링

추천 OTT 사이트 왓챠의 추천용 제목과 목록. 밑의 것들도 모두 왓챠에서 따왔다.

2. A를 연출한 감독이 디렉팅한 영화를 추천 : 원본 데이터셋에서 끌어오기(원본 데이터의 별점 투표수 많은 대로) 

3. A의 주연배우가 나오는 영화를 추천 : 원본 데이터셋에서 끌어오기(원본 데이터의 별점 투표수 많은 대로)


협업 필터링 (Collaboration Filtering)
4. A를 재밌게 본 다른 이용자들이 좋아하는 영화를 추천 : 사용자 기반 협업 필터링
5. A와 비슷한 영화(A와 평점 구조가 비슷한 영화)를 추천 : 아이템 기반 협업 필터링


6. A를 재밌게 봤다면, 이 영화도 추천 : 모델 기반-잠재 요인 협업 필터링(SVD) ; 행렬 분해로 잠재 요인을 뽑아내고, 이를 바탕으로 재구성한 행렬에서 유사도가 높은 다른 영화를 추천

7. 대중의 픽 ; 이상형 월드컵에서 우승을 많이 차지한 영화를 추천 : 사이트 배포 이후 쌓인 DB 활용


---------해보면 좋을 추천 방식(보류)----------------
8. 숨은 영화(숨은 명작, 당신이 절대 안 볼 영화) 추천 : 원본 데이터셋의 투표수가 많은 영화를 제외한 새 데이터에서 추천 : 추천 방법은?

 

 

 2) 협업 필터링 기반 추천

 

이용자 기반, 아이템 기반 협업 필터링은 개념만 잡는다면 코드 적용 자체는 그리 어렵지 않았다.

이어 잠재 요인 기반 협업 필터링을 써보기 위해 SVD를 공부했다. 손에 잡힐 듯 잡히지 않는 오묘함이었다. 결국 기본적으로 받아온 예제 코드를 우리 데이터에 적용하고 이해하는데 시간을 활용했다.

 

예제 코드를 받아온 곳은 아니고 이해하기 위해 공부한 곳들

SVD 기본개념 공부 c11.kr/mjcb

어제에 이어 오늘도. 깔끔한 예제와 코드 구현 lsjsj92.tistory.com/570

서프라이즈 모듈 활용 (나중에 따라해보자) seing.tistory.com/67

예제 코드 다수 구현 data-science-hi.tistory.com/82?category=1077184

 

 3) 또다시 오류를 발견한 데이터 정리, 정리, 코드 정리, ... , 반복

Comments