글쟁이, 코딩한다

0219 / k_digital 49일차 / 파이널프로젝트 본문

나는 코딩도 한다/TIL

0219 / k_digital 49일차 / 파이널프로젝트

Algori 2021. 2. 19. 22:38

0.

 이상형 월드컵 기반 영화 추천 사이트 만들기.

 

1. 

 오늘 한 일)

 

 1) 추천 시스템 공부&정리

 

  정리도 한 번 할 겸 팀원들과 공유도 할 겸 아아아아아아주 최소한의 정보만 담아서 개요를 정리했다.

 

세부 적용 방식과 장단점은 비워둔 내용이다. 나중에 팀원들과 함께 발표를 준비하며 더 세밀하게 준비할 필요가 있다.

다른 루트로 매일 이 방식들을 보고 익히려고 애쓰는데 텍스트를 읽을 때만 해도 그렇지, 그렇지 하다가 뒤돌아서면 그랬던가 싶다. 꽤 여러가지 말들 중에 핵심을 파악하고 확고한 중심 사항을 가져가야 하는데 아무래도 블로그 글에서는 이를 파악하기가 어렵다. ML, DL 이론에 있어서는(여전히 어렵지만) 강사님이 확실하게 짚어준 부분이 있었기에 한 가지 지점을 바탕으로 펼쳐나갔다. 여기서는 그것이 어렵다. 다들 강조하고 싶은 부분을 다르게 적어둬서 정말 중요한 것이 무엇인지 헷갈리기 마련이다. 

 

어쨌든 결과다. 추천 시스템은 돌아가고 있고 나름 느낌 있는 결과가 나왔다. 나는 개념이 틀렸을까봐, 내가 하는 말이 이치에 맞지 않을까봐 겁내며 자라처럼 목을 쑥 집어넣고는 한다. 겁내지 말자. 해보고 아니면 다시 하지 뭐. 겁낼 필요 없다. 겁낼 필요 없다.

 

 

 2) 추천 함수화

 

추천 내용을 함수로도 바꾼다.

이렇게 함수를 만들면 되는 건지, 저런 걸 인자로 받아도 되나, 이런 값을 리턴해도 되나, 이게 딕트 형태로 나가는게 맞는건가, 너무 임의로 많은 것을 결정하는 건 아닌가, 이거면 충분한가, 더 간단하고 쉽게 짜야하는 건 아닌가, 이렇게 저렇게 내용을 바꿀 수 있지는 않은가, 변수명은 이래도 되나, 클래스로 만들고 객체지향 프로그래밍을 해야한다는데 그냥 나 편하자고 이렇게만 해도 되나, 막 __init__ 생성자 이런 것도 써야 하는 일 아닌가,

하여튼 모르는 게 너무 많다.

결과가 다인가, 싶다가 그런건 아닌 것도 같은데, 싶다가 아무튼.

콘텐츠 기반 필터링 가운데 장르로 유사도를 비교해 리턴하는 내용이다. 윗부분에서 다양한 데이터 전처리와 유사도 분석을 진행했다. 

 

3) 자잘한 코드 수정

 

얻어온 코드를 공부할 때 변수명을 바꾸고 쓰다 보면 이해가 좀 빨라지길래 변수명을 자꾸 입맛대로 바꾸는 습관이 들었다. 변수 이름 짓는 연습도 되고 좋다 싶었는데 그러다보니 에러가 너무 많이 난다. 오타도 나고 실수도 한다. 

문제가 생기면 아유, 한 세월이다. 오늘도 matmul을 하려다 한참을 헤맸다. array에다가 대고 series를 행렬곱하니 도무지 먹히지가 않았다. .to_numpy() 요거 하나면 해결되는 문제를 갖고 팀원들과 한시간은 헤맸다. 참, 알 수 없는 세계다.

그 외 하나하나 해나가는 것은 또 끝도 없다. 

 

 4) 웹 사이트 기초 설계

 

어찌어찌 추천을 넘기고 이제는 Django 차례다. 사실 겁난다. 이 친구는 정말 먼 친구다.

또 하나하나 갈텐데 가다보면 새로운 친구들이 튀어나오고, 나는 늘 로그인과 회원가입은 했는데 그걸 또 만들자니, 어휴어휴다. 

그래두 웹을 구현하다보면 저 코드들보다는 블로그 쓰기가 좀 낫겠다. 또 이런 추천처럼 하다보면 재밌을지, 모르는 일이다.

 

Comments