추천시스템 이해하기

룰 베이스 기반 vs 협업 필터링 기반

게시 2024/07/14

By 안문주

10 분읽는 시간

추천시스템 이해하기

추천시스템이란?

사례

유튜브 개인화 추천
- 후보군 : 구독 채널 기반, 검색어 등 / 실시간 인기 영상, 새로운 영상, 나와 비슷한 행동을 보이는 고객들의 최근 영상 등
넷플릭스 테마별 큐레이팅 추천
- 사용자 선택이 제한적
- 다양한 테마를 보여주며 큐레이팅 + 개인화 추천
요기요
- 탐색 기회를 높여주는 추천
  - 명확한 선호가 없을 때 탐색 기회를 높여주는 추천
- 유저 컨텍스트가 중요한 추천
  - 현재 위치, 배달 시간, 배달료의 컨텍스트가 선택에 영향을 미치는 서비스

→ 추천시스템은 저마다의 목적과 배경을 가지고 있다!

(정확한 취향 저격 or 많이 보여줘 or 하나만 잘걸려라) 비즈니스 특성을 어떻게 활용할 것인가가 더 중요

구조

서비스에 로그인 → 서버에 로그인 정보 전달 (입장) → 미리 만들어놓은 데이터와 연결된 추천 API 사용 → 서버에 전달 (추천 내용) → 사용자 화면에 뿌려짐

룰 베이스 기반 추천 목록 만들기

오늘의 추천 (실시간 추천)

실시간 인기 아이템 보여주기
~~직원이 직접 고른 상품~~

→ 최근 N분동안 가장 조회(판매)된 상품

카테고리별 추천 (카테고리마다 광고상품 진열)

카테고리별 인기 상품
카테고리별 개인화 추천

→ 최근 N일, N주, N달 혹은 실시간 카테고리별 인기 상품을 진열

연관 추천 상품

연관 분석 기반 추천
광고 기반 추천

→ 연관 규칙 분석 (=장바구니 분석) : 여러 장바구니에서 특정 패턴 발견

연관 규칙 분석

데이터 예시
- 가설 : 맥주(조건절)를 산 사람이 두루마리(결과절)를 산다.

연관 규칙 분석의 계산 및 지표

지지도 Support
- 위 데이터에서 맥주의 지지도 4/10 (맥주 4개 포함됨)
규칙 지지도 : 조건절 → 결과절이 같이 가는 규칙 지지도
- 위 데이터에서 맥주를 사면 두루마리도 사는 규칙의 지지도 2/10
신뢰도 : 조건절 상황 하에 결과절 일어날 비율 (조건부확률 P(결과절 조건절))
- 위 데이터에서 규칙 지지도 / 지지도 = 2/4

향상도 : A와의 관계가 고려되어 규칙이 성립되는 경우

Lift A→B : 신뢰도 / 결과절의 지지도

= P(결과절

조건절) / P(결과절) = 규칙 지지도 / (조건절 지지도 * 결과절 지지도)

참고 : 1보다 커야 좋다[결론] 연관 규칙 분석은 인기 기반 추천 모델이다. 많이 나올수록 유리하니까!

협업 필터링 기반 추천 목록 만들기

협업 필터링 vs 콘텐츠 기반 필터링

룰 기반 필터링
- 연관 분석
- 동일 카테고리
- 동일 브랜드 추천 등
협업 필터링
- 선호가 비슷한 사람(혹은 아이템)을 참고해 점수를 부여
- 유사한 구매 패턴으로 보이면 유사한 유저로 봄
[ 유저 기반 ]
1. 미애와 가장 유사한 유저를 찾음
2. 유사 유저의 점수를 활용
[ 아이템 기반 ]
1. 존윅과 가장 유사한 영화를 찾음
2. 유사 영화의 점수를 활용[ 전체 기반 - Matrix Factorization ]

KNN으로 추천 목록 만들기

미애와 광록의 Cosine 유사도 계산 가능
- 점수가 없는 대부만 제외하고 유사도 계산
미애 - 대부 KNN을 기반한 점수는
- K = 2라고 가정 (광록과 철수가 가장 가까운 유저)
- (2(철수 대부 점수) * 0.8(철수 유사도) + 3(광록 대부 점수) * 0.87(광록 유사도)) / 0.8+0.87
만약 미애는 점수를 적게주고, 철수는 점수를 보통 주고, 광록은 점수를 많이 준다면?
- 2.4(미애의 평균점수) + ((2-3.2(철수 평균점수) * 0.8 + (3-2.8(광록 평균점수)) * 0.87 / 0.8+0.87)

tech-deep-dives, ml

ml preprocessing

추천시스템 이해하기

추천시스템이란?

사례

구조

추천 시스템 디자인

추천 서비스의 기획 과정

데이터 레이크 구축 과정

추천 서비스의 개발 과정

추천 시스템을 평가하는 방법

평가 목표 설정하기

평가에 사용되는 로그데이터

온라인 평가

오프라인 평가

룰 베이스 기반 추천 목록 만들기

오늘의 추천 (실시간 추천)

카테고리별 추천 (카테고리마다 광고상품 진열)

연관 추천 상품

연관 규칙 분석

협업 필터링 기반 추천 목록 만들기

협업 필터링 vs 콘텐츠 기반 필터링

KNN으로 추천 목록 만들기

인기 태그