공공데이터만으로는 부족한 학습 샘플
해결 · 네이버/카카오 등 리뷰 크롤링으로 원천 데이터 확보 →
konlpy(OKT)로 형태소화, 15개 취향 태그(예: spicy/cleanliness/value_for_money …)별 1~5점 ‘사전’ 정의·매칭.
유사도 ≥ 0.7만 반영, 평균 점수는 SQLAlchemy로 DB 저장.
결과 · 학습에 필요한 구조화 점수 데이터를 안정적으로 축적(약 4300개의 음식점 취향 점수화).
리뷰 노이즈(비음식/광고/짧은 글)로 품질 저하
해결 · OpenAI(GPT-4o)를 사용해 음식점 관련 리뷰만 선별(다른 도메인 포함)
→ 길이 기준 상위 30개 리뷰를 취합해 15개 항목의 선호도 점수(1.0~5.0)를 JSON으로
산출하는 프롬프트 설계.
결과 · 노이즈 감소와 일관된 스코어링으로 학습 데이터 품질 향상.
사용자–매장 매칭 기준 정의와 검증
해결 · 사용자 점수와 매장 점수의 절댓값 차이를 특징으로 구성 →
RandomForest로 80/20 검증
(파라미터 탐색·실험 로그 정리).
결과 · 분류 정확도 69.5%(macro F1 ≈ 0.68, precision ≈ 0.69, recall ≈ 0.68)로
기본 모델
유효성 확인, 이후 서비스 추천 로직에 적용.
거리 계산·검색 지연
해결 · DB의 위경도로 Haversine을 Service 레이어에서 계산, Pagination/무한스크롤 도입.
결과 · 외부 API 의존 제거, 검색 응답 체감 속도 개선·쿼리 부하 완화.
팀원별 환경 차이로 통합 난항
해결 · Git 브랜치 전략 및 AWS RDS 공유로 환경 표준화.
결과 · 마이그레이션 비용 없이 공용 DB로 개발 일관성 확보.
채팅에 AI 접목
해결 · 채팅 내 /음식점명
질의에만 감성 분석을 적용해 월간 긍정 랭킹 시각화.
결과 · 추천 신뢰 보완 및 사용자 참여 증대.