프로젝트 설명
한국연구재단
식수예측프로젝트
정보통신기획평가원?
월요일이 가장 많고 금요일이 가장 적음
겨울 인원이 많고 덥고 습한 날은 중간 봄 가을은 적음
식사인원 = 출근인원+월+요일+날씨+오차
데이터 누적량이 적음, 프로그램의 정확도 떨어짐,
원가절감
구내식당 식사인원 예측 성공 = 식사인원 데이터 분석 + 행사정보 + 직원 입맛 파악
통계분석
요일별, 월별 추이
상관계수가 높은 것을 사용
알고리즘 : linear regression / SVM / Lightgbm
목표?
****데이터를 가지고 프로그램을 업그레이드 하는 것****
연휴때의 식사인원 결측치는 어떻게 처리?
이벤트(창립기념일) 출근인원 < 식사인원 ------->>>>일반 함수에 넣으면 틀어짐
예측함수
:출근 식사인원 등 과거 3년 값을 회귀분석
변수 : 직원수, 날짜, 날씨, 실제 식사인원, 식수예측인원, 식사/출근 비율, 메뉴선호도, 사건
세부내역 : 변수 리스트(엑셀)
메뉴 : 스타일, 조리방법/재료를 기준으로 좀 더 구체화
평균기온 : 네이버 날씨(기상청)에서 당일 최고 최저 기온 조회, 엑셀입력
근무인원
논문자료 : 연세대 정라나 - 단계적 다중선형 회귀분석
구내식당의 문제, 공공기관
데이터 전처리 : 출근인원, 식사인원, 날씨, 이벤트(연휴)
변수분석 : 출근인원, 날씨, 월, 요일, 연말연시, 연휴전후, 메뉴, outlier 정리
프로그래밍 툴: 엑셀, R, 파이썬
구내식당 피드백 -> 개선
개선사항?
홈페이지 구축
관리자가 데이터 분석 실시 후 함수와 계수를 세팅하는 방식
정해진 엑셀파일로 과거데이터 출근인원, 식사인원 : 1~3년을 업로드하면 함수가 자동생성되는 방식
보정값 : 과거의 추세, 주메뉴의 인기도를 감안, 영양사가 입력
메뉴에 대한 알고리즘 필요 !
새로운 메뉴에 대한 예측
보정값 = 기본값 + 영양사의 경험
'데이터 청년 캠퍼스(경남대학교) > 수업' 카테고리의 다른 글
2021-07-12 (0) | 2021.07.12 |
---|---|
2021 - 07 - 02 (0) | 2021.07.02 |
2021-07-01 (2) (0) | 2021.07.01 |
2021-07-01 (1) (0) | 2021.07.01 |
2021-06-29 (0) | 2021.07.01 |