✔️로그란 ?
- 연속적인 데이터의 기록 , 즉 서비스나 시스템 가동 시 발생되는 이벤트의 기록
- 보통의 우리가 보는 데이터는 행,열 형태로 되어있는 RDB지만, 로그 데이터는 JSON, CSV, TSV와 같은 비정형 텍스트로 들어온다.
✔️로그 데이터의 분석
게임분야에 대해 로그 데이터를 분석한 글이 있어 대신 첨부한다.
https://datadoctorblog.com/2022/03/24/Py-Preprocessing-user-root-log/
Py) 전처리 - 게임 로그데이터 처리
아이템 획득과 관련된 사용자의 게임 로그 데이터를 정제하는 예시를 알아본다.
datadoctorblog.com
해당 글을 읽어보면, 로그는 분석하는 것도 중요하지만 설계하는 것 또한 중요함을 느낄 수 있다.
필수 로그를 빠뜨리면 인력이 더 소모되는 번거로운 일이 발생할 수 있으니 서비스를 정확히 이해하고
어떤 분석이 필요하고 이를 위해서는 어떤 로그가 필요한지를 파악해내야 한다.
처음 이 주제를 잡았을 때 글이 굉장히 길어질 것이라 생각했는데, 데이터의 형식만 다르지 파이썬을 다룰줄 아는 분석가라면 pandas, numpy를 이용한 분석은 같기 때문에 분석 자체에 어려운 부분이 없어 짧게 글을 마무리 할려고 한다.
2024-06-26 추가
1년이 지나서 이 글을 다시 보니 알맹이 없는 빈 껍데기 같은 글을 서술해놓은 것 같아 (창피하다...) 로그 데이터에서 가장 중요한 로그 설계에 대해 카일스쿨님께서 잘 다뤄주신 포스팅을 첨부해놓는다.
https://zzsza.github.io/data/2021/06/13/data-event-log-definition/
데이터 로그 설계, 데이터 로깅, 이벤트 로그 설계, 데이터 QA의 모든 것
이벤트 데이터 로그 설계, 데이터 로그 설계, 데이터 로깅, 데이터 QA에 대해 작성한 글입니다 키워드: 데이터 로깅, 데이터 로깅이란, 데이터 로깅 시스템, Firebase event logging, 이벤트 로그 설계,
zzsza.github.io
'데이터 분석 > 방법론' 카테고리의 다른 글
[A/B 테스트] A/B테스트 설계부터 결과 분석까지 (0) | 2023.05.26 |
---|---|
[데이터 분석] 데이터 분석 실무 용어 정리 (0) | 2022.12.20 |
[AARRR] AARRR이란 무엇일까? (0) | 2022.11.10 |
[코호트 분석] 코호트 분석(Cohort Analysis)이란? (2) | 2022.11.01 |
[A/B 테스트] A/B테스트와 파이썬 예제 (2) | 2022.09.08 |
댓글