-
[외부 행사] Tableau X databricks X BIGXdata D-TALK 후기
좋은 기회로 D-TALK 데이터 수다를 다녀오게 되었다! Tableau X databricks x BIGXdata 가 진행하였으며, 신논현에 있는 앙트래블에서 진행했다. 생각보다 역에서 거리가 있어서 아주 쪼금 아쉬웠는데, 들어가자마자 시설이 너무 좋아서 바로 만족했다..! 들어가서 명찰을 받고, 준비해주신 도넛과 커피를 챙겨 자리로 앉았당. 팀원들이 다 오실 때까지 기다리고, 4시 40분 정도에 첫 세션을 시작했다! 첫번째 세션은 데브시스터즈 이지용 Data TF Lead님의 발표였다. Databricks x Tableau를 도입하게 되신 배경부터, 이로인해 무엇이 좋아졌고 데브시스터즈에서는 데이터 분석을 어떻게 진행하고 있는지에 대해 발표해주셨다. 리포팅 사례를 공유해주시기도 하고, 데이터..
일기장
2025.04.02
-
[통계] 게임 데이터에서의 파레토법칙과 롱테일 법칙 (a.k.a. 고래 유저)
아래는 3월 내 블로그의 글별 조회수인데, 이걸 보면서 오랜만에 학교에서 배웠던 개념이 하나 생각나서 정리해본다. 식스시그마인지 통계적품질관리인지 둘중 하나의 수업에서 배웠던 것 같다.. 그럼 문제의 조회수를 살펴보자. 이렇게 차트화를 시켜보면 좀 더 눈에 확 들어오는데, 깃허브 사용법이 TOP10 조회수 중 약 60%를 차지하고 있다. TOP1인 깃허브 사용법과 TOP2인 깃허브 브랜치 글 두개의 점유율을 합치면 약 75%.상위 20%가 전체의 80%를 생산해낸다는 법칙인 파레토법칙이 떠오른다. 1.파레토법칙이란?상위 20%가 전체 생산의 80%를 해낸다는 법칙. 80:20 법칙 (80:20 Rule) 또는 20:80 법칙이라고 함 2.그럼 롱테일 법칙은 뭔데?롱테일 법칙이란, 파레토 법칙의 반대라..
통계
2025.03.24
-
버킷리스트
생각날 때 마다 적어보는 인생버킷리스트!! ⭐ [직무]한달에 한번 이상 티스토리 포스팅데이터 분석가 20년 하기 [여행]다합에서 프리다이빙하기 요르단 가기 이집트 피라미드 앞 피자헛에서 피자 먹기 튀르키예에서 열기구 구경하기도쿄에서 벚꽃보기 몽골에서 낙타타기 (2024.09.06 ✅) 은하수가 쏟아지는 밤하늘 아래서 Sky Full of stars 듣기 (2024.09.05 ✅) 그랜드캐니언에서 만세하기호주에서 쿼카랑 셀카찍기 울릉도에서 프리다이빙하기 삿포로에서 눈에 파무치기 (2023.01.21 ✅)밤에 오타루운하가기 (2023.01.22 ✅)부다페스트에서 국회의사당 보기 (2025.12.31 ✅)[기타]베이스로 고민중독 연주하기 영어로 프리토킹데이식스 콘서트가기콜드플레이 내한공연가기
일기장
2025.03.10
-
[Git] 깃허브 프로세스와 Staging Area에 대하여 (강의 할인 쿠폰 제공)
이 글은 근본코딩님 (geek.geunbon@gmail.com)의 투고 및 근보코딩님의 강의내용을 바탕으로 작성하는 글입니다!🔽 깃허브에 대해 더 자세하게 알고 싶으시다면!? 🔽 탱크가 쏘는 근본깃님의 Git & GitHub 강의 2만원 할인 쿠폰! [2만원 할인 쿠폰]19682-4bc78305ebfa (선착순 100명)[강의 수강 링크]https://inf.run/tWmYf Git & GitHub, 원리부터 차근차근 - 근본깃 [완성편] 강의 | geek - 인프런geek | , 원리부터 차근차근[사진]기초부터 원리까지 한 번에.Git vs GitHub❓💻 GitGit(깃)은 코드의 버전을 관리해주는 프로그램이에요. 마치 게임에서 SAVE 포인트를 만드는 것처럼, Git을 통해 코드의www.inf..
깃허브 github
2025.03.03
-
[Bigquery] 프로시저 관련 꿀쿼리 모음 (SP 실행 기록, 대상 테이블이 실행되는 프로시저, 스케줄 찾기, 특정 쿼리가 들어간 프로시저 찾기)
하..쓸 글이 엄청 많은데 정리할 것도 많고.. 개인적인 큰 일이 줄줄이 있어 손도 못대고 있다. 가볍게 쓸 수 있는 소스들 부터 차근차근 정리하는중 자자 그럼 본론으로! 프로시저를 생성할 때 마다 문서 정리를 기깔나게 해놓지만, 내가 생성한 프로시저가 아닌 경우에 수~많은 테이블과 프로시저 중에서 이 테이블이 어떤 프로시저에서 생성되고 있는지, 스케줄은 어디서 돌고있는지 찾기가 힘들다. 이를 쿼리로 조회하는 방법이 있으니..! 1.SP 실행 기록 조회 b_date 기준 실행된 SP 기록을 조회할 수 있는 쿼리이다. SELECT *FROM `project_id.dataset_name.sp_run_info2` ## 본인의 프로젝트.데이터셋으로 변경WHERE 1=1 AND b_date = DATE_AD..
SQL
2025.01.14
-
[태블로] 구매액 상위 n명의 데이터만 노출하기
태블로에서, 구매액 상위 100명만 노출시켜야하는데 여러가지 이슈가 있었다. 챗 지피티가 틀린거에 이상하게 집착해서 ;ㅇ; 시간을 엄청 잡아먹었는데, 굉장히 기본적인 기능으로 해결할 수 있었다. 1.일단 순위를 구하고자 하는 값을 그대로 보여주고 싶은 경우 선반에 이렇게 유저명밖에 없다면, 유저의 구매 총액으로 랭크를 구하기가 매우 쉽다. 아래와 같이 기준값에 대한 RANK 계산된 필드를 하나 만들어준다. 이 후 이 컬럼을 필터에 넣어준 뒤, 원하는 순위 범위를 선택해주면 끝! 2.일단 순위 기준과, 차트에 보여주고 싶은 값이 다른 경우 내가 문제가 되었던 경우다! 이렇게 말하면 이해가 바로 안될텐데 바로 순위는 vid 기준 SUM(won)값으로만 매기고 싶은데, 차트에는 상품 카테고리별로도 보..
태블로 Tableau
2024.12.10
-
[SQL 뉴비 가이드북] 2.SQL 쿼리로 게임 업계 지표 추출하기 1탄.AU편 (DAU, WAU, MAU)
게임업계를 희망하는 데이터 분석가들을 위해, SQL로 게임 업계에서 정말 많이 쓰는 주요 지표들을 추출하는 방법에 대해 작성하려고 한다. 정말 많은 지표가 있는데, 그 중에서도 가장 많이 쓰인다고 생각하는 DAU, WAU, MAU에 다뤄보겠다. 쿼리는 빅쿼리 기준으로 작성하였다. 추후 PU , NPU, ARPPU 등을 다루는 PU 편도 작성할 예정! 0.AU Active User, 활성 사용자 수 : 기간 동안 게임/앱을 사용한 유저의 유니크 카운트 여기서 Active라는걸 어떻게 정의하냐에 따라 다르지만, 내가 일했던 모든 회사들은 로그인 기준으로 산정했기 때문에 해당 글 또한 모두 로그인 기준으로 작성합니당. 1.DAU Daily Active User , 일일 활성 사용자 수 : 기준일자에 접속한..
SQL
2024.11.26