분류 전체보기107 [외부 행사] Tableau X databricks X BIGXdata D-TALK 후기 좋은 기회로 D-TALK 데이터 수다를 다녀오게 되었다! Tableau X databricks x BIGXdata 가 진행하였으며, 신논현에 있는 앙트래블에서 진행했다. 생각보다 역에서 거리가 있어서 아주 쪼금 아쉬웠는데, 들어가자마자 시설이 너무 좋아서 바로 만족했다..! 들어가서 명찰을 받고, 준비해주신 도넛과 커피를 챙겨 자리로 앉았당. 팀원들이 다 오실 때까지 기다리고, 4시 40분 정도에 첫 세션을 시작했다! 첫번째 세션은 데브시스터즈 이지용 Data TF Lead님의 발표였다. Databricks x Tableau를 도입하게 되신 배경부터, 이로인해 무엇이 좋아졌고 데브시스터즈에서는 데이터 분석을 어떻게 진행하고 있는지에 대해 발표해주셨다. 리포팅 사례를 공유해주시기도 하고, 데이터.. 탱크/일기장 2025. 4. 2. [통계] 게임 데이터에서의 파레토법칙과 롱테일 법칙 (a.k.a. 고래 유저) 아래는 3월 내 블로그의 글별 조회수인데, 이걸 보면서 오랜만에 학교에서 배웠던 개념이 하나 생각나서 정리해본다. 식스시그마인지 통계적품질관리인지 둘중 하나의 수업에서 배웠던 것 같다.. 그럼 문제의 조회수를 살펴보자. 이렇게 차트화를 시켜보면 좀 더 눈에 확 들어오는데, 깃허브 사용법이 TOP10 조회수 중 약 60%를 차지하고 있다. TOP1인 깃허브 사용법과 TOP2인 깃허브 브랜치 글 두개의 점유율을 합치면 약 75%.상위 20%가 전체의 80%를 생산해낸다는 법칙인 파레토법칙이 떠오른다. 1.파레토법칙이란?상위 20%가 전체 생산의 80%를 해낸다는 법칙. 80:20 법칙 (80:20 Rule) 또는 20:80 법칙이라고 함 2.그럼 롱테일 법칙은 뭔데?롱테일 법칙이란, 파레토 법칙의 반대라.. 통계 2025. 3. 24. 버킷리스트 생각날 때 마다 적어보는 인생버킷리스트!! ⭐ [직무]한달에 한번 이상 티스토리 포스팅데이터 분석가 20년 하기 [여행]다합에서 프리다이빙하기 요르단 가기 이집트 피라미드 앞 피자헛에서 피자 먹기 튀르키예에서 열기구 구경하기도쿄에서 벚꽃보기 몽골에서 낙타타기 (2024.09.06 ✅) 은하수가 쏟아지는 밤하늘 아래서 Sky Full of stars 듣기 (2024.09.05 ✅) 그랜드캐니언에서 만세하기호주에서 쿼카랑 셀카찍기 울릉도에서 프리다이빙하기 삿포로에서 눈에 파무치기 (2023.01.21 ✅)밤에 오타루운하가기 (2023.01.22 ✅)부다페스트에서 국회의사당 보기 (2025.12.31 ✅)[기타]베이스로 고민중독 연주하기 영어로 프리토킹데이식스 콘서트가기콜드플레이 내한공연가기 탱크/일기장 2025. 3. 10. [Git] 깃허브 프로세스와 Staging Area에 대하여 (강의 할인 쿠폰 제공) 이 글은 근본코딩님 (geek.geunbon@gmail.com)의 투고 및 근보코딩님의 강의내용을 바탕으로 작성하는 글입니다!🔽 깃허브에 대해 더 자세하게 알고 싶으시다면!? 🔽 탱크가 쏘는 근본깃님의 Git & GitHub 강의 2만원 할인 쿠폰! [2만원 할인 쿠폰]19682-4bc78305ebfa (선착순 100명)[강의 수강 링크]https://inf.run/tWmYf Git & GitHub, 원리부터 차근차근 - 근본깃 [완성편] 강의 | geek - 인프런geek | , 원리부터 차근차근[사진]기초부터 원리까지 한 번에.Git vs GitHub❓💻 GitGit(깃)은 코드의 버전을 관리해주는 프로그램이에요. 마치 게임에서 SAVE 포인트를 만드는 것처럼, Git을 통해 코드의www.inf.. 깃허브 github 2025. 3. 3. [Bigquery] 프로시저 관련 꿀쿼리 모음 (SP 실행 기록, 대상 테이블이 실행되는 프로시저, 스케줄 찾기, 특정 쿼리가 들어간 프로시저 찾기) 하..쓸 글이 엄청 많은데 정리할 것도 많고.. 개인적인 큰 일이 줄줄이 있어 손도 못대고 있다. 가볍게 쓸 수 있는 소스들 부터 차근차근 정리하는중 자자 그럼 본론으로! 프로시저를 생성할 때 마다 문서 정리를 기깔나게 해놓지만, 내가 생성한 프로시저가 아닌 경우에 수~많은 테이블과 프로시저 중에서 이 테이블이 어떤 프로시저에서 생성되고 있는지, 스케줄은 어디서 돌고있는지 찾기가 힘들다. 이를 쿼리로 조회하는 방법이 있으니..! 1.SP 실행 기록 조회 b_date 기준 실행된 SP 기록을 조회할 수 있는 쿼리이다. SELECT *FROM `project_id.dataset_name.sp_run_info2` ## 본인의 프로젝트.데이터셋으로 변경WHERE 1=1 AND b_date = DATE_AD.. 데이터베이스/SQL 2025. 1. 14. [태블로] 구매액 상위 n명의 데이터만 노출하기 태블로에서, 구매액 상위 100명만 노출시켜야하는데 여러가지 이슈가 있었다. 챗 지피티가 틀린거에 이상하게 집착해서 ;ㅇ; 시간을 엄청 잡아먹었는데, 굉장히 기본적인 기능으로 해결할 수 있었다. 1.일단 순위를 구하고자 하는 값을 그대로 보여주고 싶은 경우 선반에 이렇게 유저명밖에 없다면, 유저의 구매 총액으로 랭크를 구하기가 매우 쉽다. 아래와 같이 기준값에 대한 RANK 계산된 필드를 하나 만들어준다. 이 후 이 컬럼을 필터에 넣어준 뒤, 원하는 순위 범위를 선택해주면 끝! 2.일단 순위 기준과, 차트에 보여주고 싶은 값이 다른 경우 내가 문제가 되었던 경우다! 이렇게 말하면 이해가 바로 안될텐데 바로 순위는 vid 기준 SUM(won)값으로만 매기고 싶은데, 차트에는 상품 카테고리별로도 보.. 태블로 Tableau 2024. 12. 10. [SQL 뉴비 가이드북] 2.SQL 쿼리로 게임 업계 지표 추출하기 1탄.AU편 (DAU, WAU, MAU) 게임업계를 희망하는 데이터 분석가들을 위해, SQL로 게임 업계에서 정말 많이 쓰는 주요 지표들을 추출하는 방법에 대해 작성하려고 한다. 정말 많은 지표가 있는데, 그 중에서도 가장 많이 쓰인다고 생각하는 DAU, WAU, MAU에 다뤄보겠다. 쿼리는 빅쿼리 기준으로 작성하였다. 추후 PU , NPU, ARPPU 등을 다루는 PU 편도 작성할 예정! 0.AU Active User, 활성 사용자 수 : 기간 동안 게임/앱을 사용한 유저의 유니크 카운트 여기서 Active라는걸 어떻게 정의하냐에 따라 다르지만, 내가 일했던 모든 회사들은 로그인 기준으로 산정했기 때문에 해당 글 또한 모두 로그인 기준으로 작성합니당. 1.DAU Daily Active User , 일일 활성 사용자 수 : 기준일자에 접속한.. 데이터베이스/SQL 2024. 11. 26. [로스트아크] 로스트아크 6주년을 축하해! 크리스마스의 기적 3주년부터 시작해서, 벌써 6주년까지 같이하고 있는 로스트아크 6주년 축하해! 수직 군단장님과 함께 베히모스 하키드나 하기르까지 모두 클리어 ! 이제 한부위만 더 붙히면 하브렐슈드도 갈 수 있게 된다 > v 기원의섬 스킵 하나도 없이 플레이했는데 그동안 돌았던 레이드, 렌먹부터 시작해서 워로드백점프정상화까지 ㅋㅋ 너무재밌었다.오늘 나온 설정집 스페셜도 서버 터져서 못사가지구 속상했는데 다행히 예판을 해준대서 플미 참교육도 하고 설정집도 갖고 오히려 좋아졌다 우하하하 (되팔렘 ㄴㅇㅅ ㅋㅋ) !!!! 무언가를 엄청 좋아하는건 되게 즐겁고 행복한 일인 것 같다. 그게 게임이어도 ! 아무튼 급 마무리는 역시 로아 사랑해!!!!!!!!!!!!!!!!!!!!!!!!!!!! 나랑 팔순잔치 같이하.. 탱크/게임이야기 2024. 11. 9. [Biguqery] 뉴비를 위한 빅쿼리 User Defined Function(사용자 정의 함수) 설명 및 쿼리 사용법 DBMS 들은 대부분 UDF 기능을 가지고 있는데, 알아두면 프로시저와 같이 유용하게 쓰일 수 있다! 꼭 Bigquery가 아니어도 되지만, 이번 포스팅에선 빅쿼리를 기준으로 설명하도록 한다. 0. Function 함수란 ? 일단, 함수라는 기본 개념은 y=f(x) 인데, x에다 원하는 값을 넣으면 출력되는 y값이 있도록 만든 것이다. 프로그래밍에서도, DB에서도 똑같은 개념으로 쓰인다. 값을 넣으면 내가 정의한 처리를 거쳐 결과가 나오게끔 설정해주는 것. 그게 함수이다. 즉 사용자 정의 함수를 정의한다는 것은 내가 스스로 저 네모박스를 만들어주는 것! *왜 쓰나요?1.기니까.... 내가 막 ~~~~~~~ a라는 값을 입력하면 +2를 하고 -3을 하고 x10을하고 루트를 씌우고 이런 과정을 해야하는데 .. 데이터베이스/데이터베이스 2024. 10. 25. [Python] Pandas 과학적 표기법 해제 (지수표현을 일반 숫자로 표기) 파이썬에서 가끔 식별자 (ID) 등이 길면, 지수표현으로 나올 때가 있는데, 일반 숫자로 바꾸는 방법은 엄청 쉽다. 저장해두고 그때 그때 쓰도록 하자.pd.options.display.float_format = '{:.5f}'.format # .5 부분은 소숫점 자리수 원래대로 변경할 시 pd.reset_option('display.float_format') 카테고리 없음 2024. 10. 18. [SQL 뉴비 가이드북] 1.로그인 로그에서 SQL로 리텐션 뽑기 SQL 뉴비 가이드북의 첫 탄! 내가 첫 회사 입사 후 맡은 첫 업무였기도 하고, SELECT FROM WHERE JOIN만 알던 나에게 지옥을 선사해준 리텐션이다. 해보기 전엔 어떻게 하는지 감이 안오지만, 차근차근 따라오면 정말 쉽게 뽑을 수 있다. 그럼 함께 지표의 아주 아주 기본이 되는 리텐션을 로그인 로그를 바탕으로 뽑아보자. SQL은 모두 빅쿼리 기준!0.리텐션 고객 유지로, 고객이나 사용자가 특정 기간 동안 어떤 제품이나 서비스에 계속 관여하거나 이용하는 비율이다. 이걸 보면 이해하기가 쉬운데, 첫줄 기준으로 모든 기간에 유입한 유저들이 Day0에는 41만명이었으나, 하루가 지나면 그 중 16%인 6만명, 이틀이 지나면 첫 41만명의 11%인 약 5만명이 잔존해있다는걸 보기 쉽게 표기한 것이.. 데이터베이스/SQL 2024. 10. 2. [SQL 뉴비 가이드북] 0.컨텐츠 아카이브 SQL을 공부하게 되면, SELECT , FROM , WHERE, JOIN 등으로 시작할 것이다. 하지만 이런 예쁜 문법만 쓰는 코딩테스트의 문제는 실제 현업과 좀 다르다.코테에서 리텐션을 구하는 문제를 본 적이 있는가..? 프로그램 코테는 최적화를 시키는데 SQL 코테는 왜 안그럴까? 이처럼 SQL 문법은 익혔는데, 업무에선 어떤 쿼리를 작성할지 잘 모르는 주니어들을 위한케이스 별 쿼리 작성법에 대한 가이드를 기록해보려고 한다. 나중에 SQL 어디서 배워? 라고 했을 때 이 블로그를 전달해주는 그날까지 차곡차곡 쌓아나가보자! [SQL 뉴비 가이드북] 1.로그인 로그에서 SQL로 리텐션 뽑기SQL 뉴비 가이드북의 첫 탄! 내가 첫 회사 입사 후 맡은 첫 업무였기도 하고, SELECT FROM .. 데이터베이스/SQL 2024. 10. 2. 이전 1 2 3 4 ··· 9 다음