분류 전체보기110 [아키텍처] 메달리온 아키텍처 Medalion Architecture 와 게임 데이터 데이터브릭스 세미나를 갔을 때 많이 들었던 말 중 하나가 메달리온 아키텍쳐였다. 나도 슬슬 적용을 해보고자 해서, 메달리온 아키텍처에 대해 정리해보는 글을 써보기루!! 1.Medalion 아키텍처란 ? 메달리온 ! 우리가 생각하는 금메달, 은메달, 동메달 메달 맞다. 이 금,은,동에서 착안해서 데이터가 아키텍처의 각 단계를 통과하는 동안 브론즈 => 실버 => 골드 단계로 데이터를 정제해나가는 것을 뜻한다. 그럼, 브론즈, 실버, 골드에 대해서 각각 알아보자 ! 아마 이 개념까지하면 메달리온 아키텍처에 대해 더 잘 이해할 수 있을 것이다. 2.Bronze / Silver / Gold (1) 브론즈 데이터 우리가 흔히 "로그" 라고 부르는 서버나, API등을 통해 다이렉트로 수집하는 원본 raw 데이.. 카테고리 없음 2025. 6. 2. [로스트아크] 오랜만에 로아 일기 그리고... 오랜만에 로아일기..! 노르둠도 열심히 다녀주고 전 합주 시스템이 참 좋슴니다필보 기다리면서 한 곡 감상해주면 시간이 완전 빨리 가그등요!!! 올해 최고의 패치 짱갈래도 해쥬고 ...!!! 만우절에는 로팡플레이랑 카던 평면몹도 재밌게 즐겼습니당.강습레이드에서 민디가 유물상자도 뽑아주고!물논.... 저는 3만골 뜸 ㅎㅎ;;장기 20퍼에 22강이 붙는 고마운 일도 있었답니당. 사실 현생이 바빠 로아를 18개 레이드 중 2~3개만 하게 된지 한달 정도 된 거 같은데 ㅜㅜ ... 레이드에서 한번 예민한 사람 만나면 너무 스트레스 + 실수 강박 + 즐거우려고 하는 게임인데 눈치 보임 이런것두 있고 주변 사람들이 많이 접기두 하고... 1720을 찍어도 스페컷 맞추기가 좀 빡세서 저절로 손을 두게 된 것 같소이.. 탱크/게임이야기 2025. 5. 2. [ML] 게임 이상 탐지 논문 리뷰 - An Empirical Study of Anomaly Detection in Online Games AI 프로젝트를 위해 과장님께서 도움이 될만한 논문을 추천해주셨다. 그냥 읽으면 안읽을거 같아서 정리하며 읽어보자! 사람이 정리한 글! Abstract 온라인 게임에 대한 경험적 연구에 대해 기술함네가지 비지도 학습의 anomaly detection techniques을 사용가상 데이터셋과 VNG company의 두가지 실제 온라인 게임의 데이터셋 사용 I.Introduction [단락1] 온라인 게임 산업은 오늘날 굉장히 큰 비즈니스 시장임 but 인기가 많아질 수록 cheating도 빠르게 증가cheating은 심지어 유저의 돈을 잃게 조차 만드는 등 안좋은 영향을 끼침 따라서 cheating 예방은 매우 중요함 [단락2] 기존의 cheat prevention 기술은 사용 여부를 감지한 후 해당 .. 카테고리 없음 2025. 4. 14. [외부 행사] Tableau X databricks X BIGXdata D-TALK 후기 좋은 기회로 D-TALK 데이터 수다를 다녀오게 되었다! Tableau X databricks x BIGXdata 가 진행하였으며, 신논현에 있는 앙트래블에서 진행했다. 생각보다 역에서 거리가 있어서 아주 쪼금 아쉬웠는데, 들어가자마자 시설이 너무 좋아서 바로 만족했다..! 들어가서 명찰을 받고, 준비해주신 도넛과 커피를 챙겨 자리로 앉았당. 팀원들이 다 오실 때까지 기다리고, 4시 40분 정도에 첫 세션을 시작했다! 첫번째 세션은 데브시스터즈 이지용 Data TF Lead님의 발표였다. Databricks x Tableau를 도입하게 되신 배경부터, 이로인해 무엇이 좋아졌고 데브시스터즈에서는 데이터 분석을 어떻게 진행하고 있는지에 대해 발표해주셨다. 리포팅 사례를 공유해주시기도 하고, 데이터.. 탱크/일기장 2025. 4. 2. [통계] 게임 데이터에서의 파레토법칙과 롱테일 법칙 (a.k.a. 고래 유저) 아래는 3월 내 블로그의 글별 조회수인데, 이걸 보면서 오랜만에 학교에서 배웠던 개념이 하나 생각나서 정리해본다. 식스시그마인지 통계적품질관리인지 둘중 하나의 수업에서 배웠던 것 같다.. 그럼 문제의 조회수를 살펴보자. 이렇게 차트화를 시켜보면 좀 더 눈에 확 들어오는데, 깃허브 사용법이 TOP10 조회수 중 약 60%를 차지하고 있다. TOP1인 깃허브 사용법과 TOP2인 깃허브 브랜치 글 두개의 점유율을 합치면 약 75%.상위 20%가 전체의 80%를 생산해낸다는 법칙인 파레토법칙이 떠오른다. 1.파레토법칙이란?상위 20%가 전체 생산의 80%를 해낸다는 법칙. 80:20 법칙 (80:20 Rule) 또는 20:80 법칙이라고 함 2.그럼 롱테일 법칙은 뭔데?롱테일 법칙이란, 파레토 법칙의 반대라.. 통계 2025. 3. 24. 버킷리스트 생각날 때 마다 적어보는 인생버킷리스트!! ⭐ [직무]한달에 한번 이상 티스토리 포스팅 (~ing)데이터 분석가 20년 하기 (~ing) [여행]다합에서 프리다이빙하기 요르단 가기 이집트 피라미드 앞 피자헛에서 피자 먹기 튀르키예에서 열기구 구경하기도쿄에서 벚꽃보기 (2025.04.05 ✅) 몽골에서 낙타타기 (2024.09.06 ✅) 은하수가 쏟아지는 밤하늘 아래서 Sky Full of stars 듣기 (2024.09.05 ✅) 그랜드캐니언에서 만세하기호주에서 쿼카랑 셀카찍기 (2025.05.07 ✅)울릉도에서 프리다이빙하기 삿포로에서 눈에 파무치기 (2023.01.21 ✅)밤에 오타루운하가기 (2023.01.22 ✅)부다페스트에서 국회의사당 보기 (2025.12.31 ✅)[기타]베이스로 고민중독 .. 탱크/일기장 2025. 3. 10. [Git] 깃허브 프로세스와 Staging Area에 대하여 (강의 할인 쿠폰 제공) 이 글은 근본코딩님 (geek.geunbon@gmail.com)의 투고 및 근보코딩님의 강의내용을 바탕으로 작성하는 글입니다!🔽 깃허브에 대해 더 자세하게 알고 싶으시다면!? 🔽 탱크가 쏘는 근본깃님의 Git & GitHub 강의 2만원 할인 쿠폰! [2만원 할인 쿠폰]19682-4bc78305ebfa (선착순 100명)[강의 수강 링크]https://inf.run/tWmYf Git & GitHub, 원리부터 차근차근 - 근본깃 [완성편] 강의 | geek - 인프런geek | , 원리부터 차근차근[사진]기초부터 원리까지 한 번에.Git vs GitHub❓💻 GitGit(깃)은 코드의 버전을 관리해주는 프로그램이에요. 마치 게임에서 SAVE 포인트를 만드는 것처럼, Git을 통해 코드의www.inf.. 깃허브 github 2025. 3. 3. [Bigquery] 프로시저 관련 꿀쿼리 모음 (SP 실행 기록, 대상 테이블이 실행되는 프로시저, 스케줄 찾기, 특정 쿼리가 들어간 프로시저 찾기) 하..쓸 글이 엄청 많은데 정리할 것도 많고.. 개인적인 큰 일이 줄줄이 있어 손도 못대고 있다. 가볍게 쓸 수 있는 소스들 부터 차근차근 정리하는중 자자 그럼 본론으로! 프로시저를 생성할 때 마다 문서 정리를 기깔나게 해놓지만, 내가 생성한 프로시저가 아닌 경우에 수~많은 테이블과 프로시저 중에서 이 테이블이 어떤 프로시저에서 생성되고 있는지, 스케줄은 어디서 돌고있는지 찾기가 힘들다. 이를 쿼리로 조회하는 방법이 있으니..! 1.SP 실행 기록 조회 b_date 기준 실행된 SP 기록을 조회할 수 있는 쿼리이다. SELECT *FROM `project_id.dataset_name.sp_run_info2` ## 본인의 프로젝트.데이터셋으로 변경WHERE 1=1 AND b_date = DATE_AD.. 데이터베이스/SQL 2025. 1. 14. [태블로] 구매액 상위 n명의 데이터만 노출하기 태블로에서, 구매액 상위 100명만 노출시켜야하는데 여러가지 이슈가 있었다. 챗 지피티가 틀린거에 이상하게 집착해서 ;ㅇ; 시간을 엄청 잡아먹었는데, 굉장히 기본적인 기능으로 해결할 수 있었다. 1.일단 순위를 구하고자 하는 값을 그대로 보여주고 싶은 경우 선반에 이렇게 유저명밖에 없다면, 유저의 구매 총액으로 랭크를 구하기가 매우 쉽다. 아래와 같이 기준값에 대한 RANK 계산된 필드를 하나 만들어준다. 이 후 이 컬럼을 필터에 넣어준 뒤, 원하는 순위 범위를 선택해주면 끝! 2.일단 순위 기준과, 차트에 보여주고 싶은 값이 다른 경우 내가 문제가 되었던 경우다! 이렇게 말하면 이해가 바로 안될텐데 바로 순위는 vid 기준 SUM(won)값으로만 매기고 싶은데, 차트에는 상품 카테고리별로도 보.. 태블로 Tableau 2024. 12. 10. [SQL 뉴비 가이드북] 2.SQL 쿼리로 게임 업계 지표 추출하기 1탄.AU편 (DAU, WAU, MAU) 게임업계를 희망하는 데이터 분석가들을 위해, SQL로 게임 업계에서 정말 많이 쓰는 주요 지표들을 추출하는 방법에 대해 작성하려고 한다. 정말 많은 지표가 있는데, 그 중에서도 가장 많이 쓰인다고 생각하는 DAU, WAU, MAU에 다뤄보겠다. 쿼리는 빅쿼리 기준으로 작성하였다. 추후 PU , NPU, ARPPU 등을 다루는 PU 편도 작성할 예정! 0.AU Active User, 활성 사용자 수 : 기간 동안 게임/앱을 사용한 유저의 유니크 카운트 여기서 Active라는걸 어떻게 정의하냐에 따라 다르지만, 내가 일했던 모든 회사들은 로그인 기준으로 산정했기 때문에 해당 글 또한 모두 로그인 기준으로 작성합니당. 1.DAU Daily Active User , 일일 활성 사용자 수 : 기준일자에 접속한.. 데이터베이스/SQL 2024. 11. 26. [로스트아크] 로스트아크 6주년을 축하해! 크리스마스의 기적 3주년부터 시작해서, 벌써 6주년까지 같이하고 있는 로스트아크 6주년 축하해! 수직 군단장님과 함께 베히모스 하키드나 하기르까지 모두 클리어 ! 이제 한부위만 더 붙히면 하브렐슈드도 갈 수 있게 된다 > v 기원의섬 스킵 하나도 없이 플레이했는데 그동안 돌았던 레이드, 렌먹부터 시작해서 워로드백점프정상화까지 ㅋㅋ 너무재밌었다.오늘 나온 설정집 스페셜도 서버 터져서 못사가지구 속상했는데 다행히 예판을 해준대서 플미 참교육도 하고 설정집도 갖고 오히려 좋아졌다 우하하하 (되팔렘 ㄴㅇㅅ ㅋㅋ) !!!! 무언가를 엄청 좋아하는건 되게 즐겁고 행복한 일인 것 같다. 그게 게임이어도 ! 아무튼 급 마무리는 역시 로아 사랑해!!!!!!!!!!!!!!!!!!!!!!!!!!!! 나랑 팔순잔치 같이하.. 탱크/게임이야기 2024. 11. 9. [Biguqery] 뉴비를 위한 빅쿼리 User Defined Function(사용자 정의 함수) 설명 및 쿼리 사용법 DBMS 들은 대부분 UDF 기능을 가지고 있는데, 알아두면 프로시저와 같이 유용하게 쓰일 수 있다! 꼭 Bigquery가 아니어도 되지만, 이번 포스팅에선 빅쿼리를 기준으로 설명하도록 한다. 0. Function 함수란 ? 일단, 함수라는 기본 개념은 y=f(x) 인데, x에다 원하는 값을 넣으면 출력되는 y값이 있도록 만든 것이다. 프로그래밍에서도, DB에서도 똑같은 개념으로 쓰인다. 값을 넣으면 내가 정의한 처리를 거쳐 결과가 나오게끔 설정해주는 것. 그게 함수이다. 즉 사용자 정의 함수를 정의한다는 것은 내가 스스로 저 네모박스를 만들어주는 것! *왜 쓰나요?1.기니까.... 내가 막 ~~~~~~~ a라는 값을 입력하면 +2를 하고 -3을 하고 x10을하고 루트를 씌우고 이런 과정을 해야하는데 .. 데이터베이스/데이터베이스 2024. 10. 25. 이전 1 2 3 4 ··· 10 다음