ABOUT ME

-

Today
-
Yesterday
-
Total
-

    IT 대기업에서 일하고있는 9년차 소프트웨어 개발자입니다. 

     

    2014 (인턴)

    산업공학을 전공하다 소프트웨어로 전향했습니다. 

    산업공학의 영향인지 소프트웨어 공학에 관심이 많아서 관련 부서에서 인턴을 했습니다. 

    Agile을 처음 만나게 되었고 큰 흥미를 느꼈습니다. 

     

    2016 

    인턴했던 부서로 입사하여 Agile 문화를 전파했습니다. 

    코칭하는 선배들을 열심히 따라다니고 책을 많이 읽었습니다. 

     

    공부할 겸 Scrum Primer를 번역했는데 발번역이지만 아직도 검색 가능해서 뿌듯합니다. 

     

    개발 업무가 많지 않아 갈증이 있었습니다. 

    그래도 이 때 경험한 Agile이 이후에 협업할 때 정말 큰 도움이 되었습니다. 

     

    2017 

    Git, Gerrit에서 오는 데이터를 분석하는 일을 했습니다. 

    JAVA로 분석 자동화 프로그램을 만들었습니다. 

     

    당시 JAVA가 편해서 썼는데 다시 돌아갈 수 있다면 Python으로 할겁니다. 

     

    그 외에 코드 리뷰, 클린 코드 문화를 전파하기위한 일을 했습니다. 

     

    2018

    Gerrit뿐만 아니라 GitHub의 데이터도 분석하기 시작했습니다. 

    경영진의 관심으로 해당 데이터들로 KPI를 기획하고, 뽑고, 주기적으로 제공했습니다. 

     

    운좋게 교육으로 Data Science를 처음 접했는데 너무 재밌어서 업무와 관련없지만 혼자 공부했습니다. 

     

    2019

    KPI 업무가 커지면서 Gerrit, GitHub 뿐만 아니라 P4, Swarm, GitLab의 데이터도 수집/분석했습니다. 

     

    Python으로 수집 프로그램을 개발하여 각 서버의 관리자에게 배포했습니다. 

    분석은 SplunkPython을 같이 사용했습니다. 

     

    Splunk는 극한으로 사용했으나 정리를 제대로 해놓지않아서 매우 후회됩니다. 

     

    2020

    Data Science를 하는 부서로 이동했습니다. 

     

    Programmatic advertising 관련 업무 중 Fraud Detection, Anomaly Detection을 했습니다. 

    유명한 Fraud 사례가 우리 회사에도 발생했는지 분석했습니다. (DiCaprio, Monarch 등)

     

    관련해서 특허도 내보고 어려운 분야지만 재밌었습니다. 

     

    부가적으로 Kaggle 스터디도 하고 국내 데이터 경진대회도 나가고 보람찬 한해였습니다. 

     

    각종 분석에 Python, Spark를 많이 사용했습니다. 

     

    2021

    Big Data 분석 조직으로 이동했습니다. 

    타겟 마케팅을 지원하는 분석 업무를 했습니다. 

     

    데이터가 방대하고 개인 정보가 많아서 분석 환경에 제약이 많았습니다. 

     

    아쉽게도 SQL을 많이 썼고 제약 탓에 Python은 많이 못썼습니다. 

     

    기술적으론 아쉬웠지만 현실적인 문제를 많이 경험할 수 있었습니다. 

     

    2022

    작년의 아쉬움이 크게 남아 Data Science를 위한 분석 환경을 만드는 일을 하고 있습니다. 

     

    GCP에서 MLOps, DataOps를 목표로 이것저것 개발하고 있습니다. 

     

    최근에는 Airflow, Kubernetes를 많이 써보고 있습니다. 

     

    2023

    각종 서비스에서 오는 데이터를 잘 활용할 수 있게 데이터를 가공하고 관리하는 일을 했습니다. 

    보통 데이터 마트라고 부르는 영역입니다. 

     

    사내에는 이미 수많은 마트 테이블이 존재하는데 유지보수가 어려운 문제가 있었습니다. 

    이런 수많은 레거시 테이블을 잘 관리하기 위한 보조 도구를 만들고 방법론을 제시했습니다. 

     

    주로 Python으로 도구 개발을 했고 GitHub Actions를 많이 다뤘습니다. 

     

    2024

    사내에는 수많은 데이터가 존재하지만 스키마가 서비스에 맞춰져서 사용이 어려운 문제가 있습니다. 

    아무리 좋은 데이터가 많아도 어려워서 쓰지 못하면 소용없다고 생각했습니다. 

     

    분석가 뿐만 아니라 마케터, 전략, 기획 등 다양한 임직원들이 데이터를 쓸 수 있도록

    사용자 친화 마트를 만드는 프로젝트를 시작했습니다. 

     

    데이터 사용 난이도를 낮추는 것 뿐만 아니라 유지보수성 높은 데이터를 만드는 것을 목표로 하고 있습니다. 

     

     

     

     

     

     

     

     

Designed by Tistory.