해당 포스팅은 "실무로 통하는 인과추론 with 파이썬" 책을 학습하면서 재구성한 글입니다.1. 들어가며지난 포스팅에서는 인과추론이 필요한 이유와 연관관계와 인과관계 차이, 처치와 결과, 인과추론의 근본적인 문제에 대해서 다뤘습니다. 우리가 일상을 살다 보면 다양한 의문이 들 때가 종종 있습니다. 예를 들면, 흡연하는 사람들에게는 폐암이 더 잘 발견되는데, 이러한 이유가 꼭 흡연에 의해서 발생하는 것일까? 아니면, 환경이나 유전적 요인에 의한 것인가? 등등 이와 같은 고민을 해보셨다면 오늘 다룰 내용인 인과모델이 도움이 되실 것 같습니다. 또한 만약 모든 사람들에게 돈을 동일하게 줬다면, 어떤 일이 벌어질까? 등처럼 개입에 대한 개념도 오늘 포스팅에서 다뤄보려고 합니다.2. 인과추론 용어 정리하기인과모델..
전체 글
SOOHO 개발공부노트해당 포스팅은 "실무로 통하는 인과추론 with 파이썬" 책을 학습하면서 재구성한 글입니다.1. 인과추론이 필요한 이유 보통 회사에서 제품의 품질이 변동되거나 문제가 발생하게 되면, 데이터 분석가는 해당 원인이 무엇인지 확인하기 위해 다양한 자료들을 살펴보게 되고, 그 과정 중에 다양한 Feature 간의 상관관계를 살펴보는 일이 비일비재하게 이뤄지게 됩니다. 그때마다 과연 A와 B의 상관관계는 있지만, 인과관계가 존재하는지에 대한 의문이 존재했습니다. 보통 통계학을 공부해 본 사람이라면 흔히 상관관계는 인과관계가 아니라고 설명을 많이 들어왔을 것입니다. 저 또한 해당 내용을 익히 들었기 때문에 이번에 인과추론을 공부하면서 어떻게 제품의 문제 원인을 찾을 수 있을지 공부해보려고 합니다. 사람들은 생각보다..
글을 시작하며 그동안 앓던 이가 빠진 것처럼 최근에 ADP 자격증을 합격하고서 잠시의 휴식을 누렸습니다. 이제 시험을 위한 공부가 아니라, 내 성장을 위한 공부를 해볼 수 있겠다는 생각이 들었습니다. 물론, ADP 자격증을 공부하면서 얻은 지식들이 생각보다 많이 유용하게 사용되고 있고, 현재에도 업무에 많이 적용하고 있습니다. 그래도.. 시험을 위한 공부는 너무 싫었는데, 끝이 올까라고 생각했던 일이 끝나서 참 다행이라고 생각했습니다. 조금 더 홀가분한 마음으로 이쯤에서 업무나 개인적인 생각들을 정리하고 다시 나아갈 힘을 얻어보고자 앞으로의 계획을 작성해보려고 합니다. 이번 글에서는 현재하는 업무와 관련해서 해보면 좋은 것들과 앞으로 미래의 업무를 고려했을 때 공부해 보면 좋을 것들, 그리고 개인적인..
이 내용은 개인적인 경험을 기반으로 작성된 글입니다.1. 6수 만에 드디어 합격 10월 12일, 대전 한 시험장에서 33회 ADP 시험을 치르게 되었습니다. 사실 거의 4년 동안 지속적으로 공부해 오던 자격증이라, 매번 보는 것이 특별하다고 느껴지지는 않았습니다. 지금까지 봐왔던 실기시험은 23회, 24회, 25회, 31회, 32회, 33회 총 6회를 진행했었네요. 거의 42만 원을 시험비용으로 사용했었다니.. 믿기지 않네요. 그래도 이번 시험을 봤을 때에는 늘 시간에 쫓기던 시험이 3시간 만에 모든 문제의 대략적인 답안을 작성할 수 있었고, 남은 시간 동안 답안에 대한 검토를 할 수 있었습니다. 혹시나 해당 자격증이 무엇인지 모르는 분들을 위해 간략히 설명드려보면, ADP 자격증은 데이터 분석 전문가..
해당 글은 개인적으로 회사에서 업무를 하면서 느낀 내용에 대하여 경험적인 측면에 따라 작성되었습니다.일부 내용에 오류가 있을 수 있습니다.1. 시작하며 회사에서는 배터리의 성능을 고도화하기 위해, 성능지표와 앞쪽 공정에서의 나온 Feature과의 관계들을 확인하는 작업들을 종종 하곤 합니다. 그때마다, 엑셀에서 흔히 사용하는 추세선의 R-squred 값을 통해, 두 변수 간의 관계성을 확인합니다. 해당 시점에서의 나온 추세선은 Scatter plot을 가장 잘 나타내는 선형회귀식이고, 이를 활용하여 결정계수의 제곱근을 하여, 두 변수 간의 상관계수를 구할 수 있습니다. 그렇게 구해진 상관계수와 N의 값을 통해, 상관있음에 대한 가설검정을 진행하고 이를 받아들일지 판단하게 됩니다. 이러한 과정 중 의문점이..
2024년 10월 1일 어느덧, 시간이 또 흘러 올해의 막바지인 12월을 향해 달려가고 있는 시점입니다. 오늘은 대전을 떠나, 근교로 나와 자연을 만끽하면서 글을 작성해보고 있는데, 확실히 10월이 되면서 많이 선선해지고, 반팔보다는 긴팔을 고르게 되는 가을이 되었네요. 이 맘 때가 되면 항상 올해 초에 계획했던 것들을 하나씩 하나씩 잘 이뤄가고 있는 지를 돌아보게 되는데, 다른 분들은 잘해나가고 계신가요? 저에겐 10월은 현재 회사를 다니기 시작한 달로 사회 구성원으로의 새로운 출발이었던 시기이자 이번 글을 작성한 계기이기도 한 글또의 마지막 기수가 시작되는 시점이기도 합니다. 글또는 그동안 10기까지 총 8년에 걸쳐서 진행되어 온 "글 쓰는 또라이가 세상을 바꾼다"는 커뮤니티입니다. 많은 운영진분들..
한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다. 최근 회사 내에서 내부 데이터를 잘 수집하고 활용하기 위해 제조 데이터로 작은 서비스를 구축하고 있습니다. 아무리 작은 서비스라고 하더라도 전부를 구축하기엔 데이터베이스부터 백엔드개발, 웹개발 등 다양한 분야에 대한 공부가 필요한 시점이었습니다. 아무래도 파이썬 기반으로 제가 직접 구축해볼 수 있다면, 좀 더 빠르게 이해할 수 있을 거라 생각해서 파이썬 기반 웹프레임워크인 Django, Flask에 이어 최근 부상하고 있는 FastAPI를 배워보고자 이 책을 공부하게 되었습니다. 1. 대상 독자 이 책은 파이썬은 어느 정도 사용할 줄 알고, 이제 웹개발을 FastAPI로 처음 해보고 싶은 분에게 추천할 만한 책입니다. 무엇보다 기반지식이 없어도..
한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다. 최근 2024년 3월 8일, 유럽연합 의회에서 인공지능 기술을 안전하고 윤리적으로 사용할 수 있도록 하는 규제법안인 인공지능법을 승인했습니다. 대표적으로 자율주행의 경우에는 자칫 잘못된 결정을 한 경우에 사람의 생명까지 위협할 만큼 위험합니다. 또한 생명을 다루는 의료 분야(진단, 신약개발 등)에서도 활발히 인공지능을 개발되고 있습니다. 이처럼, 우리 삶 속에서의 인공지능이 미칠 수 있는 영역은 확대되고 있습니다. 확대가 됨에 따라, 올바르고 안전하게 사용할 수 있도록 다양한 규제 등이 강화될 것으로 보입니다. 모델을 만들고 활용하는 입장에서 어떻게 올바르게 리스크 관리를 할 것인가에 대한 내용을 다룬 책입니다. 1. 대상 독자 및 설명 이 책..
한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다. 우선 이번 달에 이 책을 리뷰할 수 있어서 너무 좋았습니다. 회사 업무적으로도 머신러닝을 사용하기 시작하면서 실무에 적용해 볼 수 있었습니다. 또한 ADP라는 자격증을 준비하고 있는데, 보통회차와는 다르게 이번 시험에서는 전처리가 기본 조건으로 주어졌습니다. 시간 부족으로 아쉽게 이번 회차에 ADP 실기에 떨어지게 되었는데, 이 책을 공부하면서 확실히 돌아오는 회차에서는 합격할 수 있다고 확신할 만큼 좋은 책입니다. 혹시나 ADP 실기 시험에 어떤 책을 가져갈까 고민이시라면, 이 책을 꼭 추천드립니다.1. 대상 독자 이 책은 머신러닝과 딥러닝에 대해 공부해보고 싶은 분이라면 가장 먼저 추천할 만큼 좋은 책입니다. 물론, 파이썬에 대한 활용법은..
이 글은 개인적인 생각과 경험으로 작성된 글이기에 다른 제조업 및 스타트업 등을 대표하지 않을 수 있음을 알려드립니다. 글을 시작하며 2020년부터 데이터 분석이라는 분야에 흥미가 생기기 시작하며, 다양한 프로그램, 교육 등을 들었고 2021년 네이버에서 진행하던 부스트캠프를 진행하게 되면서 AI와 코딩으로 진로를 정하게 되었습니다. 그러다 그 해 2021년 말, 데이터 분석가라는 직무(사실, 당시에는 데이터분석가의 직무라는 것은 없었고, 데이터분석, AI, 머신러닝을 다뤄본 사람 정도)로 회사에서 일을 시작하게 되었습니다. 처음에는 "나 같은 주니어가 제조업에서 할 수 있는 것들이 있을까?"라는 생각, "그래도 AI, 머신러닝 배웠는데, IT기업에 가는 게 좋지 않을까?"라는 생각과 "그래도 주어진 기..