| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- 다항로지스틱회귀분석
- HR
- 데이터분석
- HRA
- 피플애널리틱스
- HR대시보드
- PA 미래
- Talent Analytics
- Workforce Analytics
- people analytics
- ChatGPT
- 하나만 쓰자..
- Text mining
- Pa
- HR데이터
- HR 애널리틱스
- survival analytics
- 태그도 많이 치는거 힘들다..
- 회귀분석
- 피플 애널리틱스
- HRCommunity
- HR 데이터 분석
- HRAnalytics
- HRProfessionalNetwork
- hr애널리틱스
- PeopleAnalytics
- hr스터디
- PA201
- HR Analytics
- DataDrivenHR
- Today
- Total
PA201: People Analytics 201
[홈랩 구축기] 집에 맥미니를 들인 이유 본문
들어가며
지난 PA201 스터디에서 「Home Lab 구축기」라는 이름으로 발표를 했다. 사실 PA(People Analytics) 스터디에서 갑자기 웬 홈랩 이야기인가 싶을 수도 있다. 하지만 PA가 진짜로 돌아가려면 결국 데이터 엔지니어링의 영역과 만나야 한다.
왜 홈랩(Home Lab)을 만들게 됐나
학교에서 통계와 코딩을 배울 때까지만 해도, 분석은 그냥 노트북에서 Jupyter 켜고 데이터 불러오면 되는 일이었다. 그런데 회사에 와서 본격적으로 분석을 해보려 하니, 모르는 게 너무 많았다. 즉, 내가 배운 건 '데이터 분석(통계, Python, R)' 이거 하나였는데, 현업에서 요구하는 건 그게 다가 아니었다.

[지식 Gap]
GAP 01. Server / Linux 데이터 분석을 할 때까지만 해도 리눅스를 쓰게 될 줄은 몰랐다. 내가 아는 CLI는 MS-DOS의 exit이 전부였다.
GAP 02. DB Oracle, PostgreSQL을 직접 관리하고 데이터 파이프라인을 만들 줄도 몰랐다. SELECT문은 쓸 줄 알지만, DB를 '운영'하는 것은 다른 세계의 일이었다.
GAP 03. 배포 / 운영 로컬 Jupyter를 넘어, 배치로 돌고 24시간 살아있는 서비스를 운영해본 적이 없었다.
▶️이 GAP을 메우려면 결국 "내가 직접 굴려볼 수 있는 환경" 이 필요했다. 회사 인프라는 함부로 만질 수 없으니, 집에서 만들기로 했다.
이를 위해 3번의 시도를 했다. 가장 싸고 빠른 선택에서 출발해 결국 전용 홈서버까지 왔다.
| 첫번째 시도 | WSL (로컬 환경) |
| 두번째 시도 | AWS Lightsail (클라우드) |
| 세번째 시도 | Mac Mini M4 (온프레미스) |
첫 시도: WSL — 일단 가지고 있는 PC로
WSL(Windows Subsystem for Linux)은 한마디로 "윈도우 컴퓨터 안에서 리눅스를 직접 실행할 수 있게 해주는 기술"이다. 과거에는 윈도우에서 리눅스 환경을 쓰려면 가상 머신(VirtualBox, VMware)을 따로 설치하거나, 아예 하드디스크를 나눠서 윈도우와 리눅스를 따로 설치(멀티 부팅)해야 했다. 하지만 WSL 덕분에 이제는 윈도우 앱을 실행하듯 아주 가볍고 빠르게 리눅스 터미널과 도구들을 사용할 수 있게 됐다.
즉, 이미 가지고 있는 Windows PC에서, 무료로, 지금 당장 시작할 수 있었고, 데이터 엔지니어링을 연습하기에 가장 합리적인 선택이었다.
WSL에서 Ubuntu를 띄우고 한동안 잘 썼다. 다만, 현실과 비슷한 분석 환경이 되려면 결국 한 가지 조건이 더 필요했다.
PC가 꺼져있을 때도 서버가 살아있어야 한다!
대시보드든 배치 잡이든, 내가 잠든 사이에도 돌아가야 의미가 있다. WSL은 어디까지나 내 PC 안에서만 사는 친구였다.

두 번째 시도: 클라우드(AWS Lightsail)
WSL의 한계를 '항상 켜져 있는 원격 서버' 로 해결해보려 했다. 자연스럽게 클라우드로 눈을 돌렸고, AWS Lightsail을 골랐다. 왜 EC2가 아니라 Lightsail이었나 하면.. EC2는 너무 무거웠다. 네트워크 설정부터 보안 그룹까지, "분석을 하려고 들어왔는데 인프라 공부만 한참 하다 끝나는" 그림이 그려졌다. Lightsail은 원클릭에 월 정액제라 학습용으로 적당했다.

이걸로 하고 싶었던 것... (욕심이 많았다)

…그런데 막상 써보니 돈은 꾸준히 나가는데, 성능은 학습하기에도 부족했다. 월 2만원에 메모리는 2GB, vCPU 2개. 컨테이너 두세 개만 띄워도 메모리가 빠듯하다. 그렇다고 월 5만원짜리 인스턴스로 올라가자니, 이걸 1년 쓰면 60만원이고 2년이면 120만원이다. 이 지점에서 깨달은 것은 매달 나가는 구독료로는 (공부용으로는) 오래 갈 수 없고, 한 번 사두면 몇 년을 쓸 수 있는 '내 것'이 필요하다는 것이다(사실 핑계다)
세 번째 시도: 나만의 서버를 사자
후보는 두 가지였다.
- 미니스포럼 미니PC (MS-01) — 베어본 조립
- 애플 맥미니 M4 — 기본형
원래 마음은 '당연히 미니스포럼이지' 였다. 베어본 조립이 더 자유롭고, 10G LAN에, Proxmox 깔고 가상화 놀이도 할 수 있고. 그런데 메모리 가격이 폭등하면서 이 계산이 뒤집혔다. 성능, 가격, 전성비 — 동급 Windows 미니PC와 비교해 모든 축에서 맥미니가 앞섰다. 24시간 돌릴 서버이니 전성비는 무시할 수 없는 변수였다.


현재 구축한 인프라
어쨋든 맥미니는 샀다. 일에 치여 많이 가지고 놀진 못했지만, 몇가지 데이터 인프라를 구축하고 API 통한 데이터 수집 및 분석을 일배치로 돌려놓는데 까지는 해놨다.

각 계층의 역할은 다음과 같다. Mac Mini M4 가 물리 호스트이고, 그 위의 OrbStack 이 가상화/리눅스 커널을 담당하며, Docker 가 컨테이너 런타임 역할을 한다. 그 위에 PostgreSQL과 MinIO 가 분석 DB와 S3 호환 저장소로 데이터를 쌓고, Python·R·Superset 같은 분석 도구가 그 위에서 돌아간다. 외부에서의 안전한 접속은 Tailscale 이 책임진다.
이 여정에서 남은 것
"단순한 재미를 넘어, HR Analyst로서 데이터 분석 업무의 A부터 Z까지를 조망할 수 있게 됐다."
01. 인프라를 이해하게 됐다
대시보드 구축 요청이 왔을 때 "어디서, 어떻게 돌아가는지" 를 설계 단계부터 말할 수 있게 됐다. 그 전까지는 분석 결과만 만들고 운영은 IT팀에 넘기는 식이었다면, 이제는 운영 부담까지 고려해서 의사결정에 참여할 수 있다.
02. 실험 비용이 0에 수렴됐다
클라우드 구독이 아니라 내 서버이므로, 새 도구를 깔아보다 실패해도 손해가 없다. 망가지면 컨테이너 하나 지우고 다시 띄우면 된다. 학습의 호흡이 길어졌다.
03. PA와 DE의 간격을 좁혔다
People Analytics가 제대로 되려면, 데이터 엔지니어링에 대한 이해는 선택이 아니라 필수다. 데이터 파이프라인이 어떻게 돌아가는지 모르면, 결국 분석 결과는 누군가의 ETL 결과물에 의존할 수밖에 없고, 그 의존은 곧 분석가의 분석 영역의 한계가 된다.
마치며
PA를 한다는 것은 "회귀분석 결과 p < 0.05이고 R² 가 0.6입니다" 라고 말하고 끝나는 일이 아니다. 그 데이터가 어디서 와서, 어디에 쌓이고, 어떻게 정제되고, 누구에게 어떤 형태로 전달되는지 — 그 흐름 전체를 책임질 수 있을 때 비로소 분석가가 조직 안에서 신뢰를 얻는다.
물론 모든 PA 분석가가 서버를 직접 굴려야 한다는 얘기는 아니다. 다만, 그 영역이 어떻게 돌아가는지를 아는 것과 모르는 것은 분명히 다르다. 모르면 외주를 줄 수밖에 없고, 외주를 주면 분석의 깊이도 외주의 일정에 종속된다.
비싼 클라우드 구독 대신 작은 미니PC 한 대로도 충분하다. 시작은 의외로 가볍다.
이 글은 PA201 스터디 발표 자료(2026. 4. 25.)를 바탕으로 작성됐습니다.
'People Insight > PA201 스터디' 카테고리의 다른 글
| [기록] 주요 스터디 아젠다 (2022. 9. ~ 현재) (0) | 2024.09.09 |
|---|---|
| HR이 '피플 애널리틱스(People Analytics)'를 하면 안되는 5가지 이유 (0) | 2024.04.21 |
| 다항 로지스틱 회귀분석 (Multinomial Logistic Regression) 개념 소개 (0) | 2024.02.14 |
| 다항 로지스틱 회귀분석(Multinomial Logistic Regression)으로 분류 모델 만들어보기 (0) | 2024.02.04 |
| HR 장면에서의 생존분석 (0) | 2024.01.20 |