LLM Engineer (LLM Evaluation)
About this role
We are looking for the best
About Us
42dot์ ์ํํธ์จ์ด์ AI๋ก ๋ชจ๋น๋ฆฌํฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ ธ๋ ฅํ๋ ๋ชจ๋น๋ฆฌํฐ AI ๊ธฐ์ ์ ๋๋ค. ํ๋์๋์ฐจ๊ทธ๋ฃน ๊ธ๋ก๋ฒ ์ํํธ์จ์ด ์ผํฐ๋ก์, 42dot์ ์ํํธ์จ์ด ์ ์ ์ฐจ๋ ๊ฐ๋ฐ์ ์ ๋ํ๋ฉฐ ๋ฏธ๋ ๋ชจ๋น๋ฆฌํฐ๋ฅผ ๊ฐ์ฒํ๊ณ ์์ต๋๋ค.
LLM Engineer (LLM Evaluation)๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ฑ๋ฅ์ ์ ๋ขฐ์ฑ ์๊ฒ ํ๊ฐํ๊ณ , ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ชจ๋ธ ํ์ง์ ์ง์์ ์ผ๋ก ๊ฐ์ ํ ์ ์๋ ํ๊ฐ ์ฒด๊ณ์ ํ๋ซํผ์ ๊ตฌ์ถํฉ๋๋ค.
๋น ๋ฅด๊ฒ ๋ณํํ๋ LLM ํ๊ฒฝ ์์์ benchmark dataset, evaluation protocol, automation pipeline์ ์ค๊ณํ์ฌ ๋ชจ๋ธ์ ํ์ง๊ณผ ์์ ์ฑ์ ์ง์์ ์ผ๋ก ํฅ์์ํค๊ณ , ์ค์๋น์ค ์์ค์ ๊ฒ์ฆ ์ฒด๊ณ๋ฅผ ์ด์ํ๋ ๋ฐ ๊ธฐ์ฌํฉ๋๋ค.
๋ํ Kubernetes ๊ธฐ๋ฐ ํ๊ฒฝ์์ Argo Workflows ๋ฐ MLflow๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ ํ๊ฐโ์คํ ๊ด๋ฆฌโ๋ฐฐํฌ ๊ฒ์ฆ๊น์ง ์ด์ด์ง๋ end-to-end evaluation workflow๋ฅผ ๊ตฌ์ถํ๊ณ , ๋ฐ๋ณต ๊ฐ๋ฅํ๊ณ ์ฌํ์ฑ ์๋ ํ๊ฐ ํ๊ฒฝ์ ๊ณ ๋ํํฉ๋๋ค.
Responsibilities
LLM Evaluation & Benchmark ์ค๊ณ
LLM ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์ํ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ ๊ตฌ์ถ ๋ฐ ํ๊ฐ ์งํ(Human/LLM-based) ์ค๊ณ
๊ณต์ ํ ๋ชจ๋ธ ๋น๊ต๋ฅผ ์ํ ํ๊ฐ ํ๋กํ ์ฝ ์๋ฆฝ ๋ฐ ์ฌํ์ฑ(Reproducibility) ํ๋ณด
Evaluation Automation ๋ฐ Workflow ์ฐ๋
Argo Workflows, MLflow ๊ธฐ๋ฐ์ ํ๊ฐ ์๋ํ ํ๊ฒฝ ๊ตฌ์ถ ๋ฐ ML ํ์ดํ๋ผ์ธ ํตํฉ
๋ชจ๋ธ ๋ฐฐํฌ ์ ์ฑ๋ฅ ์ ํ(Regression) ์๋ ๊ฐ์ง ๋ฐ ์๋ฆผ ์ฒด๊ณ ์ค๊ณ
Model Quality Validation ๋ฐ ์ด์ ๊ณ ๋ํ
๋ฐ๋ณต ๊ฐ๋ฅํ ํ๊ฐ ์ํฌํ๋ก์ฐ๋ฅผ ํตํ ๋๊ท๋ชจ ๋ชจ๋ธ ํ์ง ๋ฐ ์์ ์ฑ ๊ฒ์ฆ
ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ํ ์ง์์ ์ธ ๋ชจ๋ธ ํ์ง ๊ฐ์ ํ๋ก์ธ์ค ์ด์
Qualifications
LLM ํ์ต ๋๋ ํ๊ฐ ๊ด๋ จ ๋ถ์ผ 3๋ ์ด์ ๊ฒฝ๋ ฅ
Deep Learning ๋๋ NLP ๊ด๋ จ ์ฐ๊ตฌ ๋ฐ ๊ฐ๋ฐ ๊ฒฝํ
LLM evaluation framework ์ฌ์ฉ ๊ฒฝํ (lm-eval, HELM, OpenAI Evals ๋ฑ)
Python ๊ธฐ๋ฐ ์๋น์ค ๊ฐ๋ฐ ๊ฒฝํ (async/๋น๋๊ธฐ ์ฒ๋ฆฌ ํฌํจ)
์คํ ๊ด๋ฆฌ ๋ฐ reproducibility์ ๋ํ ์ดํด
๋ชจ๋ธ ํ๊ฐ ๋ฐ validation workflow ์ค๊ณ ๊ฒฝํ
๋๋ฃ์์ ์ํํ ํ์ ๋ฅ๋ ฅ
Preferred Qualifications
Kubernetes ๋ฐ ์ปจํ ์ด๋ ๊ธฐ๋ฐ ํ๊ฒฝ ๊ฐ๋ฐ ๊ฒฝํ
๋๊ท๋ชจ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋๋ pipeline ์ค๊ณ ๊ฒฝํ
GPU ๊ธฐ๋ฐ ๋ถ์ฐ inference ๋๋ ๋๊ท๋ชจ ๋ชจ๋ธ ํ๊ฐ ๊ฒฝํ
Datadog, Prometheus ๋ฑ์ ํ์ฉํ ๋ชจ๋ํฐ๋ง ๊ตฌ์ถ ๊ฒฝํ
MLflow, Argo Workflows ๊ธฐ๋ฐ ML workflow ์ด์ ๊ฒฝํ
GPU ํด๋ฌ์คํฐ ๊ธฐ๋ฐ evaluation pipeline ์ค๊ณ ๋ฐ ์ด์ ๊ฒฝํ
LLM ํ์ง ํ๊ฐ ์๋ํ ๋ฐ ์ด์ ๊ฒฝํ
Interview Process
์๋ฅ์ ํ - ์ฝ๋ฉํ ์คํธ - ํ์๋ฉด์ (1์๊ฐ ๋ด์ธ) - ๋๋ฉด ํน์ ํ์๋ฉด์ (3์๊ฐ ๋ด์ธ) - ์ต์ข ํฉ๊ฒฉ
์ ํ์ ์ฐจ๋ ์ง๋ฌด๋ณ๋ก ๋ค๋ฅด๊ฒ ์ด์๋ ์ ์์ผ๋ฉฐ, ์ผ์ ๋ฐ ์ํฉ์ ๋ฐ๋ผ ๋ณ๋๋ ์ ์์ต๋๋ค.
์ ํ์ผ์ ๋ฐ ๊ฒฐ๊ณผ๋ ์ง์์์ ๋ฑ๋กํ์ ์ด๋ฉ์ผ๋ก ๊ฐ๋ณ ์๋ด๋๋ฆฝ๋๋ค.
Additional Information
์ด๋ ฅ์ ์ ์ถ ์ ์ฃผ๋ฏผ๋ฑ๋ก๋ฒํธ, ๊ฐ์กฑ๊ด๊ณ,ย ํผ์ธ ์ฌ๋ถ,ย ์ฐ๋ด, ์ฌ์ง, ์ ์ฒด์กฐ๊ฑด,ย ์ถ์ ์ง์ญย ๋ฑ ์ฑ์ฉ์ ์ฐจ๋ฒ์ ์๊ตฌ ๊ธ์ง๋ ์ ๋ณด๋ ์ ์ธ ๋ถํ๋๋ฆฝ๋๋ค.
๋ชจ๋ ย ์ ์ถ ํ์ผ์ย 30MB ์ดํ์ PDF ์์์ผ๋ก ์ ๋ก๋๋ฅผ ๋ถํ๋๋ฆฝ๋๋ค. (์ด๋ ฅ์ย ์ ๋ก๋ ์คย ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค๋ฉด ์ง์ํ์๊ณ ์ ํ๋ ํฌ์ง์ ์ URL๊ณผ ํจ๊ป ์ด๋ ฅ์๋ฅผย recruit@42dot.ai์ผ๋กย ์ ์ก ๋ถํ๋๋ฆฝ๋๋ค.)
์ธํฐ๋ทฐ ํ๋ก์ธ์ค ์ข ๋ฃ ํ ์ง์์์ย ๋์ํ์ย ํํ์กฐํ๊ฐ ์งํ๋ ์ ์์ต๋๋ค.
๊ตญ๊ฐ๋ณดํ๋์์ ๋ฐย ์ทจ์ ๋ณดํธ ๋์์๋ย ๊ด๊ณ๋ฒ๋ น์ ๋ฐ๋ผ ์ฐ๋ํฉ๋๋ค.
์ฅ์ ์ธย ๊ณ ์ฉ ์ด์งย ๋ฐ ์ง์ ์ฌํ๋ฒ์ ๋ฐ๋ผ ์ฅ์ ์ธ ๋ฑ๋ก์ฆ ์์ง์๋ฅผ ์ฐ๋ํฉ๋๋ค.
42dot์ ์๋ขฐํ์ง ์์ ์์นํ์ ์ด๋ ฅ์๋ฅผ ๋ฐ์ง ์์ผ๋ฉฐ, ์์ฒญํ์ง ์์ ์ด๋ ฅ์์ ๋ํด ์์๋ฃ๋ฅผ ์ง๋ถํ์ง ์์ต๋๋ค.
3๊ฐ์์ ์์ต๊ธฐ๊ฐ์ด ์ ์ฉ๋ ์ ์์ต๋๋ค.
โป ์ง์ ์ ์๋ ๋ด์ฉ์ ๊ผญ ํ์ธํด ์ฃผ์ธ์.
42dot์ด ์ผํ๋ ๋ฐฉ์, 42dot Way ๋ณด๋ฌ๊ฐ๊ธฐ โ
42dot๋ง์ ์ ๋ฌด๋ชฐ์ ํ๋ก๊ทธ๋จ, Employee Engagement Program ๋ณด๋ฌ๊ฐ๊ธฐ โ
Frequently Asked Questions
Is the salary disclosed for the LLM Engineer (LLM Evaluation) position at 42dot?
Is the LLM Engineer (LLM Evaluation) job at 42dot remote?
Is the LLM Engineer (LLM Evaluation) role at 42dot full-time or part-time?
Which team or department does the LLM Engineer (LLM Evaluation) at 42dot belong to?
How do I apply for the LLM Engineer (LLM Evaluation) position at 42dot?
When was the LLM Engineer (LLM Evaluation) job at 42dot posted?
You'll be redirected to 42dot's official application page on Ashby ATS.