데이터 라벨러

자율주행, 자연어 인식 등 인공지능 프로그램 개발을 위해 인공지능이 학습 데이터를 쉽게 인식할 수 있도록 텍스트, 사진 이미지, 동영상, 사운드 등의 파일에 등장하는 사물, 동식물, 특정 단어 등에 라벨(정보 표식)을 수집하고 입력하여 가공한다.

데이터 라벨러 직업 종사자가 업무를 수행하는 모습
데이터 라벨러 직업 종사자가 업무를 수행하는 모습
AI훈련데이터어노테이션머신러닝재택가능이미지라벨링NLP

직업 상세 정보 탭

방향키로 탭을 이동하고 Enter 키로 선택할 수 있습니다. Home/End 키로 처음과 마지막 탭으로 이동합니다.

주요 업무

수행 직무

  • 작업 전 프로젝트 가이드를 숙지한다.
  • 조건에 부합하는 이미지, 영상을 촬영하거나 음성 또는 사운드를 녹음하여 업로드한다.
  • 또는 상황별 적절한 Q&A 데이터셋을 생성한다.
  • 이미지에서 정해진 대상으로 마우스로 드래그하여 박스를 그린다.
  • 대상에 특정 부위에 점을 찍는 직업은 스켈레턴 추출작업을 한다.
  • 사진 속 사람의 얼굴 표정을 보고 감정을 추론해 태깅하거나 이미지를 글로 상세히 묘사하는 작업을 한다.
  • 화자가 특정 동작이나 대사를 말할 때 해당 구간 선택, 고객사에서 필요한 데이터에 따라 영상의 구간을 선택해 추출한다.
  • 구간 추출 후에는 감정을 태깅하거나 대사를 받아쓰는 직업을 한다.
  • 주어진 시나리오에 맞는 Q&A 대화 만들거나 제시된 지문 읽고 질문 만드는 작업을 한다.
  • 주어진 문장을 읽고 의미가 같은지 다른지 태깅하는 작업, 주어진 지문을 읽고 핵심 내용을 요약하는 작업, 문장을 읽고 느껴지는 감정을 태깅하는 작업을 한다.
  • 주어진 음성을 듣고 들리는 대로 받아쓰는 작업을 한다.
  • 기준음성과 비교 대상음성을 듣고 화자가 같은지 다른지를 태깅하는 작업을 한다.

작업강도

아주 가벼운 작업

작업장소

실내

육체활동

시각

커리어 전망

생성형 AI·대형언어모델 학습을 위한 데이터 수요가 폭발적으로 증가하면서 라벨러 수요도 단기 급증했다. 다만 자동 라벨링·합성 데이터 기술 발전으로 단순 반복 작업은 자동화될 위험이 있어, 고난도 전문 라벨링으로의 역량 전환이 필요하다.[1]

워라밸 & 사회적 평가

워라밸 지수

보통 이상

사회적 기여도

보통

워라밸

재택 근무와 탄력 근무가 가능한 경우가 많고, 집중력을 요하는 단순·반복 작업 특성상 근무 시간이 명확하게 구분된다. 단 단가 기반 업무에서는 수입 안정성이 낮아 심리적 부담이 될 수 있다.[2]

사회적 기여

AI 기술 발전의 기초 데이터를 만드는 역할로 AI 민주화에 기여한다. 다만 직접적인 사회 기여 체감도는 상대적으로 낮을 수 있다.[3]

임금 정보

초보 라벨러의 경우 연 2,400만~3,000만 원 수준이며, 전문 분야(의료·자율주행 등) 경력자는 연 3,500만 원 이상을 받을 수 있다. 크라우드소싱 방식은 건당 수수료 형태로 시급 환산 시 최저임금 수준인 경우도 있다.[4]

여담

  • OpenAI의 GPT 시리즈를 비롯한 대형 AI 모델 훈련에는 수백만~수억 건의 인간 라벨링 데이터가 사용된다. RLHF(인간 피드백 강화학습) 기법에서 라벨러의 선호도 평가가 모델 품질을 결정하는 핵심 변수로 작용한다.[5]