본문 바로가기
생활

데이터 라벨링 용어정리

by 머니머니483 2023. 11. 16.
반응형

< 데이터 라벨링 용어 정리 >

1. 크라우드소싱

  • 대중(Crowd)과 아웃소싱(outsourcing)의 합성어
  • 기업 활동의 일부 과정에서 일반 대중(크라우드워커)을 참여시키는 것을 의미

2. 크라우드워커

  • 일반인이 기업의 업무 용역을 대행 수행하고 일정 대가를 받는 경우를 의미
  • 집이나 재택근무 등의 형태로도 업무 수행이 가능하고, 자유롭게 할당된 과제물을 수행하는 일자리

3. 데어터 라벨러

  • 데이터의 수집에서 가공에 이르기까지 인공지능 학습에 필요한 형태의 데이터를 만드는 사람

4. 인공지능 학습용 데이터

  • 인공지능이 학습을 통해 성능을 향상 시키는데 활용되는 데이터

5. 인공지능 학습용 데이터 구축

  • 임무 정의, 데이터 획득, 데이터 정제, 데이터 라벨링 등 인공지능 학습용 데이터를 구축하는 일련의 활동

6. 데이터 수집(획득)

  • 인공지능의 기계학습에 필요한 데이터를 현실 세계에서 직접 수집 또는 생성하는 등 다양한 종류의 데이터를 모으는 작업

7. 데이터 정제

  • 기계학습에 필요한 형식으로 맞추거나, 불필요한 중복을 제거하며, 개인정보를 비식별화하여 처리하는 등 인공지능 학습에 적합한 형태로 바꿔주는 작업

8. 데이터 라벨링

  • 인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업

9. 데이터 검수

  • 데이터 라벨링이 올바르게 되었는지를 확인하는 작업

10. 라벨(레이블)

  • 인공지능 학습을 위해 데이터에 부착하는 것으로 해당 대상에 대한 명칭뿐 아니라 데이터 인식에 필요한 설명이나 정답과 같은 의미

11. 챗봇

  • 문자 또는 음성으로 대화하는 기능이 있는 컴퓨터 프로그램 또는 인공지능

12. 바운딩

  • 이미지에서 추출하고자 하는 대상을 네모난 박스로 표시하는 라벨링 기법으로 데이터 라벨링 작업에서 가장 일반적으로 사용되는 유형

13. 태깅

  • 이미지나 파일 등에 이름을 붙이는 것으로 대표할 수 있는 키워드를 달아줌으로써 대상을 분류하는 작업

14. 전사

  • 이미지나 영상 속의 문자를 텍스트로 옮겨 적는 작업

15. 감정분석

  • 이미지나 영상 속 사람의 표정을 보고 어떤 감정 상태인지를 추론하는 라벨링 기법

16. 키포인트

  • 작업 대상의 특정 지점에 마우스를 클릭하여 점을 찍어주는 라벨링 기법

17. 얼굴 랜드마크

  • 얼굴의 주요 부위에 마우스를 클릭하여 점을 찍어주는 라벨링 기법

18. 폴리곤

  • 객체의 불규칙한 경계를 따라 점을 찍는 라벨링 기법

19. 폴리라인

  • 여러 개의 점을 연속적으로 그리는 라벨링 기법

20. 시멘틱 세그멘테이션

  • 폴리곤, 폴리라인, 브러쉬 등을 사용하여 경계를 나누어 분할함으로써 이미지 내의 모든 대상의 위치 및 모양 등을 영역으로 분류해 내는 라벨링 기법

21. OCR(광학문자인식)

  • 영상.이미지 상의 텍스트를 기계가 읽을 수 있는 문자로 변화하는 라벨링 기법

22. 스켈레톤

  • 대상의 특정 부위에 점을 찍는 라벨링 기법

23. 특정 구간 추출

  • 작업 대상이 사전에 제시된 기준에 해당하는 말이나 행동 등을 할 때의 구간을 선택해 추출하는 라벨링 기법

24. 3D 라벨링 기법

  • 육면체의 입체적인 박스를 생성하여 바운딩 하는 것과 같이 2차원 라벨링의 한계를 넘어 3차원의 입체적 표현을 가능케 하는 라벨링 기법

25. 복합 라벨링

  • 여러 개의 라벨링 기법을 복합적으로 사용하는 라벨링 기법

26. 문장 의미 비교

  • 주어진 문장들의 의미가 같은 것인지 태깅하는 라벨링 기법

27.  감정 태깅

  • 제시된 글을 읽었을 때 느껴지는 감정을 선택하는 라벨링 기법

28. 키워드 찾기

  • 대화 내용 속에서 핵심이 되는 키워드를 찾는 라벨링 기법

29. 문장 요약

  • 글을 읽고 핵심이 되는 내용을 요약하는 라벨링 기법

30. 화자 구분

  • 제시된 음성을 모두 듣고 동일한 사람의 목소리인지를 판단해서 태깅하는 라벨링 기법

31. 음성 받아쓰기

  • 주어진 음성을 듣고 받아쓰는 라벨링 기법

32. 일반 전사

  • 사람이 말한 그대로 문자화하여 전사하는 방법

33. 이중 전사

  • 한글 맞춤법 표기에 따른 발음과 차이가 있는 경우, '발음 전사'와 '철자 전사'를 병행하여 작성하는 방법

 

< MKTV 김미경TV_미래 직업 데이터라벨링 하는 법 교육 후기 N잡 부업 >

크라우드웍스 바로가기

 

AI에 필요한 모든 데이터 솔루션 | 크라우드웍스

크라우드웍스는 데이터 중심의 인공지능 기술을 통해 사람과 인공지능이 함께 성장하는 새로운 미래를 만들어갑니다.

www.crowdworks.ai

데이터라벨링 훈련과정 찾아보기

 

직업훈련포털 HRD-Net

오늘도 더 성장할 나를 위한 직업훈련 지식포털 안녕하세요. 로그인을 해 주세요. 로그인 간편인증 로그인 개인 기업 회원가입

www.hrd.go.kr

< 인공지능 학습용 데이터 구축 과정 >

1. 데이터 수집

  • 다양한 종류의 데이터를 모으는 과정

2. 데이터 정제

  • 데이터를 인공지능 학습에 적합한 형태로 바꿔주는 과정
  • 데이터의 오류 제거, 필요한 형식이나 크기에 맞게 변형, 불필요한 데이터 제거, 개인정보 비식별화 처리

3. 데이터 라벨링

  • 인공지능이 학습할 수 있는 형태로 데이터를 가공하는 작업

4. 데이터 검수

  • 데이터 라벨링이 올바르게 되었는지를 확인하는 작업

< 데이터 유형 >

1. 이미지

  • 활용: 랜드마크, 손글씨, 얼굴 인식, 질환 진단, 엑스레이 위험물 탐지 기술 등
  • 수집: 작업 대상과 기준에 맞춰 사진을 찍어 업로드하는 방식
  • 라벨링(가공): 바운딩, 감정분석, 키포인트, 얼굴랜드마크, OCR, 폴리곤, 폴리라인

2. 영상

  • 활용: 이상행동 탐지, 동작분석, 감정 인식 등
  • 수집: 작업 대상과 기준에 맞춰 영상을 찍어 업로드 하는 형식
  • 라벨링(가공): 바운딩, 특정 구간 추출, 스켈레톤, 시멘틱 세그멘테이션

3. 텍스트

  • 활용: 인터넷 자동완성 기능, 연관 검색어, 챗봇 서비스 등
  • 수집: 제시된 내용에 적절한 질문을 작성하거나 Q&A 대화를 만드는 방식
  • 라벨링(가공): 문장 의미 비교, 키워드 찾기, 감정 태깅, 문장 요약

4. 음성

  • 활용: 상황별 맞춤 대화록 작성, 음성인식 서비스, 자동번역, 영상 자막 등
  • 수집: 휴대폰으로 음성 등의 소리를 녹음하여 바로 업로드 하는 방식
  • 라벨링(가공): 화자 구분, 음성 받아쓰기
반응형