반응형
< 데이터 라벨링 용어 정리 >
1. 크라우드소싱
- 대중(Crowd)과 아웃소싱(outsourcing)의 합성어
- 기업 활동의 일부 과정에서 일반 대중(크라우드워커)을 참여시키는 것을 의미
2. 크라우드워커
- 일반인이 기업의 업무 용역을 대행 수행하고 일정 대가를 받는 경우를 의미
- 집이나 재택근무 등의 형태로도 업무 수행이 가능하고, 자유롭게 할당된 과제물을 수행하는 일자리
3. 데어터 라벨러
- 데이터의 수집에서 가공에 이르기까지 인공지능 학습에 필요한 형태의 데이터를 만드는 사람
4. 인공지능 학습용 데이터
- 인공지능이 학습을 통해 성능을 향상 시키는데 활용되는 데이터
5. 인공지능 학습용 데이터 구축
- 임무 정의, 데이터 획득, 데이터 정제, 데이터 라벨링 등 인공지능 학습용 데이터를 구축하는 일련의 활동
6. 데이터 수집(획득)
- 인공지능의 기계학습에 필요한 데이터를 현실 세계에서 직접 수집 또는 생성하는 등 다양한 종류의 데이터를 모으는 작업
7. 데이터 정제
- 기계학습에 필요한 형식으로 맞추거나, 불필요한 중복을 제거하며, 개인정보를 비식별화하여 처리하는 등 인공지능 학습에 적합한 형태로 바꿔주는 작업
8. 데이터 라벨링
- 인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업
9. 데이터 검수
- 데이터 라벨링이 올바르게 되었는지를 확인하는 작업
10. 라벨(레이블)
- 인공지능 학습을 위해 데이터에 부착하는 것으로 해당 대상에 대한 명칭뿐 아니라 데이터 인식에 필요한 설명이나 정답과 같은 의미
11. 챗봇
- 문자 또는 음성으로 대화하는 기능이 있는 컴퓨터 프로그램 또는 인공지능
12. 바운딩
- 이미지에서 추출하고자 하는 대상을 네모난 박스로 표시하는 라벨링 기법으로 데이터 라벨링 작업에서 가장 일반적으로 사용되는 유형
13. 태깅
- 이미지나 파일 등에 이름을 붙이는 것으로 대표할 수 있는 키워드를 달아줌으로써 대상을 분류하는 작업
14. 전사
- 이미지나 영상 속의 문자를 텍스트로 옮겨 적는 작업
15. 감정분석
- 이미지나 영상 속 사람의 표정을 보고 어떤 감정 상태인지를 추론하는 라벨링 기법
16. 키포인트
- 작업 대상의 특정 지점에 마우스를 클릭하여 점을 찍어주는 라벨링 기법
17. 얼굴 랜드마크
- 얼굴의 주요 부위에 마우스를 클릭하여 점을 찍어주는 라벨링 기법
18. 폴리곤
- 객체의 불규칙한 경계를 따라 점을 찍는 라벨링 기법
19. 폴리라인
- 여러 개의 점을 연속적으로 그리는 라벨링 기법
20. 시멘틱 세그멘테이션
- 폴리곤, 폴리라인, 브러쉬 등을 사용하여 경계를 나누어 분할함으로써 이미지 내의 모든 대상의 위치 및 모양 등을 영역으로 분류해 내는 라벨링 기법
21. OCR(광학문자인식)
- 영상.이미지 상의 텍스트를 기계가 읽을 수 있는 문자로 변화하는 라벨링 기법
22. 스켈레톤
- 대상의 특정 부위에 점을 찍는 라벨링 기법
23. 특정 구간 추출
- 작업 대상이 사전에 제시된 기준에 해당하는 말이나 행동 등을 할 때의 구간을 선택해 추출하는 라벨링 기법
24. 3D 라벨링 기법
- 육면체의 입체적인 박스를 생성하여 바운딩 하는 것과 같이 2차원 라벨링의 한계를 넘어 3차원의 입체적 표현을 가능케 하는 라벨링 기법
25. 복합 라벨링
- 여러 개의 라벨링 기법을 복합적으로 사용하는 라벨링 기법
26. 문장 의미 비교
- 주어진 문장들의 의미가 같은 것인지 태깅하는 라벨링 기법
27. 감정 태깅
- 제시된 글을 읽었을 때 느껴지는 감정을 선택하는 라벨링 기법
28. 키워드 찾기
- 대화 내용 속에서 핵심이 되는 키워드를 찾는 라벨링 기법
29. 문장 요약
- 글을 읽고 핵심이 되는 내용을 요약하는 라벨링 기법
30. 화자 구분
- 제시된 음성을 모두 듣고 동일한 사람의 목소리인지를 판단해서 태깅하는 라벨링 기법
31. 음성 받아쓰기
- 주어진 음성을 듣고 받아쓰는 라벨링 기법
32. 일반 전사
- 사람이 말한 그대로 문자화하여 전사하는 방법
33. 이중 전사
- 한글 맞춤법 표기에 따른 발음과 차이가 있는 경우, '발음 전사'와 '철자 전사'를 병행하여 작성하는 방법
AI에 필요한 모든 데이터 솔루션 | 크라우드웍스
크라우드웍스는 데이터 중심의 인공지능 기술을 통해 사람과 인공지능이 함께 성장하는 새로운 미래를 만들어갑니다.
www.crowdworks.ai
직업훈련포털 HRD-Net
오늘도 더 성장할 나를 위한 직업훈련 지식포털 안녕하세요. 로그인을 해 주세요. 로그인 간편인증 로그인 개인 기업 회원가입
www.hrd.go.kr
< 인공지능 학습용 데이터 구축 과정 >
1. 데이터 수집
- 다양한 종류의 데이터를 모으는 과정
2. 데이터 정제
- 데이터를 인공지능 학습에 적합한 형태로 바꿔주는 과정
- 데이터의 오류 제거, 필요한 형식이나 크기에 맞게 변형, 불필요한 데이터 제거, 개인정보 비식별화 처리
3. 데이터 라벨링
- 인공지능이 학습할 수 있는 형태로 데이터를 가공하는 작업
4. 데이터 검수
- 데이터 라벨링이 올바르게 되었는지를 확인하는 작업
< 데이터 유형 >
1. 이미지
- 활용: 랜드마크, 손글씨, 얼굴 인식, 질환 진단, 엑스레이 위험물 탐지 기술 등
- 수집: 작업 대상과 기준에 맞춰 사진을 찍어 업로드하는 방식
- 라벨링(가공): 바운딩, 감정분석, 키포인트, 얼굴랜드마크, OCR, 폴리곤, 폴리라인
2. 영상
- 활용: 이상행동 탐지, 동작분석, 감정 인식 등
- 수집: 작업 대상과 기준에 맞춰 영상을 찍어 업로드 하는 형식
- 라벨링(가공): 바운딩, 특정 구간 추출, 스켈레톤, 시멘틱 세그멘테이션
3. 텍스트
- 활용: 인터넷 자동완성 기능, 연관 검색어, 챗봇 서비스 등
- 수집: 제시된 내용에 적절한 질문을 작성하거나 Q&A 대화를 만드는 방식
- 라벨링(가공): 문장 의미 비교, 키워드 찾기, 감정 태깅, 문장 요약
4. 음성
- 활용: 상황별 맞춤 대화록 작성, 음성인식 서비스, 자동번역, 영상 자막 등
- 수집: 휴대폰으로 음성 등의 소리를 녹음하여 바로 업로드 하는 방식
- 라벨링(가공): 화자 구분, 음성 받아쓰기
반응형
'생활' 카테고리의 다른 글
음식료주, 화학주, LCC(저가) 항공주, 요소수, 온디바이스 AI 관련주 리스트 (0) | 2023.11.27 |
---|---|
연금저축, IRP, 잘못하면 세금 토해낼 수 있다. (0) | 2023.11.16 |
NFT, 메타버스, 영상 콘텐츠, POSCO그룹, 폐배터리, DDR5, 자동차, 두산그룹, 우크라이나 재건, AR·VR 관련주 리스트 (0) | 2023.11.15 |
독감예방 주사비용 줄이기 (0) | 2023.11.13 |
HBM, 게임, 2차전지 장비, 희토류, 빈대, 리튬, 챗 GPT, 통신장비 관련주 리스트 (0) | 2023.11.09 |