728x90
반응형
1. Kaggle 소개
- Kaggle이란?
전 세계 사람들이 데이터 분석, 인공지능 대회, 코드 공유를 하는 플랫폼.
→ “데이터 과학자들의 놀이터”라고 불릴 정도로 방대한 데이터셋이 있음. - 학생들이 얻을 수 있는 것
- 다양한 이미지·텍스트·소리 데이터셋 무료 제공
- 실제 대회 문제(예: 교통 표지판 인식, 동물 분류)를 통해 실전 경험 가능
- 다른 사람들이 공유한 코드와 노트북을 참고하며 학습
Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
www.kaggle.com
2. Kaggle에서 이미지 데이터 다운로드
- kaggle.com 회원가입 및 로그인
- Search bar에서 원하는 주제 검색 (예: “cat vs dog images”)
- 원하는 Dataset 클릭 → Download 버튼
- 압축 파일(.zip)을 풀어서 이미지 파일 확인
- 또는 아래와 같이 image 검색하여 원하는 데이터 찾기
6. 고양이와 개 이미지 분류 데이터 활용해 보기
https://www.kaggle.com/datasets/samuelcortinhas/cats-and-dogs-image-classification
Cats and Dogs image classification
Binary classification between cats and dogs
www.kaggle.com
3. Kaggle 데이터셋 화면 설명 (고양이와 개 이미지 분류)
1. 데이터셋 제목
- “고양이와 개 이미지 분류”
→ 고양이와 개 사진을 구분하는 인공지능 모델을 만들기 위한 데이터셋임.
2. 데이터 셋 정보
- 데이터 출처: 구글 이미지에서 수집
- 이미지 개수: 1,000장 이상
- 이미지 크기: 최소 100×100 픽셀부터 최대 2000×1000 픽셀까지 다양
- 파일 형식: JPG (jpeg)
- 전처리: 중복된 이미지 제거 완료
👉 학생들에게: “데이터셋은 그냥 사진 모음이 아니라, 인공지능이 학습하기 좋도록 정리된 자료집이에요.”
3. 테스트 데이터 (Test Set)
- 폴더 구성:
- 고양이들 (70개 이미지)
- 개들 (70개 이미지)
- 분할 비율: 학습용 데이터(Training set)와 테스트 데이터(Test set)를 80:20으로 자동 분리해 둠
![]() |
![]() |
학습용 테스트 각 폴더 속 데이터.
![]() |
![]() |
※ 고양이 데이터와 강아지 데이터 사진 확인
👉 쉽게 설명하기:
- Training set: 공부할 때 교재
- Training Set (학습용 데이터셋): 모델이 학습하는 데 사용되는 데이터 (보통 전체의 70~80%)
- Test set: 시험 볼 때 문제지
- Test Set (테스트 데이터셋): 최종적으로 모델 성능을 평가하기 위한 데이터 (10~20%)
4. 데이터 다운로드
- 오른쪽의 데이터 탐색기에서 폴더 구조 확인 가능
- “버전 4 (69.26MB)” → 데이터셋 크기와 버전 정보
- 다운로드 버튼을 누르면 압축 파일(.zip) 형태로 받을 수 있음
💡 학생 활동 포인트
- 이 데이터셋을 Roboflow에 업로드하여 고양이/개 분류 모델 만들기
- 학습된 모델을 웹캠으로 테스트하면서 실제로 인식 여부 확인하기
728x90
반응형
'인공지능 기초 수업' 카테고리의 다른 글
Roboflow #2. 이미지 라벨링, 데이터 셋 만들기. (3) | 2025.09.01 |
---|---|
Roboflow #1. 활용 이미지 데이터 업로드 하기. (2) | 2025.09.01 |
mediapipe 매쉬 모델활용 얼굴 트레킹봇 만들기. (4) | 2025.08.14 |
포즈모델을 활용한 AI 구글 공룡 게임 (2) | 2025.06.23 |
Mediapipe hands 모델 왼손, 오른손 구별 하기. (0) | 2025.04.15 |