2023. 6. 16. 13:50ㆍ모두의연구소 AIFFEL 서포터즈
- 참가자가 데이터를 내려받는 기능
- 예측 결과 제출 시 자동 채점 기능
- 순위표인 Leaderboard 제공
- 스크립트 실행 환경 제공 (캐글 노트북 등)
- 각종 게시판 제공(캐글 Discussion 페이지 등)
캐글 Kaggle

- 가장 유명한 경진 대회 플랫폼
- 전 세계 각종 기업과 행정기관, 연구기관이 활용
- https://www.kaggle.com/
Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
www.kaggle.com
- 순위 및 등급 제도(Rankings)
- 클라우드 데이터 분석 환경인 노트북(Code)
- 정보 교환 및 토론 게시판(Discussion)
- 데이터셋 관련 내용을 공유하는 포럼(Datasets)
- 프로그래밍 언어로 캐글에 접근할 수 있는 API
- 개인별 맞춤형으로 다양한 토픽이 표시되는 뉴스피드 기능(Newsfeed)
순위 및 등급
- Competitions : 경진 대회 성적에 따른 부여
- Datasets : 인기 있는 데이터 셋에 따른 부여
- Notebooks : 좋은 노트북 공개에 따른 부여
- Discussion : 좋은 토론 게시글에 따른 부여
캐글러는 경진 대회 순위나 Code 및 Discussion 카테고리에서의 추천vote 획득 수에 따라 포인트를 받으며 이렇게 모은 포인트 수를 바탕으로 순위가 매겨진다. 과거 거둔 실적은 시간이 흐르면서 서서히 그 포인트가 차감되므로 캐글에서의 활동이 줄어들면 순위가 내려간다. 다른 참가자로부터 일정 수 이상 추천을 받으면 메달medal을 획득할 수 있다. 메달에는 금, 은, 동 세가지 종류가 있고, 메달을 일정 수 이상 획득하면 그에 맞는 등급을 얻을 수 있다.
- Novice : 노비스(초보자)
- Contributor : 컨트리뷰터
- Expert : 익스퍼트
- Master : 마스터
- Grandmaster : 그랜드마스터
Code는 웹 기반 클라우드에서 결과나 과정을 예측하거나 데이터 시각화의 소스 코드를 실행할 수 있다.
Run Data Science & Machine Learning Code Online | Kaggle
Kaggle Notebooks are a computational environment that enables reproducible and collaborative analysis.
www.kaggle.com
Code에서 제공하는 노트북을 이용하면 대회에서 제공하는 데이터를 분석하여 시각화하거나 예측 결과를 작성하여 대회에 제출할 수 있다. 또한 대회와 관계없는 데이터도 분석할 수 있다. 또 Code는 분석 코드를 공유하는 장소로, 작성자가 공개 설정을 하면 다른 사람도 코드를 함께 볼 수 있다. 공개된 노트북 코드는 추천할 수 있고, 일정 수 이상의 표를 얻으면 메달을 획득할 수 있다.
공개 코드 중, 초보자용 코드를 적절히 활용하면 기본 분석 테크닉을 배울 수 있다. 나아가 대회 중 습득한 새로운 기술이나 깊이 있는 연구 결과가 포함된 코드가 공유되기도 한다.
언어는 파이썬과 R중 선택할 수 있고, 노트북을 새로 만들 때는 스크립트타입과 노트북 타입 중 선택이 가능하다. 스크립트에서는 에디터 형태의 코드를, 노트북에서는 주피터 노트북 형태의 코드를 작성하고 실행한다. 모델 학습이나 예측 결과를 제출할 때는 스크립트 타입을 선택하고, 대화형 데이터 분석이나 데이터를 가시화할 때는 노트북 타입을 선택하기를 권한다.
캐글 API
https://github.com/Kaggle/kaggle-api
GitHub - Kaggle/kaggle-api: Official Kaggle API
Official Kaggle API. Contribute to Kaggle/kaggle-api development by creating an account on GitHub.
github.com
데이콘 Dacon
- 국내 경진 대회 플랫폼
- 국내 기업과 행정기관, 연구기관이 활용
- https://dacon.io/
Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
www.kaggle.com
시그네이트 SIGNATE
- 일본 경진 대회 플랫폼(이전 명칭은 OTP Data Science Lab)
- 일본 기업과 행정기관, 연구기관이 활용
- https://signate.jp/
TOP | SIGNATE - Data Science Competition
SIGNATEのコンペティション一覧です。SIGNATEは、Data Science Competitionはもちろん、学習コンテンツや求人情報等、データサイエンティストの皆さんに役立つコンテンツを用意しています。
signate.jp
탑코더 Top Coder
- 프로그래밍 콘테스트 플랫폼이지만 경진 대회도 개최
- https://www.topcoder.com/
Top Website Designers, Developers, Freelancers for Your Next Project | Topcoder
www.topcoder.com
'모두의연구소 AIFFEL 서포터즈' 카테고리의 다른 글
AI, 빅데이터 직무별 업무 및 요구사항 (0) | 2023.06.15 |
---|---|
성장하는 개발자가 되기 위하여... (3) | 2023.06.07 |
모두의연구소 아이펠(AIFFEL) 온라인2기 교육을 마치며 (1) | 2023.05.15 |