머신러닝(4)
-
생성형 AI 기술 개발 및 활용 - 2
https://www.accenture.com/us-en/insights/technology/generative-ai Generative AI in Business Accenture explores the potential of generative AI technology, generative AI applications in business & how generative AI systems can reinvent work. www.accenture.com 디지털오픈랩(김종우교수님)
2023.08.04 -
사이킷런 결정 트리 파라미터
결정 트리 파라미터 파라미터 명 설명 min_samples_split - 노드를 분할하기 위한 최소한의 샘플 데이터 수로 과적합을 제어하는 데 사용됨. - 디폴트는 2이고 작게 설정할수록 분할되는 노드가 많아져서 과적합 가능성 증가 min_samples_leaf - 분할이 될 경우 왼쪽과 오른쪽의 브랜치 노드에서 가져야 할 최소한의 샘플 데이터 수 - 큰 값으로 설정될수록, 분할될 경우 왼쪽과 오른쪽의 브랜치 노드에서 가져야 할 최소한의 샘플 데이터 수 조건을 만족시키기가 어려우므로 노드 분할을 상대적으로 덜 수행함. - min_samples_split와 유사하게 과적합 제어 용도. 그러나 비대칭적(imbalanced) 데이터의 경우 특정 클래스의 데이터가 극도로 작을 수 있으므로 이 경우는 작게 설정 ..
2023.07.22 -
모두의연구소 커리어랩 세미나 Git hub 관리 및 오픈소스 활동
아이펠 Online 2기 코어과정을 수료한지도 2달이 지났다. 개발자 포트폴리오를 만들게 되면서 구체적으로 어떤 포트폴리오가 좋은 포트폴리오인지에대한 명확한 기준도 모르는 상태에서 깃허브를 만들고 관리하자니 답답하고 생소한 느낌이었다. 아이펠 교육과정에서 깃허브에 업로드하는 기초적인 과정들은 배웠으나, 깃허브를 어떤 목적으로 만드는지, 그리고 내 깃허브를 통해 사람들에게 무엇을 공유할 것인지에대한 추상적인 생각으로 그동안 깃허브를 관리해왔다.(관리라고하기보다는 그냥 존재한다고 말하는 편이 좀 더 나을듯.) 그래서 현재 내 깃허브는 사실 누구한테도 보여주기 어려운 상태라고 진단했다. 나는 그동안 기획하는 일들을 해왔기 때문에 시각적인 결과물로서의 포트폴리오는 어떻게 만들어야 할지에 대한 감이 있는 사람이나..
2023.07.20 -
사이킷런의 주요 모듈
사이킷런의 주요 모듈 분류 모듈명 설명 예제 데이터 sklearn.datasets 사이킷런에 내장되어 예제로 제공하는 데이터 세트 피처 처리 sklearn.preprocessing 데이터 전처리에 필요한 다양한 가공 기능 제공(문자열을 숫자형 코드 값으로 인코딩, 정규화, 스케일링 등) sklearn.feature_selection 알고리즘에 큰 영향을 미치는 피처를 우선순위대로 셀렉션 작업을 수행하는 다양한 기능 제공 sklearn.feature_extraction 텍스트 데이터나 이미지 데이터의 벡터화된 피처를 추출하는데 사용됨. 예를 들어 텍스트 데이터에서 Count Vetorizer나 Tf-ldf Vectorizer 등을 생성하는 기능 제공. 텍스트 데이터의 피처 추출은 sklearn.featur..
2023.06.28