분류 전체보기(44)
-
생성형 AI 기술 개발 및 활용 - 1
미래 생산성 향상의 Key. - 2030년까지 AI 기술로 인해 글로벌 주요국의 국가별 성장률이 5~26%까지 폭증 전망 - AI도입으로 2035년까지 주요 12개 국가의 GVA(Gross Value Added) 성장률은 2배로 증가, 기업들의 수익성은 평균 38% 가량 향상하여 2030년까지 무려 14조 달러 규모의 경제 성장 예상 고용시장의 영향 - 물리적인 노동력 뿐 아니라 인간의 인지 및 판단 영역을 대체 - 현재 사람이 하고 있는 대부분의 직업이 대체 위험에 노출 - GPT-4를 이용하면 사람과 비슷한 완성도로 작업을 완수하는 데 드는 시간이 50% 이상 감소하는 직업과 작업이 약 14%~46%에 달함. - 2030년까지 북미와 유럽에서 AI에 의해 높은 위험에 처할 업종별 직업의 수가 무려 2..
2023.08.04 -
GAN기초, 비용함수
GAN 기초 : 적대적 훈련 생성자와 판별자는 신경망과 같은 미분가능한 함수로 표현된다. 이 신경망은 각자 자신만의 비용함수를 가진다. 판별자의 손실을 사용해 역전파로 두 네트워크를 훈련한다. 판별자는 진짜와 가짜 샘플에 대한 손실을 최소화하려고 노력한다. 반면 생성자는 자신이 생성한 가짜 샘플에 대해 판별자의 손실이 최대화되도록 노력한다. 생성자가 흉내 내려는 샘플의 종류는 훈련 데이터셋으로 결정. 예를 들어, 실제와 같은 고양이 이미지를 만드는 것이 목적이라면 GAN에 고양이 이미지 데이터셋을 주입해야 한다. 조금 더 기술적으로 말하면 생성자의 목적은 훈련 데이터셋의 데이터 분포를 흉내 내는 샘플을 생성하는 것. 컴퓨터 입장에서 보면 이미지는 값을 담은 행렬에 불과하다. 흑백 이미지는 2차원이고 컬러..
2023.08.02 -
사이킷런 결정 트리 파라미터
결정 트리 파라미터 파라미터 명 설명 min_samples_split - 노드를 분할하기 위한 최소한의 샘플 데이터 수로 과적합을 제어하는 데 사용됨. - 디폴트는 2이고 작게 설정할수록 분할되는 노드가 많아져서 과적합 가능성 증가 min_samples_leaf - 분할이 될 경우 왼쪽과 오른쪽의 브랜치 노드에서 가져야 할 최소한의 샘플 데이터 수 - 큰 값으로 설정될수록, 분할될 경우 왼쪽과 오른쪽의 브랜치 노드에서 가져야 할 최소한의 샘플 데이터 수 조건을 만족시키기가 어려우므로 노드 분할을 상대적으로 덜 수행함. - min_samples_split와 유사하게 과적합 제어 용도. 그러나 비대칭적(imbalanced) 데이터의 경우 특정 클래스의 데이터가 극도로 작을 수 있으므로 이 경우는 작게 설정 ..
2023.07.22 -
모두의연구소 커리어랩 세미나 Git hub 관리 및 오픈소스 활동
아이펠 Online 2기 코어과정을 수료한지도 2달이 지났다. 개발자 포트폴리오를 만들게 되면서 구체적으로 어떤 포트폴리오가 좋은 포트폴리오인지에대한 명확한 기준도 모르는 상태에서 깃허브를 만들고 관리하자니 답답하고 생소한 느낌이었다. 아이펠 교육과정에서 깃허브에 업로드하는 기초적인 과정들은 배웠으나, 깃허브를 어떤 목적으로 만드는지, 그리고 내 깃허브를 통해 사람들에게 무엇을 공유할 것인지에대한 추상적인 생각으로 그동안 깃허브를 관리해왔다.(관리라고하기보다는 그냥 존재한다고 말하는 편이 좀 더 나을듯.) 그래서 현재 내 깃허브는 사실 누구한테도 보여주기 어려운 상태라고 진단했다. 나는 그동안 기획하는 일들을 해왔기 때문에 시각적인 결과물로서의 포트폴리오는 어떻게 만들어야 할지에 대한 감이 있는 사람이나..
2023.07.20 -
모두의연구소 커리어랩 5기 세미나 후기 및 진로고민 MLEngineer, DataScientist(대학원 가야돼? 말아야돼? 기술 트리)
오늘 모두의 연구소 커리어랩 5기 취업 세미나를 들었다. "현직자가 들려주는 커리어성장 세미나" 세미나를 들으며 현직자 분이 굉장히 프로페셔널하다는 인상을 받았다. 아무래도 나는 따끈따끈한 스타트업에 관심이 많아 어느정도 많은 정보에 접근하려고 노력중이며, 나는 스스로 PM, 기획자에 맞다고 생각하기 때문에 열린 마음으로 다른 직무의 Task에도 관심이 많다. 세미나 연사님은 백엔드 개발자로부터 시작해서 ML엔지니어로 근무시는 분이었고, 카카오, 네이버에서 job offer를 받았으며 둘중 하나의 기업에 다니시는 분이었다. 커리어 적인 측면에서 직무가 좀더 세분화 되어있다는 느낌을 받았다 ML engineer - Applied Scientists - Research Scientists - MLOps En..
2023.07.20 -
사이킷런 내장된 예제 데이터 세트
내장된 예제 데이터 세트 API명 설명 datasets.load_boston() 회귀 용도이며, 미국 보스턴의 집 피처들과 가격에 대한 데이터 세트 datasets.load_breast_cancer() 분류 용도이며, 위스콘신 유방암 피처들과 악성/음성 레이블 데이터 세트 datasets.load_diabetes() 회귀 용도이며, 당뇨 데이터 세트 datasets.load_digits() 분류 용도이며, 0에서 9까지 숫자의 이미지 픽셀 데이터 세트 datasets.load_iris() 분류 용도이며, 붓꽃에 대한 피처를 가진 데이터 세트 fetch 계열 - 데이터의 크기가 커서 패키지에 처음부터 저장되어있지 않고, 인터넷에서 내려받아 홈 디렉터리 아래의 scikit_learn_data라는 서브 디렉터..
2023.06.28